top of page

תחומי הידע של המשרד כוללים, בין היתר:

1. מדע נתונים (שיטות לביצוע ​מחקרים של מדע נתונים, אנטומיה של פרויקט במדע נתונים ומקורות מידע​)

2. תכנות ב- Python (ביצוע עבודת חקר באמצעות Jupyter notebooks, אופרטורים של השפה: מספריים, מחרוזות, רשימות, tuples, מערכים, פלט וקלט של השפה: קריאת וכתיבת קבצים, פונקציות, לולאות, עבודה עם pip, עבודה עם סביבה וירטואלית, אירגון וחקר נתונים באמצעות NumPy ,Pandas ו- Scipy ויזואליזצית נתונים באמצעות Matplotlib ו- Seaborn)

3. תכנות ב- R (ביצוע עבודת חקר באמצעות R Studio, תחביר השפה, אופרטורים של השפה, טיפוסי נתונים של השפה, מבני נתונים של השפה: וקטורים, מטריצות, מסגרות נתונים ורשימות, מבני בקרה של השפה: לולאות, התניות, פונקציות, עיבוד נתונים עם השפה, חבילות ההרחבה של השפה, עבודה עם פקטורים ועם חבילות הרחבה פופולאריות מתחום ה- Data Science לרבות dplyr וחבילת הגרפיקה המתקדמת ggplot2)

4. ניתוח מידע בשפת SQL (בסיסי נתונים, התחברות למסדי נתונים, יצירה ומחיקה של טבלאות, פקודות: SELECT, INSERT ,DELETE ,UPDATE חיבור טבלאות JOINS, שינוי טבלה ALTER, יצירת אינדקסים, טבלאות זמניות, סינון ומיון נתונים, משתנים מחושבים: טרנספורמציות מתמטיות, פעולות על מחרוזת, פעולות על התאריך והשעה. אגרגציות של נתונים)

5. סטטיסטיקה תיאורית (סוגי נתונים והצגתם באופן טבלאי וגרפי, מדדי מרכוז ומדדי פיזור, אחוזונים, מדדי קשר והתפלגות הנתונים)

6. הסתברויות והתפלגויות (הסתברות פשוטה במרחב הסתברותי אחיד ובמרחב הסתברותי לא אחיד, הסתברות מותנית, נוסחת בייס, ניסויי ברנולי, התפלגות בינומית, התפלגות פואסונית, התפלגות היפרגאומטרית, התפלגות נורמלית וקירוב סדרות נתונים להתפלגויות אנליטיות)

7. הסקה סטטיסטית (אמידה נקודתית, רווחי סמך ומבחני השערות)

8. למידה סטטיסטית (תפקיד המשתנים בלמידה סטטיסטית: Input ו- Target, הטיה מול שונות Bias / Variance, בעיות רגרסיה מול בעיות סיווג, חלוקת הנתונים ל- Training set ו- Testing set ונרמול הנתונים)

9. למידה בהשגחה (מודלים לינאריים בבעיות רגרסיה, מודלים לינאריים בבעיות סיווג, חיזוי באמצעות שיטות KNN, עצי החלטה, יער אקראי, המסווג הנאיבי של בייס ומכונת וקטורים תומכים)

10. למידה ללא השגחה (ניתוח אשכולות עם K-Means, ניתוח אשכולות היררכי, ניתוח אשכולות באמצעות שיטות גאוסיאניות מעורבבות וניתוח אשכולות באמצעות DBSCAN)

11. צמצום מימדים (p-values, itertools combinations, ניתוח מרכיבים עיקריים ו- AutoEncoders)

12. ניתוח סדרות עתיות (ARIMA, LSTM, RNN, GRU)

13. Ensemble Learningי(Simple Averaging Approach, Voting/Stacking, Bagging, Boostingׁ)

14. סימולציה (סימולציות מונטה קרלו, סימולציית בוטסטראפ, משתנים מקריים בדידים, משתנים מקריים רציפים, התפלגות לוג-נורמלית, תנועה בראון גיאומטרית, תסוגה לממוצע ודיפוזיית קפיצות)

15. אופטימיזציה (Lagrangian Function ,Newton-Raphson Method ,Bisection Method)

16. הכנת נתונים (ייבוא נתונים, תחקור, ניקוי, השלמת ערכים חסרים באמצעות Imputation, נורמליזציה, הנדסת משתנים ובחירת משתנים למודל)

17. טיפול במערכי נתונים לא מאוזנים בצורה קיצונית (ADASYN ,ROS ,SMOTE)

18. בניית מודלי ניבוי (מודלים של ML, בחירת שיטת הערכה המתאימה ביותר - Model selection, שיפור הניבוי: כוונון היפר הפרמטרים, Underfitting/Overfitting)

19. Applied Machine Learning (תהליך בניית מודל סיווג, תהליך בניית מודל רגרסיה, בניית מנועי המלצה באמצעות למידה ללא השגחה, עיבוד שפה טבעית וניתוח טקסט, זיהוי תמונות וזיהוי קולות)

20. רשתות נוירונים (Multi-layer perceptron, Recurrent neural networks, LSTM, Convolution and pooling)

21. Applications של רשתות נוירונים (עיבוד תמונה, עיבוד קול ועיבוד שפה)

22. Deployment (באמצעות נוסחה פשוטה, באמצעות pickle, באמצעות שיטת ה- server, שיטת ה- server less/ lambda function ובאמצעות Flask ו- Docker)

23. Big data (יישומי Hadoop ו- Mapreduce)

24. Spark (עבודה עם SparkSQL ולמידת מכונה ב- Spark)

 

 All rights reserved © כל הזכויות שמורות לפרדיקציות יועצים.

bottom of page