העידן הנוכחי מבוסס במידה רבה על מידע. מידע על בוחרים מסוגל לשנות את תוצאות הבחירות כפי שראינו בארה"ב ובמקומות נוספים בעולם. מידע שמצטבר על קשרים בין תרופות לסימפטומים של מחלות שונות מאפשר להציל חיים. עסקים משתמשים במידע הנאסף בחברה ומחוצה לה על מנת למכור מוצרים רבים יותר וערים הופכות לחכמות יותר בזכות מידע המצטבר בחיישנים. כל אלה מתבצעים בזכות מפתחים בעלי יכולת של ניתוח מודלים, פיתוח אלגוריתמים וחיזוי של תוצאה עתידית.
שירותי Data Science
בעוד מומחי הבינה העסקית לומדים לרתום את הנתונים על מנת להציג דו"חות מתקדמים יותר, מומחי Data Science משתמשים ביכולות של למידת מכונה (ML) ואינטליגנציה מלאכותית (AI) על מנת לנבא סיטואציה עתידית.
על מנת להבין את ההבדלים בין Data Scientist לבין מומחה BI נשתמש בדוגמה מהחיים. ניקח לדוגמה את המשבר הכלכלי הגדול שהיה בארה"ב בעקבות משבר הסאב-פריים. מומחהBI היה מסוגל לנתח את הנתונים בדיעבד ולהבין: מה גרם למשבר? וגם: איזו כמות של משכנתאות שלא הוחזרה יכלה להוביל לירידת המחירים האסטרונומית בשנים אלה?
לעומת זאת, Data Scientist מסוגל לקחת את הנתונים הללו ולזהות מגמות עתידיות כמו חיזוי של משבר נוסף על סמך איתור דפוסים של התרחשות במשברים קודמים, ניבוי הסיכויים הסטטיסטיים להיקף שלו וחקר של מודלים כלכליים נוספים בעולם מהם ניתן להשליך מהן נקודות האל-חזור הכלכליות היכולות להוביל למשבר כזה.
ניתוחי מודלים קיימים בצורה יצירתית
העבודה של Data Scientist משלבת פעמים רבות נתונים ממספר מקורות מידע שונים. תחום זה משיק לעבודתם של מומחי Big Data, היוצרים את מסד הנתונים הדינמי המשמש לאיסוף הנתונים וכן בוחרים את מקורות המידע.
Data Scientist יכול לזהות מידע נוסף שיכול להשתלב בנתונים הקיימים ובדרך יצירתית לבנות מודלים לניבוי על בסיס עיבוד כל הנתונים הללו. חשוב להבין שלא מדובר בתהליך חד-פעמי, אלא בתהליך דינמי בו אפשר להוסיף נתונים ממקורות רבים נוספים ולשפר מודל קיים. במידה והאלגוריתם הצליח להוכיח את עצמו כנכון בחיזוי מרבית התרחישים ניתן להשתמש באותו המודל גם בעתיד.
ידע בתחומים רבים
ל- Data Scientist שילוב של ידע בתחומים שונים. הוא בקיא במודלים מתמטיים, בסטטיסטיקה ובתכנון אלגוריתמים. כמו כן, הוא יודע להשתמש בכלי פיתוח שונים על מנת לשאוב, לארגן ולעבד את המידע וכן בקיא ביצירת מסדי נתונים. הוא משתמש ביכולות של למידת מכונה על מנת לשפר את האלגוריתם ולזהות אילו עוד תובנות ניתן לקבל מהמידע באמצעות בחינה של הקשרים שנמצאו בין הנתונים שנאספו קודם לכן, בתוספת הנתונים החדשים שממשיכים לזרום לתוך המודל כל הזמן.
מדוע משרה זו כה מהותית? מכיוון שהיא מאפשרת לזהות את הקשר בין סימפטומים מסוימים לתרופה שנועדה לטיפול במחלה שונה לגמרי באמצעות עבודת ניתוח הנתונים, או לחזות את המשבר הכלכלי הבא ולהיערך לקראתו. תחום ה-Data Science צבר תאוצה משמעותית בשנים האחרונות, ונראה שהוא רק ימשיך לגדול בטווח הנראה לעין.