מתי בפעם האחרונה שיפצתם את הבית שלכם? טיפלתם בעובש שמצטבר בחדר האמבטיה? ריססתם את הבית מפני חרקים? רעננתם את הגינה שלכם? האם אתם נמנים על האנשים שמתחזקים את הבית שלהם בשוטף או דווקא על אלה אשר פעם ב- 5 שנים נכנסים לעבודת שיפוץ גדולה, ומגלים כי המצב ממש התדרדר? הבית זה הנכס שלכם. עכשיו תחשבו כיצד אתם רוצים לשמור על הנכס הזה. כמו הבית כך גם מאגר המידע הארגוני. הדאטה שלכם היא נכס יקר ערך. בהבדל אחד מהבית – על בסיס הדאטה, שמורה או מוזנחת, אתם מקבלים החלטות עסקיות הרות גורל. עכשיו, תחשבו כיצד אתם רוצים לשמור על הנכס הזה.
לפי דן אנד ברדסטריט עד 96% מכתובות הדואר האלקטרוני ונתוני הקשר של הלקוחות במערכות לקשרי לקוחות בארגונים, אינם נכונים או נכונים בחלקם. האם גם הדאטה שלכם באמת במצב כזה גרוע? לאורך זמן, איכות הדאטה יורדת ב- 2% בחודש וכך חלה התדרדרות הדרגתית של איכות המידע. מספיק שעובד משנה תפקיד בחברה ומשנה את פרטי ההתקשרות עימו כדי לפגוע באיכות הדאטה. מדי פעם, המערכות אף משכפלות את המידע הקיים או מאייתות מילים בצורה שגויה וכן הלאה.
במחקר של חברת StreamSets שני שליש מן המשתתפים הצביעו על שלושה אתגרים בשמירה על איכות הדאטה – שמירה על דיוק המידע, שלמותו ועקביותו. לעומת זה, רק למעלה ממחצית המשתתפים טענו גם כי סוגיות תפעול ואבטחת מידע מעסיקות אותן. העובדה כי איכות המידע דורגה כאתגר מטריד אף יותר מסוגיות אבטחת מידע ורגולציה היא עובדה מרעישה.
גם לעידן הביג דאטה תפקיד מכריע בבלאגן הזה. מטבעו, הוא מציף את הארגון בנתונים לא נחוצים. למשל, 87% ממשתפי המחקר של StreamSets הודו כי הם מאפשרים ביודעין למידע לא איכותי לחדור למרכזי הנתונים שלהם. החוכמה היא להשכיל ללקט את המידע שחיוני לארגון ולהחזיק רק בו. האיכות חשובה בהרבה מן הכמות, אומר גם יניב מור, מנכ"ל Xplenty במאמר שפרסם – CMS Wire. מדוע האיכות כל כך חשובה? משום שמידע לא איכותי, או חלקי, יכול להוביל אתכם לתהליך קבלת החלטות שגוי וזה גרוע יותר מלא לקבל שום החלטה.
אבל אם כבר הדאטה נאספה והתיישבה במרתפי מערכות המידע, איך בכל זאת תשפרו את איכותה וחשוב יותר, איך תתנהלו עם הדאטה החדשה שאתם צוברים? הנה מספר המלצות שכדאי לאמץ.
- מנו Chief Data Officer ותנו לו להרכיב צוות משלו. אל תשאירו את הנושא בידי מחלקת ה- IT שכן לא מדובר כאן בשיפוץ חד-פעמי אלא בתהליך רצוף של שימור הדאטה ואיכותה. חשוב אגב שה- CDO יהיה בכיר שלוקח חלק בישיבות הנהלה ויש לו say. כל המהלך הזה יתרום לבניית תרבות ארגונית מתאימה ביחס לדאטה.
- הגדירו מדיניות טיפול בדאטה ומטרות ארוכות טווח. מידע לא איכותי מקורו בקורוזיה ובאובדן מידע הנגרמים מזליגת מידע (Data Drift). זליגת מידע מתרחשת באופן בלתי צפוי וכוללת הן שינויים במבנה של מאגר הנתונים והן שינויים בסמנטיקה. הסיבות לכשל הזה, בין השאר, הן שימוש בפתרונות שפותחו בסטנדרט נמוך של עבודה ואינם עמידים בפני שינויים במבנה של מאגרי הנתונים, ואף תוכננו כך שלא ניתן יהיה לנטרם. בשלב הזה עליכם להסתכל קדימה ולתכנן כיצד אתם מייצרים דאטה איכותית לאורך זמן, או במילים אחרות, כיצד אתם עוקרים את העשבים השוטים מן השורש. עוד כדאי בשלב זה לזהות מה מקור הטעויות ולקבוע נהלים שימנעו הישנות הטעויות.
- אחדו ושלבו את מערכות המידע שלכם. לרוב, ארגונים נאבקים עם איכות הדאטה משום שהם מאחסנים אותה במערכות מידע שונות במקביל. זו כמובן תולדה של עולם ה- IT הישן, בו לכל פונקציה פיתחו מערכת חדשה שלא ידעה לדבר עם כל המערכות המקבילות לה. תשתיות הלגאסי, לרוב מבודדות ונעדרות תמיכה, לא שיפרו את המצב. במצב של ריבוי מערכות מידע, שלא יודעות להסתנכרן, לעולם לא תוכלו לקבל תמונת מצב שלמה ומלאה של הלקוח המסוים וכך תחמיצו הזדמנויות מכירה.
- נרמלו את הדאטה שלכם. המידע מגיע אליכם ממקורות שונים (קבצים פנים-ארגוניים, קבצים חיצוניים, מיילים, רשתות חברתיות, אתרי אינטרנט ועוד) ובפורמטים שונים (קבצי וורד, אקסל, תמונות, וידאו ועוד). מקורות המידע האלה שונים מבחינה טכנולוגית, יש בהם שדות שונים והפורמט שלהם שונה. על מנת שישבו במאגר מידע אחד וישמשו אתכם בצורה יעילה חשוב לנרמל אותם ולהכניס אותם לפורמט אחיד.
- העשירו והשביחו את הדאטה. אם אתם מסתמכים רק על הדאטה שאתם אוספים, אתם עלולים להחמיץ הזדמנויות עסקיות. לכן, מומלץ לרכוש מאגרי מידע של גורם צד שלישי, למשל מאגר של רשם האוכלוסין, ולהעשיר את הדאטה שלכם במידע נוסף על הלקוחות. המידע הזה יתרום רבות לתהליך קבלת ההחלטות שלכם, לפרסונליזציה בפנייה ללקוח, לחוויית הלקוח והצעות הערך שאתם מציעים לו, ובשורה התחתונה, להצלחה העסקית שלכם.
- השתמשו בכלים אוטומטים כדי לטייב נתונים. ישנם היום כלים אוטומטים שיכולים לאתר אלפי טעויות בדאטה שלכם תוך מספר דקות. לכלים אלה יכולות מרשימות, וביניהם, כלים היודעים להבחין בין אותיות דומות בעברית כמו "צ" ו- "ד" או כלי שיודע לזהות טעויות בפורמט, כמו ההבדלים בין כתיבת תאריך באנגלית לעומת עברית. אמצו כלים אוטומטים שיתפסו את השגיאות לפני שהן מתברגות במאגר הנתונים.
בשנים האחרונות הנושא של טיוב נתונים קפץ כיתה, אם לא שתיים. האינטרנט של הדברים תורם רבות להגדלת נפחי המידע, הביג דאטה תופסת את קדמת הבמה ועימה טכניקות עבודה של Data Science ו-Analytics, הצרכנים התרגלו לחיות ב-Real Time ולקבל מענה מיידי לכל בעיה והם מצפים לקבל מהספקים הצעות ערך מדויקות בתמורה לפרטיות עליה ויתרו. על רקע כל אלה, איכות הדאטה הפכה להיות גורם חשוב בהשגת היעדים העסקיים.