מתוך wikIT

קפיצה אל: ניווט, חיפוש


מיקום במודל השכבות

[עריכה] מיקום במודל השכבות

Business Facade

שווה ציטוט

[עריכה] שווה ציטוט

קישורים ממומנים

[עריכה] קישורים ממומנים


תורמים אחרים עשויים לערוך או אף להסיר את תרומתכם ל־wikIT

[עריכה] Data Mining

תגיות: Web2, Web2 מושג נרדף: Knowledge Discovery

בעברית: כריית ידע או כריית נתונים


הגידול המתמיד בפער שבין הקיבולת והיכולות של מערכות האחסון ואחזור הנתונים, לבין היכולת של המשתמשים לנתח בצורה מועילה את המידע ולפעול לפי מסקנות הניתוח, מונע פעמים רבות ניצול יעיל של גודש המידע שקיים בארגון. כיום, כאשר המידע הוא המשאב הקריטי ביותר בתחומי פעילות רבים וכמעט בכל ארגון נאגרות כמויות עצומות של מידע, גובר והולך הצורך בכלים חכמים שיאפשרו הפקת תועלת מרבית מן המידע הגולמי שנאגר.


תהליך הזיקוק של הידע הרלוונטי מתוך הכמויות האדירות של הנתונים הקיימים, נקרא בלשון מקצועית Data Mining - "כריית נתונים", שם המרמז על הערך הרב הטמון בנתונים. המיוחד בטכניקה זו, הוא האפשרות למצוא בנתונים דפוסי התנהגות (כולל מגמות), בלי לדעת מראש מה מחפשים. הצורך בכלים כאלה נובע מהסיבוך בנתונים, וחוסר היכולת להציב מטרות ברורות, הנדרשות לפתרונות המסורתיים - סטטיסטיקה, מערכות מומחה, AI וכו'. כריית נתונים הוא תהליך של ייצור יחסי גומלין בין חלקי הנתונים.


טכניקה זו יכולה לנבא מגמות עתידיות והתנהגויות ומאפשרת לקבל החלטות עסקיות פרו-אקטיביות, מבוססות מידע.


תוכן עניינים

[עריכה] מטרת כריית הידע

מטרת הכרייה היא חקר וניתוח הנתונים והמידע, מסביבות שונות, באמצעים אוטומטיים ככל שניתן, לצורך גילויים של דפוסים. כריית המידע מאפשרת גילוי קשרי גומלין שלא היו ידועים מראש בתוך הארגון. על המידע המופק להיות תקף, מחדש, שימושי ובעל משמעות, כך שהמשתמשים יוכלו להתבסס עליו באופן מעשי. שימושים נפוצים: תמיכה בהחלטות, אבחון אירועים, אפיון אוכלוסיות, איתור גורמי הצלחה וכשלון, ומחקר אמפירי. השימוש הנפוץ ביותר הוא לצורכי מודיעין עסקי - BI, אשר בו מנצלים נתונים קימים לצורך החלטה מושכלת ביחס להמשך דרך הפעולה והאסטרטגיה הארגונית.


יש הרואים בכריית נתונים רק שלב אחד בתהליך יצירת הידע והבנתו. השלב של הפיכת מידע לידע. לעיתים נדרשים כלים או שלבים טכניים נוספים, כגון אינטגראציה של מידע, הצגה מספרית וחזותית, והטמעה בתהליכי החלטה. התוצר הסופי של התהליך כולו מהווה ידע שחשיבותו ראשונה במעלה, אם בתחום המודיעין העסקי ואם בתחומים ארגוניים ורבים אחרים.

[עריכה] דוגמאות שימוש

חיזוי נטישת לקוחות.

[עריכה] דו"חות כריית נתונים מול דוחות רגילים

מה שמיחד את דוחות כריית נתונים מדוחות "רגילים" הוא הסתמכותם על מסקנות כריית נתונים. דוחות אלה מכילים מאפינים של דפוסי התנהגות, סמנים, וצירופי גורמים, אשר הוגדרו בכריית נתונים (ואינם ניתנים לאיתור בצורה אחרת).


יחד עם זאת, לאחר שהוגדרו דרישות הדיווח, ההפקה של הדוחות מבוצעת ע"י מחולל דוחות, כמו המחולל שנמצא בתוכנות Cognos, Business Objects וכד', ובסופו של דבר, כל הדוחות הם חיתוך נתונים באמצעות מיון, סיווג, והפעלה של פעולות אריתמטיות או חזותיות.


דו"חות "רגילים" יכולים להציג רק מה שהמשתמשים יודעים להגדיר. כריית נתונים מרחיבה את האפשרויות לשאלות מעורפלות שאין להן ביטוי מספרי, כגון "מה מאפיין לקוחות?", "מדוע יש תקלות בתהליך יצור?", ו"האם אפשר לדעת מראש על ירידה בדרישה למוצר לאור התנהגות העבר?". כדי להשיב לשאלות אלו יש צורך למצוא בנתונים את המאפינים והגורמים שמאחורי תופעות מענינות כגון אלה. אחרי שהם מוגדרים, ניתן לטפל בהם בצורה המקובלת של מעקב, השוואה, טיפול בחריגים, מניעה או עידוד וכד'.

[עריכה] Text Mining

בתוך עולם כריית המידע קיים תחום העוסק בכריית מידע מטקסטים. תחום זה נקרא Text Mining. זהו התחום המעניין מנהלי ידע, שכן הוא שייך לתחום אחריותם. כריית מידע מטקסט מוגדרת כתהליכי ניתוח טקסט ואיפיון תבניות שפה לצורך מיצוי המידע הקיים בטקסטים. המידע המופק בתהליך זה יכול להיות שם מחבר, כותרת המאמר, תאריך פרסום המידע, אך גם: תוכן המאמר, זיהוי מגמות, קשרים בין יישויות ועוד. כמו כן, יכול המידע המופק לשמש כבסיס ליצירת טקסונומיה ומיון מסמכים דומים לקטגוריות משותפות בעץ הנושאים ההיררכי. יעילות מיצוי המידע מהטקסט נמדדת במדדי כיסוי ודיוק.


תחום זה הוא אחד התחומים המתפתחים ביותר בכריית נתונים. הבעיה הפשוטה, ואולי גם הנפוצה ביותר שמטופלת בתחום היא קטגוריזציה של מסמכי טקסט. השיטה הבסיסית ביותר לנ"ל היא מציאת המילים והמושגים המאפיינים את המסמך הנבדק (מושגים שמופיעים במסמך יותר פעמים מ"המצופה") וקטלוג המסמך לקבוצת האפיון שלו ע"י שימוש במידע זה בטכנולוגיות מתחום ה TEXT MINING.


למרות שקטגוריזציה בלבד היא משימה מוגבלת למדי זוכה התחום לפריחה הן בגלל המגוון הגדול של השימושים הדורשים טיפל כזה (מנועי חיפוש, מערכות מודיעיניות ועוד) והן בגלל הכמות העצומה של המידע השמור כטקסט בעולם יחסית לכמות המידע השמור בטבלאות.


עם הצטברות המידע נוצר גם הצורך להעניק לו משמעות עבור הארגון, ולשכלל את יכולת האיסוף שלו, ניתוחו, והטמעתו. הרצון הוא להפוך מידע שהוא בגדר רחש סטטי כמעט - לידע. ידע המעניק יתרון תחרותי ויכולת שליטה בארגון פנימה. ידע המאפשר ראיית תמונה נכונה ועדכנית של השוק ומקנה את היכולת להגיב בזמן לשינויים המתרחשים בו.


טכנולוגיית ה- TEXT MINING עדיין בחיתוליה, ועם זאת, מגוון היכולות שהיא מעמידה לנו, מנהלי הידע, משמעותיות לצורך איסוף מדויק יותר של ידע שקיים כבר בארגונים.



כלים אישיים
ניווט

קהילה

חיפוש

תיבת כלים