ניתוח טקסט כרשת של מילים

מחקר חדש של פרופ' אלעד שגב מהחוג לתקשורת  של אוניברסיטת תל אביב שפיתח שיטה לתרגם טקסטים ארוכים לרשת סמנטית של מילים.

אנו חיים בחברה שמייצרת וצורכת כמות הולכת וגדלה של מידע בערוצי מדיה שונים. אנו קוראים חדשות בכל מקום ובכל זמן, חולקים חוויות ברשתות החברתיות, ונחשפים  לפרסום גלוי וסמוי. חלק מהמידע נכתב על ידי אנשים וחלק על ידי בוטים שמתוכנתים לקידום אינטרסים פוליטיים וכלכליים.

הזמינות של נתוני עתק אטרקטיבית במיוחד עבור חוקרי התקשורת, מדעי המדינה ומדעי החברה, המעוניינים ללמוד על עולמנו המשתנה ולחשוף את מבני הכוח בחברה. יחד עם זאת, ברוב המקרים, לא מכשירים אותנו להשתמש ולנתח נתוני עתק, וחוקרים בסופו של דבר מתפשרים על שימוש בגישות איכותיות מסורתיות (כגון ניתוח שיח) או כמותי (כגון ספר קידוד) בעת ניתוח מאמרים בעיתונים, נאומים פוליטיים או נתונים ברשתות חברתיות. שיטות מסורתיות כאלה דורשות כמות ניכרת של משאבי אנוש, גוזלות הרבה זמן, ומוגבלות לכמות קטנה יחסית של טקסט. ישנה דרישה גוברת בקרב החוקרים לשיטות חדשות לארגן, לזהות דפוסים ומבנים, ולהבין את המשמעויות של מידע בקנה מידה מאסיבי שכזה.

בכדי להתמודד עם האתגר הזה, פרופ' אלעד שגב מהחוג לתקשורת באוניברסיטת תל אביב פיתח שיטה לתרגם טקסטים ארוכים לרשת סמנטית של מילים. ניתוח רשת סמנטית הוא גם דרך לתרגם את הטקסט הליניארי למפה חזותית דו-ממדית, המאפשרת לחוקרים להתבונן בתוכן מלמעלה ולזהות את המילים המרכזיות ביותר בטקסט, ואת אשכולות המלים המבטאים משמעויות ייחודיות. הרעיון הוא פשוט. אנו משתמשים בתוכנה קלה וידידותית שפיתח פרופ' שגב כדי לזהות מילים מרכזיות שמופיעות יחד באותו משפט או פוסט. כשיש מיליוני משפטים או פוסטים כאלו, נוצרת רשת המשקפת את התכנים המרכזיים בטקסט. ניתן להשתמש בכלי מחקר מתקדמים לניתוח רשתות כדי לזהות אשכולות של מילים (בדומה לעיקרון של למידת מכונה בלתי מונחית), שבסופו של דבר יוצרים תמות. היישומים האפשריים של ניתוח רשת סמנטית במחקר הם רבים ומגוונים, החל ממיפוי המיסגורים והנושאים העיקריים המופיעים בנתוני עתק (כגון תכנים ברשתות חברתיות, חדשות, התבטאויות פוליטיות, תמלילי ראיונות ומאמרים אקדמיים) וחלה הניסיון לחשוף הטיות ומניפולציות במידע שאנו נחשפים אליו.

בחוג לתקשורת באוניברסיטת תל אביב סטודנטים לומדים קורס ייעודי ומפתחים פרויקטים משלהם הכוללים ניתוח של טקסטים גדולים.

הספר החדש של פרופ' שגב Semantic Network Analysis in Social Sciences בהוצאת Routledge מציג את השלבים הבסיסיים הנדרשים לניתוח רשת טקסטואלית. הספר מיועד לחוקרים ולסטודנטים ללא רקע מוקדם, ומפרט באופן פשוט את השלבים הנדרשים בכדי לבצע ניתוח רשת של מילים בטקסט. בספר גם מוצגים מחקרים עדכניים בתחומים שונים, בין היתר, ניתוח של נושאים המופיעים בחדשות המודפסות ובטלוויזיה, ניתוח נאומי של פוליטיקאים, ניתוח תכנים ברשתות החברתיות ותוכן גולשים, ואפילו ניתוח של מחקרים אחרים לצורך בניית סקירת ספרות, וניתוח נתוני מחקר כמו תימלולים של ראיונות לצורך זיהוי התמות המרכזיות העולות מהשיח.

 

אוניברסיטת תל אביב עושה כל מאמץ לכבד זכויות יוצרים. אם בבעלותך זכויות יוצרים בתכנים שנמצאים פה ו/או השימוש
שנעשה בתכנים אלה לדעתך מפר זכויות, נא לפנות בהקדם לכתובת שכאן >>