• Sigal Tifferet

איך לנתח נתונים בתוכנת ספסס שלב אחר שלב?

עודכן ב: אפר 11


תוכנת ספסס SPSS היא תוכנה לעיבודים סטטיסטיים המשמשת סטודנטים רבים במדעי החברה. לטובת הסטודנטים שלי, הכנתי רשימה של צעדים מומלצים בניתוח הנתונים בעזרת התוכנה. רשימה זו מהווה תזכורת למי שכבר למדה ספסס בעבר. ניתן להיעזר גם בסרטוני ההדרכה.



1. הכנסת הנתונים לספסס

בשלב הראשון יש להכניס את הנתונים לתוכנה. אפשר להקליד אותם ידנית, לייבא קובץ CSV או לייבא מידע מתוכנת המחקר Qualtrics.


שאלון ידני


אם מקלידים נתונים של שאלון מנייר, כל נבדק הוא שורה וכל שאלה היא עמודה נפרדת. יש להזין את כל המשתנים שנאספו בשאלונים כפי שהם, מבלי לעשות עליהם כל מניפולציה. על כל שאלון נייר רשמו מספר סידורי והוסיפו משתנה זה לעמודה הראשונה בקובץ.


קובץ אקסל או גוגל דוקס


אם הנתונים שלכם נמצאים בקובץ אקסל, יש לייבא את הנתונים: File > Open > Data > Files of type > Excel.

אם הנתונים נמצאים ב Google Forms צריך לייבא אותם קודם לאקסל Data > From Text > Import > Next > Comma > Next > Done > OK, ואז לייבא ל SPSS.


קוואלטריקס Qualtrics


תוכנת קוואלטריקס היא תוכנה מורכבת לאיסוף מידע מסקרים. הכנתי לכם מספר סרטונים המסבירים איך לעבוד עליה. רצף השלבים מעט שונה לפי רמת המורכבות של המחקר.

1.1. אם יש לכם נתונים פשוטים מקוואלטריקס:

1.1.1. על מנת להקל על המשך העבודה, תוודאו שנתתם שמות נוחים למשתנים שלכם בתוך השאלון של קוואלטריקס. אם לא עשיתם זאת, כדאי לכם לשנות את שמות המשתנים הנמצאים בצד השמאלי של כל שאלה.

1.1.2. לאחר סיום איסוף הנתונים יש להוריד את הנתונים לקובץ ספסס: Data & Analysis > Export & Import > Export Data > SPSS > Download

*אם בטעות זה מוריד לכם קובץ ZIP, לחצו על More Options ובטלו את ההגדרה הזו.

1.1.3. בשלב זה, ניתן לפתוח את קובץ הספסס שנוצר. שמרו אותו פעם אחת כקובץ גולמי למקרה שתהיינה בהמשך טעויות. עכשיו ניתן לנקות אותו ולמחוק ממנו את כל העמודות המיותרות שהוכנסו ע"י קוואלטריקס. כן כדאי לשמור את העמודה הנקראת Duration המראה לנו את משך הזמן שהנבדק מילא את השאלון.


1.2 אם יש לכם נתונים מקוואלטריקס של ניסוי עם הקצאה רנדומלית לקבוצות (קצת יותר מסובך):

אם השתמשתם ב-randomizer, עשו את הפעולות הבאות במקום סעיף 1.1.2:

1.2.1. לאחר סיום איסוף הנתונים הורידו את הנתונים לקובץ ספסס. Data & Analysis > Export & Import > Export Data > SPSS > More Options > Export viewing order data for randomized surveys > Download

1.2.2. האופציה הזו תוסיף לכם עמודה לקובץ שמציינת איזה בלוק קיבל כל נבדק, כלומר, באיזה תנאי הוא השתתף. אתם תראו את המשתנה החדש הזה בסוף הקובץ. משתנה זה הופך להיות המשתנה הבלתי-תלוי שלכם. אם הוא רשום כטקסט, עשו לו Recode כך שיהיה מספר, והגדירו אותו כ-Numeric.

1.2.3. הבעיה בקובץ כרגע, היא שקוואלטריקס יצר שורות ארוכות לכל נבדק, כאשר חלק מהשורה חסר. זה קורה מכיוון שהנבדק לא מילא את שני התנאים, אלא רק אחד מהם. למשל, אם יש לי שאלה של אטרקטיביות היא תופיע בקובץ פעמיים: פעם אחת אטרקטיביות בתנאי א' (a1), ופעם שניה אטרקטיביות בתנאי ב' (a2). לכל נבדק יהיה ערך רק באחת העמודות הללו, כי הוא השתתף רק באחד התנאים. מה שצריך לעשות כעת זה ליצור משתנים חדשים שישלבו את שתי העמודות, כך שתהיה עמודה אחת שתכלול את התוצאות של שני התנאים. אחת הדרכים שמצאתי לעשות זאת היא ליצור משתנה חדש שיהיה ממוצע של שני המשתנים הללו: Transform > Compute Variable ואז כותבים את שם המשתנה החדש anew ואת הפונקציה MEAN(a1,a2). אם אתן מכירות דרך טובה יותר לעשות זאת, אשמח אם תכתבו לי.

1.2.4. אפשר גם להדביק את השורה הבאה בתוך הסינטקס שלכם עם שמות המשתנים שלכם: COMPUTE anew= MEAN(a1,a2). ניתן להעתיק את שורת הסינטקס הזו כמה פעמים שצריך, כך שתכסו את כל השאלות שנמצאות בתוך הבלוק שעבר הקצאה מקרית (לא צריך לעשות זאת לכל השאלות בשאלון, רק לאלה שהיו שונות בין שתי הגרסאות). זכרו בכל שורה בסינטקס לתקן את השמות בהתאם לפריט שאתם מחליפים.


2. הגדרת משתנים


לאחר שהעברתם את הנתונים שלכם לתוך SPSS, צריך להגדיר אותם.

2.1. הקובץ אמור לכלול רק אותיות באנגלית. זה נכון לגבי שמות המשתנים, התוויות Labels, הערכים Values ושם הקובץ. אותיות בעברית עלולות להפוך לג'יבריש במעבר מגרסא אחת של SPSS לגרסא אחרת.

2.2. בכל משתנה יש להקפיד לרשום תיאור מלא של ערכי המשתנה Values, ובמידה ושם המשתנה לא מייצג בצורה חד משמעית את מהות המשתנה יש לרשום הסבר ב Labels.

2.3. תחת העמודה של Measure הגדירו את סולם המדידה של המשתנים. Nominal למשתנים שאין להם משמעות כמותית, Ordinal למשתנים שיש להם רק משמעות כמותית של סדר, Scale למשתנים שיש בהם יחידת מדידה.

* אם אין לכם אפשרות להגדיר Scale, סימן ש-Type המשתנה שלכם מוגדר בטעות כ-String. שנו אותו ל-Numeric.


3. טרנספורמציה של משתנים


3.1. הריצו Frequencies לכל המשתנים: Analyze > Descriptive Statistics > Frequencies. בדקו את ערכי המינימום והמקסימום של כל המשתנים וודאו שהם הגיוניים.

3.2. אם יש לכם פריטים המנוסחים הפוך, צריך לקודד אותם מחדש Transform > Recode into different variables.

3.3. אם יש לנו שאלון המודד את אחד המשתנים באמצעות מספר שאלות (משתנה אינדקס), נבדוק את רמת המהימנות הפנימית שלו באמצעות בדיקת אלפא של קרונבך: Analyze > Scale > Reliability Analysis. בחרו את כל הפריטים הבודדים של הסולם. לחצו על Statistics וסמנו את האפשרות Scale if item deleted. הריצו ובדקו שרמת המהימנות היא מעל 0.7. עברו על הפריטים השונים וראו מה קורה לאלפא אם מוותרים על פריט מסוים.

3.3.1 שימו לב, אם הנבדקת שלכם עונה על אותו משתנה אינדקס כמה פעמים (למשל עונה על שאלון אטרקטיביות ביחס לכמה גברים שונים), יש לחשב אלפא-קרונבך בנפרד לכל פעם (דמות). זאת משום שאנחנו מצפים שהתשובות תהיינה דומות לאותו גבר, אבל לא לכל הגברים.

3.3.2 אם מערך המחקר שלכם הוא ניסויי, כלומר יש נבדקות שראו תמונות של גברים עם זקן ויש נבדקות שראו תמונות של אותם הגברים ללא זקן, אין צורך לחשב אלפא-קרונבך בנפרד לשני תנאי הניסוי. אלפא-קרונבך מודד עקביות בתוך התשובות של אותה הנבדקת. מכיוון שכל נבדקת ענתה על תנאי אחר, אפשר בדרך-כלל להריץ אלפא-קרונבך על כל הנבדקות, ללא קשר לתנאי בו הן השתתפו.

3.4. כעת נעבור ליצירת משתנים מסכמים. אם יש לכם משתנה אחד שנמדד בעזרת מספר שאלות (משתנה אינדקס), עליכם לסכם את כל השאלות באמצעות Transform > Compute Variable. תחשבו ממוצע באמצעות הפונקציה MEAN. מקבול לקבוע את סולם המדידה של משתנה אינדקס ל-Scale, למרות שבמקור כל שאלה בתוכו היא Ordinal.

4. בדיקה ראשונית של קשרים בין משתנים


תייצרו טבלת מתאמים של כל המשתנים המסכמים שלכם (לא של שאלות בודדות מתוך שאלון) ועברו על המתאמים: Analyze > Correlate > Bivariate. ראו אם המתאמים מתאימים להשערות שלכם. בדקו האם יש מתאמים מעניינים שלא ציפיתם להם. בדקו אם המשתנים שלכם (מב"ת, ומ"ת) נמצאים במתאם עם משתנים דמוגרפיים. אם כן, יהיה חשוב לנטרל אותם בהמשך.

5. בדיקת השערות


בחרו את המבחן הסטטיסטי המתאים לכם לפי סולם המדידה של המשתנה הבלתי-תלוי (מב"ת) והמשתנה התלוי (מ"ת). לפרטים מלאים יותר, צפו בסרטון של המבחן המתאים: מבחן T למדגמים בלתי-תלויים (רגיל), מבחן T למדגמים תלויים, מתאם פירסון, רגרסיה מרובה, חי בריבוע.


6. רגרסיה מרובה

אם ההשערה שלכם בודקת קשר של יותר משני משתנים בו זמנית, עליכם להריץ רגרסיה מרובה. ישנן מספר שיטות שונות לבצע רגרסיה מרובה. ההבדלים בין השיטות נעוצים בסדר הכנסת המשתנים למשוואה. בכל מקרה, לרגרסיה רצוי להכניס רק משתנים שיש לנו סיבה טובה לחשוב שהם מנבאים, ולהשתדל שיהיו כמה שפחות מנבאים. מומלץ לעבוד בדרך הנקראת Forced entry (Enter) שהיא הכנסה בו זמנית של כל המנבאים שנבחרו. לפי שיטה זו בשלב הראשון מכניסים את כל המנבאים שנבחרו, בודקים את הממצאים, ואז עורכים רגרסיה שנייה (שלב שני) ומכניסים רק את המשתנים שנמצאו מובהקים בשלב הראשון. Analyze > Regression > Linear בוחרים את המשתנה המנובא Dependent ואת המנבאים Independents.


אם התזכורת הקצרה הזו לא מספיק מפורטת עבורכן, היכנסו לפלייליסט, שם תוכלו לקבל מידע נוסף גם ברמה של מתחילים וגם ברמה של מנוסים יותר. בהצלחה!

250 צפיות0 תגובות

© 2019 by Sigal Tifferet

  • YouTube - White Circle

ד"ר סיגל תפארת, המרכז האקדמי רופין

This site was designed with the
.com
website builder. Create your website today.
Start Now