top of page

איך לנתח נתונים בתוכנת ספסס שלב אחר שלב?

תמונת הסופר/ת:  Sigal Tifferet Sigal Tifferet

עודכן: 24 ביוני 2023


תוכנת ספסס SPSS היא תוכנה לעיבודים סטטיסטיים המשמשת סטודנטים רבים במדעי החברה. לטובת הסטודנטים והסטודנטיות שלי, הכנתי רשימה של צעדים מומלצים בניתוח הנתונים בעזרת התוכנה. רשימה זו מהווה תזכורת למי שכבר למדו SPSS בעבר. ניתן להיעזר גם בסרטוני ההדרכה וגם ב־ChatGPT.



1. הכנסת הנתונים לספסס

בשלב הראשון יש להכניס את הנתונים לתוכנה. אפשר להקליד אותם ידנית, לייבא קובץ CSV או לייבא מידע מתוכנת המחקר Qualtrics.


שאלון ידני

אם מקלידים נתונים של שאלון מנייר, כל נבדק הוא שורה וכל שאלה היא עמודה נפרדת. יש להזין את כל המשתנים שנאספו בשאלונים כפי שהם, מבלי לעשות עליהם כל מניפולציה. על כל שאלון נייר רשמו מספר סידורי והוסיפו משתנה זה לעמודה הראשונה בקובץ.


קובץ אקסל או גוגל דוקס

אם הנתונים שלכם נמצאים בקובץ אקסל, יש לייבא את הנתונים: File > Open > Data > Files of type > Excel.

אם הנתונים נמצאים ב Google Forms צריך לייבא אותם קודם לאקסל Data > From Text > Import > Next > Comma > Next > Done > OK, ואז לייבא ל SPSS.


קוואלטריקס Qualtrics

תוכנת קוואלטריקס היא תוכנה מורכבת לאיסוף מידע מסקרים. הכנתי לכם מספר סרטונים המסבירים איך לעבוד עליה. רצף השלבים מעט שונה לפי רמת המורכבות של המחקר.

1.1. אם יש לכם נתונים פשוטים מקוואלטריקס:

1.1.1. על מנת להקל על המשך העבודה, תוודאו שנתתם שמות נוחים באנגלית למשתנים שלכם בתוך השאלון של קוואלטריקס. אם לא עשיתם זאת, כדאי לכם לשנות את שמות המשתנים הנמצאים בצד השמאלי של כל שאלה.

1.1.2. לאחר סיום איסוף הנתונים יש להוריד את הנתונים לקובץ ספסס: Data & Analysis > Export & Import > Export Data > SPSS > Download

*אם בטעות זה מוריד לכם קובץ ZIP, לחצו על More Options ובטלו את ההגדרה הזו.

1.1.3. בשלב זה, ניתן לפתוח את קובץ הספסס שנוצר. שמרו אותו פעם אחת כקובץ גולמי למקרה שתהיינה בהמשך טעויות. מומלץ שלא למחוק משתנים, גם אם אינכם מבינים את משמעותם.

1.1.4 מחקו את התצפיות (שורות) שאתם לא רוצים לנתח.

ראשית, מחקו את השורות של ה preview. אלה שורות שנוצרו כאשר בדקתם את השאלון שלכם. תמצאו אותן בעזרת המשתנה שנקרא DistributionChannel.

לאחר מכן, מומלץ למחוק את התצפיות של נבדקים שסתם ענו על השאלון שלכם, מבלי לקרוא אותו. חשבו מהו משך הזמן המינימלי שאמור לקחת מילוי השאלון. עברו על המשתנה Duration_in_seconds ואם יש אנשים שלקח להם הרבה פחות זמן - רצוי למחוק אותם. את הפרטים האלה תרשמו אחר־כך בפרק השיטה.

לבסוף, אפשר למחוק גם נבדקים שלא ענו על רוב השאלון. נבדקת לא חייבת לענות על כל השאלות, אבל אם היא לא ענתה על רובו - המידע שלה לא יעזור לנו, ולכן אפשר למחוק אותו.

1.2 אם יש לכם נתונים מקוואלטריקס של ניסוי עם הקצאה רנדומלית לקבוצות (קצת יותר מסובך):

אם השתמשתם ב-randomizer, עשו את הפעולות הבאות במקום סעיף 1.1.2:

1.2.1. לאחר סיום איסוף הנתונים הורידו את הנתונים לקובץ ספסס. Data & Analysis > Export & Import > Export Data > SPSS > More Options > Export viewing order data for randomized surveys > Download

1.2.2. האופציה הזו תוסיף לכם עמודה לקובץ שמציינת איזה בלוק קיבל כל נבדק, כלומר, באיזה תנאי הוא השתתף. אתם תראו את המשתנה החדש הזה בסוף הקובץ, כנראה ששמה יתחיל באותיות FL. יכול להיות שתקבלו שני משתנים כאלה, השתמשו רק באחד מהם. משתנה זה הופך להיות המשתנה הבלתי-תלוי שלכם. אם הוא מקודד כטקסט, עשו לו Recode כך שיהיה מספר, והגדירו אותו כ-Numeric. השתמשו בפקודת Recode כדי לייצר למשתנה החדש שני ערכים: 0 = ביקורת, 1 = ניסוי.

1.2.3. הבעיה בקובץ כרגע, היא שקוואלטריקס יצר שורות ארוכות לכל נבדק, כאשר חלק מהשורה חסר. זה קורה מכיוון שהנבדק לא מילא את שני התנאים, אלא רק אחד מהם. למשל, אם יש לי שאלה של אטרקטיביות היא תופיע בקובץ פעמיים: פעם אחת אטרקטיביות בתנאי א' (a1), ופעם שניה אטרקטיביות בתנאי ב' (a2). לכל נבדק יהיה ערך רק באחת העמודות הללו, כי הוא השתתף רק באחד התנאים. מה שצריך לעשות כעת זה ליצור משתנים חדשים שישלבו את שתי העמודות, כך שתהיה עמודה אחת שתכלול את התוצאות של שני התנאים. אחת הדרכים שמצאתי לעשות זאת היא ליצור משתנה חדש שיהיה ממוצע של שני המשתנים הללו: Transform > Compute Variable ואז כותבים את שם המשתנה החדש anew ואת הפונקציה MEAN(a1,a2). אם אתן מכירות דרך טובה יותר לעשות זאת, אשמח אם תכתבו לי.

1.2.4. אפשר גם להדביק את השורה הבאה בתוך הסינטקס שלכם עם שמות המשתנים שלכם: COMPUTE anew= MEAN(a1,a2). ניתן להעתיק את שורת הסינטקס הזו כמה פעמים שצריך, כך שתכסו את כל השאלות שנמצאות בתוך הבלוק שעבר הקצאה מקרית (לא צריך לעשות זאת לכל השאלות בשאלון, רק לאלה שהיו שונות בין שתי הגרסאות). זכרו בכל שורה בסינטקס לתקן את השמות בהתאם לפריט שאתם מחליפים.

חזרו לשלב 1.1.4 ומחקו את התצפיות המיותרות


2. הגדרת משתנים

לאחר שהעברתם את הנתונים שלכם לתוך SPSS, צריך להגדיר אותם בתוך ה Variable View.

2.1. שם הקובץ ושמות המשתנים בקובץ אמורים לכלול רק אותיות באנגלית. את התוויות Labels והערכים Values רצוי אך לא הכרחי לרשום באנגלית, כי אותיות בעברית עלולות להפוך לג'יבריש במעבר מגרסא אחת של SPSS לגרסא אחרת.

2.2. בכל משתנה יש להקפיד לרשום תיאור מלא של ערכי המשתנה Values, ואם שם המשתנה לא מייצג בצורה חד משמעית את מהות המשתנה יש לרשום הסבר ב Labels. אם השתמשתם בקוואלטריקס, ה Labels יראו לכן את נוסח השאלה וה Values יעודכנו אוטומטית.

2.3. תחת העמודה של Measure הגדירו את סולם המדידה של המשתנים. Nominal למשתנים שאין להם משמעות כמותית, Ordinal למשתנים שיש להם רק משמעות כמותית של סדר, Scale למשתנים שיש בהם יחידת מדידה.

* אם אין לכם אפשרות להגדיר Scale, סימן ש-Type המשתנה שלכם מוגדר בטעות כ-String. שנו אותו ל-Numeric.


3. טרנספורמציה של משתנים

3.1. הריצו Frequencies לכל המשתנים: Analyze > Descriptive Statistics > Frequencies. בדקו את ערכי המינימום והמקסימום של כל המשתנים וודאו שהם הגיוניים. לדוגמא, לפעמים בקוואלטריקס סולם של 1-10 מקבל בטעות גם ערכים של 12, 13.

3.1.1 אם אתם מזהים טעות כזו, הסתכלו בעמודה של Values ותראו אם הערכים מוגדרים היטב. אם הם לא מוגדרים היטב, יש לכן שתי אפשרויות: לשנות אותם בתוך SPSS בעזרת פקודת recode או לחזור לתוכנת Qualtrics ולשנות שם את הערכים. איך משנים את הערכים בQualtrics? לוחצים על השאלה הרלוונטית, בצד שמאל ייפתח סרגל, בחרו באופציה של Recode Values, ושנו שם לערכים הרצויים. עכשיו אפשר להוריד את הנתונים מחדש.

3.2. אם יש לכם פריטים המנוסחים הפוך, צריך לקודד אותם מחדש Transform > Recode into different variables.

3.3. אם יש לכם שאלון המודד את אחד המשתנים באמצעות מספר שאלות (משתנה אינדקס), בדקו את רמת המהימנות הפנימית שלו באמצעות בדיקת אלפא של קרונבך: Analyze > Scale > Reliability Analysis. בחרו את כל הפריטים הבודדים של הסולם. לחצו על Statistics וסמנו את האפשרות Scale if item deleted. הריצו ובדקו שרמת המהימנות היא מעל 0.7. עברו על הפריטים השונים וראו מה קורה לאלפא אם מוותרים על פריט מסוים.

3.3.1 שימו לב, לא זורקים פנימה את כל השאלות של השאלון, רק קבוצה של שאלות שמודדת את אותו המשתנה.

3.3.2 שימו לב, אם הנבדקת שלכם עונה על אותו משתנה אינדקס כמה פעמים (למשל עונה על שאלון אטרקטיביות ביחס לכמה גברים שונים), יש לחשב אלפא-קרונבך בנפרד לכל פעם (דמות). זאת משום שאנחנו מצפים שהתשובות תהיינה דומות לאותו גבר, אבל לא לכל הגברים. במקרה כזה, נציג טווח של אלפות שהתקבלו.

3.3.3 אם מערך המחקר שלכם הוא ניסויי, כלומר יש נבדקות שראו תמונות של גברים עם זקן ויש נבדקות שראו תמונות של אותם הגברים ללא זקן, אין צורך לחשב אלפא-קרונבך בנפרד לשני תנאי הניסוי. אלפא-קרונבך מודד עקביות בתוך התשובות של אותה הנבדקת. מכיוון שכל נבדקת ענתה על תנאי אחר, אפשר בדרך-כלל להריץ אלפא-קרונבך על כל הנבדקות, ללא קשר לתנאי בו הן השתתפו.

3.4. כעת נעבור ליצירת משתנים מסכמים. אם יש לכם משתנה אחד שנמדד בעזרת מספר שאלות (משתנה אינדקס), עליכם לסכם את כל השאלות באמצעות Transform > Compute Variable. תחשבו ממוצע באמצעות הפונקציה MEAN. מקבול לקבוע את סולם המדידה של משתנה אינדקס ל-Scale, למרות שבמקור כל שאלה בתוכו היא Ordinal.

4. בדיקה ראשונית של קשרים בין משתנים

תייצרו טבלת מתאמים של כל המשתנים המסכמים שלכם (לא של שאלות בודדות מתוך שאלון) ועברו על המתאמים: Analyze > Correlate > Bivariate. ראו אם המתאמים מתאימים להשערות שלכם. בדקו האם יש מתאמים מעניינים שלא ציפיתם להם. בדקו אם המשתנים שלכם (מב"ת, ומ"ת) נמצאים במתאם עם משתנים דמוגרפיים. אם כן, יהיה חשוב לנטרל אותם בהמשך.

5. בדיקת השערות

בחרו את המבחן הסטטיסטי המתאים לכם לפי סולם המדידה של המשתנה הבלתי-תלוי (מב"ת) והמשתנה התלוי (מ"ת). לפרטים מלאים יותר, צפו בסרטון של המבחן המתאים: מבחן T למדגמים בלתי-תלויים (רגיל), מבחן T למדגמים תלויים, מתאם פירסון, רגרסיה מרובה, חי בריבוע.


6. רגרסיה מרובה

אם ההשערה שלכם בודקת קשר של יותר משני משתנים בו זמנית, עליכם להריץ רגרסיה מרובה. ישנן מספר שיטות שונות לבצע רגרסיה מרובה. ההבדלים בין השיטות נעוצים בסדר הכנסת המשתנים למשוואה. בכל מקרה, לרגרסיה רצוי להכניס רק משתנים שיש לנו סיבה טובה לחשוב שהם מנבאים, ולהשתדל שיהיו כמה שפחות מנבאים. מומלץ לעבוד בדרך הנקראת Forced entry (Enter) שהיא הכנסה בו זמנית של כל המנבאים שנבחרו. לפי שיטה זו בשלב הראשון מכניסים את כל המנבאים שנבחרו, בודקים את הממצאים, ואז עורכים רגרסיה שנייה (שלב שני) ומכניסים רק את המשתנים שנמצאו מובהקים בשלב הראשון. Analyze > Regression > Linear בוחרים את המשתנה המנובא Dependent ואת המנבאים Independents.


אם התזכורת הקצרה הזו לא מספיק מפורטת עבורכן, היכנסו לפלייליסט, שם תוכלו לקבל מידע נוסף גם ברמה של מתחילים וגם ברמה של מנוסים יותר. בהצלחה!

bottom of page