רגרסיה לוגיסטית (מהשיעור של 28.12.04)

 

אנו מעוניינים לבדוק כיצד מין (מגדר) משפיע על תעסוקה – באיזו מידה מין הנחקר יכול לנבא אם הוא/היא עובד/ת או לא?
"עובד או לא עובד" מהווה משתנה תלוי דיכוטומי. לכן עלינו להשתמש ברגרסיה לוגיסטית ולא ברגרסיה רגילה. המשמעות היא שה"אפקט" של משתנה בלתי תלוי, שנמדד ע"י המקדם שלו (
B), מייצג יחס של סיכויים. נדגים זאת בדוגמא שמתבססת על נתונים אמיתיים מסקר ה-ISSP הישראלי. העיבוד מתייחס למבוגרים בגילאי העבודה המרכזיים (25-54). העיבודים נעשו ב-SPSS.

 

תחילה, הנה המשתנה הבלתי-תלוי, מין, שנקרא WOMEN. במקרה הזה, גם הוא דיכוטומי (1=כן אישה, 0=לא אשה, כלומר גבר).

 

women

 

 

 

Frequency

Percent

Valid Percent

Cumulative Percent

Valid

.00

352

42.5

42.6

42.6

1.00

475

57.4

57.4

100.0

Total

827

99.9

100.0

 

Missing

System

1

.1

 

 

Total

828

100.0

 

 

 

 

כאמור, המשתנה התלוי מודד אם הנחקר/ת עובד/ת או לא. לצורך כך אנו הפכנו את המשתנה "מעמד תעסוקתי" לשתי קטגוריות בלבד,
כן או לא עובד. המשתנה החדש נקרא
WORKING.

 

working

 

 

 

Frequency

Percent

Valid Percent

Cumulative Percent

Valid

.00

143

17.3

17.3

17.3

1.00

684

82.6

82.7

100.0

Total

827

99.9

100.0

 

Missing

System

1

.1

 

 

Total

828

100.0

 

 

 

 
כעת נבקש צילבוח (CROSSTAB) של שני המשתנים. אנו רואים שבעוד ש-96% של הגברים עובדים, רק 73% של הנשים עובדות.
 

working * women Crosstabulation
% within women

 

 

 

women

Total

 

.00

1.00

 

working

.00

3.7%

27.4%

17.3%

 

1.00

96.3%

72.6%

82.7%

 

Total

100.0%

100.0%

100.0%

 

 

להלן אותה טבלה עם מספר אך בהצגת מספר המקרים במקום אחוזים.

 

working * women Crosstabulation
Count

 

 

 

women

Total

 

.00

1.00

 

working

.00

13

130

143

 

1.00

338

345

683

 

Total

351

475

826

 

 

להלן קטע של גיליון EXCEL. תחילה אנחנו רואים העתק של הטבלה שלעיל, בתוספת סימון של הטורים והשורות. הסימון יאפשר לנו לעשות מניפולציות של הנתונים. ראו למשל את השורה הראשונה שמתחת לטבלה: "ההסתברות שאישה תעבוד". ה"נוסח" שמחשב נתון זה מופיע ליד: 
הוא מחלק את התא
D5 (מספר הנשים שעובדות – 375) בתא D6 (סה"כ מספר הנשים – 475). התוצאה = .73 (כלומר, 73%).
 
 

A

B

C

D

E

 

2

 

women

 

 

3

working

0

1

Total

 

4

0

13

130

143

 

5

1

338

345

683

 

6

Total

351

475

826

 

7

 

 

 

 

 

8

 

 

0.73

=D5/D6

ההסתברות שאישה תעבוד

9

 

 

2.65

=D5/D4

הסיכוי שאישה תעבוד

10

 

 

26.00

=C5/C4

הסיכוי שגבר יעבוד

11

 

 

0.102

=D9/D10

היחס בין הסיכויים

12

 

 

-2.282

=LN(E12)

הלוגריתם של יחס הסיכויים

 

 

 

 

 

 

 
השורות הבאות מציגות כיצד מחשבים סיכויים יחס של סיכויים – שימו לב לשוני מחישוב של הסתברות. עברו על השורות הללו בעיון – הם מסבירים את עצמם!
יחס הסיכויים הנו .102 , במילים אחרות 10% בקירוב. המשמעות היא שהסיכוי שאישה תעבוד הוא רק כעשירית הסיכוי שגבר יעבוד. 
השורה האחרונה (מסומן בצהוב) מציג את הלוגריתם הטבעי של יחס הסיכויים. למה? משום שזה בעצם המקדם שיתקבל למשתנה מין ברגרסיה לוגיסטית שבוחנת את הקשר בין מין ותעסוקה. את זה נוכל ליראות ע"י הרצת הרגרסיה הנ"ל ב-SPSS. המשתנה התלוי הנו WORKING והמשתנה הבלתי תלוי הנו WOMEN.

Logistic Regression

Variables in the Equation

 

 

 

B

S.E.

Wald

df

Sig.

Exp(B)

Step 1(a)

women

-2.282

.301

57.564

1

.000

.102

Constant

3.258

.283

132.886

1

.000

26.000

a Variable(s) entered on step 1: women.


התוצאות של הרגרסיה מראות שהמקדם B של המשתנה WOMEN (-2.282) הוא אכן זהה לחישוב ב-EXCEL של הלוגריתם של יחס הסיכויים לעבוד של נשים לעומת גברים. יתר על כן, לנוחיותנו SPSS אף מציג את יחס הסיכויים בטור הימיני של הפלט (.102). נתון זה לא מחושב בדרך שאנחנו עשינו קודם ב-EXCEL. SPSS מחשב אותו ע"י הפיכת המקדם B ממספר לוגריתמי למספר רגיל, באמצעות פונקציה שנקראת EXPONENT – לכן הכותרת "Exp(B)".
היתרון של השימוש ברגרסיה לוגיסטית הוא אותו יתרון שיש באופן כללי לרגרסיה מרובה – היכולת לבדוק את האפקט של גורם כלשהו תוך בקרה על השפעות של גורמים אחרים. למשל, מה יקרה לסיכוי היחסי של נשים/גברים לעבוד אחרי פיקוח על גיל, השכלה, וכדומה? אם יש נטייה לנשים להיות מבוגרות יותר ומשכילות פחות מגברים זה אולי יסביר חלק של האפקט הגולמי ("ברוטו") של מין על תעסוקה.