דגימה ושיטות דגימה – סיכום

דגימה

ההשערות נוגעות לאוכלוסיה מסוימת, אך מכיוון שאי אפשר בד"כ לאסוף מידע על האוכלוסיה כולה, החוקר בודק חלק קטן ממנה- מדגם.
היתרון: חסכון בזמן ומשאבים

החסרון: יש להקיש מתוצאות המדגם אל האוכלוסיה, וייתכן שהתוצאות אינן מייצגות.

מדגם לא מייצג הוא מדגם שאינו משקף את האוכלוסיה לגבי משתנים מסוימים, ובפרט אלו הנבדקים.

מכיוון שמדגם הוא תמיד רק חלק מהאוכלוסיה, תמיד קיים סיכוי שהתוצאות לא ישקפו את התופעה באוכלוסיה כולה, כל שאפשר לעשות זה לנסות להגדיל את הסיכוי שהמדגם יהיה מייצג ע"י הקפדה על שיטות דגימה.

הסיכוי שמדגם ישקף את האוכלוסיה תלוי במידה רבה בשיטת הדגימה:

ישנן 2 שיטות כלליות לדגימה

  1. דגימה הסתברותית– מקיימת 3 תנאים:
    א. לכל הפרטים באוכלוסיה יש הסתברות ידועה להיבחר למדגם.

ב. לשום פרט אין סיכוי וודאי להיבחר.

ג. שום פרט אינו יוצא מכלל האפשרות להיבחר.

במילים אחרות: לכל פרט יש סיכוי ידוע pi להיבחר כאשר 1>pi>0

  1. דגימה לא הסתברותית– לפחות תנאי אחד לא מתקיים: הסתברות הבחירה אינה ידועה/יש פרטים שייבחרו בוודאות/ יש פרטים שבוודאי לא ייבחרו.

מידת האמון במדגם תלויה בהסתברות לטעות. את סיכויי הטעות ניתן לחשב ע"י הסקה סטטיסטית, רק במדגמים שנדגמו בדגימה הסתברותית. לכן, שיטה זו עדיפה על השנייה.

הומוגניות והטרוגניות

לדוגמא 2 מחקרים:

  1. אנתרופולוג פגש 2 אנשים משבט פרימיטיבי, ומן התקשורת שקיימו 2 אנשים אלו ביניהם הסיק כי השפה בין בני השבט כוללת הברות קוליות ותנועות גוף.
  2. במחקר ניסו לאמוד את אחוז הצופים בתוכנית. 20% מהנשאלים במדגם ענו כי הם צופים בה, והחוקר הסיק כי זהו גם אחוז הצופים באוכלוסיה כולה.

בשני מחקרים אלו הוסקו מסקנות ממדגם לאוכלוסיה. אולם יש ביניהם הבדל מהותי, בעוד מסקנת האירוע הראשון תתקבל כתקפה, מסקנת האירוע השני תיתקל בשאלות לגבי גודל המדגם, האם הוא מייצג או לא וכו'.

הבדל זה נעוץ באופי האוכלוסיה הנבדקת לגבי המשתנה:

אנשי השבט הם אוכלוסיה הומוגנית לגבי המשתנה הנחקר – ההנחה היא, שלכל אנשי השבט יש אותו ערך במשתנה "שפה": אין הבדל בשפה בין אנשי השבט השונים. כאשר האוכלוסיה הומוגנית בתכונה הנחקרת, אין חשיבות לגודל המדגם או לצורת הדגימה. גם המדגם המזערי ביותר יספיק כדי להסיק ממנו לאוכלוסיה.

לעומת זאת, באירוע השני האוכלוסיה הייתה הטרוגנית במשתנה הנחקר- מניחים כי לא כל האוכלוסיה צופה בתוכנית, וכי תהיה שונות בין האנשים. אם נדגום רק בני 60 ומעלה, ייתכן שאחוז הצפייה בקרבם שונה מהאחוז בכל האוכלוסיה –  ההבדלים בין תוצאות מדגמים שונים נובעים מההטרוגניות באוכלוסיה.

מידת ההטרוגניות, או השונות, קובעת באיזו מידה ניתן להסיק מהמדגם על האוכלוסיה.

לכן, במחקרים על אוכלוסיות הטרוגניות, יש להקפיד שהמדגם ייצג את האוכלוסיה במשתנה זה.

דגימה לא הסתברותית

יש מקרים בהם דגימה הסתברותית אינה אפשרית או לא הולמת. בעיות עלולות להתעורר בכל אחד משלבי איסוף הנתונים, והן משפיעות על שיטת הדגימה:

  1. בעיות באיתור הנבדקים– כאשר מדובר באוכלוסיה שלא מעוניינת/קשה לחשוף את חבריה (צרכני סמים), גם לחץ חברתי יכול לגרום לאנשים לא לרצות להיחשף (אנאלפביתים, ילדים מחוץ לנישואים).
  2. בעיות בהתקשרות עם הנבדקים– לעתים מדובר באוכלוסיה שקשה להגיע אל אנשיה (מסיימי אוניבר' לפני 20 שנה).
  3. בעיות בשיתוף פעולה– כאשר המחקר מצריך זמן רב/דן בבעיות רגישות. על בעיה זו ניתן להתגבר ע"י מדגם מתנדבים.

דרכים להתגבר:

על בעיות באיתור והתקשרות

  1. מדגם כדור השלג– המדגם נבחר בעזרת קבוצה קטנה של "מודיעים", שמהם מקבלים שמות וכתובות של אנשים נוספים, השייכים לאוכלוסיה הנחקרת. מקובלת מאוד במחקרים על קבוצות מיעוט.
  2. שיטת המכסה– דואגים שאחוז הנבדקים שנבחרים למדגם מקבוצה כלשהי באוכלוסיה יהיה זהה לאחוזם האמיתי באוכלוסיה.

יתרונות:

א. טוב למצבים בהם אין רישום מרכזי של האוכלוסיה, שהוא הכרחי לדגימה הסתברותית.

ב. גם במצבים שיש רישום- זהו חיסכון בזמן ומשאבים. מראיין שצריך לראיין 30 אנשים מסוימים בשכונה מסוימת יקדיש לכך יותר זמן ממראיין שיכול לבחור 30 אנשים כרצונו מאותה שכונה.

החסרון:
מידת היציגות של המדגם- בבחירת הנבדקים המראיין מתרכז במשתנה אחד (לדוגמה השיוך השכונתי) ולא במאפיינים אחרים של הנבדקים. אם, למשל, הוא מראיין אנשים בתחנת האוטובוס של שכונה, סביר שבמדגם יהיו מעט מאוד מבני המעמד הגבוה, שהם בעלי מכוניות פרטיות. אם נושא הראיון קשור למצב כלכלי, עלולה להתקבל תמונה מהמדגם השכונתי, שאינה משקפת את כלל תושבי השכונה.

 

מסגרת הדגימה

כוללת את כל הפרטים מתוכם נלקח המדגם הלכה למעשה. זהות בין מסגרת הדגימה לאוכלוסייה קיימת, רק כאשר יש רשימה מפורטת של האוכלוסייה. למשל, מחקר על עמדות פסיכולוגים בישראל מבוסס על מדגם שנלקח מהכרטסת של הפסיכולוגים החברים בהסתדרות הפסיכולוגים. מכיוון שכל הפסיכולוגים בישראל רשומים בה, יש זהות בין המדגם לאוכלוסיה.
בד"כ מסגרת הדגימה לא זהה לאוכלוסיה, וההיסק הסטטיסטי נעשה רק לגביה. למשל, במחקרים רבים משערים השערות לגבי האוכלוסיה המבוגרת, אולם מכיוון שמרביתם נעשים באוניברסיטה, מסגרת הדגימה היא הסטודנטים (המבוגרים) הרשומים בהן.

למעשה מדובר ב-2 היסקים:

  • סטטיסטי– מהמדגם (הסטודנטים) למסגרת הדגימה (כל הסטודנטים המבוגרים הרשומים באוניברסיטה).
  • אינטואיטיבי– ממסגרת הדגימה (הסטודנטים הרשומים) לאוכלוסיה הנחקרת (המבוגרים).

כשם שדיוק ההיסק הראשון תלוי במידה בה המדגם מייצג את מסגרת הדגימה, כן הדיוק של ההיסק השני תלוי במידה בה מסגרת הדגימה מייצגת את האוכלוסייה.

שיטות הדגימה ההסתברותית מנסות להבטיח, שהמדגם ייצג את מסגרת הדגימה.

הבעיה: יציגות מסגרת הדגימה נראית מובנת מאליה, והרבה הטיות מחקר נובעות מחוסר תשומת לב לפער בין מסגרת הדגימה לאוכלוסיה.  לעיתים בדגימה ההסתברותית לא מבחינים בין מסגרת הדגימה לאוכלוסיה, ודנים על דגימה מתוך אוכלוסייה בהנחה שמסגרת הדגימה כוללת את כולה.

שיטות הדגימה ההסתברותית

תזכורת סטטיסטית:

סטטיסטי– מדד המחושב במדגם (ממוצע, למשל).

פרמטר– מדד המחושב באוכלוסיה (תוחלת, למשל).

התפלגות דגימה– התפלגות סטטיסטי מסוים עבור מדגם בגודל n, שנלקחו מאוכלוסיה מסוימת. למשל, התפלגות הממוצעים של אינסוף מדגמים בגודל 20.

טעות הדגימה– סטיית התקן של התפלגות הדגימה.  מלמדת על גודל הטעות שאפשר לטעות כאשר דוגמים מדגם אחד בלבד, מחשבים ממנו את הסטטיסטי ומקישים ממנו על הפרמטר באוכלוסיה. אם סטיית התקן של התפלגות הדגימה היא גדולה, אז יש סיכוי גדול יותר לטעות.

גודל טעות הדגימה מושפע מ:

  1. 1. סטיית התקן באוכלוסיה– אם האוכלוסיה הומוגנית במשתנה X, כל מדגם (בכל גודל שהוא) ייתן את אותו ממוצע. במקרה הזה ס"ת באוכלוסיה היא אפס, ולכן גם ס"ת בהתפלגות הדגימה היא אפס, ואין כל סיכוי לטעות. ככל שסטיית התקן באוכלוסיה גדלה, המדגמים יהיו הטרוגניים יותר, הממוצעים יהיו שונים זה מזה- וטעות הדגימה תגדל.
  2. גודל המדגם. מדגם גדול יותר- טעות תקן קטנה יותר.

שיטות דגימה הסתברותית

דגימה מקרית פשוטה

דגימה שיטתית

דגימת שכבות

דגימת אשכולות

בחזרה אל: פסיכולוגיה ניסויית – סיכומים

ללמוד טוב יותר:

לקבל השראה:

להפעיל את הראש:

להשתפר: