مقالات

10.1: أحادي الاتجاه ANOVA - الرياضيات


الغرض من اختبار (ANOVA ) أحادي الاتجاه هو تحديد وجود فرق معتد به إحصائيًا بين العديد من وسائل المجموعة. يستخدم الاختبار بالفعل الفروق للمساعدة في تحديد ما إذا كانت الوسائل متساوية أم لا. لإجراء اختبار أحادي الاتجاه (ANOVA ) ، هناك عدة افتراضات أساسية يجب تحقيقها:

يجب تحقيق خمسة افتراضات أساسية حول ANOVA أحادي الاتجاه

  1. يفترض أن تكون كل مجموعة يتم أخذ عينة منها طبيعية.
  2. يتم اختيار جميع العينات بشكل عشوائي ومستقل.
  3. يُفترض أن يكون للمجموعات انحرافات معيارية (أو تباينات) متساوية.
  4. العامل هو متغير قاطع.
  5. الاستجابة متغير عددي.

الفرضيات الباطلة والبديلة

الفرضية الصفرية هي ببساطة أن جميع وسائل المجموعة السكانية هي نفسها. الفرضية البديلة هي أن زوجًا واحدًا على الأقل من الوسائل مختلف. على سبيل المثال ، إذا كانت هناك مجموعات (ك ):

  • (H_ {0}: mu_ {1} = mu_ {2} = mu_ {3} = dotsc = mu_ {k} )
  • (H_ {a}: text {اثنان على الأقل من المجموعة تعني} mu_ {2} = mu_ {3} = dotsc = mu_ {k} text {لا تساوي} )

الرسوم البيانية ، وهي مجموعة من المخططات الصندوقية التي تمثل توزيع القيم مع مجموعة الوسائل المشار إليها بخط أفقي عبر المربع ، تساعد في فهم اختبار الفرضية. في الرسم البياني الأول (مخططات المربع الأحمر) ، (H_ {0}: mu_ {1} = mu_ {2} = mu_ {3} ) ويكون للمجموعات الثلاثة نفس التوزيع إذا كانت الفرضية الصفرية صحيحة . تباين البيانات المجمعة هو تقريبًا نفس تباين كل مجموعة من المجموعات السكانية.

إذا كانت الفرضية الصفرية خاطئة ، فإن تباين البيانات المجمعة يكون أكبر بسبب الوسائل المختلفة كما هو موضح في الرسم البياني الثاني (مخططات الصندوق الأخضر).

الشكل ( PageIndex {1} ): (أ) (H_ {0} ) صحيح. جميع الوسائل هي نفسها ؛ الاختلافات بسبب الاختلاف العشوائي. (ب) (H_ {0} ) ليس صحيحًا. كل الوسائل ليست هي نفسها. الاختلافات أكبر من أن تكون بسبب الاختلاف العشوائي.

مراجعة الفصل

يوسع تحليل التباين مقارنة مجموعتين إلى عدة مجموعات ، كل منها مستوى متغير فئوي (عامل). العينات من كل مجموعة مستقلة ، ويجب اختيارها عشوائيا من السكان العاديين مع تباينات متساوية. نحن نختبر الفرضية الصفرية المتمثلة في الوسائل المتساوية للاستجابة في كل مجموعة مقابل الفرضية البديلة لمجموعة واحدة أو أكثر تعني الاختلاف عن المجموعات الأخرى. يحدد اختبار فرضية (ANOVA ) أحادي الاتجاه ما إذا كانت عدة وسائل مجتمعية متساوية. توزيع الاختبار هو توزيع (F ) بدرجتين مختلفتين من الحرية.

الافتراضات:

  1. يفترض أن تكون كل مجموعة يتم أخذ عينة منها طبيعية.
  2. يتم اختيار جميع العينات بشكل عشوائي ومستقل.
  3. يُفترض أن يكون للمجموعات انحرافات معيارية (أو تباينات) متساوية.

قائمة المصطلحات

تحليل التباين
يشار إليها أيضًا باسم (ANOVA ) ، وهي طريقة لاختبار ما إذا كانت وسائل ثلاثة أو أكثر من المجموعات السكانية متساوية أم لا. الطريقة قابلة للتطبيق إذا:
  • يتم توزيع جميع الفئات السكانية المعنية بشكل طبيعي.
  • السكان لديهم انحرافات معيارية متساوية.
  • عينات (ليست بالضرورة من نفس الحجم) يتم اختيارها بشكل عشوائي ومستقل من كل مجموعة.

إحصائية الاختبار لتحليل التباين هي نسبة (F ).

اتجاه واحد أنوفا)
طريقة لاختبار ما إذا كانت وسائل ثلاثة أو أكثر من السكان متساوية أم لا ؛ الطريقة قابلة للتطبيق إذا:
  • يتم توزيع جميع الفئات السكانية المعنية بشكل طبيعي.
  • السكان لديهم انحرافات معيارية متساوية.
  • عينات (ليست بالضرورة من نفس الحجم) يتم اختيارها بشكل عشوائي ومستقل من كل مجموعة.

إحصائية الاختبار لتحليل التباين هي نسبة (F ).

التباين
متوسط ​​الانحرافات التربيعية عن المتوسط ​​؛ مربع الانحراف المعياري. بالنسبة لمجموعة من البيانات ، يمكن تمثيل الانحراف كـ (x - bar {x} ) حيث يمثل (x ) قيمة البيانات و ( bar {x} ) متوسط ​​العينة. تباين العينة يساوي مجموع مربعات الانحرافات مقسومًا على اختلاف حجم العينة وواحد.

13.1 ANOVA أحادي الاتجاه

الغرض من اختبار ANOVA أحادي الاتجاه هو تحديد وجود فرق معتد به إحصائيًا بين عدة وسائل جماعية. يستخدم الاختبار بالفعل الفروق للمساعدة في تحديد ما إذا كانت الوسائل متساوية أم لا. من أجل إجراء اختبار ANOVA أحادي الاتجاه ، هناك خمسة أساسيات الافتراضات التي ينبغي الوفاء بها:

  1. يفترض أن تكون كل مجموعة يتم أخذ عينة منها طبيعية.
  2. يتم اختيار جميع العينات بشكل عشوائي ومستقل.
  3. يفترض أن يكون للمجموعات انحرافات معيارية متساوية (أو الفروق).
  4. العامل هو متغير قاطع.
  5. الاستجابة متغير عددي.

الفرضيات الباطلة والبديلة

الفرضية الصفرية هي ببساطة أن جميع وسائل المجموعة السكانية هي نفسها. الفرضية البديلة هي أن زوجًا واحدًا على الأقل من الوسائل مختلف. على سبيل المثال ، إذا كان هناك ك مجموعات:

الرسوم البيانية ، وهي مجموعة من المخططات الصندوقية التي تمثل توزيع القيم مع مجموعة الوسائل المشار إليها بخط أفقي عبر المربع ، تساعد في فهم اختبار الفرضية. في الرسم البياني الأول (مخططات الصندوق الأحمر) ، ح0: ميكرومتر1 = ميكرومتر2 = ميكرومتر3 والمجموعات الثلاثة لها نفس التوزيع إذا كانت الفرضية الصفرية صحيحة. تباين البيانات المجمعة هو تقريبًا نفس تباين كل مجموعة من المجموعات السكانية.

إذا كانت الفرضية الصفرية خاطئة ، فإن تباين البيانات المجمعة يكون أكبر بسبب الوسائل المختلفة كما هو موضح في الرسم البياني الثاني (مخططات الصندوق الأخضر).


ANOVA أحادي الاتجاه: التعريف والصيغة والمثال

أ اتجاه واحد أنوفا يقارن (& # 8220 تحليل التباين & # 8221) وسائل ثلاث مجموعات مستقلة أو أكثر لتحديد ما إذا كان هناك فرق ذو دلالة إحصائية بين متوسطات السكان المقابلة.

يوضح هذا البرنامج التعليمي ما يلي:

  • الدافع لأداء ANOVA أحادي الاتجاه.
  • الافتراضات التي يجب أن تتحقق لأداء ANOVA أحادي الاتجاه.
  • عملية إجراء ANOVA أحادي الاتجاه.
  • مثال على كيفية إجراء ANOVA أحادي الاتجاه.

اتجاه واحد ANOVA: الدافع

لنفترض أننا نريد معرفة ما إذا كانت ثلاثة برامج مختلفة للإعداد للاختبار تؤدي إلى درجات مختلفة في امتحان القبول بالكلية أم لا. نظرًا لوجود الملايين من طلاب المدارس الثانوية في جميع أنحاء البلاد ، فسيستغرق الأمر وقتًا طويلاً ومكلفًا للغاية للذهاب إلى كل طالب والسماح لهم باستخدام أحد برامج الإعداد للاختبار.

بدلاً من ذلك ، قد نختار ثلاث عينات عشوائية من 100 طالب من السكان ونسمح لكل عينة باستخدام أحد برامج الإعداد للاختبار الثلاثة للتحضير للاختبار. بعد ذلك ، يمكننا تسجيل الدرجات لكل طالب بمجرد إجراء الاختبار.

ومع ذلك ، فمن المؤكد تقريبًا أن متوسط ​​درجة الاختبار بين العينات الثلاث سيكون مختلفًا قليلاً على الأقل. السؤال هو ما إذا كان هذا الاختلاف ذو دلالة إحصائية أم لا. لحسن الحظ ، يسمح لنا ANOVA أحادي الاتجاه بالإجابة على هذا السؤال.

اتجاه واحد ANOVA: الافتراضات

لكي تكون نتائج ANOVA أحادية الاتجاه صالحة ، يجب استيفاء الافتراضات التالية:

1. الحالة الطبيعية - تم سحب كل عينة من السكان الموزعين بشكل طبيعي.

2. الفروق المتساوية - تباينات المجموعات السكانية التي تأتي منها العينات متساوية. يمكنك استخدام Bartlett & # 8217s Test للتحقق من هذا الافتراض.

3. الاستقلال - الملاحظات في كل مجموعة مستقلة عن بعضها البعض وتم الحصول على الملاحظات داخل المجموعات بواسطة عينة عشوائية.

اقرأ هذه المقالة للحصول على تفاصيل متعمقة حول كيفية التحقق من هذه الافتراضات.

اتجاه واحد ANOVA: العملية

يستخدم ANOVA أحادي الاتجاه الفرضيات الفارغة والبديلة التالية:

  • ح0 (فرضية العدم): ميكرومتر1 = μ2 = μ3 = & # 8230 = μك (كل الوسائل السكانية متساوية)
  • ح1 (فرضية بديلة): متوسط ​​عدد واحد على الأقل يختلف عن البقية

ستستخدم عادةً بعض البرامج الإحصائية (مثل R ، و Excel ، و Stata ، و SPSS ، وما إلى ذلك) لإجراء ANOVA في اتجاه واحد نظرًا لأنه من الصعب أداءها يدويًا.

بغض النظر عن البرنامج الذي تستخدمه ، ستتلقى الجدول التالي كإخراج:

مصدر مجموع المربعات (SS) مدافع يعني المربعات (MS) F ص
علاج SSR مدافعص MSR MSR / MSE Fمدافعص، مدافعه
خطأ SSE مدافعه MSE
مجموع طائرة أسرع من الصوت مدافعر

  • SSR: مجموع انحدار المربعات
  • SSE: مجموع خطأ المربعات
  • طائرة أسرع من الصوت: المجموع الكلي للمربعات (SST = SSR + SSE)
  • مدافعص: درجات انحدار الحرية (dfص = ك -1)
  • مدافعه: درجات الحرية في الخطأ (dfه = ن ك)
  • مدافعر: درجات الحرية الكلية (dfر = ن -1)
    • ك: العدد الإجمالي للمجموعات
    • ن: مجموع الملاحظات

    إذا كانت القيمة p أقل من مستوى الأهمية الذي اخترته (على سبيل المثال 0.05) ، فيمكنك رفض الفرضية الصفرية واستنتاج أن واحدة على الأقل من وسائل المحتوى تختلف عن غيرها.

    ملحوظة: إذا رفضت فرضية العدم ، فهذا يشير إلى أن واحدة على الأقل من وسائل المحتوى تختلف عن غيرها ، لكن جدول ANOVA لا يحدد & # 8217t الذي يعني السكان مختلفة. لتحديد ذلك ، تحتاج إلى إجراء اختبارات لاحقة ، تُعرف أيضًا باسم & # 8220 مقارنات متعددة & # 8221 الاختبارات.

    اتجاه واحد ANOVA: مثال

    لنفترض أننا نريد معرفة ما إذا كانت ثلاثة برامج مختلفة للإعداد للاختبار تؤدي إلى درجات مختلفة في اختبار معين أم لا. لاختبار ذلك ، نقوم بتجنيد 30 طالبًا للمشاركة في دراسة وتقسيمهم إلى ثلاث مجموعات. يتم تعيين الطلاب في كل مجموعة بشكل عشوائي لاستخدام أحد برامج الإعداد للاختبار الثلاثة للأسابيع الثلاثة المقبلة للتحضير للامتحان. في نهاية الأسابيع الثلاثة ، يخضع جميع الطلاب للاختبار نفسه.

    درجات الامتحان لكل مجموعة موضحة أدناه:

    لإجراء ANOVA أحادي الاتجاه على هذه البيانات ، سنستخدم Statology One-Way ANOVA Calculator مع المدخلات التالية:

    من جدول الإخراج نرى أن إحصاء اختبار F هو 2.358 والقيمة الاحتمالية المقابلة هي 0.11385.

    نظرًا لأن هذه القيمة p لا تقل عن 0.05 ، فإننا نفشل في رفض فرضية العدم. هذا يعني أنه ليس لدينا أدلة كافية للقول بأن هناك فرقًا مهمًا من الناحية الإحصائية بين متوسط ​​درجات الامتحان للمجموعات الثلاث.

    مصادر إضافية

    توضح المقالات التالية كيفية إجراء ANOVA أحادي الاتجاه باستخدام برامج إحصائية مختلفة:


    معاينة المحتوى

    قبل أن ندخل في تفاصيل الاختبار ، نحتاج إلى تحديد الفرضيات الصفرية والبديلة. تذكر أنه من أجل اختبار وسيلتين مستقلتين ، كانت الفرضية الصفرية ( mu_1 = mu_2 ). في ANOVA أحادي الاتجاه ، نريد مقارنة (t ) يعني السكان ، حيث (t & gt2 ). لذلك ، فإن الفرضية الصفرية لتحليل التباين من أجل (t ) يعني السكان هي:

    ومع ذلك ، لا يمكن إعداد البديل بشكل مشابه للحالة المكونة من عينتين. إذا أردنا معرفة ما إذا كانت وسيلتان من السكان مختلفتين ، فسيكون البديل ( mu_1 ne mu_2 ). مع وجود أكثر من مجموعتين ، يكون سؤال البحث هو "هل تختلف بعض الوسائل؟". إذا قمنا بإعداد البديل ليكون ( mu_1 ne mu_2 ne… ne mu_t ) ، فسنحصل على اختبار لمعرفة ما إذا كانت جميع الوسائل مختلفة. ليس هذا ما نريده. يجب أن نكون حذرين في كيفية إعداد البديل. النسخة الرياضية للبديل هي.

    (H_a القولون mu_i ne mu_j text <بالنسبة للبعض> i text <و> j text i ne j )

    هذا يعني أن أحد الأزواج على الأقل غير متساوٍ. العرض الأكثر شيوعًا للبديل هو:

    تذكر أنه عندما نقارن متوسط ​​مجموعتين من السكان لعينات مستقلة ، فإننا نستخدم عينة مكونة من عينتين ر-اختبار مع تباين مجمع عندما يمكن افتراض تساوي تباينات المحتوى.

    لأكثر من مجموعتين ، إحصاء الاختبار ، (F ) ، هو النسبة بين تباين عينة المجموعة والتباين داخل العينة-المجموعة. هذا هو،

    في ظل الفرضية الصفرية (وبافتراضات معينة) ، تقدر كلتا الكميتين تباين الخطأ العشوائي ، وبالتالي يجب أن تكون النسبة قريبة من 1. إذا كانت النسبة كبيرة ، فعندئذ يكون لدينا دليل ضد العدم ، وبالتالي ، رفض فرضية العدم.

    في القسم التالي ، نقدم الافتراضات لهذا الاختبار. في القسم التالي ، نقدم كيفية العثور على التباين بين المجموعة ، والتباين داخل المجموعة ، وإحصاء F في جدول ANOVA.


    11.3 أمثلة

    11.3.1 أنسنة

    تدرس هذه الورقة تأثير التعرف على كرم مجموعة أخرى على آراء الأفراد حول المجموعة الأخرى. تمت قراءة ملخص موجز لإعصار كاترينا على المشاركين ، ثم تمت قراءة أي منهما

    1. لم يخبر أي شيء آخر (سيطرة)
    2. أخبرنا عن المساعدات التي أرسلتها باكستان ، لكن بالنظر إلى الأرقام المنخفضة لمقدار المساعدات.
    3. تحدثت عن المساعدات التي أرسلتها باكستان ، لكن بالنظر إلى الأعداد الكبيرة لمقدار المساعدات.

    بعد ذلك ، سُئل المشاركون عن مدى اعتقادهم القوي بأن الباكستانيين سيشعرون بالعواطف الثانوية والأولية بعد الكارثة ، وتم أخذ معنى ردودهم.

    نخطط لتحليل ما إذا كان هناك اختلاف في متوسط ​​اعتقاد المجموعات الثلاث حول مدى قوة شعور الباكستانيين بالعواطف الثانوية. يمكنك قراءة المزيد عن التجربة في صفحة التعليمات الخاصة بالبيانات ، أو بقراءة الورقة المرتبطة. إحدى مشكلات التقنية التي نستخدمها هي أننا نقوم بذلك متوسط أجوبة المقياس الترتيبي على الأسئلة السبعة المتعلقة بالعواطف ، وهو أمر شائع ، ولكنه ليس صحيحًا دائمًا.

    يمكننا تحميل البيانات عبر ما يلي.

    سنقوم أولاً بفحص البيانات لمعرفة ما إذا كانت تبدو طبيعية تقريبًا مع وجود تباينات متساوية عبر المجموعات. نحن مهتمون فقط بهذه المشكلة مع الأشخاص الذين قيل لهم عن إعصار كاترينا.

    هذه لا تبدو سيئة للغاية ، باستثناء أن كل من المجموعة الضابطة والمجموعة المنخفضة لديهما قيم تساوي 1 تمامًا مما هو متوقع في التوزيع العادي. دعونا نلقي نظرة على المتوسط ​​والانحراف المعياري وحجم العينة في كل مجموعة.

    من الجيد أيضًا أن تقوم بعمل مدرج تكراري.

    لإجراء ANOVA في R ، نقوم أولاً ببناء نموذج خطي لـ pak_sec كما هو موضح بواسطة المجموعة ، ثم نطبق وظيفة anova على النموذج. ينتج anova جدولًا يحتوي على جميع الحسابات من المناقشة أعلاه.

    تتوافق مجموعة الصفوف والمتبقية مع المجموعة بين المجموعة وداخل تباين المجموعة.

    يعطي العمود الأول Df درجات الحرية في كل حالة. بما أن (k = 3 ) ، فإن التباين بين المجموعة له (k - 1 = 2 ) درجات من الحرية ، ومنذ ذلك الحين (N = 161 ) ، فإن التباين داخل المجموعة (المتبقي) لديه (N - k = 158 ) درجة حرية.

    يعطي العمود Sum Sq (SSD_B ) و (SSD_W ). متغير متوسط ​​Sq هو قيمة Sum Sq مقسومة على درجات الحرية. هذان الرقمان هما بسط ومقام إحصاء الاختبار ، (F ). إذن هنا (F = 3.7279 / 0.7723 = 4.8269 ).

    لحساب قيمة (p ) ، نحتاج إلى المنطقة الموجودة أسفل ذيل التوزيع (F ) أعلاه (F = 4.8269 ). لاحظ أن هذا اختبار أحادي الطرف ، لأن القيم الصغيرة لـ (F ) تكون أكثر احتمالًا عند (H_0 ) صحيح.

    يعطي جدول ANOVA (p ) -value كـ Pr (& gtF) ، هنا (P = 0.009231 ). يمكننا حساب هذا من (F ) باستخدام:

    وفقًا لقيمة (p ) ، فإننا نرفض عند مستوى ( alpha = .05 ) ونستنتج أنه لم يكن لدى المجموعات الثلاث جميعها نفس الوسيلة للتنبؤ بمدى قوة شعور الباكستانيين بالعواطف الثانوية بعد الكارثة .

    11.3.2 الفئران على THC

    لنعد إلى fosdata :: mice_pot. لقد رأينا بالفعل أن التوزيعات طبيعية تقريبًا مع تباين متساوٍ تقريبًا ، ولا يبدو أن الاستقلال يمثل مشكلة. الفرضية الصفرية هي

    (H_0: mu_1 = cdots = mu_4 ) ، حيث ( mu_i ) هو متوسط ​​نشاط النسبة المئوية الحقيقي بالنسبة لخط الأساس ، والفرضية البديلة هي أن واحدة على الأقل من الوسائل مختلفة. سنختبر على مستوى ( alpha = .05 ).

    لإجراء ANOVA في R ، نقوم أولاً ببناء نموذج خطي للمتغير الرقمي على متغير التجميع. ثم نقوم بتشغيل anova على كائن النموذج.

    نرى أن لدينا (p ) -قيمة (p = .0357 ) ، لذلك نرفض الفرضية الصفرية القائلة بأن جميع الوسائل هي نفسها عند مستوى tha ( alpha = .05 ) .

    أذكر أنه هو أساسى أن تكون تلك المجموعة عاملاً. من الخطأ الجسيم أن يكون متغير التجميع على أنه رقمي ، لكن R لن يعطي تحذيرًا. أحد الاختبارات الجيدة هو أن درجات الحرية يجب أن تكون عدد المجموعات ناقص 1. إذا كانت 1 وليس لديك مجموعتان ، فمن المحتمل أنك أخطأت في تشفير متغير التجميع.

    11.3.3 الشمبانزي (تباين غير متكافئ)

    ضع في اعتبارك مجموعة البيانات الشمبانزي في حزمة fosdata. يمكننا تحميل البيانات عبر

    عُرضت صور الشمبانزي من الأعمار المعروفة على القضاة البشر ، الذين أشاروا بمقياس من 1 إلى 6 إلى مدى اللون الرمادي لشعر وجه الشمبانزي (باستثناء الذقن ، والذي غالبًا ما يكون رماديًا حتى عند الصغار). الورقة الأصلية هنا 38. كان هدف المؤلفين هو تحديد ما إذا كان الشعر الرمادي في الشمبانزي يزداد مع تقدم العمر ، كما هو الحال مع البشر. وجد المؤلفون أنه بعد سن الثلاثين ، لا يبدو أن هناك تأثيرًا على العمر.

    سنستخدم البيانات بطريقة مختلفة. نرغب في تحديد ما إذا كان متوسط ​​الشعر الرمادي مختلفًا عن الشمبانزي 30 أو أكثر في المجموعات الثلاث. لم يجد مؤلفو الدراسة تأثيرًا للعمر ، لذلك لن نأخذ في الحسبان أعمار الشمبانزي. دعونا نلقي نظرة على boxplot. نلاحظ أن أحد الشمبانزي (Brownface) لديه صورتان في مجموعة البيانات عندما كان عمره أكثر من 29 عامًا. نختار بشكل تعسفي حذف الصورة عندما كان أكبر سناً من أجل الحفاظ على الاستقلال. لا يؤثر هذا الاختيار على استنتاجات الاختبارات التالية.

    بناءً على هذه المؤامرة ، يبدو أنه قد يكون هناك اختلاف في متوسط ​​الدرجة الرمادية حسب عدد السكان ، ولكن يبدو أيضًا أنه من غير الحكمة افتراض أن الفروق بين المجموعات الثلاث متساوية. إذا تجاهلنا الفروق غير المتكافئة ، فيمكننا استخدام anova على النحو التالي.

    نحن سوف ليس رفض الفرضية الصفرية بأن الوسائل هي نفسها ( (ع = .1418 )). سنرى أدناه أن oneway.test طريقة لاختبار (H_0: mu_1 = cdots = mu_k ) مقابل (H_a: ) ليست كل ( mu_i ) متساوية. لديها افتراضات عن الحالة الطبيعية في كل مجموعة ، ولكن لا يوجد افتراض للتباين المتساوي. يؤدي تطبيق oneway.test على هذه البيانات إلى ما يلي.

    الآن ، نرى أن لدينا (p ) -قيمة (. 03033 ) ، لذلك نرفض (H_0 ) أن المجموعات الثلاث جميعها لها نفس اللون الرمادي في ( alpha = .05 ) ) مستوى. نظرًا لأن المساواة في التباينات هي سؤال في مجموعة البيانات هذه ، فمن المحتمل أن يكون oneway.test هو السبيل للذهاب.


    الفرضيات الباطلة والبديلة

    الفرضية الصفرية هي ببساطة أن جميع وسائل المجموعة السكانية هي نفسها. الفرضية البديلة هي أن زوجًا واحدًا على الأقل من الوسائل مختلف. على سبيل المثال ، إذا كانت هناك مجموعات (ك ):

    الرسوم البيانية ، وهي مجموعة من المخططات الصندوقية التي تمثل توزيع القيم مع مجموعة الوسائل المشار إليها بخط أفقي عبر المربع ، تساعد في فهم اختبار الفرضية. في الرسم البياني الأول (مخططات الصندوق الأحمر) ، (H_ <0>: mu_ <1> = mu_ <2> = mu_ <3> ) ويكون للمجموعات الثلاثة نفس التوزيع إذا كانت الفرضية الصفرية صحيحة . تباين البيانات المجمعة هو تقريبًا نفس تباين كل مجموعة من المجموعات السكانية.

    إذا كانت الفرضية الصفرية خاطئة ، فإن تباين البيانات المجمعة يكون أكبر بسبب الوسائل المختلفة كما هو موضح في الرسم البياني الثاني (مخططات الصندوق الأخضر).

    الشكل ( PageIndex <1> ): (أ) (H_ <0> ) صحيح. كل الوسائل هي نفسها ، الاختلافات بسبب الاختلاف العشوائي. (ب) (H_ <0> ) ليس صحيحًا. جميع الوسائل ليست هي نفسها ، الاختلافات كبيرة جدًا بحيث لا يمكن أن تكون بسبب الاختلاف العشوائي.


    اتجاه واحد أنوفا¶

    كما ذكرنا ، Anova هو اختصار لتحليل تباين المتغير.

    متى نستخدم Anova؟ لقد ذكرنا سابقًا أنه يتم استخدام anova عندما نريد مقارنة الوسائل بين المجموعات ، وهذا في الواقع يأخذ شكلاً مثيرًا للاهتمام عندما يتعلق الأمر بمجموعات البيانات. لنفترض أن لدينا متغيرًا فئويًا ومتغيرًا مستمرًا ، مثل الفئة العمرية (صغير ، متوسط ​​، كبير) وطول الأفراد. يمكننا التعامل مع مستويات العمر المتغير الفئوي كمجموعات منفصلة وقياس ما إذا كان متوسط ​​الارتفاع هو نفسه في جميع المجموعات أم لا. لماذا هذا مهم؟ حسنًا ، إذا كنت تحل مشكلة تعلم الآلة ، وتريد توقع ارتفاع الأفراد ، واستخدمت العمر كمتغير للتنبؤ بالطول ، فستجد أنه إذا كانت وسائل المجموعات في العمر هي نفسها ، فإن الارتفاع قد لا تختلف كثيرًا حسب العمر. في هذه الحالة لن تكون قادرًا على تعليم الكمبيوتر لتوقع الطول من العمر. في الاتجاه المعاكس ، أنت يريد فرق في المتوسط ​​بين المجموعات المختلفة لمتغير فئوي. هذا الاختلاف هو ما يتعلمه الكمبيوتر عند تشغيل خوارزمية ML. يمكنك القول بشكل فضفاض جدًا أنه قد يكون هناك اعتماد للارتفاع على عمرك المتغير القاطع. هذا ما نحن بعد!

    إذا كان ما ورد أعلاه يبدو محيرًا حقًا ، فما عليك سوى الانتظار ، وسترى ما أعنيه!

    Anova هو أيضًا نوع آخر من اختبار الفرضية ، مما يعني أننا نتبع نموذج منطق اختبار الفرضية. في القسم الأخير ، عندما أجرينا اختبار مربع كاي ، استخدمنا توزيع مربع كاي وحددنا إحصائية اختبار مربع كاي بشكل صحيح. هنا ، نستخدم توزيع F وإحصاء F كإحصاء اختبار. سنرى بشكل أساسي ما إذا كانت فرضيتنا الصفرية صالحة أم لا تستخدم توزيع F. على غرار الدرس الخاص باختبار مربع كاي ، لن نتعمق في كيفية الحصول على توزيع F ولكننا ننتقل مباشرة إلى التطبيقات. بخلاف درس مربع كاي أيضًا ، سنقوم في الواقع بتوليد بيانات ، وبعض البيانات المزيفة. إذن ما الذي تنطوي عليه؟ حسنًا ، هذه هي الخطوات في Anova:

    1) تحديد الفرضية الصفرية والبديلة
    2) تعيين مستوى الأهمية
    3) احسب إحصاء f
    4) احسب القيمة الاحتمالية
    5) قارن قيمة p ومستوى الأهمية لاستنتاج ما إذا كانت الفرضية الصفرية صحيحة أم لا

    سترى أن هذه الخطوات تشبه إلى حد كبير الدرس الموجود في دفتر اختبار الفرضيات أو اختبار مربع كاي.

    بالنسبة لهذه المشكلة ، لن نستخدم بيانات حقيقية ، سننشئ بياناتنا الخاصة. هذا بسبب نوع الافتراضات التي تكمن وراء إجراء تحليل anova:

    الافتراضات - 1) الوضع الطبيعي: يجب أن تكون البيانات في كل مستوى من الفئات طبيعية تقريبًا. في بيانات العمر مقابل عدد ساعات المشاهدة التليفزيونية ، الافتراض هو أنه في كل فئة ، أي الشباب ومتوسطي العمر وكبار السن ، يكون لعدد ساعات مشاهدة التلفزيون توزيعًا طبيعيًا.

    2) تجانس التباين: افتراض أن التباين داخل كل مجموعة يجب أن يكون مشابهًا للمجموعات الأخرى

    3) حجم العينة: من المتوقع عادة أن يكون لديك 20 عينة

    4) استقلالية الملاحظات: يجب أن تكون القيم من مجموعة واحدة مستقلة عن المجموعات الأخرى. هذا هو الشرط الصعب إلى حد ما ، وهو أمر سنقلق بشأنه قليلاً.

    بدلاً من محاولة العثور على مجموعة بيانات تلبي هذه المعايير. سنقوم فقط بسحب البيانات من التوزيع الطبيعي وتشغيل Anova. هذا أكثر إفادة لأنه يمكننا عرض حالات مختلفة مع هذا بدلاً من الاعتماد فقط على حالة واحدة.

    الفرضية الصفرية والفرضية البديلة واضحة جدًا.

    فرضية لاغية: وسائل كل المجموعات متساوية

    الفرضية البديلة: وسائل كل المجموعات غير متساوية. ملاحظة: هذا لا يخبرنا حقًا عن الوسائل التي لا تساوي الوسائل الأخرى. فقط أن الفرضية الصفرية غير صالحة

    مثالنا الأول هو مثال بسيط حقًا. سنقوم بسحب بعض البيانات من التوزيع الطبيعي ، وتوفير بعض السياق ، ثم تشغيل Anova عليه. ثم سنفعل الحساب كله يدويًا. للتبسيط ، سنستخدم متغيرًا فئويًا بمجموعتين فقط.

    افترض أن لدينا مجموعتين من الناس - الصغار والكبار. نقيس كمية التلفاز الذي يشاهدونه في الأسبوع ونحصل على البيانات التالية.


    حص 202 ملاحظات: ربيع 2021

    يمكنك مشاهدة الفيديو هنا أكمل إجابتك هنا.

    8.1.1 مقدمة: ما الغرض من هذا؟

    الإطار العام للاستدلال المتكرر مرن بشكل مدهش. كما اتضح ، هناك الكثير من الاختبارات المختلفة التي يمكنك إجراؤها ، من أجل التعامل مع أنواع مختلفة من البيانات والإجابة على أسئلة مختلفة.

    تتضمن بعض الأمثلة التي قد تكون واجهتها في أيام المقدمة النسب ، والوسائل ، والفرق بين النسبتين ، والفرق بين الوسيلتين ، ومنحدر الانحدار ، وما إلى ذلك.

    الآن بعد أن أصبح "الاختلاف بين وسيلتين" يبدو أنه يمكن أن يكون مفيدًا. بعد كل شيء ، بصفتنا مجربين ، غالبًا ما نهتم بمقارنة بعض المتغيرات لمجموعتين - محصول نباتات الطماطم مع السماد A أو B ، على سبيل المثال ، أو ما إذا كان المقهى يعمل بشكل أفضل عند وضع صورة على اللافتة أو الإعلان خاص ، أو ما إذا كان صغار الصغار يكبرون إذا أطعمتهم حمية 1 أو حمية 2.

    لكن انتظر: لماذا اثنين مجموعات؟ هذا مقيد جدا! يوجد أكثر من نوعين من الأسمدة في العالم. هناك أكثر من طريقتين لإطعام الدجاج. ربما نود المقارنة العديد مستويات مختلفة لبعض عوامل التجميع.

    السؤال الذي نطرحه إذن هو: هل أي من هذه المجموعات مختلفة؟ هل الأسمدة مهمة؟ هل النظام الغذائي مهم؟

    هذا ما نفعله في ANOVA. إنها طريقة لمقارنة مجموعات متعددة ، أو بعبارة أخرى ، مستويات متعددة من عامل التجميع ، من أجل التساؤل عما إذا كان لهذا العامل أي تأثير بشكل عام.

    2.1.8 ANOVA المفاهيمي: الإشارة والضوضاء ، بين وداخل

    إليكم الفكرة الأساسية لـ ANOVA ، بالكلمات: تختلف الملاحظات. السؤال هو ، هل يمكن أن نشرح لماذا؟ حسنًا ، بعض هذا الاختلاف يرجع فقط إلى العشوائية. لكن ربما ، يعود سبب ذلك إلى أن الملاحظات تأتي من مجموعات مختلفة. هذا الاهتمام بالاختلاف هو المكان الذي يأتي منه اسم ANOVA ، بالمناسبة: إنه يرمز إلى ANalysis Of VAriance.

    ضع في اعتبارك مثال الكتاكيت الصغيرة. تزن فراخ الأطفال المختلفة كميات مختلفة. إلى حد ما ، هذا مجرد عشوائي: يختلف الدجاج. ولكن ربما يكون سبب ذلك هو أننا منحنا الكتاكيت المختلفة بشكل مختلف الحميات.

    إذا كان يساعدك ، يمكنك التفكير في هذا من حيث الإشارة و الضوضاء. نحن مهتمون حقًا بمعرفة ما إذا كان النظام الغذائي للدجاج ينعكس في وزنهم - هذه هي الإشارة. ولكن هناك أيضًا هذا الاختلاف العشوائي بين فرادى الدجاج ، وهو مجرد ضوضاء.

    مجموعة المصطلحات الأخرى التي نستخدمها هنا هي ما بين و في غضون. نريد أن نعرف ما إذا كان هناك فرق كبير ما بين المجموعات - الدجاج الذي يحصل على كل نوع من أنواع الحمية. ولكن ما الذي يشكل اختلافًا كبيرًا من حيث أوزان صغار الصيصان؟ لفهم الحجم ، ننظر إلى التباين في غضون كل مجموعة. إذا كان للكتاكيت التي تتبع نفس النظام الغذائي أوزان مختلفة ، فهذا لا علاقة له بعلاجنا. إنه ببساطة انعكاس للتنوع الطبيعي والعشوائي بين الكتاكيت الفردية.

    إذا رأينا هذا الاختلاف ما بين الكتاكيت التي تتبع أنظمة غذائية مختلفة أكبر بكثير من هذا الاختلاف الفردي الطبيعي والعشوائي - حسنًا ، هذا عندما نبدأ في الاعتقاد بأن النظام الغذائي مهم!

    لاحظ كيف أتحدث بشكل عام عن النظام الغذائي هنا. أنا لا أسأل ما إذا كان النظام الغذائي 1 أفضل من النظام الغذائي 3 ، بل أسأل عما إذا كان هناك ، بشكل عام ، فرق بين الأنظمة الغذائية. ANOVA لديها فرضية فارغة عامة جدًا: العامل الذي أبحث عنه ، بشكل عام ، لا يهم. لا فرق بين أي من المجموعات.

    8.1.3 المثال المرئي

    حسنًا ، افترض أننا نجري هذه التجربة مع صغار الكتاكيت.

    نقوم بإطعام كل دجاجة صغيرة واحدة من أربع وجبات مختلفة ، ونسجل مقدار وزنها ، لنقل ، على سبيل المثال ، 20 يومًا. أذهب وألقي نظرة على البيانات وإليكم ما أراه:

    أنيق! يبدو أن الكتاكيت في الأنظمة الغذائية المختلفة لها متوسط ​​وزن مختلف.

    لكن ، بالطبع ، سؤالي التالي هو: كيف مختلف؟ يبدو أن متوسط ​​الأوزان في كل نظام غذائي يختلف من 20 إلى 50 جرامًا. 20 جرامًا في الحقيقة ليس كثيرًا. ولكن بعد ذلك ، هذه فراخ صغيرة منفوشة ربما 20 جرامًا كبيرة بالنسبة لهم.

    حسنًا ، لنفعل ما يفعله الإحصائيون ، ونرسم صورة. افترض أنني صنعت مخططًا مربعًا للأوزان جنبًا إلى جنب وبدا كما يلي:

    أوههو! واعدة جدا. يبدو أن النظام الغذائي مهم حقًا!

    ولكن ماذا لو بدا مخطط التشتت هكذا:

    ممم. الآن لست متأكدًا. لن أكون واثقًا من القول إن هناك حقًا أي اختلاف هنا بناءً على النظام الغذائي.

    ومع ذلك: في كلتا المؤامرات ، كانت وسائل المجموعة متشابهة تمامًا! في الحبكة الأولى ، بدا أن النظام الغذائي مهم لأن الاختلاف ما بين كانت المجموعات كبيرة مقارنة ب انتشار داخل كل مجموعة. في الحبكة الثانية ، أدى التباين داخل كل مجموعة إلى إغراق الاختلافات بينهما.

    هذا ما تدور حوله ANOVA: تحديد ما إذا كانت الاختلافات بين المجموعات كبيرة مقارنة بالتنوع داخلها.

    لحظة الاستجابة: إذا لم تتمكن من إجراء ANOVA - وهو ما أعتقد أنه لا يمكنك حتى الآن - وأردت معرفة ما إذا كان النظام الغذائي مهمًا ، فما هو الاختبار (الاختبارات) الذي يمكنك إجراؤه بدلاً من ذلك؟ هل يمكنك التفكير في أي عيوب أو عيوب محتملة للقيام بذلك؟


    10.1: أحادي الاتجاه ANOVA - الرياضيات

    في الفصل التاسع "مشاكل في عينتين" رأينا كيفية مقارنة متوسطين من السكان μ 1 و μ 2. سنتعلم في هذا القسم مقارنة ثلاث أو أكثر من الوسائل السكانية في نفس الوقت ، والتي غالبًا ما تكون ذات أهمية في التطبيقات العملية. على سبيل المثال ، قد يكون المسؤول في إحدى الجامعات مهتمًا بمعرفة ما إذا كانت متوسطات درجة الطالب هي نفسها بالنسبة للتخصصات المختلفة. في مثال آخر ، قد يكون اختصاصي الأورام مهتمًا بمعرفة ما إذا كان المرضى الذين يعانون من نفس النوع من السرطان لديهم نفس متوسط ​​أوقات البقاء على قيد الحياة في ظل عدة علاجات مختلفة للسرطان.

    بشكل عام ، افترض أن هناك ك مجموعات سكانية طبيعية ذات وسائل مختلفة ربما ، μ 1 ، μ 2 ، ... ، μ K ، ولكن جميعها بنفس التباين σ 2. سؤال الدراسة هو ما إذا كان كل ك يعني السكان هي نفسها. نصوغ هذا السؤال كاختبار للفرضيات

    H 0: μ 1 = μ 2 = · · · = μ K مقابل H a: ليست كل متوسطات السكان K متساوية

    لإجراء الاختبار ك يتم أخذ عينات عشوائية مستقلة من ك السكان العاديين. ال ك العينة يعني ك عينة الفروق ، و ك يتم تلخيص أحجام العينات في الجدول:

    تعداد السكان حجم العينة متوسط ​​العينة نموذج التباين
    1 ن 1 س - 1 ق 1 2
    2 ن 2 س - 2 ق 2 2
    ك ن ك س - ك ق ك 2

    حدد الكميات التالية:

    ال حجم العينة مجتمعة:

    ال يعني العينة المجمعة للجميع ن الملاحظات:

    x - = Σ x n = n 1 x - 1 + n 2 x - 2 + · · · + n K x - K n

    ال يعني مربع للعلاج:

    M S T = n 1 (x - 1 - x -) 2 + n 2 (x - 2 - x -) 2 + · · · + n K (x - K - x -) 2 K - 1

    ال يعني مربع الخطأ:

    M S E = (n 1 - 1) s 1 2 + (n 2-1) s 2 2 + · · · + (n K - 1) s K 2 n - K

    MST يعني مربع للعلاج. يمكن اعتباره تباينًا بين ك العينات العشوائية المستقلة الفردية ومتوسط ​​مربع الخطأ MSE. مثل التباين داخل العينات. هذا هو سبب تسمية "تحليل التباين" ، والمختصر عالميًا تحليل التباين ANOVA. . تتعلق صفة "أحادية الاتجاه" بحقيقة أن مخطط أخذ العينات هو أبسط طريقة ممكنة ، وهو أخذ عينة عشوائية واحدة من كل مجموعة سكانية قيد الدراسة. إذا كانت وسيلة ك المجموعات السكانية كلها متشابهة ، لذا يجب أن تكون الكميتان MST و MSE قريبتين من نفسهما ، لذلك سيتم رفض فرضية العدم إذا كانت نسبة هاتين الكميتين أكبر بكثير من 1. هذا ينتج إحصاء الاختبار التالي وطرقه وشروطه استخدامه.

    إحصائية اختبار لاختبار الفرضية الفارغة التي ك الوسائل السكانية متساوية

    إذا كان ك يتم توزيع السكان بشكل طبيعي مع تباين مشترك وإذا كان H 0: μ 1 = · · = μK صحيحًا عندئذٍ في إطار أخذ عينات عشوائية F يتبع ما يقرب من F- التوزيع بدرجات الحرية d f 1 = K - 1 و d f 2 = n - K.

    الاختبار ذو الطرف الأيمن: ح0 تم رفضه عند مستوى الأهمية α إذا كان F F α.

    كما هو الحال دائمًا ، يتم إجراء الاختبار باستخدام الإجراء المعتاد المكون من خمس خطوات.

    المثال 8

    يُعد متوسط ​​معدلات الدرجات (GPAs) لدورات الكلية في تخصص معين مقياسًا لصعوبة التخصص. يرغب أحد المعلمين في إجراء دراسة لمعرفة ما إذا كانت مستويات الصعوبة في التخصصات المختلفة هي نفسها. لمثل هذه الدراسة ، يتم اختيار عينة عشوائية من متوسطات النقاط الرئيسية (GPA) لـ 11 من كبار السن المتخرجين في جامعة كبيرة لكل من التخصصات الأربعة في الرياضيات ، واللغة الإنجليزية ، والتعليم ، وعلم الأحياء. البيانات معطاة في الجدول 11.17 "مستويات الصعوبة في تخصصات الكلية". Test, at the 5% level of significance, whether the data contain sufficient evidence to conclude that there are differences among the average major GPAs of these four majors.

    Table 11.17 Difficulty Levels of College Majors

    الرياضيات English Education Biology
    2.59 3.64 4.00 2.78
    3.13 3.19 3.59 3.51
    2.97 3.15 2.80 2.65
    2.50 3.78 2.39 3.16
    2.53 3.03 3.47 2.94
    3.29 2.61 3.59 2.32
    2.53 3.20 3.74 2.58
    3.17 3.30 3.77 3.21
    2.70 3.54 3.13 3.23
    3.88 3.25 3.00 3.57
    2.64 4.00 3.47 3.22

    Step 1. The test of hypotheses is

    Step 3. If we index the population of mathematics majors by 1, English majors by 2, education majors by 3, and biology majors by 4, then the sample sizes, sample means, and sample variances of the four samples in Table 11.17 "Difficulty Levels of College Majors" are summarized (after rounding for simplicity) by:

    رائد حجم العينة متوسط ​​العينة Sample Variance
    الرياضيات n 1 = 11 x - 1 = 2.90 s 1 2 = 0.188
    English n 2 = 11 x - 2 = 3.34 s 2 2 = 0.148
    Education n 3 = 11 x - 3 = 3.36 s 3 2 = 0.229
    Biology n 4 = 11 x - 4 = 3.02 s 4 2 = 0.157

    The average of all 44 observations is (after rounding for simplicity) x - = 3.15 . We compute (rounding for simplicity)

    M S T = 11 ( 2.90 − 3.15 ) 2 + 11 ( 3.34 − 3.15 ) 2 + 11 ( 3.36 − 3.15 ) 2 + 11 ( 3.02 − 3.15 ) 2 4 − 1 = 1.7556 3 = 0.585

    M S E = ( 11 − 1 ) ( 0.188 ) + ( 11 − 1 ) ( 0.148 ) + ( 11 − 1 ) ( 0.229 ) + ( 11 − 1 ) ( 0.157 ) 44 − 4 = 7.22 40 = 0.181

    Figure 11.12 Note 11.36 "Example 8" Rejection Region

    • Step 5. Since F = 3.232 > 2.84 , we reject ح0. The data provide sufficient evidence, at the 5% level of significance, to conclude that the averages of major GPAs for the four majors considered are not all equal.

    Example 9

    A research laboratory developed two treatments which are believed to have the potential of prolonging the survival times of patients with an acute form of thymic leukemia. To evaluate the potential treatment effects 33 laboratory mice with thymic leukemia were randomly divided into three groups. One group received Treatment 1, one received Treatment 2, and the third was observed as a control group. The survival times of these mice are given in Table 11.18 "Mice Survival Times in Days". Test, at the 1% level of significance, whether these data provide sufficient evidence to confirm the belief that at least one of the two treatments affects the average survival time of mice with thymic leukemia.

    Table 11.18 Mice Survival Times in Days

    Treatment 1 Treatment 2 يتحكم
    71 75 77 81
    72 73 67 79
    75 72 79 73
    80 65 78 71
    60 63 81 75
    65 69 72 84
    63 64 71 77
    78 71 84 67
    91

    Step 1. The test of hypotheses is

    Step 3. If we index the population of mice receiving Treatment 1 by 1, Treatment 2 by 2, and no treatment by 3, then the sample sizes, sample means, and sample variances of the three samples in Table 11.18 "Mice Survival Times in Days" are summarized (after rounding for simplicity) by:

    مجموعة حجم العينة متوسط ​​العينة Sample Variance
    Treatment 1 n 1 = 16 x - 1 = 69.75 s 1 2 = 34.47
    Treatment 2 n 2 = 9 x - 2 = 77.78 s 2 2 = 52.69
    يتحكم n 3 = 8 x - 3 = 75.88 s 3 2 = 30.69

    The average of all 33 observations is (after rounding for simplicity) x - = 73.42 . We compute (rounding for simplicity)

    M S T = 16 ( 69.75 − 73.42 ) 2 + 9 ( 77.78 − 73.42 ) 2 + 8 ( 75.88 − 73.42 ) 2 3 − 1 = 434.63 2 = 217.50

    M S E = ( 16 − 1 ) ( 34.47 ) + ( 9 − 1 ) ( 52.69 ) + ( 8 − 1 ) ( 30.69 ) 33 − 3 = 1153.4 30 = 38.45

    Figure 11.13 Note 11.37 "Example 9" Rejection Region

    • Step 5. Since F = 5.65 > 5.39 , we reject ح0. The data provide sufficient evidence, at the 1% level of significance, to conclude that a treatment effect exists at least for one of the two treatments in increasing the mean survival time of mice with thymic leukemia.

    It is important to to note that, if the null hypothesis of equal population means is rejected, the statistical implication is that not all population means are equal. It does not however tell which population mean is different from which. The inference about where the suggested difference lies is most frequently made by a follow-up study.

    Key Takeaway

    • ان F-test can be used to evaluate the hypothesis that the means of several normal populations, all with the same standard deviation, are identical.

    تمارين

    Basic

    The following three random samples are taken from three normal populations with respective means μ 1 , μ 2 , and μ 3 , and the same variance σ 2 .

    1. Find the combined sample size ن.
    2. Find the combined sample mean x - .
    3. Find the sample mean for each of the three samples.
    4. Find the sample variance for each of the three samples.
    5. Find M S T .
    6. Find M S E .
    7. Find F = M S T ∕ M S E .

    The following three random samples are taken from three normal populations with respective means μ 1 , μ 2 , and μ 3 , and a same variance σ 2 .

    1. Find the combined sample size ن.
    2. Find the combined sample mean x - .
    3. Find the sample mean for each of the three samples.
    4. Find the sample variance for each of the three samples.
    5. Find M S T .
    6. Find M S E .
    7. Find F = M S T ∕ M S E .
    1. Find the number of populations under consideration ك.
    2. Find the degrees of freedom d f 1 = K − 1 and d f 2 = n − K .
    3. For α = 0.05 , find F α with the degrees of freedom computed above.

    At α = 0.05 , test hypotheses

    1. Find the number of populations under consideration ك.
    2. Find the degrees of freedoms d f 1 = K − 1 and d f 2 = n − K .
    3. For α = 0.01 , find F α with the degrees of freedom computed above.

    At α = 0.01 , test hypotheses

    التطبيقات

    The Mozart effect refers to a boost of average performance on tests for elementary school students if the students listen to Mozart’s chamber music for a period of time immediately before the test. In order to attempt to test whether the Mozart effect actually exists, an elementary school teacher conducted an experiment by dividing her third-grade class of 15 students into three groups of 5. The first group was given an end-of-grade test without music the second group listened to Mozart’s chamber music for 10 minutes and the third groups listened to Mozart’s chamber music for 20 minutes before the test. The scores of the 15 students are given below:

    Using the ANOVA F-test a test based on an F statistic to check whether several population means are equal. at α = 0.10 , is there sufficient evidence in the data to suggest that the Mozart effect exists?

    The Mozart effect refers to a boost of average performance on tests for elementary school students if the students listen to Mozart’s chamber music for a period of time immediately before the test. Many educators believe that such an effect is not necessarily due to Mozart’s music per se but rather a relaxation period before the test. To support this belief, an elementary school teacher conducted an experiment by dividing her third-grade class of 15 students into three groups of 5. Students in the first group were asked to give themselves a self-administered facial massage students in the second group listened to Mozart’s chamber music for 15 minutes students in the third group listened to Schubert’s chamber music for 15 minutes before the test. The scores of the 15 students are given below:

    Test, using the ANOVA F-test at the 10% level of significance, whether the data provide sufficient evidence to conclude that any of the three relaxation method does better than the others.

    Precision weighing devices are sensitive to environmental conditions. Temperature and humidity in a laboratory room where such a device is installed are tightly controlled to ensure high precision in weighing. A newly designed weighing device is claimed to be more robust against small variations of temperature and humidity. To verify such a claim, a laboratory tests the new device under four settings of temperature-humidity conditions. First, two levels of high و low temperature and two levels of high و low humidity are identified. يترك تي stand for temperature and ح for humidity. The four experimental settings are defined and noted as (تي, ح): (high, high), (high, low), (low, high), and (low, low). A pre-calibrated standard weight of 1 kg was weighed by the new device four times in each setting. The results in terms of error (in micrograms mcg) are given below:

    (high, high) (high, low) (low, high) (low, low)
    −1.50 11.47 −14.29 5.54
    −6.73 9.28 −18.11 10.34
    11.69 5.58 −11.16 15.23
    −5.72 10.80 −10.41 −5.69

    Test, using the ANOVA F-test at the 1% level of significance, whether the data provide sufficient evidence to conclude that the mean weight readings by the newly designed device vary among the four settings.

    To investigate the real cost of owning different makes and models of new automobiles, a consumer protection agency followed 16 owners of new vehicles of four popular makes and models, call them T C , H A , N A , and F T , and kept a record of each of the owner’s real cost in dollars for the first five years. The five-year costs of the 16 car owners are given below:

    TC HA غير متوفر FT
    8423 7776 8907 10333
    7889 7211 9077 9217
    8665 6870 8732 10540
    7129 9747
    7359 8677

    Test, using the ANOVA F-test at the 5% level of significance, whether the data provide sufficient evidence to conclude that there are differences among the mean real costs of ownership for these four models.

    Helping people to lose weight has become a huge industry in the United States, with annual revenue in the hundreds of billion dollars. Recently each of the three market-leading weight reducing programs claimed to be the most effective. A consumer research company recruited 33 people who wished to lose weight and sent them to the three leading programs. After six months their weight losses were recorded. The results are summarized below:

    إحصائية Prog. 1 Prog. 2 Prog. 3
    متوسط ​​العينة x - 1 = 10.65 x - 2 = 8.90 x - 3 = 9.33
    Sample Variance s 1 2 = 27.20 s 2 2 = 16.86 s 3 2 = 32.40
    حجم العينة n 1 = 11 n 2 = 11 n 3 = 11

    The mean weight loss of the combined sample of all 33 people was x - = 9.63 . Test, using the ANOVA F-test at the 5% level of significance, whether the data provide sufficient evidence to conclude that some program is more effective than the others.

    A leading pharmaceutical company in the disposable contact lenses market has always taken for granted that the sales of certain peripheral products such as contact lens solutions would automatically go with the established brands. The long-standing culture in the company has been that lens solutions would not make a significant difference in user experience. Recent market research surveys, however, suggest otherwise. To gain a better understanding of the effects of contact lens solutions on user experience, the company conducted a comparative study in which 63 contact lens users were randomly divided into three groups, each of which received one of three top selling lens solutions on the market, including one of the company’s own. After using the assigned solution for two weeks, each participant was asked to rate the solution on the scale of 1 to 5 for satisfaction, with 5 being the highest level of satisfaction. The results of the study are summarized below:

    إحصائيات Sol. 1 Sol. 2 Sol. 3
    متوسط ​​العينة x - 1 = 3.28 x - 2 = 3.96 x - 3 = 4.10
    Sample Variance s 1 2 = 0.15 s 2 2 = 0.32 s 3 2 = 0.36
    حجم العينة n 1 = 18 n 2 = 23 n 3 = 22

    The mean satisfaction level of the combined sample of all 63 participants was x - = 3.81 . Test, using the ANOVA F-test at the 5% level of significance, whether the data provide sufficient evidence to conclude that not all three average satisfaction levels are the same.

    Large Data Set Exercise

    Large Data Set 9 records the costs of materials (textbook, solution manual, laboratory fees, and so on) in each of ten different courses in each of three different subjects, chemistry, computer science, and mathematics. Test, at the 1% level of significance, whether the data provide sufficient evidence to conclude that the mean costs in the three disciplines are not all the same.


    10.1: One-Way ANOVA - Mathematics

    The one-sample and two-sample Student's t-tests allow us to compare a sample mean with a known or predetermined population mean or to compare two sample means. If we wish to compare more than two sample groups, however, we must turn to a different method. One-way ANOVA provides such a method, allowing us to compare the means of three or more sample groups. In this article, we focus on the one-way ANOVA test statistic and how to use it to determine if several sample means deviate significantly from each other.

    o Analysis of variances (ANOVA)

    o Identify the test statistic for one-way ANOVA

    o Use one-way ANOVA to compare the means of multiple sample groups

    o A table of values for the Student's't distribution is available at http://www.itl.nist.gov/div898/handbook/eda/section3/eda3673.htm

    Introduction to One-Way ANOVA

    Our study of ANOVA will be limited to so-called one-way ANOVA, which involves comparison of samples on the basis of only one factor (just as t-tests only involved one factor). For instance, a manufacturing company might wish to compare the quality of several groups of products on the basis of a certain setting on a given machine. (In this case, the "factor" is product quality.) Such a comparison would be impossible using t-tests, which only allow examination of two groups (or products, in this case). Using one-way ANOVA, however, the company could compare quality for any number of product groups. Thus, one-way ANOVA adds another tool to our statistical toolbox that we have developed.

    One-way ANOVA differs from the Student's t-test primarily in the test statistic, which involves calculation of variances between and among the groups (or samples) under test. Although a thorough derivation of this test statistic is beyond the scope of this article, we have developed a sufficient foundation in statistics to facilitate a basic understanding of the statistic.

    As with the Student's t-tests that we studied in the preceding two articles, one-way ANOVA is based on several assumptions. If these assumptions do not apply in a given situation, the analysis will be flawed. Thus, careful consideration of the problem is always required (both for ANOVA and for Student's t-tests) to avoid blind (and erroneous) use of hypothesis testing.

    As with the Student's t-tests, one-way ANOVA assumes that the data are normally distributed and that the data groups have equivalent population variances. (Note, then, that the samples need not necessarily have the same variance, although they should be similar if they are chosen properly.) Furthermore, proper use of ANOVA assumes that the samples are independent. Following our manufacturing example, groups of products are independent if the selection of products for one group does not have any bearing on the selection of products for another group.

    The overall approach to ANOVA is essentially the same as that of the Student's t-test we will apply the hypothesis testing procedure once more, but our test statistic and the critical value associated with that statistic will be different in this case. Our null hypothesis will once again be the following (or some similar formulation):

    ح0 = The sample means do not vary significantly for the factor under test.

    The alternative hypothesis is then, of course, the negation of this statement.

    حa = The sample means vary significantly for the factor under test.

    As with any hypothesis test, we must also choose a significance level. Also, as before, values of α = 0.05 and α = 0.01 are typical.

    We must now determine a test statistic that adequately takes the multiple sample groups into account. We'll assume that we have ك sample groups, each of which has ن samples (we make this latter assumption for simplicity at this point). Thus, for group 1, we have data <x11, x12, x13. x1ن> for group 2, <x21, x22, x23. x2ن> and so on. We identify a general data element as xji, أين ي is the group number (1 to ك) و أنا is the data item number (from 1 to ن) in that group.

    We can calculate the overall sample mean across all groups by adding all the data values from every group and dividing by the total number of values. We'll call this "grand mean" . The formula for calculating the grand mean is expressed below. Note that because each of the ك groups contains ن values, the total number of values is kn.

    Each individual group ي has a mean defined as follows. This is simply the sample mean for group ي.

    As the name indicates, ANOVA involves analysis of variances. Let's use the definitions and nomenclature above to calculate some parameters along these lines. We start with the "variation between groups," which we label SSب note that this is variation, ليس variance. The variation is simply a sum of squares. In this case, we are calculating the sum of the squared differences between the group sample means and the grand mean. We also multiply by n, the number of samples in each group.

    We can also calculate the total variation within the groups (SSدبليو). The expression for this case is more familiar--it is the sum of squares that we use in the sample variance formula, but it adds these sums across all groups.

    We can convert these variations into variances by dividing by the number of degrees of freedom in each case (this is the same thing we do when calculating a sample variance, for instance--in that case, the number of degrees of freedom is one less than the sample size). For the variation between groups (SSب), the number of degrees of freedom is one less than the number of groups, or ك – 1. For the variation within groups (SSدبليو), the number of degrees of freedom is the product of the number of groups and one less than the number of sample values-mathematically, ك(ن – 1). Let's then call the variance (technically, the "mean square") between groups and the variance (or "mean square") within groups. ثم،

    We can use these variances to calculate a test statistic, which is called the F-test. The test statistic F is expressed below in terms of the formulas above:

    Although we followed a simpler approach to this statistic wherein the number of values in each sample group is equal to n, we can also calculate F for the more general case wherein the number of values in each sample group varies (we'll call ني the number of values in each group ي). These more general formulas for and are given below.

    The formula for F remains the same.

    ال F statistic is then a ratio of variances. If the variance between groups is similar to the variance within groups, F will be relatively low. On the other hand, if the variance between groups is large compared with the variance within groups, then F will be relatively high. In the first case, the F-test is more likely to support the null hypothesis, whereas it is less likely to do so in the second case.

    Of course, we also need a critical value with which to compare our test statistic. As with the t-test and chi-square statistics, these critical values are available in tables. The tables involve more parameters, so they are not arranged in precisely the same manner as those of the Student's't and chi-square statistics. In this case, the each table has one associated significance level, with the vertical axis usually associated with the number of degrees of freedom of the denominator in the F statistic and the horizontal axis usually associated with the number of degrees of freedom in the numerator of the F إحصائية. In our case, the number of degrees of freedom in the denominator is ك(ن – 1) (this is for the case where ن is constant across all groups), and the number of degrees of freedom in the numerator is ك – 1. Using specific values and a determined significance level, we can find the critical value and then use it to complete the hypothesis testing procedure in the usual manner.

    The following practice problem illustrates the use of ANOVA and the F-test to determine whether the means of a few sample groups deviate significantly from one another.

    Practice Problem: Determine whether the sample means of the three data groups below deviate in a statistically significant manner (assume a significance level of 0.05).


    شاهد الفيديو: ANOVA on SPSS تحليل التباين الاحادي والثنائي (شهر نوفمبر 2021).