مقالات

5.7: اختبار الفروق الفردية - الرياضيات


يفترض اختبار التباين الفردي أن التوزيع الأساسي هو عادي. إحصائية الاختبار هي:

[ chi ^ {2} = frac {(n-1) s ^ {2}} { sigma ^ {2}} label {test} ]

أين:

  • (n ) هو العدد الإجمالي للبيانات
  • (s ^ {2} ) هو عينة التباين
  • ( sigma ^ {2} ) هو تباين المحتوى

قد تفكر في (s ) كمتغير عشوائي في هذا الاختبار. عدد درجات الحرية (df = n - 1 ). قد يكون اختبار التباين الفردي ذو الطرف الأيمن أو الذيل الأيسر أو ثنائي الطرف. سيوضح لك المثال التالي كيفية إعداد الفرضيات الصفرية والبديلة. تحتوي الفرضيات الفارغة والبديلة على عبارات حول تباين المحتوى.

مثال ( PageIndex {1} )

لا يهتم معلمو الرياضيات فقط بكيفية أداء طلابهم في الامتحانات ، في المتوسط ​​، ولكن أيضًا بكيفية اختلاف درجات الامتحان. بالنسبة للعديد من المدرسين ، قد يكون التباين (أو الانحراف المعياري) أكثر أهمية من المتوسط.

افترض أن مدرس الرياضيات يعتقد أن الانحراف المعياري لامتحانه النهائي هو خمس نقاط. أحد أفضل طلابه يعتقد خلاف ذلك. يدعي الطالب أن الانحراف المعياري يزيد عن خمس نقاط. إذا كان الطالب سيجري اختبار فرضية ، فماذا ستكون الفرضيات الصفرية والبديلة؟

إجابه

على الرغم من أننا حصلنا على الانحراف المعياري للمحتوى ، يمكننا إعداد الاختبار باستخدام تباين المحتوى على النحو التالي.

  • (H_ {0}: sigma ^ {2} = 5 ^ {2} )
  • (H_ {a}: sigma ^ {2}> 5 ^ {2} )

تمرين ( PageIndex {1} )

يريد أحد مدربي SCUBA تسجيل الأعماق الجماعية التي يغوص فيها كل طالب من طلابه أثناء الخروج. إنه مهتم بكيفية اختلاف الأعماق ، على الرغم من أنه كان يجب أن يكون الجميع على نفس العمق. يعتقد أن الانحراف المعياري يبلغ ثلاثة أقدام. يعتقد مساعده أن الانحراف المعياري أقل من ثلاثة أقدام. إذا كان المدرب سيجري اختبارًا ، فماذا ستكون الفرضيات الفارغة والبديلة؟

إجابه
  • (H_ {0}: sigma ^ {2} = 3 ^ {2} )
  • (H_ {a}: sigma ^ {2}> 3 ^ {2} )

مثال ( PageIndex {2} )

مع وجود خطوط فردية في نوافذه المختلفة ، يجد مكتب البريد أن الانحراف المعياري لأوقات الانتظار الموزعة بشكل طبيعي للعملاء بعد ظهر يوم الجمعة هو 7.2 دقيقة. يقوم مكتب البريد بإجراء تجارب على خط انتظار رئيسي واحد ووجد أنه بالنسبة لعينة عشوائية من 25 عميلًا ، يكون لأوقات الانتظار للعملاء انحراف معياري يبلغ 3.5 دقيقة.

مع مستوى أهمية 5٪ ، اختبر الادعاء بأن يؤدي الخط الواحد إلى اختلاف أقل بين أوقات الانتظار (فترات انتظار أقصر) للعملاء.

إجابه

نظرًا لأن الادعاء هو أن سطرًا واحدًا يسبب تباينًا أقل ، فهذا اختبار لتباين واحد. المعلمة هي تباين المحتوى ، ( sigma ^ {2} ) ، أو الانحراف المعياري للمحتوى ، ( sigma ).

متغير عشوائي: نموذج الانحراف المعياري ، (ق ) ، هو المتغير العشوائي. دعونا (s = text {الانحراف المعياري لأوقات الانتظار} ).

  • (H_ {0}: sigma ^ {2} = 7.2 ^ {2} )
  • (H_ {a}: sigma ^ {2} <7.2 ^ {2} )

الكلمة "أقل" يخبرك أن هذا اختبار ذو طرف أيسر.

توزيع الاختبار: ( chi ^ {2} _ {24} ) ، حيث:

  • (n = text {عدد العملاء الذين تم أخذ عينات منهم} )
  • (مدافع = ن - 1 = 25-1 = 24 )

احسب إحصاء الاختبار (المعادلة المرجع {test}):

[ chi ^ {2} = frac {(n-1) s ^ {2}} { sigma ^ {2}} = frac {(25-1) (3.5) ^ {2}} {7.2 ^ {2}} = 5.67 بلا رقم ]

حيث (n = 25 ) و (s = 3.5 ) و ( سيجما = 7.2 ).

رسم بياني:

الشكل ( PageIndex {1} ).

بيان الاحتمالية: (p text {-value} = P ( chi ^ {2} <5.67) = 0.000042 )

قارن (ألفا) و ال (p text {-value} ):

[ alpha = 0.05 (p text {-value} = 0.000042 alpha> p text {-value} nonumber ]

اصنع قرار: منذ ( alpha> p text {-value} ) ، ارفض (H_ {0} ). هذا يعني أنك ترفض ( sigma ^ {2} = 7.2 ^ {2} ). بمعنى آخر ، لا تعتقد أن الاختلاف في أوقات الانتظار هو 7.2 دقيقة ؛ تعتقد أن الاختلاف في أوقات الانتظار أقل.

استنتاج: عند مستوى أهمية بنسبة 5٪ ، من البيانات ، هناك أدلة كافية لاستنتاج أن السطر الواحد يؤدي إلى اختلاف أقل بين فترات الانتظار أو بخط واحد ، تختلف أوقات انتظار العميل عن 7.2 دقيقة.

فيالحي الثاني، استعمال7: χ2cdf. بناء الجملة هو(سفلي ، علوي ، مدافع)لقائمة المعلمات. فمثلا،χ2cdf (-1E99،5.67،24). (p text {-value} = 0.000042 ).

تمرين ( PageIndex {2} )

تجري لجنة الاتصالات الفيدرالية (FCC) اختبارات سرعة النطاق العريض لقياس مقدار البيانات التي تمر في الثانية بين كمبيوتر المستهلك والإنترنت. اعتبارًا من أغسطس 2012 ، بلغ الانحراف المعياري لسرعات الإنترنت عبر مزودي خدمة الإنترنت (ISPs) 12.2 بالمائة. لنفترض أنه تم أخذ عينة من 15 من مزودي خدمات الإنترنت ، والانحراف المعياري هو 13.2. يدعي أحد المحللين أن الانحراف المعياري للسرعة أكبر مما تم الإبلاغ عنه. اذكر الفرضيات الفارغة والبديلة ، واحسب درجات الحرية ، وإحصاء الاختبار ، وارسم الرسم البياني لـ ص- القيمة ، واستخلاص النتيجة. اختبر عند مستوى أهمية 1٪.

إجابه
  • (H_ {0}: sigma ^ {2} = 12.2 ^ {2} )
  • (H_ {a}: sigma ^ {2}> 12.2 ^ {2} )

فيالحي الثاني، استخدم 7:χ2cdf. بناء الجملة هو(سفلي ، علوي ، مدافع)لقائمة المعلمات.χ2cdf (16.39،10 ^ 99،14). (p text {-value} = 0.2902 ).

(مدافع = 14 )

[ text {chi} ^ {2} text {test statistic} = 16.39 nonumber ]

الشكل ( PageIndex {2} ).

(p text {-value} ) هي (0.2902 ) ، لذلك نرفض رفض الفرضية الصفرية. لا توجد أدلة كافية تشير إلى أن التباين أكبر من (12.2 ^ {2} ).

إعادة النظر

لاختبار التباين ، استخدم اختبار مربع كاي لتباين واحد. قد يكون الاختبار يسارًا أو يمينًا أو ثنائي الذيل ، ويتم التعبير عن فرضياته دائمًا من حيث التباين (أو الانحراف المعياري).

مراجعة الصيغة

( chi ^ {2} = frac {(n-1) cdot s ^ {2}} { sigma ^ {2}} ) اختبار إحصاء تباين واحد حيث:

(n: text {sample size} )

(ق: نص {نموذج الانحراف المعياري} )

( سيجما: نص {الانحراف المعياري للسكان} )

(df = n - 1 text {درجات الحرية} )

اختبار تباين واحد

  • استخدم الاختبار لتحديد التباين.
  • درجات الحرية هي ( نص {عدد العينات} - 1 ).
  • إحصائية الاختبار هي ( frac {(n-1) cdot s ^ {2}} { sigma ^ {2}} ) ، حيث (n = text {العدد الإجمالي للبيانات} ) ، (s ^ {2} = text {sample variance} ) و ( sigma ^ {2} = text {Population variance} ).
  • قد يكون الاختبار يسارًا أو يمينًا أو ثنائي الذيل.

استخدم المعلومات التالية للإجابة على التدريبات الثلاثة التالية: الانحراف المعياري لرامي السهام في ضرباته هو ستة (تقاس البيانات بالمسافة من مركز الهدف). يدعي مراقب أن الانحراف المعياري أقل.

تمرين ( PageIndex {3} )

ما نوع الاختبار الذي يجب استخدامه؟

إجابه

اختبار تباين واحد

تمرين ( PageIndex {4} )

اذكر الفرضيات الباطلة والبديلة.

تمرين ( PageIndex {5} )

هل هذا اختبار ذيل أيمن أم أيسر أم ذيلان؟

إجابه

اختبار الذيل الأيسر

استخدم المعلومات التالية للإجابة على التدريبات الثلاثة التالية: الانحراف المعياري لارتفاعات الطلاب في المدرسة هو 0.81. تم أخذ عينة عشوائية من 50 طالبًا ، والانحراف المعياري لارتفاعات العينة هو 0.96. يعتقد الباحث المسؤول عن الدراسة أن الانحراف المعياري لارتفاعات المدرسة أكبر من 0.81.

تمرين ( PageIndex {6} )

ما نوع الاختبار الذي يجب استخدامه؟

تمرين ( PageIndex {5} )

اذكر الفرضيات الباطلة والبديلة.

إجابه

(H_ {0}: sigma ^ {2} = 0.81 ^ {2} ) ؛

(H_ {a}: sigma ^ {2}> 0.81 ^ {2} )

تمرين ( PageIndex {6} )

(df = ) ________

استخدم المعلومات التالية للإجابة على التمارين الأربعة التالية: يختلف متوسط ​​وقت الانتظار في عيادة الطبيب. الانحراف المعياري لأوقات الانتظار في عيادة الطبيب هو 3.4 دقيقة. عينة عشوائية من 30 مريضًا في مكتب الطبيب بها انحراف معياري لأوقات الانتظار البالغة 4.1 دقيقة. يعتقد أحد الأطباء أن تباين أوقات الانتظار أكبر مما كان يعتقد في الأصل.

تمرين ( PageIndex {7} )

ما نوع الاختبار الذي يجب استخدامه؟

إجابه

اختبار تباين واحد

تمرين ( PageIndex {8} )

ما هي إحصائية الاختبار؟

تمرين ( PageIndex {9} )

ما هو (p text {-value} )؟

إجابه

0.0542

تمرين ( PageIndex {10} )

ما الذي يمكنك استنتاجه عند مستوى الأهمية 5٪؟


حاسبة الانحراف المعياري

يرجى تقديم أرقام مفصولة بفاصلة لحساب الانحراف المعياري والتباين والمتوسط ​​والمجموع وهامش الخطأ.

الانحراف المعياري في الإحصاء ، ويُشار إليه عادةً بـ σ، هو مقياس للتباين أو التشتت (يشير إلى مدى التوزيع للتمدد أو الضغط) بين القيم في مجموعة من البيانات. كلما انخفض الانحراف المعياري ، كلما اقتربت نقاط البيانات من المتوسط ​​(أو القيمة المتوقعة) ، & مو. على العكس من ذلك ، يشير الانحراف المعياري الأعلى إلى نطاق أوسع من القيم. على غرار المفاهيم الرياضية والإحصائية الأخرى ، هناك العديد من المواقف المختلفة التي يمكن فيها استخدام الانحراف المعياري ، وبالتالي العديد من المعادلات المختلفة. بالإضافة إلى التعبير عن التباين السكاني ، غالبًا ما يستخدم الانحراف المعياري أيضًا لقياس النتائج الإحصائية مثل هامش الخطأ. عند استخدامه بهذه الطريقة ، غالبًا ما يطلق على الانحراف المعياري الخطأ المعياري للمتوسط ​​، أو الخطأ المعياري للتقدير فيما يتعلق بالمتوسط. تحسب الآلة الحاسبة أعلاه الانحراف المعياري للمجتمع وعينة الانحراف المعياري ، بالإضافة إلى تقديرات فاصل الثقة التقريبية.

الانحراف المعياري السكان

الانحراف المعياري للمحتوى ، التعريف القياسي لـ σ، عندما يمكن قياس المحتوى بأكمله ، وهو الجذر التربيعي للتباين في مجموعة بيانات معينة. في الحالات التي يمكن فيها أخذ عينات لكل فرد من السكان ، يمكن استخدام المعادلة التالية للعثور على الانحراف المعياري للمجموعة بأكملها:

بالنسبة لأولئك الذين ليسوا على دراية بالتدوين التجميعي ، قد تبدو المعادلة أعلاه شاقة ، ولكن عند معالجتها من خلال مكوناتها الفردية ، فإن هذا الجمع ليس معقدًا بشكل خاص. ال أنا = 1 في التجميع يشير إلى مؤشر البداية ، أي لمجموعة البيانات 1 ، 3 ، 4 ، 7 ، 8 ، أنا = 1 سيكون 1 ، أنا = 2 سيكون 3 ، وهكذا. ومن ثم فإن تدوين الجمع يعني ببساطة تنفيذ عملية (xأنا - & مو 2) على كل قيمة من خلال ن، وهي في هذه الحالة 5 نظرًا لوجود 5 قيم في مجموعة البيانات هذه.

مثال: & مو = (1 + 3 + 4 + 7 + 8) / 5 = 4.6
& # 963 = & جذر [(1 - 4.6) 2 + (3 - 4.6) 2 +. + (8 - 4.6) 2)] / 5
& # 963 = & جذر (12.96 + 2.56 + 0.36 + 5.76 + 11.56) / 5 = 2.577

الانحراف المعياري للعينة

في كثير من الحالات ، لا يمكن أخذ عينة من كل فرد داخل مجتمع ما ، مما يتطلب تعديل المعادلة أعلاه بحيث يمكن قياس الانحراف المعياري من خلال عينة عشوائية من المجتمع محل الدراسة. مقدر مشترك ل σ هو الانحراف المعياري للعينة ، ويُشار إليه عادةً بالرمز س. من الجدير بالذكر أن هناك العديد من المعادلات المختلفة لحساب الانحراف المعياري للعينة لأنه على عكس متوسط ​​العينة ، لا يحتوي الانحراف المعياري للعينة على أي مقدر واحد غير متحيز وفعال وله أقصى احتمال. المعادلة الواردة أدناه هي "نموذج الانحراف المعياري المصحح". إنها نسخة مصححة من المعادلة التي تم الحصول عليها من تعديل معادلة الانحراف المعياري للمجتمع باستخدام حجم العينة كحجم السكان ، مما يزيل بعض التحيز في المعادلة. ومع ذلك ، فإن التقدير غير المتحيز للانحراف المعياري ينطوي على قدر كبير من الأهمية ويختلف حسب التوزيع. على هذا النحو ، فإن "الانحراف المعياري للعينة المصححة" هو المقدر الأكثر استخدامًا للانحراف المعياري للمجتمع ، ويشار إليه عمومًا باسم "الانحراف المعياري للعينة". إنه تقدير أفضل بكثير من نسخته غير المصححة ، ولكن لا يزال لديه تحيز كبير لأحجام العينات الصغيرة (N <10).

راجع قسم "الانحراف المعياري للمجموعة" للحصول على مثال حول كيفية التعامل مع عمليات الجمع. المعادلة هي نفسها بشكل أساسي باستثناء المصطلح N-1 في معادلة انحراف العينة المصححة ، واستخدام قيم العينة.

تطبيقات الانحراف المعياري

يستخدم الانحراف المعياري على نطاق واسع في الإعدادات التجريبية والصناعية لاختبار النماذج مقابل بيانات العالم الحقيقي. مثال على ذلك في التطبيقات الصناعية هو مراقبة الجودة لبعض المنتجات. يمكن استخدام الانحراف المعياري لحساب الحد الأدنى والحد الأقصى للقيمة التي يجب أن تقع ضمنها بعض جوانب المنتج في نسبة مئوية عالية من الوقت. في الحالات التي تقع فيها القيم خارج النطاق المحسوب ، قد يكون من الضروري إجراء تغييرات على عملية الإنتاج لضمان مراقبة الجودة.

يستخدم الانحراف المعياري أيضًا في الطقس لتحديد الاختلافات في المناخ الإقليمي. تخيل مدينتين ، واحدة على الساحل وأخرى عميقة في الداخل ، لهما نفس متوسط ​​درجة الحرارة 75 درجة فهرنهايت. في حين أن هذا قد يدفع إلى الاعتقاد بأن درجات الحرارة في هاتين المدينتين هي نفسها تقريبًا ، يمكن إخفاء الواقع إذا تم معالجة المتوسط ​​فقط وتجاهل الانحراف المعياري. تميل المدن الساحلية إلى الحصول على درجات حرارة أكثر استقرارًا بسبب التنظيم من قبل المسطحات المائية الكبيرة ، نظرًا لأن المياه تتمتع بسعة حرارية أعلى من الأرض بشكل أساسي ، وهذا يجعل المياه أقل عرضة للتغيرات في درجات الحرارة ، وتظل المناطق الساحلية أكثر دفئًا في الشتاء وأكثر برودة. في الصيف بسبب كمية الطاقة المطلوبة لتغيير درجة حرارة الماء. ومن ثم ، في حين أن المدينة الساحلية قد تتراوح درجات الحرارة فيها بين 60 درجة فهرنهايت و 85 درجة فهرنهايت خلال فترة زمنية معينة لتؤدي إلى متوسط ​​75 درجة فهرنهايت ، يمكن أن يكون للمدينة الداخلية درجات حرارة تتراوح من 30 درجة فهرنهايت إلى 110 درجة فهرنهايت للحصول على نفس المتوسط.

المجال الآخر الذي يستخدم فيه الانحراف المعياري إلى حد كبير هو التمويل ، حيث يستخدم غالبًا لقياس المخاطر المرتبطة بتقلبات الأسعار لبعض الأصول أو محفظة الأصول. يوفر استخدام الانحراف المعياري في هذه الحالات تقديرًا لعدم التأكد من العوائد المستقبلية على استثمار معين. على سبيل المثال ، عند مقارنة المخزون A الذي يبلغ متوسط ​​عائده 7٪ مع انحراف معياري 10٪ مقابل المخزون B ، والذي له نفس متوسط ​​العائد ولكن بانحراف معياري بنسبة 50٪ ، فمن الواضح أن المخزون الأول سيكون الخيار الأكثر أمانًا ، نظرًا لأن الانحراف المعياري للمخزون B أكبر بكثير ، لنفس العائد بالضبط. هذا لا يعني أن السهم A هو بالتأكيد خيار استثمار أفضل في هذا السيناريو ، لأن الانحراف المعياري يمكن أن يحرف المتوسط ​​في أي من الاتجاهين. في حين أن السهم أ لديه احتمال أعلى بمتوسط ​​عائد أقرب إلى 7٪ ، يمكن أن يوفر المخزون ب عائدًا (أو خسارة) أكبر بكثير.

هذه ليست سوى أمثلة قليلة لكيفية استخدام الانحراف المعياري ، ولكن يوجد الكثير منها. بشكل عام ، يعد حساب الانحراف المعياري ذا قيمة في أي وقت يكون مطلوبًا فيه لمعرفة مدى البعد عن المتوسط ​​الذي يمكن أن تكون عليه القيمة النموذجية من التوزيع.


تحليل التباين

رونالد ن. فورثوفر. مايك هيرنانديز ، في الإحصاء الحيوي (الإصدار الثاني) ، 2007

استنتاج

قدمنا ​​في هذا الفصل عدة نماذج أساسية لتحليل التباين. يتم استخدام ANOVA أحادي الاتجاه لتحليل البيانات من تصميم تجريبي عشوائي تمامًا. يمكن استخدام ANOVA ذات الاتجاهين لتصميم الكتلة العشوائية وكذلك لتصميم عاملين مع التفاعل. لاستخدام هذه الأساليب التحليلية بشكل صحيح ، يجب أن نكون على دراية بكيفية جمع البيانات والتأكد من أن البيانات تلبي افتراضات ANOVA. أخيرًا ، ناقشنا مشاكل وطرق تحليل البيانات غير المتوازنة. في الفصل التالي ، سنقوم بتوسيع النموذج الخطي إلى نماذج الانحدار.


محتويات

يشمل هذا التعريف المتغيرات العشوائية التي يتم إنشاؤها بواسطة عمليات منفصلة أو مستمرة أو غير مختلطة أو مختلطة. يمكن أيضًا اعتبار التباين على أنه تغاير متغير عشوائي مع نفسه:

بمعنى آخر ، تباين X يساوي متوسط ​​مربع X ناقص مربع متوسط ​​X. لا ينبغي استخدام هذه المعادلة للحسابات باستخدام حساب الفاصلة العائمة ، لأنها تعاني من الإلغاء الكارثي إذا كان مكونا المعادلة متشابهين في الحجم. للبدائل الأخرى المستقرة عدديًا ، راجع الخوارزميات لحساب التباين.

تحرير المتغير العشوائي المنفصل

(عندما يتم تحديد مثل هذا التباين الموزون المنفصل بواسطة الأوزان التي لا يكون مجموعها 1 ، فحينئذٍ يقسم المرء على مجموع الأوزان.)

تحرير متغير عشوائي مستمر تمامًا

في هذه الصيغ ، التكاملات بالنسبة إلى d x < displaystyle dx> و d F (x) < displaystyle dF (x)> هي تكاملات Lebesgue و Lebesgue – Stieltjes على التوالي.

تحرير التوزيع الأسي

التوزيع الأسي مع المعلمة λ هو توزيع مستمر يتم إعطاء دالة كثافة الاحتمال بواسطة

على الفاصل الزمني [0 ، ∞). يمكن أن يظهر معناه أن يكون

باستخدام التكامل بالأجزاء والاستفادة من القيمة المتوقعة المحسوبة بالفعل ، لدينا:

وبالتالي ، يتم إعطاء تباين X بواسطة

عادل النرد تحرير

يمكن نمذجة نرد عادل سداسي الجوانب كمتغير عشوائي منفصل ، X ، مع النتائج من 1 إلى 6 ، لكل منها احتمالية متساوية 1/6. القيمة المتوقعة لـ X هي (1 + 2 + 3 + 4 + 5 + 6) / 6 = 7 / 2. لذلك ، فإن تباين X هو

الصيغة العامة لتباين النتيجة ، X ، لنرد من جانب n هي

توزيعات الاحتمالية شائعة الاستخدام

يسرد الجدول التالي التباين لبعض التوزيعات الاحتمالية الشائعة الاستخدام.

اسم التوزيع الاحتمالي دالة التوزيع الاحتمالية تعني فرق
توزيع ثنائي Pr (X = k) = (n k) * k (1 - p) n - k > ص ^(1 - ص) ^> ن ص ن ص (1 - ع)
التوزيع الهندسي Pr (X = k) = (1 - p) k - 1 * p ص> 1 ص

>>

(1 - *) * 2 >>>
التوزيع الطبيعي و (س ∣ μ، σ 2) = 1 2 π σ 2 هـ - (س - μ) 2 2 σ 2 right) = < frac <1> < sqrt <2 pi sigma ^ <2> >>> e ^ <- < frac <(x- mu) ^ <2>> <2 sigma ^ <2> >> >> ميكرومتر σ 2 >
توزيع موحد (مستمر) f (x ∣ a، b) = <1 b - a for a ≤ x ≤ b، 0 for x & lt a or x & gt b > & أمبير < نص> a leq x leq b، [3pt] 0 & amp < text> x & lta < text <أو >> x & gtb end>> أ + ب 2 <2>>> (ب - أ) 2 12 > <12> >>
توزع استثنائى و (س ∣ λ) = λ e - λ x > 1 λ >> 1 λ 2 >>>
توزيع السم و (س ∣ λ) = ه - λ λ س س! لامدا ^>>> λ λ

الخصائص الأساسية تحرير

التباين غير سالب لأن المربعات موجبة أو صفرية:

تباين الثابت هو صفر.

على العكس من ذلك ، إذا كان تباين المتغير العشوائي هو 0 ، فمن المؤكد أنه ثابت تقريبًا. أي أنه دائمًا ما يكون له نفس القيمة:

التباين ثابت فيما يتعلق بالتغييرات في معلمة الموقع. بمعنى ، إذا تمت إضافة ثابت إلى جميع قيم المتغير ، فإن التباين لا يتغير:

إذا تم قياس جميع القيم بواسطة ثابت ، فسيتم قياس التباين بمربع ذلك الثابت:

يتم إعطاء التباين لمجموع متغيرين عشوائيين بواسطة

تؤدي هذه النتائج إلى تباين التركيبة الخطية على النحو التالي:

مسائل المحدودية تحرير

إذا لم يكن للتوزيع قيمة متوقعة محدودة ، كما هو الحال بالنسبة لتوزيع كوشي ، فلا يمكن أن يكون التباين محدودًا أيضًا. ومع ذلك ، قد لا يكون لبعض التوزيعات تباين محدود ، على الرغم من أن قيمتها المتوقعة محدودة. مثال على ذلك هو توزيع باريتو الذي يلبي مؤشره k < displaystyle k> 1 & lt k ≤ 2.

مجموع المتغيرات غير المرتبطة (صيغة Bienaymé) تحرير

أحد أسباب استخدام التباين في التفضيل على مقاييس التشتت الأخرى هو أن التباين في مجموع (أو اختلاف) المتغيرات العشوائية غير المرتبطة هو مجموع الفروق:

يُطلق على هذه العبارة اسم معادلة Bienaymé [2] واكتشفت في عام 1853. [3] [4] غالبًا ما يتم إجراؤها بشرط أقوى أن تكون المتغيرات مستقلة ، ولكن عدم الترابط يكفي. إذن ، إذا كانت جميع المتغيرات لها نفس التباين σ 2 ، فمنذ القسمة على ن هو تحويل خطي ، تشير هذه الصيغة على الفور إلى أن تباين متوسطها هو

وهذا يعني أن تباين المتوسط ​​يتناقص عندما ن يزيد. تستخدم هذه الصيغة الخاصة بتباين المتوسط ​​في تعريف الخطأ المعياري لمتوسط ​​العينة ، والذي يستخدم في نظرية الحد المركزي.

لإثبات البيان الأولي ، يكفي إظهار ذلك

النتيجة العامة بعد ذلك تتبع الاستقراء. بدءا من التعريف ،

استخدام خطية عامل التوقع وافتراض استقلالية (أو عدم الارتباط) X و ص، هذا يبسط بشكل أكبر على النحو التالي:

تحرير مجموع المتغيرات المترابطة

مع الارتباط وحجم العينة الثابت تحرير

بشكل عام ، تباين مجموع متغيرات n هو مجموع تغايراتها:

(ملاحظة: المساواة الثانية تأتي من حقيقة أن Cov (Xأنا,Xأنا) = فار (Xأنا) .)

هنا ، Cov ⁡ (⋅، ⋅) ( cdot، cdot)> هو التغاير ، وهو صفر للمتغيرات العشوائية المستقلة (إن وجدت). تنص الصيغة على أن تباين المجموع يساوي مجموع كل العناصر في مصفوفة التغاير للمكونات. يوضح التعبير التالي بشكل مكافئ أن تباين المجموع هو مجموع قطري مصفوفة التغاير بالإضافة إلى ضعف مجموع عناصرها المثلثية العلوية (أو عناصرها المثلثية السفلية) وهذا يؤكد أن مصفوفة التغاير متماثلة. تستخدم هذه الصيغة في نظرية ألفا كرونباخ في نظرية الاختبار الكلاسيكية.

لذلك إذا كانت المتغيرات لها تباين متساوٍ σ 2 ومتوسط ​​ارتباط المتغيرات المتميزة هو ρ، ثم تباين متوسطها هو

هذا يعني أن تباين المتوسط ​​يزداد مع متوسط ​​الارتباطات. بمعنى آخر ، الملاحظات المترابطة الإضافية ليست فعالة مثل الملاحظات المستقلة الإضافية في تقليل عدم اليقين من المتوسط. علاوة على ذلك ، إذا كانت المتغيرات تحتوي على وحدة تباين ، على سبيل المثال إذا كانت موحدة ، فسيتم تبسيط ذلك إلى

تُستخدم هذه الصيغة في صيغة التنبؤ سبيرمان-براون لنظرية الاختبار الكلاسيكية. هذا يتقارب ل ρ إذا ن يذهب إلى ما لا نهاية ، بشرط أن يظل متوسط ​​الارتباط ثابتًا أو يتقارب أيضًا. لذلك بالنسبة للتباين في متوسط ​​المتغيرات المعيارية ذات الارتباطات المتساوية أو الارتباط المتوسط ​​المتقارب ، لدينا

لذلك ، فإن التباين في متوسط ​​عدد كبير من المتغيرات المعيارية يساوي تقريبًا متوسط ​​الارتباط. يوضح هذا أن متوسط ​​عينة المتغيرات المرتبطة لا يتقارب عمومًا مع متوسط ​​المحتوى ، على الرغم من أن قانون الأعداد الكبيرة ينص على أن متوسط ​​العينة سيتقارب مع المتغيرات المستقلة.

معرف مع تعديل حجم العينة العشوائي

هناك حالات يتم فيها أخذ عينة دون معرفة مسبقة بعدد الملاحظات التي ستكون مقبولة وفقًا لبعض المعايير. في مثل هذه الحالات ، حجم العينة ن هو متغير عشوائي يضيف تباينه إلى تباين X، مثل ذلك،

فار (∑X) = ه (ن) فار (X) + فار (ن) ه 2 (X). [5]

لو ن له توزيع بواسون ، ثم E (ن) = فار (ن) مع مقدر ن = ن. إذن ، مقدر فار (∑X) يصبح nS 2 X + ن X 2 العطاء

خطأ تقليدي( X) = √[(س 2 X + X 2 )/ن].

تدوين المصفوفة لتباين توليفة خطية تحرير

هذا يعني أنه يمكن كتابة تباين المتوسط ​​على أنه (مع متجه عمود واحد)

المجموع المرجح للمتغيرات تحرير

خاصية القياس وصيغة Bienaymé ، إلى جانب خاصية التباين المشترك Cov (فأس, بواسطة) = أب كوف (X, ص) بشكل مشترك يعني ذلك

هذا يعني أنه في المجموع المرجح للمتغيرات ، سيكون للمتغير ذو الوزن الأكبر وزن كبير بشكل غير متناسب في تباين الإجمالي. على سبيل المثال ، إذا X و ص غير مرتبطة ووزن X ضعف وزن ص، ثم وزن التباين X سيكون أربعة أضعاف وزن التباين ص.

يمكن أن يمتد التعبير أعلاه إلى مجموع مرجح لمتغيرات متعددة:

منتج المتغيرات المستقلة تحرير

إذا كان المتغيرين X و Y مستقلين ، فإن التباين في منتجهما يُعطى بواسطة [7]

بالتساوي ، باستخدام الخصائص الأساسية للتوقع ، يتم إعطاؤها بواسطة

نتاج المتغيرات التابعة إحصائيا تحرير

بشكل عام ، إذا كان هناك متغيرين معتمدين إحصائيًا ، يتم إعطاء تباين منتجهما من خلال:

تحرير التحلل

يتم تطبيق صيغة مماثلة في تحليل التباين ، حيث تكون الصيغة المقابلة

يمكن أيضًا اشتقاق هذا من إضافة التباينات ، نظرًا لأن النتيجة الإجمالية (المرصودة) هي مجموع الدرجة المتوقعة ودرجة الخطأ ، حيث لا يتم ربط الأخيرين.

تحليلات مماثلة ممكنة لمجموع الانحرافات التربيعية (مجموع المربعات ، S S >> ):

الحساب من تحرير CDF

يمكن التعبير عن تباين المحتوى لمتغير عشوائي غير سالب من حيث دالة التوزيع التراكمي F استخدام

يمكن استخدام هذا التعبير لحساب التباين في المواقف التي يمكن فيها التعبير عن CDF بسهولة ، ولكن ليس الكثافة.

الخاصية المميزة تحرير

وحدات القياس تحرير

على عكس الانحراف المطلق المتوقع ، فإن تباين المتغير له وحدات هي مربع وحدات المتغير نفسه. على سبيل المثال ، المتغير المقاس بالأمتار سيكون له تباين يقاس بالمتر المربع. لهذا السبب ، غالبًا ما يُفضل وصف مجموعات البيانات عبر الانحراف المعياري أو الجذر التربيعي المتوسط ​​للانحراف عن استخدام التباين. في مثال النرد ، يكون الانحراف المعياري 2.9 ≈ 1.7 ، أكبر قليلاً من الانحراف المطلق المتوقع 1.5.

يمكن استخدام كل من الانحراف المعياري والانحراف المطلق المتوقع كمؤشر على "انتشار" التوزيع. الانحراف المعياري أكثر قابلية للتلاعب الجبري من الانحراف المطلق المتوقع ، جنبًا إلى جنب مع التباين وتغاير تعميمه ، يتم استخدامه بشكل متكرر في الإحصائيات النظرية ، ولكن الانحراف المطلق المتوقع يميل إلى أن يكون أكثر قوة لأنه أقل حساسية للقيم المتطرفة الناشئة عن قياس الشذوذ أو التوزيع ذو الذيل الثقيل بشكل غير ملائم.

تستخدم طريقة دلتا توسعات تايلور من الدرجة الثانية لتقريب تباين دالة لمتغير واحد أو أكثر من المتغيرات العشوائية: انظر توسعات تايلور للحظات وظائف المتغيرات العشوائية. على سبيل المثال ، يتم إعطاء التباين التقريبي لدالة لمتغير واحد بواسطة

بشرط F قابل للاشتقاق مرتين وأن المتوسط ​​والتباين X محدودة.

لا يمكن أن تكون ملاحظات العالم الحقيقي مثل قياسات مطر الأمس على مدار اليوم مجموعات كاملة من جميع الملاحظات الممكنة التي يمكن إجراؤها. على هذا النحو ، فإن التباين المحسوب من المجموعة المحدودة لن يتطابق بشكل عام مع التباين الذي كان من الممكن حسابه من المجموعة الكاملة للملاحظات الممكنة. هذا يعني أن المرء يقدر المتوسط ​​والتباين اللذين كان يمكن حسابهما من مجموعة الملاحظات كلي العلم باستخدام معادلة مقدر. المقدّر هو دالة لعينة ن الملاحظات مستمدة من دون تحيز الملاحظة من جميع السكان من الملاحظات المحتملة. في هذا المثال ، ستكون هذه العينة عبارة عن مجموعة القياسات الفعلية لهطول الأمطار أمس من مقاييس المطر المتاحة داخل الجغرافيا محل الاهتمام.

أبسط تقديرات لمتوسط ​​المجتمع وتباين المجتمع هي ببساطة متوسط ​​وتباين العينة ، و متوسط ​​العينة و (غير مصحح) عينة التباين - هذه تقديرات متسقة (تتقارب مع القيمة الصحيحة مع زيادة عدد العينات) ، ولكن يمكن تحسينها. إن تقدير تباين المجتمع بأخذ تباين العينة قريب من المستوى الأمثل بشكل عام ، ولكن يمكن تحسينه بطريقتين. ببساطة ، يتم حساب تباين العينة كمتوسط ​​للانحرافات التربيعية حول المتوسط ​​(العينة) ، عن طريق القسمة على ن. ومع ذلك ، باستخدام قيم أخرى غير ن يحسن المقدر بطرق مختلفة. أربع قيم مشتركة للمقام هي ن، ن − 1, ن + 1 و ن − 1.5: ن هو أبسط (التباين السكاني للعينة) ، ن - 1 يزيل التحيز ، ن + 1 يقلل متوسط ​​الخطأ التربيعي للتوزيع الطبيعي ، و ن - 1.5 يزيل في الغالب التحيز في التقدير غير المتحيز للانحراف المعياري للتوزيع الطبيعي.

أولاً ، إذا كان متوسط ​​كل العلم غير معروف (وتم حسابه على أنه متوسط ​​العينة) ، فإن تباين العينة يكون مقدرًا متحيزًا: فهو يقلل من التباين بواسطة عامل (ن − 1) / ن التصحيح بهذا العامل (قسمة على ن - 1 بدلا من ن) يسمى تصحيح بيسل. المقدر الناتج غير متحيز ، ويسمى (مصحح) عينة التباين أو تباين العينة غير المتحيز. على سبيل المثال ، متى ن = 1 من الواضح أن التباين في ملاحظة واحدة حول متوسط ​​العينة (نفسه) هو صفر بغض النظر عن تباين المحتوى. إذا تم تحديد المتوسط ​​بطريقة أخرى غير من نفس العينات المستخدمة لتقدير التباين ، فلن ينشأ هذا التحيز ويمكن تقدير التباين بأمان على أنه من العينات المتعلقة بالمتوسط ​​(المعروف بشكل مستقل).

ثانيًا ، لا يقلل تباين العينة عمومًا متوسط ​​الخطأ التربيعي بين تباين العينة وتباين المجتمع. غالبًا ما يؤدي تصحيح التحيز إلى جعل هذا الأمر أسوأ: يمكن دائمًا اختيار عامل مقياس يؤدي بشكل أفضل من تباين العينة المصحح ، على الرغم من أن عامل المقياس الأمثل يعتمد على التفرطح الزائد للسكان (انظر متوسط ​​الخطأ التربيعي: التباين) ، ويقدم التحيز. يتكون هذا دائمًا من تصغير المقدر غير المتحيز (القسمة على عدد أكبر من ن - 1) ، وهو مثال بسيط لمقدر الانكماش: "ينكمش" المقدر غير المتحيز باتجاه الصفر. للتوزيع الطبيعي ، قسمة على ن + 1 (بدلاً من ن - 1 أو ن) يقلل متوسط ​​الخطأ التربيعي. المقدر الناتج متحيز ، ومع ذلك ، ويعرف باسم اختلاف العينة المتحيزة.

تحرير التباين السكاني

بشكل عام ، فإن تباين المجتمع من أ محدود عدد السكان من حيث الحجم ن مع القيم xأنا اعطي من قبل

حيث يعني السكان

يمكن أيضًا حساب تباين المحتوى باستخدام

يطابق تباين المحتوى تباين التوزيع الاحتمالي المُنشئ. بهذا المعنى ، يمكن توسيع مفهوم السكان ليشمل المتغيرات العشوائية المستمرة مع عدد لا حصر له من السكان.

تعديل عينة التباين

تعديل تباين العينة المتحيز

في العديد من المواقف العملية ، لا يُعرف التباين الحقيقي للسكان بداهة ويجب أن تحسب بطريقة أو بأخرى. عند التعامل مع مجموعات سكانية كبيرة للغاية ، لا يمكن حساب كل كائن في المجتمع ، لذلك يجب إجراء الحساب على عينة من السكان. [9] يمكن أيضًا تطبيق تباين العينة لتقدير التباين في التوزيع المستمر من عينة من ذلك التوزيع.

نأخذ عينة مع استبدال ن القيم ص1, . صن من السكان ، أين ن & lt ن، وتقدير التباين على أساس هذه العينة. [10] أخذ التباين المباشر في بيانات العينة يعطي متوسط ​​الانحرافات التربيعية:

تحرير تباين العينة غير المتحيز

يؤدي تصحيح هذا التحيز إلى إنتاج تباين العينة غير المتحيز، يرمز إلى الصورة 2 >:

قد يشار إلى أي من المقدر ببساطة باسم تباين العينة عندما يمكن تحديد الإصدار حسب السياق. ينطبق نفس الدليل أيضًا على العينات المأخوذة من توزيع احتمالي مستمر.

استخدام المصطلح ن - 1 يسمى تصحيح بيسل ، ويستخدم أيضًا في عينة التباين والانحراف المعياري للعينة (الجذر التربيعي للتباين). الجذر التربيعي هو دالة مقعرة وبالتالي يقدم تحيزًا سلبيًا (بواسطة عدم مساواة جنسن) ، والذي يعتمد على التوزيع ، وبالتالي فإن الانحراف المعياري للعينة المصححة (باستخدام تصحيح بيسل) متحيز. يعتبر التقدير غير المتحيز للانحراف المعياري مشكلة فنية متضمنة ، على الرغم من التوزيع الطبيعي باستخدام المصطلح ن - 1.5 ينتج مقدرًا غير متحيز تقريبًا.

تباين العينة غير المتحيز هو إحصاء U للدالة ƒ(ذ1, ذ2) = (ذ1ذ2) 2/2 ، مما يعني أنه يتم الحصول عليها عن طريق حساب متوسط ​​إحصائية من عينتين على مجموعات فرعية مكونة من عنصرين من المجتمع.


يسمى الجذر التربيعي الموجب للتباين الانحراف المعياري. وهذا يعني أن الانحراف المعياري هو الجذر التربيعي الموجب لمتوسط ​​مربعات الانحرافات للقيم المعطاة عن وسطها. يتم الإشارة إليه بواسطة σ.

يعطي الانحراف المعياري فكرة واضحة عن مدى انتشار القيم أو انحرافها عن المتوسط.




حساب الانحراف المعياري من التباين

في التمويل وفي معظم التخصصات الأخرى ، يتم استخدام الانحراف المعياري بشكل متكرر أكثر من التباين. كلاهما مقياس للتشتت أو التقلب في مجموعة البيانات وهما مرتبطان ارتباطًا وثيقًا.

الانحراف المعياري هو الجذر التربيعي للتباين.

والعكس صحيح ، التباين هو مربع الانحراف المعياري.

لحساب الانحراف المعياري عن التباين ، خذ الجذر التربيعي.

في مثالنا ، فرق تساوي 200 ، وبالتالي فإن الانحراف المعياري يساوي الجذر التربيعي لـ 200 ، وهو ما يساوي 14.14.

لحساب الانحراف المعياري لمجموعة بيانات ، قم أولاً بحساب التباين ثم الجذر التربيعي لذلك.


محتويات

تم نشر التمهيد بواسطة برادلي إيفرون في "طرق التمهيد: نظرة أخرى على سكين جاك" (1979) ، [5] [6] [7] مستوحى من العمل السابق على سكين جاك. [8] [9] [10] تم تطوير تقديرات محسنة للتباين في وقت لاحق. [11] [12] تم تطوير امتداد بايزي في عام 1981. [13] تم تطوير التمهيد المصحح والمتسارع (BCa) بواسطة إيفرون في عام 1987 ، [14] وإجراء ABC في عام 1992. [15]

الفكرة الأساسية لعملية التمهيد هي أنه يمكن نمذجة الاستدلال حول مجتمع من بيانات العينة (عينة → السكان) جارى الاختزال بيانات العينة وإجراء استدلال حول عينة من البيانات المعاد أخذ عيناتها (إعادة أخذ العينات ← عينة). نظرًا لأن المحتوى غير معروف ، فإن الخطأ الحقيقي في عينة إحصائية مقابل قيمة محتواه غير معروف. في عينات التمهيد ، يكون "السكان" في الواقع هو العينة ، وهذا معروف وبالتالي فإن جودة الاستدلال للعينة "الحقيقية" من البيانات المعاد أخذ عيناتها (العينة المعاد تشكيلها ← العينة) قابلة للقياس.

بشكل أكثر رسمية ، يعمل التمهيد من خلال معالجة الاستدلال على توزيع الاحتمال الحقيقي ي، بالنظر إلى البيانات الأصلية ، باعتبارها مماثلة لاستدلال التوزيع التجريبي Ĵ، بالنظر إلى البيانات المعاد تشكيلها. دقة الاستنتاجات المتعلقة Ĵ باستخدام البيانات المعاد تشكيلها يمكن تقييمها لأننا نعلم Ĵ. لو Ĵ هو تقريب معقول ل ي، ثم جودة الاستدلال ي يمكن استنتاجه بدوره.

كمثال ، افترض أننا مهتمون بمتوسط ​​(أو متوسط) ارتفاع الأشخاص في جميع أنحاء العالم. لا يمكننا قياس جميع الأشخاص في سكان العالم ، لذلك بدلاً من ذلك نقوم بأخذ عينة صغيرة منه فقط ، وقياس ذلك. افترض أن العينة ذات حجم ن وهذا يعني أننا نقيس ارتفاعات ن فرادى. من تلك العينة المنفردة ، يمكن الحصول على تقدير واحد فقط للمتوسط. من أجل التفكير في السكان ، نحتاج إلى بعض الإحساس بتنوع المتوسط ​​الذي حسبناه. تتضمن أبسط طريقة للتمهيد أخذ مجموعة البيانات الأصلية من الارتفاعات ، واستخدام جهاز كمبيوتر ، وأخذ عينات منها لتكوين عينة جديدة (تسمى عينة "إعادة العينة" أو نموذج التمهيد) والتي تكون أيضًا ذات حجم ن. يتم أخذ عينة التمهيد من النسخة الأصلية باستخدام أخذ العينات مع الاستبدال (على سبيل المثال ، قد "نعيد العينة" 5 مرات من [1،2،3،4،5] ونحصل على [2،5،4،4،1]) ، لذلك ، على افتراض ن كبيرة بما فيه الكفاية ، لجميع الأغراض العملية ، هناك احتمال صفري تقريبًا أن تكون مطابقة للعينة "الحقيقية" الأصلية. تتكرر هذه العملية عددًا كبيرًا من المرات (عادةً 1000 أو 10000 مرة) ، ولكل من عينات التمهيد هذه نحسب متوسطها (يُطلق على كل منها تقديرات التمهيد). يمكننا الآن إنشاء رسم بياني لوسائل التمهيد. يوفر هذا الرسم البياني تقديرًا لشكل توزيع متوسط ​​العينة الذي يمكننا من خلاله الإجابة عن أسئلة حول مدى اختلاف المتوسط ​​عبر العينات. (يمكن تطبيق الطريقة الموضحة هنا للمتوسط ​​على أي إحصاء أو مقدر آخر تقريبًا.)

مزايا تحرير

ميزة كبيرة للتمهيد هي بساطته. إنها طريقة مباشرة لاشتقاق تقديرات الأخطاء المعيارية وفترات الثقة لمقدرات التوزيع المعقدة ، مثل النقاط المئوية ، والنسب ، ونسبة الأرجحية ، ومعاملات الارتباط. يعد Bootstrap أيضًا طريقة مناسبة للتحكم في ثبات النتائج والتحقق منها. على الرغم من أنه من المستحيل معرفة فاصل الثقة الحقيقي بالنسبة لمعظم المشكلات ، إلا أن التمهيد أكثر دقة بشكل مقارب من الفترات القياسية التي تم الحصول عليها باستخدام تباين العينة وافتراضات الحالة الطبيعية. [16] يعد Bootstrapping أيضًا طريقة ملائمة تتجنب تكلفة تكرار التجربة للحصول على مجموعات أخرى من عينات البيانات.

عيوب تحرير

على الرغم من أن التمهيد (في ظل بعض الظروف) متسق مقاربًا ، إلا أنه لا يوفر ضمانات عامة للعينة المحدودة. قد تعتمد النتيجة على العينة التمثيلية.قد تخفي البساطة الظاهرة حقيقة أن الافتراضات المهمة يتم وضعها عند إجراء تحليل التمهيد (مثل استقلالية العينات) حيث يتم ذكرها بشكل رسمي في مناهج أخرى. أيضًا ، يمكن أن يكون التمهيد مستهلكًا للوقت.

توصيات تحرير

أوصى العلماء بمزيد من عينات التمهيد مع زيادة قوة الحوسبة المتاحة. إذا كانت النتائج قد يكون لها عواقب كبيرة في العالم الحقيقي ، فيجب على المرء استخدام أكبر عدد ممكن من العينات ، بالنظر إلى قوة الحوسبة المتاحة والوقت. لا يمكن أن تؤدي زيادة عدد العينات إلى زيادة كمية المعلومات في البيانات الأصلية ، بل يمكنها فقط تقليل آثار أخطاء أخذ العينات العشوائية التي يمكن أن تنشأ من إجراء التمهيد نفسه. علاوة على ذلك ، هناك دليل على أن عدد العينات الأكبر من 100 يؤدي إلى تحسينات طفيفة في تقدير الأخطاء المعيارية. [17] في الواقع ، وفقًا للمطور الأصلي لطريقة التمهيد ، من المحتمل أن يؤدي تحديد عدد العينات عند 50 عينة إلى تقديرات خطأ معيارية جيدة إلى حد ما. [18]

Adèr et al. التوصية بإجراء التمهيد للحالات التالية: [19]

  • عندما يكون التوزيع النظري لإحصاء الفائدة معقدًا أو غير معروف. نظرًا لأن إجراء التمهيد مستقل عن التوزيع ، فإنه يوفر طريقة غير مباشرة لتقييم خصائص التوزيع الأساسي للعينة والمعلمات ذات الأهمية المشتقة من هذا التوزيع.
  • عندما يكون حجم العينة غير كافٍ للاستدلال الإحصائي المباشر. إذا كان التوزيع الأساسي معروفًا جيدًا ، فإن التمهيد يوفر طريقة لحساب التشوهات التي تسببها العينة المحددة التي قد لا تكون ممثلة بشكل كامل للسكان.
  • عندما يتعين إجراء حسابات الطاقة ، وتكون عينة تجريبية صغيرة متاحة. تعتمد معظم حسابات القوة وحجم العينة بشكل كبير على الانحراف المعياري لإحصاء الفائدة. إذا كان التقدير المستخدم غير صحيح ، فسيكون حجم العينة المطلوب خاطئًا أيضًا. تتمثل إحدى طرق الحصول على انطباع عن تباين الإحصاء في استخدام عينة تجريبية صغيرة وتنفيذ التمهيد عليها للحصول على انطباع عن التباين.

ومع ذلك ، أظهر Athreya [20] أنه إذا قام المرء بتنفيذ تمهيد ساذج على متوسط ​​العينة عندما يفتقر المجتمع الأساسي إلى تباين محدود (على سبيل المثال ، توزيع قانون الطاقة) ، فلن يتقارب توزيع التمهيد إلى نفس الحد مثل متوسط ​​العينة. نتيجة لذلك ، قد تكون فترات الثقة على أساس محاكاة مونت كارلو لحذاء التمهيد مضللة. يقول أثريا أنه "ما لم يكن المرء متأكدًا بشكل معقول من أن التوزيع الأساسي ليس ذيلًا ثقيلًا ، يجب على المرء أن يتردد في استخدام التمهيد الساذج".

في المشكلات أحادية المتغير ، من المقبول عادةً إعادة أخذ عينات الملاحظات الفردية مع الاستبدال ("إعادة تشكيل الحالة" أدناه) على عكس الاختزال الجزئي ، حيث تكون إعادة التشكيل بدون استبدال وتكون صالحة في ظل ظروف أضعف بكثير مقارنةً بعملية التمهيد. في العينات الصغيرة ، قد يكون من المفضل اتباع نهج حدودي حدودي. لمشاكل أخرى ، أ تمهيد سلس من المحتمل أن يكون مفضلًا.

لمشاكل الانحدار ، تتوفر بدائل أخرى مختلفة. [21]

تعديل إعادة تشكيل الحالة

يعد Bootstrap مفيدًا بشكل عام لتقدير توزيع الإحصاء (على سبيل المثال ، المتوسط ​​، التباين) دون استخدام النظرية العادية (مثل إحصاء z ، إحصاء t). يكون Bootstrap مفيدًا عندما لا يكون هناك شكل تحليلي أو نظرية عادية للمساعدة في تقدير توزيع الإحصائيات ذات الأهمية ، حيث يمكن أن تنطبق طرق bootstrap على معظم الكميات العشوائية ، على سبيل المثال ، نسبة التباين والمتوسط. هناك طريقتان على الأقل لإجراء إعادة تشكيل الحالة.

  1. تعد خوارزمية مونت كارلو لاعادة تشكيل الحالة بسيطة للغاية. أولاً ، نقوم بإعادة تشكيل البيانات مع الاستبدال ، ويجب أن يكون حجم إعادة العينة مساويًا لحجم مجموعة البيانات الأصلية. ثم يتم حساب إحصائية الفائدة من إعادة العينة من الخطوة الأولى. نكرر هذا الروتين عدة مرات للحصول على تقدير أكثر دقة لتوزيع Bootstrap للإحصاء.
  2. يتشابه الإصدار "الدقيق" لإعادة تشكيل الحالة ، لكننا نعدد بشكل شامل كل إعادة عينة ممكنة لمجموعة البيانات. يمكن أن يكون هذا مكلفًا من الناحية الحسابية حيث يوجد إجمالي (2 ن - 1 ن) = (2 ن - 1)! ن ! (ن - 1)! > = < فارك <(2n-1)!>>> عينات مختلفة ، أين ن هو حجم مجموعة البيانات. هكذا ل ن = 5 ، 10 ، 20 ، 30 هناك 126 ، 92378 ، 6.89 × 10 10 و 5.91 × 10 16 عينة مختلفة على التوالي. [22]

تقدير توزيع العينة يعني تحرير

ضع في اعتبارك تجربة قلب العملة. نقلب العملة ونسجل ما إذا كانت تهبط على الوجه أم الذيل. يترك س = س1, x2, …, x10 تكون 10 ملاحظات من التجربة. xأنا = 1 إذا سقط الوجه الأول ، و 0 بخلاف ذلك. من النظرية العادية ، يمكننا استخدام إحصاء t لتقدير توزيع متوسط ​​العينة ،

تحرير الانحدار

في مشاكل الانحدار ، إعادة تشكيل الحالة يشير إلى مخطط بسيط لإعادة عينات الحالات الفردية - غالبًا صفوف من مجموعة البيانات. بالنسبة لمشاكل الانحدار ، طالما أن مجموعة البيانات كبيرة إلى حد ما ، فإن هذا المخطط البسيط غالبًا ما يكون مقبولًا. ومع ذلك ، فإن الطريقة مفتوحة للنقد [ بحاجة لمصدر ] .

في مشاكل الانحدار ، غالبًا ما تكون المتغيرات التوضيحية ثابتة ، أو على الأقل يتم ملاحظتها بمزيد من التحكم عن متغير الاستجابة. كما يحدد نطاق المتغيرات التوضيحية المعلومات المتاحة منها. لذلك ، فإن إعادة تشكيل الحالات يعني أن كل عينة تمهيدية ستفقد بعض المعلومات. على هذا النحو ، ينبغي النظر في إجراءات بديلة التمهيد.

تحرير التمهيد بايزي

تحرير التمهيد السلس

بموجب هذا المخطط ، تتم إضافة كمية صغيرة (عادةً ما تكون موزعة عادةً) ضوضاء عشوائية صفرية المركز إلى كل ملاحظة تم إعادة تشكيلها. هذا يعادل أخذ العينات من تقدير كثافة النواة للبيانات. يفترض ك لتكون دالة كثافة النواة متماثلة مع تباين الوحدة. مقدر النواة القياسي f ^ h (x) >_(x)> لـ f (x) هو

حيث h < displaystyle h> هي معلمة التنعيم. ومقدر دالة التوزيع المقابلة F ^ h (x) >_(خ)> هو

تحرير حدودي التمهيد

استنادًا إلى افتراض أن مجموعة البيانات الأصلية هي تحقيق لعينة عشوائية من توزيع نوع حد معين ، في هذه الحالة يتم تركيب نموذج حدودي بواسطة معلمة θ ، غالبًا بأقصى احتمالية ، ويتم أخذ عينات من الأرقام العشوائية من هذا النموذج المناسب. عادة ما يكون للعينة المسحوبة نفس حجم العينة مثل البيانات الأصلية. ثم يمكن كتابة تقدير الوظيفة الأصلية F كـ F ^ = F θ ^ > = F _ < hat < theta >>>. تتكرر عملية أخذ العينات هذه عدة مرات كما هو الحال مع طرق التمهيد الأخرى. بالنظر إلى متوسط ​​العينة المركز في هذه الحالة ، يتم استبدال دالة التوزيع الأصلي للعينة العشوائية F θ > بعينة تمهيدية عشوائية مع الوظيفة F θ ^ > > ، والتوزيع الاحتمالي لـ X n ¯ - μ θ >> - mu _ < theta >> تقترب من X ¯ n ∗ - μ ∗ >_^ <*> - mu ^ <* >> ، حيث μ ∗ = μ ​​θ ^ = mu _ >> ، وهو التوقع المقابل لـ F θ ^ >>. [25] استخدام نموذج حدودي في مرحلة أخذ العينات لمنهجية التمهيد يؤدي إلى إجراءات مختلفة عن تلك التي تم الحصول عليها من خلال تطبيق النظرية الإحصائية الأساسية للاستدلال لنفس النموذج.

إعادة تشكيل المخلفات تحرير

طريقة أخرى لإقلاع التمهيد في مشاكل الانحدار هي إعادة عينة المخلفات. الطريقة تسير على النحو التالي.

يتميز هذا المخطط بأنه يحتفظ بالمعلومات في المتغيرات التوضيحية. ومع ذلك ، فإن السؤال الذي يطرح نفسه حول أي البقايا لإعادة أخذ عينة. تعتبر المخلفات الخام أحد الخيارات الأخرى وهي المخلفات الطلابية (في الانحدار الخطي). على الرغم من وجود حجج لصالح استخدام المخلفات الطلابية في الممارسة العملية ، إلا أن ذلك لا يحدث فرقًا كبيرًا ، ومن السهل مقارنة نتائج كلا المخططين.

عملية غاوسي انحدار التمهيد تحرير

عندما تكون البيانات مترابطة مؤقتًا ، فإن عملية التمهيد المباشر تدمر الارتباطات المتأصلة. تستخدم هذه الطريقة انحدار عملية Gaussian (GPR) لتلائم نموذجًا احتماليًا يمكن بعد ذلك استنباط التكرارات منه. GPR هي طريقة بايزي لانحدار غير خطي. عملية Gaussian (GP) عبارة عن مجموعة من المتغيرات العشوائية ، وأي عدد محدود منها له توزيع غاوسي مشترك (عادي). يتم تعريف GP من خلال دالة متوسطة ودالة التباين ، والتي تحدد المتجهات المتوسطة ومصفوفات التغاير لكل مجموعة محدودة من المتغيرات العشوائية. [26]

عملية غاوسية سابقة:

عملية غاوسية اللاحقة:

وفقا ل GP السابقة ، يمكننا الحصول عليها

دع x1 *. xس * كن مجموعة محدودة أخرى من المتغيرات ، من الواضح أن

حسب المعادلات أعلاه ، المخرجات ذ يتم أيضًا توزيعها بشكل مشترك وفقًا لـ Gaussian متعدد المتغيرات. هكذا،

Wild bootstrap تحرير

الحذاء البري ، الذي اقترحه في الأصل وو (1986) ، [27] يناسب عندما يُظهر النموذج مغايرة التغاير. تتمثل الفكرة ، مثل التمهيد المتبقي ، في ترك المنحدرات عند قيمة العينة الخاصة بهم ، ولكن إعادة تشكيل متغير الاستجابة بناءً على القيم المتبقية. أي ، لكل تكرار ، يحسب المرء y جديدًا بناءً على

  • التوزيع الطبيعي القياسي
  • توزيع اقترحه Mammen (1993). [28]
  • أو التوزيع الأبسط المرتبط بتوزيع Rademacher:

كتلة تحرير التمهيد

يتم استخدام كتلة التمهيد عندما تكون البيانات أو الأخطاء في النموذج مترابطة. في هذه الحالة ، ستفشل الحالة البسيطة أو إعادة التشكيل المتبقية ، لأنها غير قادرة على تكرار الارتباط في البيانات. يحاول bootstrap الكتلة تكرار الارتباط عن طريق إعادة أخذ عينات داخل كتل البيانات. تم استخدام كتلة التمهيد بشكل أساسي مع البيانات المرتبطة بالوقت (أي السلاسل الزمنية) ولكن يمكن أيضًا استخدامها مع البيانات المرتبطة في الفضاء ، أو بين المجموعات (ما يسمى ببيانات الكتلة).

السلاسل الزمنية: تحرير كتلة تمهيد بسيطة

في قالب التمهيد (البسيط) ، يتم تقسيم متغير الفائدة إلى كتل غير متداخلة.

السلاسل الزمنية: نقل كتلة التمهيد تحرير

في التمهيد للكتلة المتحركة ، الذي قدمه Künsch (1989) ، [29] يتم تقسيم البيانات إلى نب + 1 كتل متداخلة الطول ب: الملاحظة من 1 إلى ب ستكون الخانة 1 ، الملاحظة 2 إلى ب + 1 سيكون الخانة 2 ، إلخ. ثم من هؤلاء نب + 1 بلوك ، ن/ب سيتم سحب الكتل بشكل عشوائي مع الاستبدال. ثم محاذاة هذه الكتل n / b بالترتيب الذي تم اختيارهم به ، ستعطي ملاحظات التمهيد.

يعمل هذا التمهيد مع البيانات التابعة ، ومع ذلك ، لن تكون الملاحظات التي تم تمهيدها ثابتة بعد الآن من خلال البناء. ولكن ، تبين أن التباين العشوائي في طول الكتلة يمكن أن يتجنب هذه المشكلة. [30] تُعرف هذه الطريقة باسم التمهيد الثابت. التعديلات الأخرى ذات الصلة بتمهيد الكتلة المتحركة هي حذاء ماركوفيان وطريقة تمهيد ثابتة تتطابق مع الكتل اللاحقة بناءً على مطابقة الانحراف المعياري.

السلاسل الزمنية: الحد الأقصى لتحرير التمهيد للإنتروبيا

يقدم Vinod (2006) ، [31] طريقة تقوم بتمهيد بيانات السلاسل الزمنية باستخدام مبادئ الانتروبيا القصوى التي ترضي نظرية Ergodic مع قيود الحفاظ على الكتلة والحفاظ عليها. هناك حزمة R ، ميبوت، [32] الذي يستخدم الطريقة التي لها تطبيقات في الاقتصاد القياسي وعلوم الكمبيوتر.

بيانات الكتلة: كتلة تحرير التمهيد

تصف بيانات الكتلة البيانات التي يتم فيها ملاحظة العديد من الملاحظات لكل وحدة. قد يكون هذا هو مراقبة العديد من الشركات في العديد من الولايات ، أو مراقبة الطلاب في العديد من الفصول الدراسية. في مثل هذه الحالات ، يتم تبسيط بنية الارتباط ، وعادة ما يفترض المرء أن البيانات مرتبطة داخل مجموعة / عنقود ، ولكنها مستقلة بين المجموعات / الكتل. يمكن الحصول على هيكل كتلة التمهيد بسهولة (حيث تتوافق الكتلة فقط مع المجموعة) ، وعادة ما يتم إعادة تشكيل المجموعات فقط ، بينما تترك الملاحظات داخل المجموعات دون تغيير. كاميرون وآخرون. (2008) يناقش هذا للأخطاء العنقودية في الانحدار الخطي. [33]

يعد bootstrap أسلوبًا قويًا على الرغم من أنه قد يتطلب موارد حوسبة كبيرة في كل من الوقت والذاكرة. تم تطوير بعض التقنيات لتقليل هذا العبء. يمكن دمجها بشكل عام مع العديد من الأنواع المختلفة من مخططات Bootstrap والخيارات المختلفة للإحصاء.

تحرير Poisson bootstrap

يتطلب التمهيد العادي اختيارًا عشوائيًا لعدد n من العناصر من قائمة ، وهو ما يعادل الرسم من توزيع متعدد الحدود. قد يتطلب هذا عددًا كبيرًا من التمريرات عبر البيانات ويصعب تشغيل هذه الحسابات بالتوازي. بالنسبة لقيم n الكبيرة ، يعد Poisson bootstrap طريقة فعالة لتوليد مجموعات بيانات تمهيد التشغيل. [34] عند إنشاء عينة تمهيد تشغيل واحدة ، بدلاً من الرسم العشوائي من عينة البيانات مع الاستبدال ، يتم تعيين وزن عشوائي لكل نقطة بيانات موزعة وفقًا لتوزيع بواسون مع λ = 1 . بالنسبة لبيانات العينة الكبيرة ، سيقارب هذا أخذ العينات العشوائي مع الاستبدال. هذا يرجع إلى التقريب التالي:

تتناسب هذه الطريقة أيضًا بشكل جيد مع تدفق البيانات ومجموعات البيانات المتزايدة ، حيث لا يلزم معرفة العدد الإجمالي للعينات مسبقًا قبل البدء في أخذ عينات التمهيد.

حقيبة من Little Bootstraps Edit

تم استخدام توزيع التمهيد لمقدر النقطة لمعلمة المجتمع لإنتاج فاصل ثقة تم تشغيله للقيمة الحقيقية للمعلمة ، إذا كان من الممكن كتابة المعلمة كدالة لتوزيع السكان.

مقدر نقطة بايزي ومقدر الاحتمالية القصوى لهما أداء جيد عندما يكون حجم العينة غير محدود ، وفقًا لنظرية التقارب. بالنسبة للمشاكل العملية المتعلقة بالعينات المحدودة ، قد يكون من الأفضل استخدام تقديرات أخرى. تقترح النظرية المقاربة التقنيات التي غالبًا ما تعمل على تحسين أداء المقدرين المحترفين ، غالبًا ما يتم تحسين التمهيد لمقدر الاحتمالية القصوى باستخدام التحويلات المتعلقة بالكميات المحورية. [36]

تم استخدام توزيع التمهيد لمقدر المعلمة لحساب فترات الثقة لمعلمة السكان الخاصة به. [ بحاجة لمصدر ]

تحرير فترات التحيز وعدم التناسق والثقة

  • تحيز: قد يختلف توزيع التمهيد والعينة بشكل منهجي ، وفي هذه الحالة قد يحدث تحيز. إذا كان توزيع التمهيد للمقدر متماثل ، فغالبًا ما يتم استخدام فاصل الثقة المئوي مثل هذه الفواصل الزمنية تكون مناسبة بشكل خاص للمقدرين المتوسطين غير المتحيزين للحد الأدنى من المخاطر (فيما يتعلق بوظيفة الفاسدة المطلقة). سيؤدي التحيز في توزيع التمهيد إلى التحيز في فاصل الثقة. خلاف ذلك ، إذا كان توزيع التمهيد غير متماثل ، فغالبًا ما تكون فواصل الثقة المئوية غير مناسبة.

تحرير طرق فترات الثقة في التمهيد

هناك عدة طرق لإنشاء فترات الثقة من توزيع التمهيد للمعامل الحقيقي:

  • التمهيد الأساسي، [36] المعروف أيضًا باسم الفاصل المئوي العكسي. [37] التمهيد الأساسي هو مخطط بسيط لبناء فاصل الثقة: يأخذ المرء ببساطة الكميات التجريبية من توزيع التمهيد للمعامل (انظر Davison and Hinkley 1997، Equ. 5.6 p. 194):
  • التمهيد المئوي. يستمر التمهيد المئوي بطريقة مماثلة لعملية التمهيد الأساسية ، باستخدام النسب المئوية لتوزيع التمهيد ، ولكن مع صيغة مختلفة (لاحظ انعكاس الكميات اليمنى واليسرى!):
  • طالب التمهيد. الحذاء الطلابي ، ويسمى أيضًا التمهيد- t، بشكل مشابه لفاصل الثقة القياسي ، لكنه يستبدل الكميات من التقريب العادي أو الطالب بالكميات من توزيع التمهيد لاختبار t للطالب (انظر Davison and Hinkley 1997 ، Equ. 5.7 p. 194 and Efron and Tibshirani 1993 يساوي 12.22 ، ص 160):
  • التمهيد تصحيح التحيز - يضبط للتحيز في توزيع التمهيد.
  • التمهيد المعجل - يتم ضبط التمهيد المصحح والمتسارع (BCa) ، بواسطة Efron (1987) ، [14] لكل من التحيز والانحراف في توزيع التمهيد. هذا النهج دقيق في مجموعة متنوعة من الإعدادات ، وله متطلبات حسابية معقولة ، وينتج فترات ضيقة بشكل معقول. [بحاجة لمصدر]

اختبار فرضية التمهيد

تعديل التمهيد السلس

في عام 1878 ، سجل سايمون نيوكومب ملاحظات حول سرعة الضوء. [41] تحتوي مجموعة البيانات على اثنين من القيم المتطرفة ، والتي تؤثر بشكل كبير على متوسط ​​العينة. (لا يلزم أن يكون متوسط ​​العينة مقدرًا متسقًا لأي وسط مجتمع ، لأنه لا توجد حاجة متوسطة لتوزيع ذي طرف ثقيل.) الإحصاء القوي المحدد جيدًا للاتجاه المركزي هو متوسط ​​العينة ، وهو متسق ومتوسط ​​غير متحيز لمتوسط ​​السكان.

يظهر أدناه توزيع التمهيد لبيانات Newcomb. تقلل طريقة الالتواء للتنظيم من التمييز في توزيع التمهيد بإضافة كمية صغيرة من ن(0, σ 2) ضوضاء عشوائية لكل عينة تمهيد. الاختيار التقليدي هو σ = 1 / n >> لحجم العينة ن. [ بحاجة لمصدر ]

تظهر الرسوم البيانية لتوزيع التمهيد وتوزيع التمهيد السلس أدناه. توزيع التمهيد للوسيط العينة يحتوي فقط على عدد صغير من القيم. يتمتع توزيع التمهيد المصقول بدعم أكثر ثراءً.

في هذا المثال ، فاصل الثقة 95٪ (المئوي) لمتوسط ​​المحتوى هو (26 ، 28.5) ، وهو قريب من الفاصل الزمني لـ (25.98 ، 28.46) للتمهيد المتجانس.

تحرير العلاقة بطرق إعادة التشكيل الأخرى

يتميز bootstrap عن:

  • إجراء jackknife ، المستخدم لتقدير تحيزات إحصائيات العينة ولتقدير التباينات ، وفيه يتم تطبيق المعلمات (مثل أوزان الانحدار وتحميلات العوامل) التي تم تقديرها في عينة فرعية واحدة على عينة فرعية أخرى.

تجميع Bootstrap (التعبئة) عبارة عن خوارزمية وصفية تعتمد على حساب متوسط ​​نتائج عينات التمهيد المتعددة.

تحرير إحصائيات U

في الحالات التي يمكن فيها استنباط إحصائية واضحة لقياس خاصية مطلوبة باستخدام رقم صغير فقط ، ص، من عناصر البيانات ، يمكن صياغة إحصائية مقابلة بناءً على العينة بأكملها. نظرا ل ص-عينة إحصائية ، يمكن للمرء إنشاء ملف ن-Sample statistic بواسطة شيء مشابه لـ bootstrapping (أخذ متوسط ​​الإحصاء على جميع العينات الفرعية للحجم ص). من المعروف أن هذا الإجراء له خصائص جيدة والنتيجة هي إحصاء U. متوسط ​​العينة وتباين العينة من هذا النموذج ، لـ ص = 1 و ص = 2.


اتجاه واحد أنوفا

استخدم anova أحادي الاتجاه عندما يكون لديك متغير اسمي واحد ومتغير قياس واحد ، حيث يقسم المتغير الاسمي القياسات إلى مجموعتين أو أكثر. يختبر ما إذا كانت وسائل متغير القياس هي نفسها للمجموعات المختلفة.

متى يتم استخدامه

تحليل التباين (anova) هو الأسلوب الأكثر استخدامًا لمقارنة وسائل مجموعات بيانات القياس. هناك الكثير من التصاميم التجريبية المختلفة التي يمكن تحليلها بأنواع مختلفة من الأنوفا في هذا الكتيب ، أصف فقط الأنوفا أحادية الاتجاه ، والأنوفا المتداخلة ، والأنوفا ثنائية الاتجاه.

في anova أحادي الاتجاه (المعروف أيضًا باسم anova أحادي أو عامل واحد أو تصنيف مفرد) ، يوجد متغير قياس واحد ومتغير اسمي واحد. تقوم بعمل ملاحظات متعددة لمتغير القياس لكل قيمة من قيم المتغير الاسمي. على سبيل المثال ، إليك بعض البيانات حول قياس الصدفة (طول الندبة العضلية الأمامية المقربة ، موحَّدة بالقسمة على الطول سأسميها "طول AAM") في بلح البحر Mytilus trossulus من خمسة مواقع: Tillamook و Oregon Newport و Oregon Petersburg و Alaska Magadan، Russia و Tvarminne، Finland ، مأخوذة من مجموعة بيانات أكبر بكثير مستخدمة في McDonald et al. (1991).

تيلاموكنيوبورتبطرسبورغماجادانتفارمين
0.05710.08730.09740.10330.0703
0.08130.06620.13520.09150.1026
0.08310.06720.08170.07810.0956
0.09760.08190.10160.06850.0973
0.08170.07490.09680.06770.1039
0.08590.06490.10640.06970.1045
0.07350.08350.1050.0764
0.06590.0725 0.0689
0.0923
0.0836

المتغير الاسمي هو الموقع ، مع القيم الخمس Tillamook و Newport و Petersburg و Magadan و Tvarminne. هناك ست إلى عشر ملاحظات لمتغير القياس ، طول AAM ، من كل موقع.

فرضية العدم

الفرضية الصفرية الإحصائية هي أن وسائل متغير القياس هي نفسها بالنسبة لفئات البيانات المختلفة ، والفرضية البديلة هي أنها ليست كلها متشابهة. بالنسبة لمجموعة البيانات النموذجية ، فإن الفرضية الصفرية هي أن متوسط ​​طول AAM هو نفسه في كل موقع ، والفرضية البديلة هي أن متوسط ​​أطوال AAM ليست كلها متشابهة.

كيف يعمل الاختبار

الفكرة الأساسية هي حساب متوسط ​​الملاحظات داخل كل مجموعة ، ثم مقارنة التباين بين هذه الوسائل بمتوسط ​​التباين داخل كل مجموعة. في ظل الفرضية الصفرية أن الملاحظات في المجموعات المختلفة لها نفس المتوسط ​​، سيكون التباين الموزون بين المجموعة هو نفسه التباين داخل المجموعة. مع تباعد الوسائل ، يزداد التباين بين الوسائل. وبالتالي ، فإن إحصاء الاختبار هو نسبة التباين بين الوسائل مقسومًا على متوسط ​​التباين داخل المجموعات ، أو Fس. هذه الإحصائية لها توزيع معروف تحت فرضية العدم ، وبالتالي فإن احتمال الحصول على F المرصودةس تحت الفرضية الصفرية يمكن حسابها.

يعتمد شكل التوزيع F على درجتين من الحرية ، ودرجات حرية البسط (التباين بين المجموعات) ودرجات حرية المقام (التباين داخل المجموعة). درجات الحرية بين المجموعات هي عدد المجموعات ناقص واحد. درجات الحرية داخل المجموعات هي العدد الإجمالي للملاحظات مطروحًا منه عدد المجموعات. وبالتالي إذا كان هناك ن الملاحظات في أ المجموعات ، درجات الحرية هي البسط أ-1 والمقام درجات الحرية ن-أ. بالنسبة لمجموعة البيانات النموذجية ، هناك 5 مجموعات و 39 ملاحظة ، وبالتالي فإن درجات الحرية في البسط هي 4 ودرجات الحرية للمقام هي 34. أيًا كان البرنامج الذي تستخدمه للتباين ، فمن شبه المؤكد أن يحسب درجات الحرية لك.

الطريقة التقليدية للإبلاغ عن النتائج الكاملة لأنوة هي باستخدام الجدول (غالبًا ما يتم حذف عمود "مجموع المربعات"). فيما يلي نتائج التحليل الأحادي الاتجاه على بيانات بلح البحر:

مجموع
مربعات
د.تعني
مربع
Fسص
بين المجموعات0.0045240.0011137.122.8吆 -4
داخل المجموعات0.00539340.000159
مجموع0.0099138

إذا كنت لن تستخدم المربعات المتوسطة لأي شيء ، فيمكنك الإبلاغ عن ذلك على أنه "كانت الوسائل غير متجانسة إلى حد كبير (anova أحادي الاتجاه ، F4, 34=7.12, ص= 2.8 & # 21510 -4). "درجات الحرية معطاة على شكل حرف F ، مع البسط أولاً.

لاحظ أن الإحصائيين يطلقون غالبًا على مربع متوسط ​​داخل المجموعة مربع متوسط ​​"الخطأ". أعتقد أن هذا قد يكون مربكًا لغير الإحصائيين ، لأنه يشير إلى أن الاختلاف ناتج عن خطأ تجريبي أو خطأ في القياس. في علم الأحياء ، غالبًا ما يكون التباين داخل المجموعة نتيجة للاختلاف البيولوجي الحقيقي بين الأفراد ، وليس نوع الأخطاء التي تنطوي عليها كلمة "خطأ". هذا هو السبب في أنني أفضل مصطلح "مربع متوسط ​​داخل المجموعة".

الافتراضات

يفترض التحليل الأحادي الاتجاه أن الملاحظات داخل كل مجموعة يتم توزيعها بشكل طبيعي. ليس حساسًا بشكل خاص للانحرافات عن هذا الافتراض إذا قمت بتطبيق تحليل أحادي الاتجاه على بيانات غير طبيعية ، فإن فرصتك في الحصول على ص القيمة أقل من 0.05 ، إذا كانت الفرضية الصفرية صحيحة ، فلا تزال قريبة جدًا من 0.05. من الأفضل أن تكون بياناتك قريبة من المعدل الطبيعي ، لذلك بعد أن تقوم بجمع بياناتك ، يجب أن تحسب القيم المتبقية (الفرق بين كل ملاحظة ومتوسط ​​مجموعتها) وتخطيطها على مدرج تكراري. إذا بدت القيم المتبقية غير طبيعية إلى حد كبير ، فحاول تحويل البيانات ومعرفة ما إذا كان المرء يجعل البيانات تبدو طبيعية أكثر.

إذا لم تكن أي من التحويلات التي تحاولها تجعل البيانات تبدو طبيعية بدرجة كافية ، فيمكنك استخدام اختبار Kruskal-Wallis. اعلم أنه يفترض أن المجموعات المختلفة لها نفس شكل التوزيع ، وأنها لا تختبر نفس الفرضية الصفرية مثل anova أحادية الاتجاه. أنا شخصياً لا أحب اختبار Kruskal-Wallis ، أوصي بأنه إذا كان لديك بيانات غير عادية لا يمكن إصلاحها عن طريق التحويل ، يمكنك المضي قدمًا واستخدام anova أحادي الاتجاه ، ولكن كن حذرًا بشأن رفض الفرضية الصفرية إذا ال ص القيمة ليست أقل بكثير من 0.05 وبياناتك غير عادية للغاية.

يفترض التحليل الأحادي الاتجاه أيضًا أن بياناتك متجانسة ، مما يعني أن الانحرافات المعيارية متساوية في المجموعات. يجب عليك فحص الانحرافات المعيارية في المجموعات المختلفة ومعرفة ما إذا كانت هناك اختلافات كبيرة بينها.

إذا كان لديك تصميم متوازن ، مما يعني أن عدد الملاحظات هو نفسه في كل مجموعة ، فإن anova أحادي الاتجاه ليس حساسًا للغاية للتغاير (الانحرافات المعيارية المختلفة في المجموعات المختلفة). لم أجد دراسة شاملة لتأثيرات التغاير المرونة تأخذ في الاعتبار جميع مجموعات عدد المجموعات ، وحجم العينة لكل مجموعة ، ومقدار التغايرية. لقد أجريت عمليات محاكاة مع مجموعتين ، وأشاروا إلى أن التغاير المرن سيعطي نسبة زائدة من الإيجابيات الخاطئة لتصميم متوازن فقط إذا كان الانحراف المعياري واحدًا على الأقل ثلاثة أضعاف حجم الآخر ، و حجم العينة في كل مجموعة أقل من 10. أعتقد أن قاعدة مماثلة ستنطبق على الأنوفا أحادية الاتجاه مع أكثر من مجموعتين وتصميمات متوازنة.

تعد عدم المرونة المتجانسة مشكلة أكبر بكثير عندما يكون لديك تصميم غير متوازن (أحجام عينات غير متكافئة في المجموعات). إذا كانت المجموعات ذات أحجام العينات الأصغر تحتوي أيضًا على انحرافات معيارية أكبر ، فستحصل على عدد كبير جدًا من الإيجابيات الخاطئة. لا يجب أن يكون الفرق في الانحرافات المعيارية كبيرًا ، فقد يكون للمجموعة الأصغر انحراف معياري أكبر بنسبة 50٪ ، ويمكن أن يكون معدل الإيجابيات الخاطئة أعلى من 10٪ بدلاً من 5٪ حيث تنتمي. إذا كانت المجموعات ذات الأحجام الأكبر للعينات تحتوي على انحرافات معيارية أكبر ، يكون الخطأ في الاتجاه المعاكس ، حيث تحصل على عدد قليل جدًا من الإيجابيات الخاطئة ، والتي قد تبدو شيئًا جيدًا باستثناء أنها تعني أيضًا أنك تفقد القوة (احصل على الكثير من السلبيات الخاطئة ، إذا كان هناك اختلاف في الوسائل).

يجب أن تحاول جاهدًا أن يكون لديك أحجام عينات متساوية في جميع مجموعاتك. مع التصميم المتوازن ، يمكنك استخدام anova أحادي الاتجاه بأمان ما لم تكن أحجام العينة لكل مجموعة أقل من 10 و تختلف الانحرافات المعيارية بمقدار ثلاثة أضعاف أو أكثر. إذا كان لديك تصميم متوازن بأحجام عينات صغيرة وتباين كبير جدًا في الانحرافات المعيارية ، فيجب عليك استخدام أنوفا ويلش بدلاً من ذلك.

إذا كان لديك تصميم غير متوازن ، فيجب عليك فحص الانحرافات المعيارية بعناية. ما لم تكن الانحرافات المعيارية متشابهة جدًا ، يجب أن تستخدم على الأرجح أنوفا ويلش. إنه أقل قوة من التحليل الأحادي الاتجاه للبيانات المثلية ، ولكنه يمكن أن يكون أكثر دقة للبيانات غير المتجانسة من تصميم غير متوازن.

تحليلات إضافية

اختبار Tukey-Kramer

إذا رفضت الفرضية الصفرية بأن جميع الوسائل متساوية ، فربما تريد إلقاء نظرة على البيانات بمزيد من التفصيل. إحدى الطرق الشائعة للقيام بذلك هي مقارنة أزواج مختلفة من الوسائل ومعرفة أيها يختلف اختلافًا كبيرًا عن بعضها البعض. بالنسبة لصدفة بلح البحر ، فإن الإجمالي ص القيمة مهمة للغاية ، ربما ترغب في متابعتها عن طريق السؤال عما إذا كان المتوسط ​​في Tillamook مختلفًا عن المتوسط ​​في Newport ، وما إذا كان Newport مختلفًا عن Petersburg ، وما إلى ذلك.

قد يكون من المغري استخدام عينة بسيطة من عينتين ر& ndashtest على كل مقارنة زوجية تبدو مثيرة للاهتمام بالنسبة لك. ومع ذلك ، يمكن أن يؤدي هذا إلى الكثير من الإيجابيات الخاطئة. عندما يكون هناك أ مجموعات ، هناك (أ 2 & ناقصأ) / 2 مقارنات زوجية محتملة ، وهو رقم يرتفع بسرعة مع زيادة عدد المجموعات. مع 5 مجموعات ، توجد 10 مقارنات زوجية مع 10 مجموعات ، وهناك 45 مجموعة ، وفي 20 مجموعة ، يوجد 190 زوجًا. عند إجراء مقارنات متعددة ، فإنك تزيد من احتمالية وجود ملف ص قيمة أقل من 0.05 بالصدفة البحتة ، حتى لو كانت الفرضية الصفرية لكل مقارنة صحيحة.

يوجد عدد من الاختبارات المختلفة للمقارنات الزوجية بعد تحليل أحادي الاتجاه ، ولكل منها مزايا وعيوب. الاختلافات بين نتائجهم دقيقة إلى حد ما ، لذلك سأصف واحدًا فقط ، اختبار Tukey-Kramer. من المحتمل أن يكون الاختبار اللاحق الأكثر استخدامًا بعد تحليل التباين أحادي الاتجاه ، ومن السهل فهمه إلى حد ما.

في طريقة Tukey – Kramer ، يتم حساب أدنى فرق كبير (MSD) لكل زوج من الوسائل. يعتمد ذلك على حجم العينة في كل مجموعة ، ومتوسط ​​الاختلاف داخل المجموعات ، والعدد الإجمالي للمجموعات. للحصول على تصميم متوازن ، ستكون جميع MSDs هي نفسها بالنسبة للتصميم غير المتوازن ، وستحتوي أزواج المجموعات ذات الأحجام الصغيرة على وحدات MSD أكبر. إذا كان الاختلاف الملحوظ بين زوج من الوسائل أكبر من MSD ، فإن زوج الوسائل يختلف اختلافًا كبيرًا. على سبيل المثال ، Tukey MSD للفرق بين Newport و Tillamook هو 0.0172. الفرق الملحوظ بين هذه الوسائل هو 0.0054 ، لذا فإن الفرق ليس كبيرًا. نيوبورت وبارسبورغ لديهما Tukey MSD يبلغ 0.0188 والفرق الملحوظ هو 0.0286 ، لذلك فهو مهم.

هناك طريقتان شائعتان لعرض نتائج اختبار Tukey & ndashKramer. تتمثل إحدى الأساليب في العثور على كل مجموعات المجموعات التي تفيد وسائلها ليس تختلف اختلافًا كبيرًا عن بعضها البعض ، ثم أشر إلى كل مجموعة برمز مختلف.

موقعيعني AAMتوكي وندشكرامر
نيوبورت0.0748أ
ماجادان0.0780أ ، ب
تيلاموك0.0802أ ، ب
تفارمين0.0957ب ، ج
بطرسبورغ0.103ج

ثم تشرح أن "الوسائل التي تحمل نفس الحرف لا تختلف كثيرًا عن بعضها البعض (اختبار Tukey & ndashKramer ، P & gt0.05)." يوضح هذا الجدول أن نيوبورت وماغادان لديهما حرف "a" ، لذا فهما ليسا مختلفين بشكل كبير عن Newport ولا يمتلك Tvarminne نفس الحرف ، لذا فهما مختلفان تمامًا.

هناك طريقة أخرى يمكنك من خلالها توضيح نتائج اختبار Tukey & ndashKramer وهي من خلال ربط الخطوط بوسائل لا تختلف كثيرًا عن بعضها البعض. يكون هذا أسهل عندما يتم فرز الوسائل من الأصغر إلى الأكبر:

يعني AAM (ندبة العضلة الأمامية المقربة موحدة بطول القشرة الكلي) لـ Mytilus trossulus من خمسة مواقع. لا تختلف أزواج الوسائل المجمعة بخط أفقي اختلافًا كبيرًا عن بعضها البعض (طريقة Tukey & ndashKramer ، P & gt0.05).

توجد أيضًا اختبارات لمقارنة مجموعات مختلفة من المجموعات ، على سبيل المثال ، يمكنك مقارنة عينتي أوريغون (نيوبورت وتيلاموك) بالعينتين من أقصى الشمال في المحيط الهادئ (ماجادان وبيرسبورغ). من المحتمل أن يكون اختبار Scheff & eacute هو الأكثر شيوعًا. تكمن المشكلة في هذه الاختبارات في أنه مع وجود عدد معتدل من المجموعات ، يصبح عدد المقارنات الممكنة كبيرًا جدًا لدرجة أن ص تصبح القيم المطلوبة للأهمية صغيرة بشكل يبعث على السخرية.

فرق التقسيم

أكثر أنواع الأنوفا أحادية الاتجاه شيوعًا هي أنوفا "التأثير الثابت" أو "النموذج الأول". المجموعات المختلفة مثيرة للاهتمام ، وتريد أن تعرف المجموعات المختلفة عن بعضها البعض. على سبيل المثال ، يمكنك مقارنة طول AAM لأنواع بلح البحر Mytilus edulis, Mytilus galloprovincialis, Mytilus trossulus و Mytilus californianus تريد أن تعرف أيهما يحتوي على أطول AAM ، والأقصر ، سواء M. edulis كان مختلفًا بشكل كبير عن م. trossulus، إلخ.

النوع الآخر من anova أحادي الاتجاه هو "التأثير العشوائي" أو "النموذج الثاني" anova. المجموعات المختلفة عبارة عن عينات عشوائية من مجموعة أكبر من المجموعات ، ولا يهمك تحديد المجموعات التي تختلف عن بعضها البعض. مثال على ذلك هو أخذ نسل من خمس عائلات عشوائية من م. trossulus ومقارنة أطوال AAM بين العائلات. لن تهتم بالعائلة التي لديها أطول AAM ، وما إذا كانت العائلة A تختلف اختلافًا كبيرًا عن الأسرة B ، فهي مجرد عائلات عشوائية تم أخذ عينات منها من عدد أكبر ممكن من العائلات. بدلاً من ذلك ، ستكون مهتمًا بكيفية مقارنة التباين بين العائلات بالتنوع داخل العائلات بمعنى آخر ، فأنت تريد تقسيم التباين.

في ظل الفرضية الصفرية لتجانس الوسائل ، فإن متوسط ​​المربع بين المجموعة والمربع المتوسط ​​داخل المجموعة كلاهما تقديرات للتباين البارامترى داخل المجموعة. إذا كانت الوسيلة غير متجانسة ، فإن متوسط ​​المربع داخل المجموعة لا يزال تقديرًا للتباين داخل المجموعة ، لكن المربع المتوسط ​​بين المجموعات يقدر مجموع التباين داخل المجموعة بالإضافة إلى حجم عينة المجموعة مضروبًا في التباين الإضافي بين المجموعات . لذلك ، فإن طرح المربع المتوسط ​​داخل المجموعة من المربع المتوسط ​​بين المجموعات ، وقسمة هذا الاختلاف على متوسط ​​حجم عينة المجموعة ، يعطي تقديرًا لمكون التباين الإضافي بين المجموعات. المعادلة هي:

أينا هو رقم قريب من المتوسط ​​الحسابي لحجم العينة (nأنا) من كل من أ مجموعات:

غالبًا ما يتم التعبير عن كل مكون من مكونات التباين كنسبة مئوية من إجمالي مكونات التباين. وبالتالي فإن جدول anova لـ anova أحادي الاتجاه يشير إلى مكون التباين بين المجموعة ومكون التباين داخل المجموعة ، وستضيف هذه الأرقام إلى 100٪.

على الرغم من أن الإحصائيين يقولون إن كل مستوى من مستويات التحليل "يشرح" نسبة من التباين ، فإن هذه المصطلحات الإحصائية لا تعني أنك وجدت تفسيرًا للسبب والنتيجة البيولوجية. إذا قمت بقياس عدد آذان الذرة لكل ساق في 10 مواقع عشوائية في حقل ما ، فقم بتحليل البيانات باستخدام anova أحادي الاتجاه ، وقلت أن الموقع "يشرح" 74.3٪ من التباين ، فأنت لم تشرح أي شيء حقًا أنت لا تعرف ما إذا كانت بعض المناطق لديها غلة أعلى بسبب المحتوى المائي المختلف في التربة ، أو الكميات المختلفة من الأضرار التي تسببها الحشرات ، أو الكميات المختلفة من العناصر الغذائية في التربة ، أو الهجمات العشوائية من قبل عصابة من عصابات الذرة الغارقة.

يعد تقسيم مكونات التباين مفيدًا بشكل خاص في علم الوراثة الكمي ، حيث قد يعكس المكون داخل الأسرة التباين البيئي بينما يعكس المكون بين الأسرة التباين الجيني. بالطبع ، يتضمن تقدير التوريث أكثر من مجرد تحليل تحليل بسيط ، لكن المفهوم الأساسي مشابه.

هناك مجال آخر يكون فيه تقسيم مكونات التباين مفيدًا في تصميم التجارب. على سبيل المثال ، لنفترض أنك تخطط لتجربة كبيرة لاختبار تأثير الأدوية المختلفة على امتصاص الكالسيوم في خلايا الكلى لدى الفئران. تريد معرفة عدد الجرذان التي يجب استخدامها ، وعدد القياسات التي يجب إجراؤها على كل فأر ، لذلك عليك إجراء تجربة تجريبية تقيس فيها امتصاص الكالسيوم على 6 فئران ، مع 4 قياسات لكل فأر. تقوم بتحليل البيانات باستخدام تحليل أحادي الاتجاه وإلقاء نظرة على مكونات التباين. إذا كانت هناك نسبة عالية من التباين بين الجرذان ، فسيخبرك ذلك أن هناك الكثير من الاختلاف من فأر إلى آخر ، لكن القياسات داخل فأر واحد موحدة إلى حد ما. يمكنك بعد ذلك تصميم تجربتك الكبيرة لتشمل الكثير من الفئران لكل علاج دوائي ، ولكن ليس الكثير من القياسات لكل فأر. أو يمكنك إجراء المزيد من التجارب التجريبية لمحاولة اكتشاف سبب وجود الكثير من الاختلاف بين الجرذان (ربما تختلف أعمار الجرذان ، أو أن بعضها قد أكل مؤخرًا أكثر من غيرها ، أو مارس البعض أكثر من ذلك) ومحاولة التحكم هو - هي. من ناحية أخرى ، إذا كان جزء التباين بين الجرذان منخفضًا ، فسيخبرك ذلك أن القيم المتوسطة للفئران المختلفة كانت كلها تقريبًا متشابهة ، بينما كان هناك الكثير من الاختلاف بين القياسات على كل فأر. يمكنك تصميم تجربتك الكبيرة باستخدام عدد أقل من الفئران ومزيد من الملاحظات لكل فأر ، أو يمكنك محاولة معرفة سبب وجود الكثير من الاختلافات بين القياسات والتحكم فيها بشكل أفضل.

هناك معادلة يمكنك استخدامها للتخصيص الأمثل للموارد في التجارب. يتم استخدامه عادةً في anova المتداخلة ، ولكن يمكنك استخدامه في anova أحادي الاتجاه إذا كانت المجموعات ذات تأثير عشوائي (النموذج II).

ينطبق تقسيم التباين فقط على نموذج II (تأثيرات عشوائية) أحادي الاتجاه. إنه لا يخبرك حقًا بأي شيء مفيد حول النموذج الأكثر شيوعًا I (التأثيرات الثابتة) أحادي الاتجاه ، على الرغم من أن الناس في بعض الأحيان يحبون الإبلاغ عنه (لأنهم فخورون بكمية التباين التي تشرحها مجموعاتهم ، خمن).

مثال

فيما يلي بيانات عن حجم الجينوم (مقاسة بالبيكوجرام من الحمض النووي لكل خلية أحادية الصيغة الصبغية) في عدة مجموعات كبيرة من القشريات ، مأخوذة من جريجوري (2014). كان سبب الاختلاف في حجم الجينوم لغزًا لفترة طويلة سأستخدم هذه البيانات للإجابة على السؤال البيولوجي حول ما إذا كانت بعض مجموعات القشريات لها أحجام جينوم مختلفة عن غيرها. نظرًا لأن البيانات من الأنواع وثيقة الصلة لن تكون مستقلة (من المحتمل أن يكون للأنواع وثيقة الصلة أحجام جينوم متشابهة ، لأنها تنحدر مؤخرًا من سلف مشترك) ، فقد استخدمت مولد أرقام عشوائي لاختيار نوع واحد عشوائيًا من كل عائلة.

AmphipodsالبرنقيلBranchiopodsمجدافيات الأرجلأجهزة فك التشفيرمتساويات الأرجلأوستراكودز
0.740.670.190.251.601.710.46
0.950.900.210.251.652.350.70
1.711.230.220.581.802.400.87
1.891.400.220.971.903.001.47
3.801.460.281.631.945.653.13
3.972.600.301.772.285.70
7.16 0.402.672.446.79
8.48 0.475.452.668.60
13.49 0.636.812.788.82
16.09 0.87 2.80
27.00 2.77 2.83
50.91 2.91 3.01
64.62 4.34
4.50
4.55
4.66
4.70
4.75
4.84
5.23
6.20
8.29
8.53
10.58
15.56
22.16
38.00
38.47
40.89

بعد جمع البيانات ، فإن الخطوة التالية هي معرفة ما إذا كانت طبيعية ومتجانسة. من الواضح أن معظم القيم أقل من 10 ، لكن هناك عددًا صغيرًا أعلى من ذلك بكثير. يوضح الرسم البياني لأكبر مجموعة ، وهي عشاري الأرجل (السرطانات والروبيان والكركند):

رسم بياني لحجم الجينوم في القشريات عشاري الأرجل.

البيانات هي أيضا متغايرة للغاية وتتراوح الانحرافات المعيارية من 0.67 في البرنقيل إلى 20.4 في amphipods. لحسن الحظ ، فإن تحويل البيانات اللوغاريتمية يجعلها أقرب إلى المثلية (الانحرافات المعيارية التي تتراوح من 0.20 إلى 0.63) وتبدو طبيعية أكثر:

رسم بياني لحجم الجينوم في القشريات عشاري الأرجل بعد تحويل اللوغاريتم الأساسي 10.

تحليل البيانات التي تم تحويلها من خلال السجل باستخدام anova أحادي الاتجاه ، تكون النتيجة F6,76=11.72, ص= 2.9 مرات 10 & ناقص 9. لذلك هناك تباين كبير جدًا في متوسط ​​حجم الجينوم بين هذه المجموعات التصنيفية السبع للقشريات.

تتمثل الخطوة التالية في استخدام اختبار Tukey-Kramer لمعرفة أي أزواج من الأصناف تختلف اختلافًا كبيرًا في متوسط ​​حجم الجينوم. الطريقة المعتادة لعرض هذه المعلومات هي تحديد المجموعات الموجودة ليس تختلف اختلافًا كبيرًا هنا ، فأنا أفعل ذلك باستخدام أشرطة أفقية:

و 95٪ ثقة بحدود حجم الجينوم في سبع مجموعات من القشريات. مجموعات روابط الأشرطة الأفقية التي لا تختلف اختلافًا كبيرًا (اختبار Tukey-Kramer ، P & gt0.05). تم إجراء التحليل على بيانات محولة بسجل ، ثم تمت إعادة تحويلها لهذا الرسم البياني.

يشير هذا الرسم البياني إلى وجود مجموعتين من أحجام الجينوم ، ومجموعات بها جينومات صغيرة (branchiopods ، و ostracods ، و barnacles ، و مجدافيات الأرجل) ومجموعات ذات جينومات كبيرة (decapods و amphipods) أعضاء كل مجموعة لا تختلف اختلافًا كبيرًا عن بعضها البعض. تقع متساويات الأرجل في المنتصف ، والمجموعة الوحيدة التي تختلف اختلافًا كبيرًا عنها هي العصيات الأرجل. لذا فإن الإجابة على السؤال البيولوجي الأصلي ، "هل تمتلك بعض مجموعات القشريات أحجام جينوم مختلفة عن غيرها" ، نعم. لا يزال سبب وجود مجموعات مختلفة من أحجام مختلفة من الجينوم لغزا.

رسم النتائج بيانيًا

الطريقة المعتادة لرسم نتائج التحليل الأحادي الاتجاه هي باستخدام الرسم البياني الشريطي. تشير ارتفاعات الأشرطة إلى الوسيلة ، وعادة ما يكون هناك نوع من شريط الخطأ ، إما 95٪ فترات ثقة أو أخطاء قياسية. تأكد من ذكر ما تمثله أشرطة الخطأ في التعليق التوضيحي.

اختبارات مماثلة

إذا كان لديك مجموعتان فقط ، فيمكنك عمل عينتين ر& ndashtest. هذا مكافئ رياضيًا لـ anova وسيؤدي إلى نفس الشيء تمامًا ص القيمة ، لذلك إذا كان كل ما ستفعله هو إجراء مقارنات بين مجموعتين ، فيمكنك أيضًا تسميتها ر& ndashtests. إذا كنت ستجري بعض المقارنات بين مجموعتين ، وبعضها يحتوي على أكثر من مجموعتين ، فمن المحتمل أن يكون الأمر أقل إرباكًا إذا اتصلت بجميع اختباراتك أحادية الاتجاه.

إذا كان هناك متغيران اسميان أو أكثر ، فيجب عليك استخدام anova ثنائي الاتجاه أو anova متداخل أو شيء أكثر تعقيدًا لن أغطيه هنا. إذا كنت تميل إلى إجراء تحليل تحليل معقد للغاية ، فقد ترغب في تقسيم تجربتك إلى مجموعة من التجارب الأبسط من أجل الاستيعاب.

إذا كانت البيانات تنتهك بشدة افتراضات anova ، فيمكنك استخدام أنوفا Welch إذا كانت الانحرافات المعيارية غير متجانسة أو استخدم اختبار Kruskal-Wallis إذا كانت التوزيعات غير طبيعية.

كيف تفعل الاختبار

جدول

لقد قمت بتجميع جدول بيانات لعمل تحليل أحادي الاتجاه لما يصل إلى 50 مجموعة و 1000 ملاحظة لكل مجموعة. يحسب ص القيمة ، يقوم باختبار Tukey & ndashKramer ، ويقسم التباين.

تتضمن بعض إصدارات Excel "Analysis Toolpak" ، والتي تتضمن وظيفة "Anova: Single Factor" التي ستقوم بعمل تحليل أحادي الاتجاه. يمكنك استخدامه إذا أردت ، لكن لا يمكنني مساعدتك في ذلك. لا يتضمن أي تقنيات للمقارنات غير المخططة للوسائل ، ولا يقسم التباين.

صفحات الانترنت

قام العديد من الأشخاص بتجميع صفحات الويب التي ستؤدي إلى أنوفا أحادية الاتجاه واحدة جيدة هنا. إنه سهل الاستخدام ، وسوف يتعامل مع ثلاث إلى 26 مجموعة و 3 إلى 1024 ملاحظة لكل مجموعة. لا يقوم باختبار Tukey-Kramer ولا يقسم التباين.

سالفاتور مانجيافيكو رفيق R يحتوي على نموذج R لبرنامج anova أحادي الاتجاه.

هناك العديد من إجراءات SAS التي ستقوم بإجراء تحليل أحادي الاتجاه. النوعان الأكثر استخدامًا هما PROC ANOVA و PROC GLM. قد يكون أي منهما جيدًا بالنسبة إلى anova أحادي الاتجاه ، ولكن يمكن استخدام PROC GLM (والتي تعني "النماذج الخطية العامة") لمجموعة أكبر بكثير من التحليلات الأكثر تعقيدًا ، لذا يمكنك استخدامها أيضًا في كل شيء.

هنا برنامج SAS لعمل anova أحادي الاتجاه على بيانات بلح البحر من الأعلى.

يتضمن الإخراج جدول anova التقليدي و ص يتم إعطاء القيمة ضمن "Pr & gt F".

لا يحسب PROC GLM مكونات التباين لـ anova. بدلاً من ذلك ، يمكنك استخدام PROC VARCOMP. قمت بإعداده تمامًا مثل PROC GLM ، مع إضافة METHOD = TYPE1 (حيث يتضمن "TYPE1" الرقم 1 ، وليس الحرف el. يحتوي الإجراء على أربع طرق مختلفة لتقدير مكونات التباين ، ويبدو أن TYPE1 هو نفسه تقنية مثل تلك التي وصفتها أعلاه. إليك كيفية عمل anova أحادي الاتجاه ، بما في ذلك تقدير مكونات التباين ، لمثال صدفة بلح البحر.

وتشمل النتائج ما يلي:

لم يتم إعطاء الناتج كنسبة مئوية من الإجمالي ، لذا سيتعين عليك حساب ذلك. لهذه النتائج ، يكون المكون بين المجموعة 0.0001254 / (0.0001254 + 0.0001586) = 0.4415 ، أو 44.15٪ المكون داخل المجموعة هو 0.0001587 / (0.0001254 + 0.0001586) = 0.5585 ، أو 55.85٪.

أنوفا ويلش

إذا أظهرت البيانات الكثير من عدم التجانس (المجموعات المختلفة لها انحرافات معيارية مختلفة) ، يمكن أن ينتج عن الأنوفا أحادية الاتجاه خطأ غير دقيق ص قيمة قد يكون احتمال وجود إيجابية خاطئة أعلى بكثير من 5٪. في هذه الحالة ، يجب عليك استخدام أنوفا ويلش. لقد قمت بكتابة جدول بيانات لعمل تحليل تحليل ويلش. يتضمن اختبار Games-Howell ، والذي يشبه اختبار Tukey-Kramer للحصول على أنوفا منتظمة. (ملاحظة: قدم جدول البيانات الأصلي نتائج غير صحيحة لاختبار Games-Howell وتم تصحيحه في 28 أبريل 2015). يمكنك عمل anova Welch في SAS عن طريق إضافة بيان MEANS ، واسم المتغير الاسمي ، وكلمة WELCH بعد الشرطة المائلة. لسوء الحظ ، لا تجري SAS اختبار Games-Howell اللاحق. فيما يلي مثال لبرنامج SAS من الأعلى ، تم تعديله ليقوم بعمل anova لـ Welch:

هذا جزء من الإخراج:

تحليل القوة

يعد إجراء تحليل قوة لتحليل أحادي الاتجاه أمرًا صعبًا نوعًا ما ، لأنك تحتاج إلى تحديد نوع حجم التأثير الذي تبحث عنه. إذا كنت مهتمًا بشكل أساسي باختبار الأهمية الكلية ، فإن حجم العينة المطلوب هو دالة للانحراف المعياري لمفهوم المجموعة. قد يعتمد تقديرك للانحراف المعياري للوسائل التي تبحث عنها على تجربة تجريبية أو مؤلفات منشورة حول تجارب مماثلة.

إذا كنت مهتمًا بشكل أساسي بمقارنات الوسائل ، فهناك طرق أخرى للتعبير عن حجم التأثير. يمكن أن يكون تأثيرك فرقًا بين أصغر وأكبر الوسائل ، على سبيل المثال ، أنك تريد أن تكون مهمًا من خلال اختبار Tukey-Kramer. توجد طرق لإجراء تحليل قوة بهذا النوع من حجم التأثير ، لكني لا أعرف الكثير عنها ولن أتطرق إليها هنا.

لإجراء تحليل للطاقة لتحليل أحادي الاتجاه باستخدام البرنامج المجاني G * Power ، اختر "اختبارات F" من قائمة "عائلة الاختبار" و "ANOVA: التأثيرات الثابتة ، الشاملة ، أحادية الاتجاه" من "الاختبار الإحصائي" قائمة. لتحديد حجم التأثير ، انقر فوق الزر تحديد وأدخل عدد المجموعات ، والانحراف المعياري داخل المجموعات (يفترض البرنامج أنها جميعًا متساوية) ، والمتوسط ​​الذي تريد رؤيته في كل مجموعة. عادةً ما تترك أحجام العينات كما هي لجميع المجموعات (تصميم متوازن) ، ولكن إذا كنت تخطط لعينة غير متوازنة مع عينات أكبر في بعض المجموعات عن مجموعات أخرى ، فيمكنك إدخال أحجام عينات نسبية مختلفة. ثم انقر فوق الزر "حساب ونقل إلى النافذة الرئيسية" حيث يقوم بحساب حجم التأثير ويدخله في النافذة الرئيسية. أدخل ألفا (عادة 0.05) والقوة (عادة 0.80 أو 0.90) واضغط على زر الحساب. والنتيجة هي الحجم الإجمالي للعينة في التجربة بأكملها ، وسيتعين عليك القيام ببعض العمليات الحسابية لمعرفة حجم العينة لكل مجموعة.

على سبيل المثال ، لنفترض أنك تدرس كمية نصية لبعض الجينات في عضلة الذراع وعضلة القلب والدماغ والكبد والرئة. استنادًا إلى الأبحاث السابقة ، قررت أنك تريد أن يكون أنوفا مهمًا إذا كانت الوسائل عبارة عن 10 وحدات في عضلة الذراع ، و 10 وحدات في عضلة القلب ، و 15 وحدة في الدماغ ، و 15 وحدة في الكبد ، و 15 وحدة في الرئة. الانحراف المعياري لمقدار النسخ داخل نوع الأنسجة الذي رأيته في البحث السابق هو 12 وحدة. بإدخال هذه الأرقام في G * Power ، جنبًا إلى جنب مع ألفا 0.05 وقوة 0.80 ، تكون النتيجة إجمالي حجم العينة 295. نظرًا لوجود خمس مجموعات ، ستحتاج إلى 59 ملاحظة لكل مجموعة للحصول على فرصة بنسبة 80٪ من الحصول على (ص& lt0.05) تحليل أحادي الاتجاه.

مراجع

ماكدونالد ، JH ، R. Seed و R.K. كوهن. 1991. اللوزيمات والشخصيات الشكلية لثلاثة أنواع من Mytilus في نصفي الكرة الشمالي والجنوبي. علم الأحياء البحرية 111: 323-333.

& lArr الموضوع السابق | الموضوع التالي & rArr جدول المحتويات

تم إجراء آخر مراجعة لهذه الصفحة في 20 يوليو 2015. عنوانها هو http://www.biostathandbook.com/onewayanova.html. يمكن أن يقتبس على النحو التالي:
ماكدونالد ، ج. 2014. كتيب الإحصاءات البيولوجية (الطبعة الثالثة). دار سباركي للنشر ، بالتيمور ، ماريلاند. تحتوي صفحة الويب هذه على محتوى الصفحات 145-156 في النسخة المطبوعة.

& copy2014 بواسطة John H. McDonald. ربما يمكنك فعل ما تريد باستخدام هذا المحتوى ، راجع صفحة الأذونات للحصول على التفاصيل.


الاستدلالات لشعبين

رودولف جيه فرويند. دونا إل مور ، في الأساليب الإحصائية (الطبعة الثالثة) ، 2010

5.2.2 توزيع المعاينة للفرق بين وسيلتين

نظرًا لأن متوسط ​​العينة عبارة عن متغيرات عشوائية ، فإن الفرق بين متوسطي العينة هو دالة خطية لمتغيرين عشوائيين. هذا هو،

من حيث الوظيفة الخطية المحددة أعلاه ، n = 2 ، و 1 = 1 ، و 2 = - 1. باستخدام هذه المواصفات ، يكون لتوزيع العينات للفرق بين وسيلتين متوسط ​​(μ 1 - μ 2).

علاوة على ذلك ، نظرًا لأن y ¯ 1 و y 2 هما وسيلتان نموذجيتان ، فإن تباين y ¯ 1 هو σ 1 2 ∕ n 1 وتباين y ¯ 2 هو σ 2 2 ∕ n 2. أيضًا ، نظرًا لأننا افترضنا أن العيّنتين مأخوذتان بشكل مستقل من المجموعتين ، فإن وسطاء العينة هما متغيران عشوائيان مستقلان. إذن ، تباين الفرق (y ¯ 1 - y ¯ 2) هو

لاحظ أنه بالنسبة للحالة الخاصة حيث σ 1 2 = σ 2 2 = σ 2 و n 1 = n 2 = n ، فإن تباين الاختلاف هو 2 σ 2 ∕ n.

أخيرًا ، تنص نظرية الحد المركزي على أنه إذا كانت أحجام العينة كبيرة بدرجة كافية ، فإن y y 1 و y ¯ 2 يتم توزيعهما بشكل طبيعي ومن ثم يتم توزيع L بشكل طبيعي أيضًا بالنسبة لمعظم التطبيقات.

وبالتالي ، إذا كانت الفروق σ 1 2 و σ 2 2 معروفة ، فيمكننا تحديد تباين الاختلاف (y ¯ 1 - y ¯ 2). كما هو الحال في الحالة المكونة من مجموعة واحدة ، نقدم أولاً إجراءات الاستدلال التي تفترض أن تباينات المجتمع معروفة. يتم عرض الإجراءات باستخدام الفروق المقدرة لاحقًا في هذا القسم.


محتويات

بينما وصل تحليل التباين إلى ثماره في القرن العشرين ، امتدت السوابق إلى قرون في الماضي وفقًا لستيجلر. [1] وتشمل اختبار الفرضيات ، وتقسيم مجاميع المربعات ، والتقنيات التجريبية ، والنموذج الإضافي. كان لابلاس يقوم باختبار الفرضيات في سبعينيات القرن الثامن عشر. [2] حوالي عام 1800 ، طور لابلاس وغاوس طريقة المربعات الصغرى لدمج الملاحظات ، مما أدى إلى تحسين الأساليب المستخدمة بعد ذلك في علم الفلك والجيوديسيا. كما شرع في دراسة الكثير من المساهمات في مجاميع المربعات. عرف لابلاس كيفية تقدير التباين من مجموع المربعات المتبقية (وليس الإجمالي). [3] بحلول عام 1827 ، كان لابلاس يستخدم طرق المربعات الصغرى لمعالجة مشاكل ANOVA المتعلقة بقياسات المد والجزر في الغلاف الجوي. [4] قبل عام 1800 ، كان علماء الفلك قد عزلوا أخطاء الرصد الناتجة عن أوقات رد الفعل ("المعادلة الشخصية") وطوروا طرقًا لتقليل الأخطاء. [5] الطرق التجريبية المستخدمة في دراسة المعادلة الشخصية تم قبولها لاحقًا من قبل مجال علم النفس الناشئ [6] والذي طور طرقًا تجريبية قوية (عاملي كامل) أضيف إليها العشوائية والتعمية قريبًا. [7] شرح بليغ غير رياضي لنموذج التأثيرات المضافة كان متاحًا في عام 1885. [8]

قدم رونالد فيشر مصطلح التباين واقترح تحليله الرسمي في مقال عام 1918 العلاقة بين الأقارب على افتراض الميراث المندلي. [9] نُشر تطبيقه الأول لتحليل التباين في عام 1921. [10] أصبح تحليل التباين معروفًا على نطاق واسع بعد إدراجه في كتاب فيشر لعام 1925 الأساليب الإحصائية للعاملين في مجال البحوث.

تم تطوير نماذج التوزيع العشوائي من قبل العديد من الباحثين. نُشر الأول باللغة البولندية بواسطة جيرزي نيمان عام 1923. [11]

يمكن استخدام تحليل التباين لوصف العلاقات المعقدة بين المتغيرات. يقدم عرض الكلاب مثالا. لا يُعد عرض الكلاب عينة عشوائية من السلالة: فهو يقتصر عادةً على الكلاب البالغة ، والمولودة الأصيلة ، والمثالية. قد يكون الرسم البياني لأوزان الكلاب من العرض معقدًا إلى حد ما ، مثل التوزيع الأصفر البرتقالي الموضح في الرسوم التوضيحية. لنفترض أننا أردنا التنبؤ بوزن كلب بناءً على مجموعة معينة من خصائص كل كلب. طريقة واحدة للقيام بذلك هي يشرح توزيع الأوزان بتقسيم عدد الكلاب إلى مجموعات بناءً على تلك الخصائص. سيؤدي التجميع الناجح إلى تقسيم الكلاب بحيث (أ) لكل مجموعة تباين منخفض في أوزان الكلاب (بمعنى أن المجموعة متجانسة نسبيًا) و (ب) يكون متوسط ​​كل مجموعة متميزًا (إذا كان لدى مجموعتين نفس المتوسط ​​، فهذا يعني أنه ليس من المعقول استنتاج أن المجموعات منفصلة في الواقع بأي طريقة ذات معنى).

في الرسوم التوضيحية على اليمين ، يتم تحديد المجموعات على أنها X1, X2، إلخ. في الرسم التوضيحي الأول ، يتم تقسيم الكلاب وفقًا للمنتج (التفاعل) لمجموعتين ثنائيتين: الصغار مقابل كبار السن ، وقصير الشعر مقابل طويل الشعر (على سبيل المثال ، المجموعة 1 عبارة عن كلاب شابة وقصيرة الشعر ، ومجموعة 2 شابة ، كلاب طويلة الشعر ، إلخ). نظرًا لأن توزيعات وزن الكلاب داخل كل مجموعة (كما هو موضح باللون الأزرق) لها تباين كبير نسبيًا ، وبما أن الوسائل متشابهة جدًا عبر المجموعات ، فإن تجميع الكلاب حسب هذه الخصائص لا ينتج طريقة فعالة لشرح التباين في أوزان الكلاب : معرفة المجموعة التي ينتمي إليها الكلب لا يسمح لنا بالتنبؤ بوزنه بشكل أفضل بكثير من مجرد معرفة أن الكلب في عرض للكلاب. وبالتالي ، فشل هذا التجميع في تفسير التباين في التوزيع الكلي (أصفر برتقالي).

محاولة لشرح توزيع الوزن عن طريق تجميع الكلاب على أنها الحيوانات الأليفة مقابل سلالة العمل و أقل رياضية مقابل أكثر رياضية من المحتمل أن تكون أكثر نجاحًا إلى حد ما (مناسبة بشكل معقول). من المرجح أن تكون أثقل كلاب العرض سلالات كبيرة وقوية وعاملة ، بينما تميل السلالات التي يتم الاحتفاظ بها كحيوانات أليفة إلى أن تكون أصغر وبالتالي تكون أخف وزنًا. كما هو موضح في الرسم التوضيحي الثاني ، فإن التوزيعات لها تباينات أصغر بكثير مما كانت عليه في الحالة الأولى ، والوسائل أكثر تميزًا. ومع ذلك ، فإن التداخل الكبير في التوزيعات ، على سبيل المثال ، يعني أنه لا يمكننا التمييز X1 و X2 بثقة. قد ينتج عن تجميع الكلاب وفقًا لقلب العملة توزيعات تبدو متشابهة.

من المرجح أن تؤدي محاولة تفسير الوزن حسب السلالة إلى ملاءمة جيدة جدًا. كل الشيواوا خفيفة وكل سانت برناردز ثقيلة. الاختلاف في الأوزان بين السلالات والمؤشرات لا يبرر انفصال السلالات. يوفر تحليل التباين الأدوات الرسمية لتبرير هذه الأحكام البديهية. الاستخدام الشائع للطريقة هو تحليل البيانات التجريبية أو تطوير النماذج. تتميز الطريقة ببعض المزايا مقارنة بالارتباط: لا يجب أن تكون جميع البيانات رقمية ، وإحدى نتائج الطريقة هي الحكم على الثقة في العلاقة التفسيرية.

ANOVA هو شكل من أشكال اختبار الفرضيات الإحصائية يستخدم بكثرة في تحليل البيانات التجريبية. تسمى نتيجة الاختبار (المحسوبة من الفرضية الصفرية والعينة) ذات دلالة إحصائية إذا كان من غير المحتمل حدوثها عن طريق الصدفة ، افتراض حقيقة الفرضية الصفرية. نتيجة ذات دلالة إحصائية ، عندما يكون الاحتمال (ص-value) أقل من عتبة محددة مسبقًا (مستوى الأهمية) ، تبرر رفض الفرضية الصفرية ، ولكن فقط إذا لم يكن الاحتمال المسبق للفرضية الصفرية مرتفعًا.

في التطبيق النموذجي لـ ANOVA ، فإن الفرضية الصفرية هي أن جميع المجموعات هي عينات عشوائية من نفس السكان. على سبيل المثال ، عند دراسة تأثير العلاجات المختلفة على عينات مماثلة من المرضى ، فإن الفرضية الصفرية هي أن جميع العلاجات لها نفس التأثير (ربما لا شيء). يُؤخذ رفض فرضية العدم على أنه يعني أن الاختلافات في التأثيرات المرصودة بين مجموعات العلاج من غير المرجح أن تكون بسبب الصدفة العشوائية.

من خلال البناء ، يحد اختبار الفرضيات من معدل أخطاء النوع الأول (الإيجابيات الخاطئة) إلى مستوى الأهمية. يرغب المجربون أيضًا في الحد من أخطاء النوع الثاني (السلبيات الخاطئة). يعتمد معدل أخطاء النوع الثاني إلى حد كبير على حجم العينة (المعدل أكبر للعينات الأصغر) ، ومستوى الأهمية (عندما يكون معيار الإثبات مرتفعًا ، تكون فرص تجاهل الاكتشاف عالية أيضًا) وحجم التأثير (حجم تأثير أصغر هو أكثر عرضة لخطأ من النوع الثاني).

إن مصطلحات ANOVA مستمدة إلى حد كبير من التصميم الإحصائي للتجارب. يقوم المجرب بضبط العوامل وقياس الاستجابات في محاولة لتحديد التأثير. يتم تعيين العوامل للوحدات التجريبية من خلال مزيج من العشوائية والحظر لضمان صحة النتائج. إن التعمية تحافظ على الوزن غير متحيز. تظهر الردود تباينًا ناتجًا جزئيًا عن التأثير وخطأ عشوائي جزئيًا.

ANOVA هو تجميع للعديد من الأفكار ويستخدم لأغراض متعددة. نتيجة لذلك ، من الصعب تعريفه بإيجاز أو بدقة.

تقوم ANOVA "الكلاسيكية" للبيانات المتوازنة بثلاثة أشياء في وقت واحد:

  1. كتحليل بيانات استكشافية ، يستخدم ANOVA تحلل البيانات الإضافي ، وتشير مجاميع المربعات الخاصة به إلى تباين كل مكون من عناصر التحلل (أو ، على نحو مكافئ ، كل مجموعة من المصطلحات في النموذج الخطي).
  2. مقارنات بين المربعات المتوسطة ، جنبًا إلى جنب مع F-اختبار . تسمح باختبار تسلسل متداخل من النماذج.
  3. يرتبط ارتباطًا وثيقًا بـ ANOVA بنموذج خطي يتناسب مع تقديرات المعامل والأخطاء المعيارية. [12]

ANOVA "تمتعت منذ فترة طويلة بحالة كونها التقنية الإحصائية الأكثر استخدامًا (قد يقول البعض إساءة استخدامها) في البحث النفسي." [13]

من الصعب تدريس ANOVA ، خاصة بالنسبة للتجارب المعقدة ، حيث تشتهر تصاميم الحبكة المقسمة. [14] في بعض الحالات ، يتم تحديد التطبيق المناسب للطريقة بشكل أفضل من خلال التعرف على نمط المشكلة متبوعًا باستشارة اختبار موثوق كلاسيكي. [15]

هناك ثلاث فئات من النماذج المستخدمة في تحليل التباين ، وهي موضحة هنا.

تحرير نماذج التأثيرات الثابتة

ينطبق نموذج التأثيرات الثابتة (الفئة الأولى) لتحليل التباين على المواقف التي يطبق فيها المجرب علاجًا واحدًا أو أكثر على موضوعات التجربة لمعرفة ما إذا كانت قيم الاستجابة المتغيرة تتغير أم لا. يسمح ذلك للمُجرب بتقدير نطاقات قيم الاستجابة المتغيرة التي قد يولدها العلاج في المجتمع ككل.

تحرير نماذج التأثيرات العشوائية

يستخدم نموذج التأثيرات العشوائية (الفئة الثانية) عندما لا تكون العلاجات ثابتة. يحدث هذا عندما يتم أخذ عينات من مستويات العوامل المختلفة من عدد أكبر من السكان.نظرًا لأن المستويات نفسها عبارة عن متغيرات عشوائية ، فإن بعض الافتراضات وطريقة تباين المعالجات (تعميم متعدد المتغيرات للاختلافات البسيطة) تختلف عن نموذج التأثيرات الثابتة. [16]

تحرير نماذج التأثيرات المختلطة

يحتوي نموذج التأثيرات المختلطة (الفئة الثالثة) على عوامل تجريبية من كلا النوعين من التأثيرات الثابتة والعشوائية ، مع تفسيرات وتحليلات مختلفة بشكل مناسب لكلا النوعين.

مثال: يمكن إجراء تجارب التدريس بواسطة كلية أو قسم جامعي للعثور على كتاب تمهيدي جيد ، مع اعتبار كل نص علاجًا. سيقارن نموذج التأثيرات الثابتة قائمة من النصوص المرشحة. سيحدد نموذج التأثيرات العشوائية ما إذا كانت هناك اختلافات مهمة بين قائمة النصوص المختارة عشوائيًا. سيقارن نموذج التأثيرات المختلطة النصوص الحالية (الثابتة) بالبدائل المختارة عشوائيًا.

لقد ثبت أن تحديد التأثيرات الثابتة والعشوائية بعيد المنال ، حيث يمكن القول إن التعريفات المتنافسة تؤدي إلى مستنقع لغوي. [17]

تمت دراسة تحليل التباين من خلال عدة مناهج ، يستخدم أكثرها شيوعًا نموذجًا خطيًا يربط الاستجابة للعلاجات والكتل. لاحظ أن النموذج خطي في المعلمات ولكنه قد يكون غير خطي عبر مستويات العوامل. التفسير سهل عندما تكون البيانات متوازنة عبر العوامل ولكن هناك حاجة إلى فهم أعمق للبيانات غير المتوازنة.

تحليل الكتاب المدرسي باستخدام التوزيع العادي تحرير

يمكن تقديم تحليل التباين من حيث نموذج خطي ، مما يجعل الافتراضات التالية حول التوزيع الاحتمالي للإجابات: [18] [19] [20] [21]

    من الملاحظات - هذا افتراض للنموذج الذي يبسط التحليل الإحصائي. - توزيعات المخلفات طبيعية.
  • المساواة (أو "التجانس") في التباينات ، تسمى المثلية - يجب أن يكون التباين في البيانات في المجموعات هو نفسه.

تشير الافتراضات المنفصلة لنموذج الكتاب المدرسي إلى أن الأخطاء يتم توزيعها بشكل مستقل ومتشابه وطبيعي لنماذج التأثيرات الثابتة ، أي أن الأخطاء (ε ) مستقلة و

تحرير التحليل المعتمد على التوزيع العشوائي

في تجربة عشوائية محكومة ، يتم تعيين العلاجات بشكل عشوائي إلى الوحدات التجريبية ، وفقًا للبروتوكول التجريبي. هذا التوزيع العشوائي موضوعي ومعلن قبل إجراء التجربة. يتم استخدام التخصيص العشوائي الموضوعي لاختبار أهمية الفرضية الصفرية ، باتباع أفكار سي إس بيرس ورونالد فيشر. تمت مناقشة هذا التحليل القائم على التصميم وتطويره بواسطة فرانسيس جيه أنسكومب في محطة روثامستيد التجريبية وأوسكار كيمبثورن في جامعة ولاية أيوا. [22] قام كيمبثورن وطلابه بافتراض أن وحدة العلاج الإضافية، والتي تمت مناقشتها في كتب Kempthorne و David R. Cox. [ بحاجة لمصدر ]

تعديل وحدة المعالجة

لا يمكن عادةً تزوير افتراض وحدة المعالجة الإضافية بشكل مباشر ، وفقًا لكوكس وكيمبثورن. ولكن العديد من الآثار يمكن تزوير إضافة وحدة المعالجة. لتجربة عشوائية ، افتراض وحدة المعالجة المضافة يدل أن التباين ثابت لجميع العلاجات. لذلك ، عن طريق التناقض ، فإن الشرط الضروري لإضافات وحدة المعالجة هو أن يكون التباين ثابتًا.

إن استخدام وحدة المعالجة الإضافية والعشوائية مشابه للاستدلال القائم على التصميم القياسي في أخذ عينات مسح السكان المحدود.

النموذج الخطي المشتق تحرير

يستخدم Kempthorne التوزيع العشوائي وافتراض وحدة العلاج الإضافية لإنتاج أ النموذج الخطي المشتق، مشابه جدًا لنموذج الكتاب المدرسي الذي تمت مناقشته سابقًا. [26] يتم تقريب إحصائيات الاختبار لهذا النموذج الخطي المشتق عن طريق إحصائيات الاختبار لنموذج خطي عادي مناسب ، وفقًا لنظريات التقريب ودراسات المحاكاة. [27] ومع ذلك ، هناك اختلافات. على سبيل المثال ، ينتج عن التحليل المعتمد على التوزيع العشوائي ارتباط سلبي صغير (صارم) بين الملاحظات. [28] [29] في التحليل العشوائي ، هناك لا افتراض من أ عادي التوزيع وبالتأكيد لا افتراض من استقلال. على العكس تماما، الملاحظات تعتمد!

التحليل المعتمد على التوزيع العشوائي له عيب يتمثل في أن عرضه ينطوي على الجبر الممل ووقت طويل. نظرًا لأن التحليل القائم على التوزيع العشوائي معقد ويتم تقريبه بشكل وثيق من خلال النهج باستخدام نموذج خطي عادي ، فإن معظم المعلمين يؤكدون على نهج النموذج الخطي العادي. قلة من الإحصائيين يعترضون على التحليل القائم على النموذج للتجارب العشوائية المتوازنة.

النماذج الإحصائية لبيانات المراقبة تحرير

ومع ذلك ، عند تطبيقه على البيانات من التجارب غير العشوائية أو الدراسات القائمة على الملاحظة ، يفتقر التحليل القائم على النموذج إلى ضمان التوزيع العشوائي. [30] بالنسبة لبيانات المراقبة ، يجب استخدام اشتقاق فترات الثقة شخصي النماذج ، كما أكد عليها رونالد فيشر وأتباعه. من الناحية العملية ، غالبًا ما تكون تقديرات آثار العلاج من الدراسات القائمة على الملاحظة غير متسقة. في الممارسة العملية ، "النماذج الإحصائية" وبيانات المراقبة مفيدة لاقتراح الفرضيات التي يجب أن يتعامل معها الجمهور بحذر شديد. [31]

ملخص الافتراضات تحرير

يفترض تحليل ANOVA القائم على النموذج الطبيعي استقلالية التباينات وحالتها الطبيعية وتجانسها. يفترض التحليل المعتمد على التوزيع العشوائي فقط تجانس تباينات المخلفات (نتيجة لإضافة وحدة المعالجة) ويستخدم إجراء التوزيع العشوائي للتجربة. كلا هذين التحليلين يتطلبان المثلية ، كافتراض لتحليل النموذج الطبيعي وكنتيجة للعشوائية والإضافة للتحليل المعتمد على التوزيع العشوائي.

ومع ذلك ، فقد أجريت بنجاح دراسات للعمليات التي تغير التباينات بدلاً من الوسائل (تسمى تأثيرات التشتت) باستخدام ANOVA. [32] هناك رقم الافتراضات اللازمة لـ ANOVA في عموميتها الكاملة ، ولكن F-الاختبار المستخدم لاختبار فرضية ANOVA له افتراضات وقيود عملية ذات أهمية مستمرة.

غالبًا ما يمكن تحويل المشكلات التي لا تفي بافتراضات ANOVA لتلبية الافتراضات. إن خاصية إضافة وحدة المعالجة ليست ثابتة في ظل "تغيير المقياس" ، لذلك غالبًا ما يستخدم الإحصائيون التحولات لتحقيق وحدة المعالجة الإضافية. إذا كان من المتوقع أن يتبع متغير الاستجابة عائلة بارامترية من التوزيعات الاحتمالية ، فقد يحدد الإحصائي (في بروتوكول التجربة أو الدراسة القائمة على الملاحظة) أن يتم تحويل الاستجابات لتحقيق الاستقرار في التباين. [33] أيضًا ، قد يحدد الإحصائي تطبيق التحويلات اللوغاريتمية على الاستجابات التي يُعتقد أنها تتبع نموذجًا مضاعفًا. [24] [34] وفقًا لنظرية المعادلة الوظيفية لكوشي ، فإن اللوغاريتم هو التحويل المستمر الوحيد الذي يحول الضرب الحقيقي إلى الجمع. [ بحاجة لمصدر ]

يتم استخدام ANOVA في تحليل التجارب المقارنة ، تلك التي يكون فيها الاختلاف في النتائج فقط ذا أهمية. يتم تحديد الدلالة الإحصائية للتجربة بنسبة تباينين. هذه النسبة مستقلة عن العديد من التعديلات المحتملة على الملاحظات التجريبية: إضافة ثابت لجميع الملاحظات لا يغير الأهمية. ضرب كل الملاحظات في ثابت لا يغير المعنى. لذا فإن نتيجة الأهمية الإحصائية لـ ANOVA مستقلة عن التحيز الثابت وأخطاء القياس بالإضافة إلى الوحدات المستخدمة في التعبير عن الملاحظات. في عصر الحساب الميكانيكي ، كان من الشائع طرح ثابت من جميع الملاحظات (عندما يكون معادلاً لإسقاط الأرقام البادئة) لتبسيط إدخال البيانات. [35] [36] هذا مثال على ترميز البيانات.

يمكن وصف حسابات ANOVA بحساب عدد من الوسائل والتباينات ، وتقسيم تباينين ​​ومقارنة النسبة إلى قيمة كتيب لتحديد الأهمية الإحصائية. عندئذ يكون حساب تأثير العلاج تافهًا: "يتم تقدير تأثير أي علاج بأخذ الفرق بين متوسط ​​الملاحظات التي تتلقى العلاج والمتوسط ​​العام". [37]

تقسيم مجموع المربعات تحرير

الأسلوب الأساسي هو تقسيم المجموع الكلي للمربعات SS في المكونات المتعلقة بالتأثيرات المستخدمة في النموذج. على سبيل المثال ، نموذج ANOVA المبسط بنوع واحد من العلاج بمستويات مختلفة.

عدد درجات الحرية مدافع يمكن تقسيمها بطريقة مماثلة: أحد هذه المكونات (ذلك للخطأ) يحدد توزيع مربع كاي الذي يصف مجموع المربعات المرتبطة ، في حين أن نفس الشيء ينطبق على "العلاجات" إذا لم يكن هناك تأثير علاجي.

ال F-تحرير الاختبار

ال F- يستخدم الاختبار لمقارنة عوامل الانحراف الكلي. على سبيل المثال ، في اتجاه واحد ، أو ANOVA أحادي العامل ، يتم اختبار الأهمية الإحصائية من خلال مقارنة إحصائية اختبار F

هناك طريقتان لإتمام اختبار فرضية ANOVA ، وكلاهما ينتج نفس النتيجة:

  • طريقة الكتاب المدرسي هي مقارنة القيمة الملحوظة لـ F مع القيمة الحرجة لـ F المحددة من الجداول. القيمة الحرجة لـ F هي دالة لدرجات حرية البسط والمقام ومستوى الأهمية (α). إذا كان F ≥ F.حرج، تم رفض الفرضية الصفرية.
  • تحسب طريقة الكمبيوتر الاحتمال (القيمة الاحتمالية) لقيمة F أكبر من أو تساوي القيمة المرصودة. يتم رفض الفرضية الصفرية إذا كان هذا الاحتمال أقل من أو يساوي مستوى الأهمية (α).

أنوفا F- من المعروف أن الاختبار هو الأمثل تقريبًا من حيث تقليل الأخطاء السلبية الخاطئة إلى الحد الأدنى لمعدل ثابت من الأخطاء الإيجابية الخاطئة (أي زيادة القدرة إلى الحد الأقصى لمستوى أهمية ثابت). على سبيل المثال ، لاختبار الفرضية القائلة بأن العلاجات الطبية المختلفة لها نفس التأثير تمامًا ، فإن F-الاختبار ص- القيم تقترب عن كثب من القيم p لاختبار التقليب: يكون التقريب قريبًا بشكل خاص عندما يكون التصميم متوازنًا. [27] [38] اختبارات التقليب هذه تميز الاختبارات بقوة قصوى ضد جميع الفرضيات البديلة ، كما لاحظ روزنباوم. [ملحوظة 2] أنوفا F-اختبار (فرضية العدم أن جميع المعالجات لها نفس التأثير تمامًا) يوصى به كاختبار عملي ، بسبب متانته ضد العديد من التوزيعات البديلة. [39] [ملحوظة 3]

تمديد المنطق تحرير

يتكون ANOVA من أجزاء قابلة للفصل وتقسيم مصادر التباين ويمكن استخدام اختبار الفرضيات بشكل فردي. يستخدم ANOVA لدعم الأدوات الإحصائية الأخرى. يتم استخدام الانحدار أولاً لملاءمة النماذج الأكثر تعقيدًا مع البيانات ، ثم يتم استخدام ANOVA لمقارنة النماذج بهدف اختيار نماذج (r) بسيطة تصف البيانات بشكل مناسب. "يمكن أن تكون هذه النماذج مناسبة بدون أي إشارة إلى ANOVA ، ولكن يمكن بعد ذلك استخدام أدوات ANOVA لفهم النماذج المجهزة ، ولاختبار الفرضيات حول دفعات من المعاملات." [40] "[نحن] نفكر في تحليل التباين على أنه طريقة لفهم وهيكلة النماذج متعددة المستويات - ليس كبديل للانحدار ولكن كأداة لتلخيص الاستدلالات المعقدة عالية الأبعاد." [40]

أبسط تجربة مناسبة لتحليل ANOVA هي التجربة العشوائية بالكامل بعامل واحد. تتضمن التجارب الأكثر تعقيدًا مع عامل واحد قيودًا على التوزيع العشوائي وتتضمن كتلًا عشوائية بالكامل ومربعات لاتينية (ومتغيرات: المربعات اليونانية اللاتينية ، وما إلى ذلك). تشترك التجارب الأكثر تعقيدًا في العديد من تعقيدات العوامل المتعددة. تتوفر مناقشة كاملة نسبيًا للتحليل (النماذج ، ملخصات البيانات ، جدول ANOVA) للتجربة العشوائية تمامًا.

بالنسبة لعامل واحد ، هناك بعض البدائل لتحليل التباين أحادي الاتجاه ، وهي اختبار ويلش غير المتغاير F ، واختبار ويلش غير المتجانسة F مع الوسائل المشذبة والتباينات Winsorized ، واختبار Brown-Forsythe ، واختبار AlexanderGovern ، واختبار James من الدرجة الثانية ، و Kruskal-Wallis اختبار ، متوفر في حزمة onewaytests R. [41]

ANOVA يعمم دراسة تأثيرات العوامل المتعددة. عندما تتضمن التجربة ملاحظات في جميع مجموعات مستويات كل عامل ، يتم تسميتها عاملي. تعد التجارب العواملية أكثر كفاءة من سلسلة تجارب العامل الفردي وتزداد الكفاءة مع زيادة عدد العوامل. [42] وبالتالي ، يتم استخدام التصاميم عامل بكثرة.

استخدام ANOVA لدراسة تأثيرات عوامل متعددة له مضاعفات. في ANOVA ثلاثي الاتجاهات مع العوامل x و y و z ، يتضمن نموذج ANOVA مصطلحات للتأثيرات الرئيسية (x ، y ، z) وشروط التفاعلات (xy ، xz ، yz ، xyz). تتطلب جميع المصطلحات اختبارات فرضية. يزيد انتشار مصطلحات التفاعل من خطر أن ينتج عن بعض اختبارات الفرضية نتيجة إيجابية خاطئة عن طريق الصدفة. لحسن الحظ ، تقول التجربة أن التفاعلات عالية المستوى أمر نادر الحدوث. [43] [ مطلوب التحقق ] القدرة على اكتشاف التفاعلات هي ميزة رئيسية لعوامل ANOVA المتعددة. يؤدي اختبار عامل واحد في كل مرة إلى إخفاء التفاعلات ، ولكنه ينتج عنه نتائج تجريبية غير متسقة على ما يبدو. [42]

ينصح بالحذر عند مواجهة التفاعلات اختبر شروط التفاعل أولاً وقم بتوسيع التحليل إلى ما بعد ANOVA إذا تم العثور على تفاعلات. تختلف النصوص في توصياتها فيما يتعلق بمواصلة إجراء ANOVA بعد مواجهة التفاعل. التفاعلات تعقد تفسير البيانات التجريبية. لا يمكن أخذ حسابات الأهمية ولا تأثيرات العلاج المقدرة بالقيمة الاسمية. "التفاعل الكبير غالبًا ما يخفي أهمية التأثيرات الرئيسية." [44] يوصى باستخدام الأساليب الرسومية لتعزيز الفهم. غالبًا ما يكون الانحدار مفيدًا. مناقشة مطولة للتفاعلات متاحة في كوكس (1958). [45] يمكن إزالة بعض التفاعلات (عن طريق التحولات) بينما لا يمكن للبعض الآخر ذلك.

يتم استخدام مجموعة متنوعة من التقنيات مع ANOVA متعدد العوامل لتقليل النفقات. تتمثل إحدى التقنيات المستخدمة في التصميمات العوامل في تقليل التكرار (ربما لا يوجد تكرار بدعم من الخداع التحليلي) ودمج المجموعات عندما يتبين أن التأثيرات غير مهمة إحصائيًا (أو عمليًا). قد تنهار تجربة تحتوي على العديد من العوامل غير المعنوية إلى واحدة مع عدد قليل من العوامل يدعمها العديد من المضاعفات. [46]

مطلوب بعض التحليل لدعم التصميم من التجربة بينما يتم إجراء تحليل آخر بعد أن تبين رسميًا أن التغييرات في العوامل تؤدي إلى تغييرات ذات دلالة إحصائية في الردود. نظرًا لأن التجريب متكرر ، فإن نتائج تجربة واحدة تغير الخطط للتجارب التالية.

التحليل التحضيري تحرير

عدد الوحدات التجريبية تحرير

في تصميم التجربة ، يتم تخطيط عدد الوحدات التجريبية لتحقيق أهداف التجربة. غالبًا ما تكون التجارب متسلسلة.

غالبًا ما يتم تصميم التجارب المبكرة لتوفير تقديرات متوسطة غير متحيزة لتأثيرات العلاج والخطأ التجريبي. غالبًا ما يتم تصميم التجارب اللاحقة لاختبار فرضية أن تأثير العلاج له حجم مهم في هذه الحالة ، ويتم اختيار عدد الوحدات التجريبية بحيث تكون التجربة في حدود الميزانية ولديها قوة كافية ، من بين أهداف أخرى.

مطلوب بشكل عام الإبلاغ عن تحليل حجم العينة في علم النفس. "تقديم معلومات عن حجم العينة والعملية التي أدت إلى قرارات حجم العينة." [47] التحليل ، المكتوب في البروتوكول التجريبي قبل إجراء التجربة ، يتم فحصه في طلبات المنح ومجالس المراجعة الإدارية.

إلى جانب تحليل الطاقة ، هناك طرق أقل رسمية لاختيار عدد الوحدات التجريبية. وتشمل هذه الأساليب الرسومية القائمة على الحد من احتمالية الأخطاء السلبية الخاطئة ، والطرق الرسومية القائمة على زيادة التباين المتوقعة (فوق القيم المتبقية) والطرق القائمة على تحقيق فاصل الثقة المطلوب. [48]

تحرير تحليل الطاقة

غالبًا ما يتم تطبيق تحليل الطاقة في سياق ANOVA من أجل تقييم احتمالية رفض الفرضية الصفرية بنجاح إذا افترضنا تصميم ANOVA معين وحجم التأثير في المجتمع وحجم العينة ومستوى الأهمية. يمكن أن يساعد تحليل القوة في تصميم الدراسة من خلال تحديد حجم العينة المطلوب من أجل الحصول على فرصة معقولة لرفض الفرضية الصفرية عندما تكون الفرضية البديلة صحيحة. [49] [50] [51] [52]

تحرير حجم التأثير

تم اقتراح العديد من مقاييس التأثير المعيارية لـ ANOVA لتلخيص قوة الارتباط بين المتنبئ (المتنبئين) والمتغير التابع أو الاختلاف القياسي العام للنموذج الكامل. تسهل تقديرات حجم التأثير المعيارية مقارنة النتائج عبر الدراسات والتخصصات. ومع ذلك ، في حين أن أحجام التأثير الموحدة تستخدم بشكل شائع في كثير من الأدبيات المهنية ، إلا أن المقياس غير القياسي لحجم التأثير الذي يحتوي على وحدات "ذات مغزى" على الفور قد يكون مفضلاً لأغراض إعداد التقارير. [53]

نموذج تأكيد التحرير

في بعض الأحيان يتم إجراء اختبارات لتحديد ما إذا كانت افتراضات ANOVA تبدو منتهكة. يتم فحص المخلفات أو تحليلها لتأكيد الشذوذ الجنسي والحالة الطبيعية الإجمالية. [54] يجب أن يكون للمتبقي مظهر ضوضاء (متوسط ​​التوزيع الطبيعي الصفري) عند رسمها كدالة لأي شيء بما في ذلك قيم الوقت والبيانات النموذجية. تلمح الاتجاهات إلى التفاعلات بين العوامل أو بين الملاحظات.

متابعة الاختبارات تحرير

غالبًا ما يتبع التأثير ذي الدلالة الإحصائية في ANOVA اختبارات إضافية. يمكن القيام بذلك من أجل تقييم المجموعات التي تختلف عن المجموعات الأخرى أو لاختبار فرضيات أخرى مركزة مختلفة. غالبًا ما يتم تمييز اختبارات المتابعة من حيث ما إذا كانت "مخططة" (مسبقًا) أو "لاحقة". يتم تحديد الاختبارات المخططة قبل النظر في البيانات ، ولا يتم تصور الاختبارات اللاحقة إلا بعد النظر إلى البيانات (على الرغم من أن مصطلح "ما بعد المخصص" يستخدم بشكل غير متسق).

قد تكون اختبارات المتابعة عبارة عن مقارنات زوجية "بسيطة" لوسائل المجموعة الفردية أو قد تكون مقارنات "مركبة" (على سبيل المثال ، مقارنة متوسط ​​التجميع عبر المجموعات A و B و C بمتوسط ​​المجموعة D). يمكن أن تنظر المقارنات أيضًا في اختبارات الاتجاه ، مثل العلاقات الخطية والتربيعية ، عندما يتضمن المتغير المستقل مستويات مرتبة. غالبًا ما تتضمن اختبارات المتابعة طريقة تعديل لمشكلة المقارنات المتعددة.

هناك عدة أنواع من ANOVA. يعتمد العديد من الإحصائيين على ANOVA على تصميم التجربة ، [55] خاصة على البروتوكول الذي يحدد التخصيص العشوائي للعلاجات للمواضيع ، يجب أن يتضمن وصف البروتوكول لآلية التخصيص تحديدًا لهيكل المعالجات وأي حظر. من الشائع أيضًا تطبيق ANOVA على بيانات المراقبة باستخدام نموذج إحصائي مناسب. [ بحاجة لمصدر ]

تستخدم بعض التصميمات الشائعة الأنواع التالية من ANOVA:

    يستخدم لاختبار الفروق بين مجموعتين أو أكثر من المجموعات المستقلة (الوسائل) ، على سبيل المثالمستويات مختلفة من تطبيق اليوريا في المحاصيل ، أو مستويات مختلفة من تأثير المضادات الحيوية على عدة أنواع بكتيرية مختلفة ، [56] أو مستويات مختلفة من تأثير بعض الأدوية على مجموعات من المرضى. ومع ذلك ، إذا لم تكن هذه المجموعات مستقلة ، وكان هناك ترتيب في المجموعات (مثل المرض الخفيف والمتوسط ​​والشديد) ، أو في جرعة الدواء (مثل 5 مجم / مل ، 10 مجم / مل ، 20 مجم / مل) لنفس المجموعة من المرضى ، ثم يجب استخدام تقدير الاتجاه الخطي. ومع ذلك ، عادةً ما يتم استخدام ANOVA أحادي الاتجاه لاختبار الاختلافات بين ثلاث مجموعات على الأقل ، حيث يمكن تغطية الحالة المكونة من مجموعتين عن طريق اختبار t. [57] عند وجود وسيلتين فقط للمقارنة ، اختبار t و ANOVA F- الاختبار يعادل العلاقة بين ANOVA و ر اعطي من قبل F = ر 2 .
    يستخدم ANOVA عندما يكون هناك أكثر من عامل. يتم استخدام ANOVA عند استخدام نفس الموضوعات لكل عامل (على سبيل المثال ، في دراسة طولية). يتم استخدام (MANOVA) عندما يكون هناك أكثر من متغير استجابة.

التجارب المتوازنة (تلك التي لها حجم عينة متساوٍ لكل علاج) يسهل نسبيًا تفسيرها التجارب غير المتوازنة تقدم تعقيدًا أكثر. بالنسبة لعامل ANOVA الأحادي (أحادي الاتجاه) ، يكون تعديل البيانات غير المتوازنة أمرًا سهلاً ، لكن التحليل غير المتوازن يفتقر إلى كل من القوة والقوة. [58] بالنسبة للتصاميم الأكثر تعقيدًا ، يؤدي عدم التوازن إلى مزيد من التعقيدات. "خاصية التعامد للتأثيرات الرئيسية والتفاعلات الموجودة في البيانات المتوازنة لا تنتقل إلى الحالة غير المتوازنة. وهذا يعني أن التحليل المعتاد لتقنيات التباين لا ينطبق. وبالتالي ، فإن تحليل العوامل غير المتوازنة أصعب بكثير من تحليل العوامل المتوازنة تصميمات." [59] في الحالة العامة ، "يمكن أيضًا تطبيق تحليل التباين على البيانات غير المتوازنة ، ولكن بعد ذلك على مجاميع المربعات ، والمربعات المتوسطة ، و F- ستعتمد النسب على الترتيب الذي يتم فيه النظر في مصادر التباين. "[40] إن أبسط التقنيات لمعالجة البيانات غير المتوازنة استعادة التوازن إما عن طريق التخلص من البيانات أو عن طريق تجميع البيانات المفقودة. تستخدم التقنيات الأكثر تعقيدًا الانحدار.

ANOVA (جزئيًا) اختبار ذو دلالة إحصائية. ترى جمعية علم النفس الأمريكية (والعديد من المنظمات الأخرى) أن مجرد الإبلاغ عن الأهمية الإحصائية غير كافٍ وأن الإبلاغ عن حدود الثقة هو المفضل. [53]

تعتبر ANOVA حالة خاصة من الانحدار الخطي [60] [61] والتي تعد بدورها حالة خاصة للنموذج الخطي العام. [62] يعتبر الجميع أن الملاحظات هي مجموع نموذج (ملائم) ومتبقي (خطأ) يجب تصغيره.

يعتبر اختبار Kruskal-Wallis واختبار فريدمان من الاختبارات اللامعلمية ، والتي لا تعتمد على افتراض الحالة الطبيعية. [63] [64]

تحرير الاتصال بالانحدار الخطي

نوضح أدناه العلاقة بين ANOVA متعدد الاتجاهات والانحدار الخطي.

مع وجود هذا الترميز في مكانه الصحيح ، لدينا الآن الصلة الدقيقة مع الانحدار الخطي. نحن ببساطة نتراجع عن الاستجابة y k < displaystyle y_> مقابل المتجه X k < displaystyle X_>. ومع ذلك ، هناك قلق بشأن تحديد الهوية. للتغلب على مثل هذه المشكلات ، نفترض أن مجموع المعلمات داخل كل مجموعة من التفاعلات يساوي صفرًا. من هنا ، يمكن للمرء أن يستخدم F- الإحصاء أو طرق أخرى لتحديد مدى ملاءمة العوامل الفردية.

مثال تحرير

يمكننا النظر في مثال التفاعل ثنائي الاتجاه حيث نفترض أن العامل الأول يحتوي على مستويين والعامل الثاني يحتوي على 3 مستويات.


شاهد الفيديو: مقرر الفروق الفردية المحاضرة الثانية التحليل العاملي (ديسمبر 2021).