مقالات

1.6.5.4: الحالة الطبيعية - الرياضيات


كيف تقرر أي اختبار يجب استخدامه ، حدودي أم غير حدودي ، اختبار تي أم ويلكوكسون؟ نحتاج إلى معرفة ما إذا كان التوزيع يتبع أو على الأقل يقترب من الحالة الطبيعية. يمكن التحقق من ذلك بصريًا (الشكل ( PageIndex {1} )):

الرمز ( PageIndex {1} ) (R):

كيف تعمل مؤامرة QQ؟ أولاً ، يتم ترتيب نقاط البيانات ويتم تعيين كل نقطة إلى مقياس. ثانيًا ، مجموعة من الكميات النظرية - المواقف التي يجب أن تشغلها نقاط البيانات في التوزيع الطبيعي-تم حسابه. أخيرًا ، يتم إقران الكميات النظرية والتجريبية ورسمها.

لقد غطينا المؤامرة بخط قادم عبر الأرباع. عندما تتبع النقاط الخط عن كثب ، يكون التوزيع التجريبي طبيعيًا. هنا الكثير من النقاط في ذيول بعيدة. مرة أخرى ، نستنتج أن التوزيع الأصلي ليس طبيعيًا.

تقدم R أيضًا أدوات عددية تتحقق من الحالة الطبيعية. أولهم اختبار شابيرو ويلك (من فضلك يركض هذا الرمز بنفسك):

الرمز ( PageIndex {2} ) (R):

هنا الإخراج مقتضب إلى حد ما. قيم P صغيرة ، لكن ما هي الفرضية الصفرية؟ حتى المساعدة المضمنة لا تذكر ذلك. لفهم ذلك ، قد نجري تجربة بسيطة:

الرمز ( PageIndex {3} ) (R):

يولد الأمر rnorm () أرقامًا عشوائية تتبع التوزيع الطبيعي ، كما هو مذكور في الوسيطة. هنا حصلنا على قيمة p تقترب من الوحدة. من الواضح أن الفرضية الصفرية كانت "التوزيع التجريبي طبيعي".

الشكل ( PageIndex {1} ) تحقق رسومي من الوضع الطبيعي.

مسلحين بهذه التجربة الصغيرة ، قد نستنتج أن توزيعات الراتب والرواتب 2 ليست طبيعية.

يعمل اختبار Kolmogorov-Smirnov بتوزيعين. الفرضية الصفرية هي أن كلتا العيّنتين جاءت من نفس المجموعة السكانية. إذا أردنا اختبار توزيع واحد مقابل التوزيع الطبيعي ، فيجب أن تكون الوسيطة الثانية غير طبيعية:

الرمز ( PageIndex {4} ) (R):

(النتيجة قابلة للمقارنة بنتيجة اختبار Shapiro-Wilk. قمنا بقياس البيانات لأنه افتراضيًا ، تستخدم الوسيطة الثانية توزيعًا عاديًا متدرجًا.)

تقبل الدالة ks.test () أي نوع من الوسيطة الثانية ، وبالتالي يمكن استخدامها للتحقق من مدى موثوقية تقريب التوزيع الحالي باستخدام أي التوزيع النظري ، ليس بالضرورة طبيعيًا. ومع ذلك ، غالبًا ما يُرجع اختبار Kolmogorov-Smirnov الإجابة الخاطئة للعينات التي يكون حجمها (<50 ) ، لذلك فهي أقل قوة من اختبار Shapiro-Wilks.

2.2e-16 لنا ما يسمى الأسية، طريقة إظهار أرقام صغيرة جدًا مثل هذا ( (2.2 times 10 ^ {- 16} )). إذا لم يكن هذا الترميز مريحًا لك ، فهناك طريقة للتخلص منه:

الرمز ( PageIndex {5} ) (R):

(الخيار scipen يساوي الحد الأقصى المسموح به لعدد الأصفار.)

في معظم الأحيان ، تتفق هذه الطرق الثلاثة لتحديد الحالة الطبيعية ، لكن هذا ليس مفاجئًا إذا كانت ترجع إلى نتائج مختلفة. فحص الحالة الطبيعية ليس حكماً بالإعدام ، إنه مجرد رأي مبني على الاحتمالية.

مرة أخرى ، إذا كان حجم العينة صغيرًا ، فعادة ما تفشل الاختبارات الإحصائية وحتى المؤامرات الكمية - الكمية في اكتشاف الحالة غير الطبيعية. في هذه الحالات ، قد توفر أدوات أبسط مثل مخطط الجذع أو الرسم البياني مساعدة أفضل.


شاهد الفيديو: الحصة الخامسة التوزيع الطبيعي (شهر نوفمبر 2021).