مقالات

8.4: مثال ملائم لمنحنى الممارسة - الرياضيات


ضع في اعتبارك كثير الحدود التالي مع الحجميات الثابتة (أ ) ، (ب ) ، و (ج ) ، التي تقع على (س ص ) - المستوى:

[f (x) = ax ^ 2 + bx + c nonumber ]

سؤال

هل هذه الوظيفة خطية؟ لما و لما لا؟

افترض أننا لا نعرف قيم (أ ) و (ب ) و (ج ) ، لكننا نعلم أن النقاط (1،2) و (-1،12) و (2) ، 3) على كثير الحدود. يمكننا تعويض النقاط المعروفة في المعادلة أعلاه. بالنسبة إلى eample ، باستخدام النقطة (1،2) نحصل على المعادلة التالية:

[2 = a1 ^ 2 + b1 + c nonumber ]

[ text {or} nonumber ]

[2 = أ + ب + ج بلا رقم ]

سؤال

قم بإنشاء معادلتين أخريين عن طريق استبدال النقاط (-1،12) و (2،3) في المعادلة أعلاه:

سؤال

إذا فعلنا هذا بشكل صحيح ، يجب أن يكون لدينا ثلاث معادلات وثلاثة مجاهيل ( (أ ) ، (ب ) ، (ج )). لاحظ أيضًا أن هذه المعادلات خطية (كيف حدث ذلك؟). حول نظام المعادلات هذا إلى مصفوفتين (A ) و (ب ) كما فعلنا أعلاه.

سؤال

اكتب الكود المطلوب حله من أجل (س ) (على سبيل المثال ، ( (أ ) ، (ب ) ، (ج ))) باستخدامحبيبي.

سؤال

نظرا لقيمة الخاص بكxمصفوفة مشتقة من السؤال السابق ، ما هي قيم (أ ) و (ب ) و (ج )؟

بافتراض صحة ما ورد أعلاه ، فإن الكود التالي سيطبع متعدد الحدود من الدرجة الثانية ويرسم النقاط الأصلية:

سؤال

يهدف البرنامج التالي إلى أخذ أربع نقاط كمدخلات ( (p1 ) ، (p2 ) ، (p3 ) ، (p4 ) ( في R ^ 2 )) وحساب المعاملات (a ) و (b ) و (c ) و (d ) بحيث يمر الرسم البياني لـ (f (x) = ax ^ 3 + bx ^ 2 + cx + d ) بسلاسة من خلال النقاط. اختبر الوظيفة بالنقاط التالية (1،2) ، (-1،6) ، (2،3) ، (3،2) كمدخلات واطبع قيم (أ ) ، (ب ) ، (ج ) و (د ).

سؤال

قم بتعديل ما ورد أعلاهfitpoly3تعمل أيضًا على إنشاء رقم لنقاط الإدخال وكثير الحدود الناتجة في النطاقس = (- 3،3).

سؤال

أعط أي أربع نقاط إدخال (R ^ 2 ) إلىمناسب 3، هل يوجد دائمًا حل فريد؟ اشرح اجابتك.


عندما يكون متغير استجابتنا ثنائيًا ، فإن نموذج الانحدار له عدة قيود. من بين الأمور الأكثر وضوحًا - والمتعارضة منطقيًا - أن خط الانحدار يمتد بلا حدود في أي من الاتجاهين. هذا يعني أنه على الرغم من أن متغير استجابتنا (y ) يأخذ فقط القيم 0 و 1 ، فإن القيم الملائمة لدينا ( قبعة) يمكن أن تتراوح في أي مكان من (- infty ) إلى ( infty ). هذا لا معنى له.

لرؤية هذا عمليًا ، سنلائم نموذج الانحدار الخطي لبيانات حول 55 طالبًا تقدموا إلى كلية الطب. نريد أن نفهم كيف يرتبط المعدل التراكمي للطلاب الجامعيين باحتمالية قبولهم من قبل مدرسة معينة (القبول).

ممارسه الرياضه

يتم تحميل بيانات قبول كلية الطب في مساحة العمل الخاصة بك كـ MedGPA.

  • قم بإنشاء مخطط مبعثر يسمى data_space للقبول كدالة لـ GPA. استخدم geom_jitter () لتطبيق مقدار ضئيل من الارتعاش على النقاط في الاتجاه y من خلال ضبط العرض = 0 والارتفاع = 0.05.


الملخص

تعد نماذج الانحدار غير الخطي أدوات مهمة لأن العديد من عمليات المحاصيل والتربة يتم تمثيلها بشكل أفضل بواسطة النماذج اللاخطية أكثر من النماذج الخطية. لا يعد تركيب النماذج غير الخطية إجراءً من خطوة واحدة ولكنه عملية متضمنة تتطلب فحصًا دقيقًا لكل خطوة على حدة. اعتمادًا على الهدف ومجال التطبيق ، يتم تحديد أولويات مختلفة عند تركيب النماذج غير الخطية ، وتشمل هذه الحصول على تقديرات معلمة مقبولة ونموذج مناسب مع تلبية الافتراضات القياسية للنماذج الإحصائية. نقترح خطوات في ملاءمة النماذج غير الخطية كما هو موضح في مخطط التدفق ونناقش كل خطوة على حدة مع تقديم أمثلة وتحديثات على الإجراءات المستخدمة. تؤخذ الخطوات التالية في الاعتبار: (1) اختيار النماذج المرشحة ، (2) تعيين قيم البداية ، (3) النماذج الملائمة ، (4) التحقق من تقديرات التقارب والمعلمات ، (5) العثور على النموذج "الأفضل" بين النماذج المتنافسة ، (6) ) تحقق من افتراضات النموذج (التحليل المتبقي) ، و (7) احسب الواصفات الإحصائية وفواصل الثقة. تتم أيضًا معالجة آليات التغذية الراجعة المرتبطة (أي تجانس تباين النموذج). على وجه الخصوص ، نؤكد على الخطوة الأولى (اختيار النماذج المرشحة) من خلال توفير مكتبة واسعة من الوظائف غير الخطية (77 معادلة مع معاني المعلمات المرتبطة بها) وأمثلة للتطبيقات النموذجية في الزراعة. نأمل أن توضح هذه المساهمة بعض الصعوبات والارتباك مع مهمة استخدام النماذج غير الخطية.

في تحليل البيانات، غالبًا ما نطرح الأسئلة التالية: ما هو أفضل نموذج لوصف بياناتنا؟ ما هو أفضل مؤشر إحصائي للحكم على جودة الملاءمة؟ كيف نختار من بين النماذج المتنافسة؟ لا توجد إجابات بسيطة على هذه الأسئلة. هنا نحاول تزويد المهندسين الزراعيين بإطار عام حول كيفية التعامل مع هذه الأسئلة بشكل مناسب. أهدافنا المحددة هي: (1) تقديم نظرة عامة موجزة عن النماذج غير الخطية ووضع دليل إرشادي لفهم مجموعة الوظائف المستخدمة في التطبيقات الزراعية (2) للإشارة إلى تقنيات تعديل النماذج غير الخطية وكيفية التعامل مع النماذج غير الخطية المتعددة ( 3) لمناقشة القضايا المنهجية الرئيسية المتعلقة بتقدير المعلمات وأداء النموذج والمقارنة و (4) لإظهار التحليل التدريجي للبيانات التجريبية باستخدام نموذج الانحدار غير الخطي. يتبع الهيكل مخطط التدفق في الشكل 1. نبدأ بتعريف نماذج الانحدار غير الخطي ونناقش مزاياها وعيوبها الرئيسية. ثم نقدم 77 دالة غير خطية (بما في ذلك تلك الموجودة في الجداول التكميلية) مع مراجع للتطبيقات في الزراعة. نحن نقدم نظرة عامة محدثة على المنهجيات لتناسب النماذج ، واختيار قيم البداية ، وتقييم ملاءمة الملاءمة ، واختيار أفضل النماذج ، وتقييم المخلفات. أخيرًا ، نقوم بإعادة تحليل البيانات التجريبية حول نمو الكتلة الحيوية مع مرور الوقت (Danalatos et al. ، 2009).

سير العمل المقترح في تحليل الانحدار غير الخطي. تشير الأسهم السميكة إلى الخطوات الرئيسية ، بينما تشير الأسهم الرفيعة إلى الخطوات الفرعية ، وتشير الأسهم المتقطعة إلى ردود الفعل في الانحدار غير الخطي. الجزء المظلل اختياري ويمكن تجاهله في الحالات البسيطة. (الاختصارات: GLMs ، النماذج الخطية المعممة LRT ، اختبار نسبة الاحتمالية AIC ، معيار معلومات Akaike BIC ، معيار المعلومات Bayesian.)


رقمنة التصميم

يصف هذا القسم نظام الإحداثيات المستخدم لتأسيس مواقع النقاط التي تحدد مخطط الصورة الرمزية. كما يوثق وضع الحروف الرسومية فيما يتعلق بمحاور الإحداثيات.

الخطوط العريضة

في خط TrueType ، يتم وصف أشكال الحروف الرسومية بواسطة حدودها التفصيلية. يتكون مخطط الصورة الرمزية من سلسلة من الملامح. قد يكون للحرف الرسومي البسيط محيط واحد فقط. يمكن أن تحتوي الحروف الرسومية الأكثر تعقيدًا على محيطين أو أكثر. يمكن إنشاء الحروف الرسومية المركبة من خلال الجمع بين اثنين أو أكثر من الحروف الرسومية الأبسط. سيتم تعيين أحرف تحكم معينة ليس لها مظهر مرئي إلى الصورة الرمزية بدون حدود.

شكل 1-1 صور رمزية ذات ملامح واحدة أو اثنتين أو ثلاثة على التوالي

تتكون الملامح من خطوط ومنحنيات مستقيمة. يتم تحديد المنحنيات من خلال سلسلة من النقاط التي تصف شرائح بيزير من الدرجة الثانية. يستخدم تنسيق TrueType Bezierspline نوعين من النقاط لتحديد المنحنيات ، تلك الموجودة على المنحنى وتلك الموجودة إيقاف المنحنى. أي مجموعة من نقاط المنحنى "off and on" مقبولة عند تحديد المنحنى. يتم تحديد الخطوط المستقيمة بنقطتين متتاليتين على نقاط المنحنى.

شكل 1-2 وصف رسومي يتكون من سلسلة من نقاط المنحنى داخل وخارج

يجب ترقيم النقاط التي يتكون منها المنحنى بترتيب متتالي. يحدث فرقًا سواء كان الترتيب يتزايد أو يتناقص في تحديد نمط تعبئة الأشكال التي يتكون منها الصورة الرمزية. يجب أن يكون اتجاه المنحنيات بحيث إذا تم اتباع المنحنى في اتجاه زيادة أرقام النقاط ، فإن المساحة السوداء (المنطقة المملوءة) ستكون دائمًا على اليمين.

FUnits و em square

في ملف خط TrueType ، يتم وصف مواقع النقاط في وحدات الخط ، أو FUnits. FUnit هي أصغر وحدة قابلة للقياس في مربع em ، وهو مربع وهمي يستخدم لتغيير حجم ومحاذاة الحروف الرسومية. أبعاد المربع em هي أبعاد ارتفاع الخط بالكامل بالإضافة إلى بعض التباعد الإضافي لمنع أسطر النص من الاصطدام عند الطباعة بدون مسافة بادئة إضافية.

بينما في أيام الكتابة المعدنية ، لا يمكن أن تمتد الحروف الرسومية إلى ما بعد مربع em ، فإن الخطوط الرقمية ليست مقيدة للغاية. يمكن جعل مربع em كبيرًا بما يكفي لاحتواء جميع الحروف الرسومية بالكامل ، بما في ذلك الحروف الرسومية المُعلَّمة. أو ، إذا ثبت أنه مناسب ، فقد تمتد أجزاء من الحروف الرسومية خارج مربع em. يمكن أن تتعامل خطوط TrueType مع أي من الأسلوبين ، لذا فإن الخيار هو الشركة المصنعة للخط.

الشكل 1-3 حرف يمتد خارج مربع em

يحدد مربع em شبكة إحداثيات ثنائية الأبعاد يكون x-المحور يصف الحركة في الاتجاه الأفقي والتي ذ-المحور يصف الحركة في اتجاه عمودي. تمت مناقشة هذا بمزيد من التفصيل في القسم التالي.

FUnits والشبكة

يتمثل أحد القرارات الرئيسية في رقمنة الخط في تحديد الدقة التي يتم بها وصف النقاط التي تشكل مخططات الحروف الرسومية. تمثل النقاط مواقع في شبكة تُعرف أصغر وحدة قابلة للعنونة باسم FUnit أو Font Unit. الشبكة عبارة عن نظام إحداثيات ثنائي الأبعاد x-المحور يصف الحركة في الاتجاه الأفقي والتي ذ-المحور يصف الحركة في اتجاه عمودي. إحداثيات أصل الشبكة (0،0). الشبكة ليست مستوى لانهائي. يجب أن تكون كل نقطة ضمن النطاق -16384 و +16383 وحدة. اعتمادًا على الدقة المختارة ، سيكون نطاق مواقع الشبكة القابلة للعنونة أصغر.

يتم اختيار درجة دقة شبكة الإحداثيات - أي عدد الوحدات لكل em (upem) - بواسطة الشركة المصنعة للخط. سيكون مقياس المخطط التفصيلي أسرع إذا تم اختيار الوحدات لكل م لتكون أس 2 ، مثل 2048.

الشكل 1-4 نظام الإحداثيات

لا يحتاج أصل مربع em إلى أي علاقة متسقة مع الخطوط العريضة للصورة الرمزية. في الممارسة العملية ، ومع ذلك ، تعتمد التطبيقات على وجود بعض الاصطلاحات الخاصة بوضع الحروف الرسومية لخط معين. بالنسبة للخطوط الرومانية ، التي من المفترض أن يتم تخطيطها أفقيًا ، أ ذ- يُفترض عادةً أن تتوافق القيمة المنسقة لـ 0 مع الخط الأساسي للخط. لا يوجد معنى معين معين لملف x-تنسيق 0 ولكن الشركات المصنعة قد تحسن أداء التطبيقات عن طريق اختيار معنى قياسي لـ x الأصل.

على سبيل المثال ، يمكنك وضع حرف رسومي بحيث يكون مركزه الجمالي في x- القيمة المنسقة 0. أي مجموعة من الحروف الرسومية مصممة على هذا النحو عند وضعها في عمود بحيث x- القيم المنسقة للصفر متطابقة ستظهر لتكون متمركزة بشكل جيد. يمكن استخدام هذا الخيار مع كانجي أو أي خطوط يتم تنضيدها عموديًا. بديل آخر هو وضع كل حرف رسومي بحيث يكون لنقطة المخطط التفصيلية أقصى اليسار x-قيمة تساوي اتجاه الجانب الأيسر من الصورة الرمزية. قد تسمح الخطوط التي تم إنشاؤها بهذه الطريقة لبعض التطبيقات بالطباعة بسرعة أكبر على طابعات PostScript.

الشكل 1-5 خياران محتملان لأصل الصورة الرمزية بخط روماني. في الحالة الأولى (يسار) يكون اتجاه الجانب الأيسر x-صفر. في الجزء الثاني (على اليمين) ، المركز الجمالي للشخصية هو x-صفر

إذا كانت الخطوط لنصوص مختلفة ، فقد يُفضل استخدام اصطلاحات مختلفة لمعنى ملف x الأصل و ذ الأصل. للحصول على أفضل النتائج مع الإضاءة العالية وعلامات الإقحام ، يجب أن يكون جسم الشخصية متمركزًا تقريبًا في العرض المتقدم. على سبيل المثال ، سيكون للحرف المتماثل محامل الجانب الأيمن والأيسر متساوية.

يتم تحديد دقة مربع em من خلال عدد FUnits لكل em ، أو ببساطة وحدات لكل em. يحدد مربع em كما تم تقسيمه إلى FUnits نظام إحداثيات بوحدة واحدة تساوي FUnit. يجب أن تحتوي جميع النقاط المحددة في هذا النظام الإحداثي على مواقع متكاملة. كلما زاد عدد الوحدات لكل م ، زادت الدقة المتاحة في معالجة المواقع داخل مربع em.

الشكل 1-6 مربعان em ، 8 وحدات لكل م (يسار) ، 16 وحدة لكل م (يمين)

وحدات F هي وحدات نسبية لأنها تختلف في الحجم مع تغير حجم مربع em. يظل عدد الوحدات لكل em ثابتًا لخط معين بغض النظر عن حجم النقطة. عدد النقاط لكل em ، ومع ذلك ، سوف يختلف مع حجم نقطة الصورة الرمزية. يبلغ ارتفاع مربع em 9 نقاط بالضبط عندما يتم عرض حرف رسومي عند 9 نقاط ، بارتفاع 10 نقاط بالضبط عند عرض الخط عند 10 نقاط ، وهكذا. نظرًا لأن عدد الوحدات لكل نطاق لا يختلف باختلاف حجم النقطة التي يتم عرض الخط بها ، فإن الحجم المطلق لوحدة FUnit يختلف باختلاف حجم النقطة.

شكل 1-7 72 نقطة M و 127 نقطة M ومربعاتها em. Upem يساوي 8 في كلتا الحالتين.

نظرًا لأن FUnits مرتبطة بمربع em ، فإن الموقع المحدد على الصورة الرمزية سيكون له نفس موقع الإحداثيات في FUnits بغض النظر عن حجم النقطة التي يتم عرض الخط عنده. هذا مناسب لأنه يجعل من الممكن توجيه نقاط المخطط التفصيلي بمجرد النظر في المخطط التفصيلي الأصلي فقط وجعل التغييرات تنطبق على الصورة الرمزية بأي حجم ودقة يتم تقديمها في النهاية.


8.3 المحاكاة

سوف نوضح هذه التحليلات ، وأهمها مقايضة التباين التحيز ، من خلال المحاكاة. لنفترض أننا نرغب في تدريب نموذج لمعرفة وظيفة الانحدار الحقيقي (f (x) = x ^ 2 ).

بشكل أكثر تحديدًا ، نرغب في توقع ملاحظة ، (Y ) ، بالنظر إلى أن (X = x ) باستخدام ( hat(خ) ) أين

[ mathbb[Y mid X = x] = sigma ^ 2. ]

بدلاً من ذلك ، يمكننا كتابة هذا كـ

حيث ( mathbb[ epsilon] = 0 ) و ( mathbb[ epsilon] = سيجما ^ 2 ). في هذه الصيغة ، نسمي (f (X) ) الإشارة و ( إبسيلون ) الضوضاء.

لتنفيذ مثال محاكاة ملموسة ، نحتاج إلى تحديد عملية توليد البيانات بشكل كامل. نقوم بذلك باستخدام رمز R التالي.

لاحظ أيضًا أنه إذا كنت تفضل التفكير في هذا الموقف باستخدام صياغة (Y = f (X) + epsilon ) ، فإن الكود التالي يمثل نفس عملية توليد البيانات.

لتحديد عملية توليد البيانات بالكامل ، قمنا بعمل افتراضات نموذجية أكثر من مجرد ( mathbb[Y mid X = x] = x ^ 2 ) و ( mathbb[Y mid X = x] = sigma ^ 2 ). خاصه،

  • إن (x_i ) في ( mathcal) مأخوذة من توزيع موحد على ([0، 1] ).
  • إن (x_i ) و ( epsilon ) مستقلان.
  • إن (y_i ) في ( mathcal) مأخوذة من التوزيع الطبيعي المشروط.

باستخدام هذا الإعداد ، سننشئ مجموعات بيانات ، ( mathcal) ، مع حجم عينة (n = 100 ) وتناسب أربعة نماذج.

لفهم البيانات وهذه النماذج الأربعة ، نقوم بإنشاء مجموعة بيانات محاكاة واحدة ، وتناسب النماذج الأربعة.

لاحظ أننا كسالى من الناحية الفنية ونستخدم العديد من الحدود المتعامدة ، ولكن القيم المناسبة هي نفسها ، لذلك لا يحدث أي فرق في أغراضنا.

برسم هذه النماذج الأربعة المدربة ، نرى أن نموذج التوقع الصفري يعمل بشكل سيء للغاية. نموذج الدرجة الأولى معقول ، لكن يمكننا أن نرى أن نموذج الدرجة الثانية يناسب بشكل أفضل. نموذج الدرجة التاسعة يبدو جامحًا نوعًا ما.

تم إنشاء المخططات الثلاثة التالية باستخدام ثلاث مجموعات بيانات محاكاة إضافية. كان المتنبئ الصفري وكثير الحدود من الدرجة التاسعة مناسبين لكل منهما.

يجب أن توضح هذه المؤامرة الفرق بين التحيز والتباين في هذين النموذجين. من الواضح أن نموذج التوقع الصفري خاطئ ، أي متحيز ، ولكنه متماثل تقريبًا لكل مجموعة من مجموعات البيانات ، نظرًا لأنه يحتوي على تباين منخفض جدًا.

على الرغم من أن نموذج الدرجة التاسعة لا يبدو صحيحًا لأي من عمليات المحاكاة الثلاث هذه ، فسنرى أنه كذلك في المتوسط ​​، وبالتالي يتم إجراء تقدير غير متحيز. ومع ذلك ، توضح هذه المخططات بوضوح أن متعدد الحدود من الدرجة التاسعة متغير للغاية. ينتج عن كل مجموعة بيانات نموذج ملائم مختلف تمامًا. ليس الصحيح في المتوسط ​​هو الهدف الوحيد الذي نسعى إليه ، لأنه من الناحية العملية ، سيكون لدينا مجموعة بيانات واحدة فقط. لهذا السبب نود أيضًا أن تعرض نماذجنا تباينًا منخفضًا.

كان بإمكاننا أيضًا أن نلائم (ك ) - أقرب نماذج الجيران لمجموعات البيانات الثلاث هذه.

هنا نرى أنه عندما (k = 100 ) يكون لدينا نموذج متحيز بتباين منخفض جدًا. (إنه في الواقع نفس النموذج الخطي للتنبؤ 0.) عندما (k = 5 ) ، لدينا مرة أخرى نموذج متغير للغاية.

تعزز هاتان المجموعتان من المؤامرات حدسنا حول مقايضة التباين التحيز. النماذج المعقدة (متعددة الحدود من الدرجة التاسعة و (ك ) = 5) متغيرة للغاية ، وغالبًا ما تكون غير متحيزة. النماذج البسيطة (نموذج خطي متنبئ صفري و (k = 100 )) متحيزة للغاية ، ولكن لها تباين منخفض للغاية.

سنكمل الآن دراسة محاكاة لفهم العلاقة بين التحيز والتباين والخطأ التربيعي المتوسط ​​لتقديرات (f (x) ) التي قدمتها هذه النماذج الأربعة عند النقطة (x = 0.90 ). نستخدم المحاكاة لإكمال هذه المهمة ، حيث أن إجراء الحسابات التحليلية سيكون شاقًا وصعبًا إلى حد ما.

لاحظ أن هذه إحدى الطرق العديدة التي كان من الممكن أن ننجز بها هذه المهمة باستخدام R. على سبيل المثال ، كان بإمكاننا استخدام مجموعة من وظائف التكرار () و * التطبيق (). بدلاً من ذلك ، كان بإمكاننا استخدام نهج مدبب ، والذي من المحتمل أن يستخدم مزيجًا من dplyr و tidyr و purrr.

تم اختيار نهجنا ، الذي سيعتبر نهجًا أساسيًا R ، لتوضيح ما يتم القيام به قدر الإمكان. يكتسب نهج المد والجزر شعبية بسرعة في مجتمع R ، ولكنه قد يجعل من الصعب رؤية ما يحدث هنا ، ما لم تكن على دراية بهذا النهج بالفعل.

تجدر الإشارة أيضًا إلى أنه على الرغم من أنه قد يبدو أن المخرجات المخزنة في التنبؤات ستلبي تعريف البيانات المرتبة التي قدمها هادلي ويكهام نظرًا لأن كل صف يمثل محاكاة ، إلا أنه في الواقع يكون قصيرًا قليلاً. لكي تكون بياناتنا مرتبة ، يجب أن يخزن الصف رقم المحاكاة والنموذج والتنبؤ الناتج. لقد قمنا بالفعل بتجميع مستوى واحد فوق هذا. وحدة المراقبة الخاصة بنا عبارة عن محاكاة (مع أربعة تنبؤات) ، ولكن بالنسبة للبيانات المرتبة ، يجب أن تكون تنبؤًا واحدًا. قد تتم مراجعة هذا من قبل المؤلف لاحقًا عندما يكون هناك المزيد من الأمثلة على كيفية القيام بذلك من مجتمع R.

توضح المؤامرة أعلاه التنبؤات لكل من 250 محاكاة لكل نموذج من النماذج الأربعة ذات درجات متعددة الحدود المختلفة. الحقيقة ، (f (x = 0.90) = (0.9) ^ 2 = 0.81 ) ، يتم الحصول عليها من خلال الخط الأفقي الأسود الصلب.

هناك أمران واضحان على الفور:

  • مثل التعقيد يزيد, ينخفض ​​التحيز. (متوسط ​​توقعات النموذج أقرب إلى الحقيقة).
  • مثل التعقيد يزيد, يزيد التباين. (يزداد التباين حول متوسط ​​تنبؤات النموذج.)

الهدف من دراسة المحاكاة هذه هو إظهار أن ما يلي ينطبق على كل من النماذج الأربعة.

[ نص يسار (و (0.90) قبعة_k (0.90) right) = underbrace < left ( mathbb غادر [ قبعة_k (0.90) right] - f (0.90) right) ^ 2> _ < text^ 2 يسار ( قبعة_k (0.90) right)> + underbrace < mathbb يسار [ يسار ( قبعة_k (0.90) - mathbb غادر [ قبعة_k (0.90) right] right) ^ 2 right]> _ < text يسار ( قبعة_k (0.90) يمين)> ]

سنستخدم النتائج التجريبية لعمليات المحاكاة الخاصة بنا لتقدير هذه الكميات. (نعم ، نحن نستخدم التقدير لتبرير الحقائق حول التقدير.) لاحظ أننا استخدمنا بالفعل عددًا صغيرًا من عمليات المحاكاة. من الناحية العملية ، يجب أن نستخدم المزيد ، ولكن من أجل وقت الحساب ، أجرينا عمليات محاكاة كافية للحصول على النتائج المرجوة. (نظرًا لأننا نقوم بتقدير التقدير ، فكلما زاد حجم العينة ، كان ذلك أفضل).

لتقدير متوسط ​​الخطأ التربيعي لتوقعاتنا ، سنستخدم

نكتب أيضًا دالة R مصاحبة.

وبالمثل ، بالنسبة إلى انحياز تنبؤاتنا التي نستخدمها ،

ومرة أخرى ، نكتب دالة R مصاحبة.

أخيرًا ، بالنسبة لتباين توقعاتنا لدينا

في حين أن هناك بالفعل وظيفة R للتباين ، فإن ما يلي أكثر ملاءمة في هذه الحالة.

للحصول على هذه النتائج بسرعة لكل من النماذج الأربعة ، نستخدم وظيفة application ().

نلخص هذه النتائج في الجدول التالي.

الدرجة العلمية يعني خطأ تربيعيا مربع التحيز التباين
0 0.22643 0.22476 0.00167
1 0.00829 0.00508 0.00322
2 0.00387 0.00005 0.00381
9 0.01019 0.00002 0.01017

هناك عدد من الأشياء التي يجب ملاحظتها هنا:

  • نستخدم الانحياز التربيعي في هذا الجدول. نظرًا لأن التحيز يمكن أن يكون إيجابيًا أو سلبيًا ، فإن التحيز التربيعي يكون أكثر فائدة لمراقبة الاتجاه مع زيادة التعقيد.
  • اتجاه التحيز التربيعي الذي نراه هنا هو تناقص مع زيادة التعقيد ، وهو ما نتوقع رؤيته بشكل عام.
  • العكس هو الصحيح من التباين. كلما زاد تعقيد النموذج ، زاد التباين يزيد.
  • يتناقص متوسط ​​مربع الخطأ ، وهو دالة للانحياز والتباين ، ثم يزداد. هذا نتيجة لمقايضة التباين التحيز. يمكننا تقليل التحيز عن طريق زيادة التباين. أو يمكننا تقليل التباين عن طريق زيادة التحيز. من خلال تحقيق التوازن الصحيح ، يمكننا العثور على خطأ متوسط ​​مربع جيد!

يمكننا التحقق من هذه الاتجاهات باستخدام وظيفة diff () في R.

النماذج ذات الدرجات متعددة الحدود 2 و 9 كلاهما غير متحيزين بشكل أساسي. نرى بعض التحيز هنا نتيجة استخدام المحاكاة. إذا قمنا بزيادة عدد عمليات المحاكاة ، فسنرى أن كلا التحيزين ينخفضان. نظرًا لأن كلاهما غير متحيز ، فإن النموذج ذو الدرجة 2 يتفوق على النموذج بدرجة 9 نظرًا لتباينه الأصغر.

النماذج ذات الدرجة 0 و 1 منحازة لأنها تتخذ الشكل الخطأ لدالة الانحدار. بينما يقوم نموذج الدرجة 9 بهذا أيضًا ، إلا أنه يتضمن جميع درجات كثيرة الحدود الضرورية.

[ قبعة_9 (x) = hat < beta> _0 + hat < beta> _1 x + hat < beta> _2 x ^ 2 + ldots + hat < beta> _9 x ^ 9 ]

بعد ذلك ، بما أن تقدير المربعات الصغرى غير متحيز ،

بالنسبة إلى (د = 3 ، 4 ، النقاط 9 ) ، لدينا

[ mathbb غادر [ قبعة_9 (x) right] = beta_0 + beta_1 x + beta_2 x ^ 2 ]

الآن يمكننا أخيرًا التحقق من تحلل التباين التحيز.

لكن انتظر ، هذا يقول أنه ليس صحيحًا ، باستثناء نموذج الدرجة 9؟ اتضح أن هذه مجرد مسألة حسابية. إذا سمحنا ببعض التسامح الصغير جدًا مع الخطأ ، فإننا نرى أن تحلل التباين التحيز صحيح بالفعل بالنسبة للتنبؤات من هذه النماذج.

حتى الآن ، ركزنا جهودنا على النظر إلى متوسط ​​الخطأ التربيعي لتقدير (f (0.90) ) باستخدام ( hat(0.90) ). يمكننا أيضًا النظر في خطأ التنبؤ المتوقع باستخدام ( hat(X) ) عندما (X = 0.90 ) لتقدير (Y ).

[ نص يسار (Y ، قبعة_k (0.90) right) = mathbb_> يسار [ يسار (Y - hat_k (X) right) ^ 2 mid X = 0.90 right] ]

يمكننا تقدير هذه الكمية لكل من النماذج الأربعة باستخدام دراسة المحاكاة التي أجريناها بالفعل.

ماذا عن خطأ التنبؤ المتوقع غير المشروط. هذا هو ، لأي (X ) ، وليس فقط (0.90 ). على وجه التحديد ، خطأ التنبؤ المتوقع لتقدير (ص ) باستخدام ( قبعة(X) ). توفر دراسة المحاكاة (الجديدة) التالية تقديرًا لـ

[ نص يسار (Y ، قبعة_k (X) right) = mathbb_> يسار [ يسار (Y - hat_k (X) right) ^ 2 right] ]

بالنسبة للنموذج التربيعي ، هذا هو (ك = 2 ) كما حددنا (ك ).

لاحظ أنه في الممارسة العملية ، يجب أن نستخدم العديد من عمليات المحاكاة في هذه الدراسة.


8.4 دالات التوزيع التراكمي

البيانات العددية التي ليست فئوية لها أيضًا توزيعات. بشكل عام ، عندما لا تكون البيانات فئوية ، فإن الإبلاغ عن تكرار كل إدخال لا يعد ملخصًا فعالًا لأن معظم الإدخالات فريدة. في دراسة الحالة الخاصة بنا ، بينما أبلغ العديد من الطلاب عن ارتفاع 68 بوصة ، أبلغ طالب واحد فقط عن ارتفاع 68.503937007874 بوصة وطالب واحد فقط أبلغ عن ارتفاع 68.8976377952756 بوصة. نفترض أنهم تحولوا من 174 و 175 سم ، على التوالي.

تعلمنا كتب الإحصاء المدرسية أن الطريقة الأكثر فائدة لتحديد توزيع البيانات الرقمية هي تحديد وظيفة تُبلغ عن نسبة البيانات أدناه (أ ) لجميع القيم الممكنة لـ (أ ). تسمى هذه الوظيفة دالة التوزيع التراكمي (CDF). في الإحصاء ، يتم استخدام الترميز التالي:

فيما يلي مخطط (F ) لبيانات ارتفاع الذكور:

على غرار ما يفعله جدول التردد للبيانات الفئوية ، يحدد CDF توزيع البيانات الرقمية. من المؤامرة ، يمكننا أن نرى أن 16٪ من القيم أقل من 65 ، منذ (F (66) = ) 0.164 ، أو أن 84٪ من القيم أقل من 72 ، منذ (F (72) = ) 0.841 وهكذا. في الواقع ، يمكننا الإبلاغ عن نسبة القيم بين أي ارتفاعين ، على سبيل المثال (أ ) و (ب ) ، عن طريق حساب (F (b) - F (a) ). هذا يعني أنه إذا أرسلنا هذه المؤامرة أعلاه إلى ET ، فسيكون لديه كل المعلومات اللازمة لإعادة بناء القائمة بأكملها. عند إعادة صياغة التعبير "الصورة تساوي ألف كلمة" ، في هذه الحالة ، تكون الصورة مفيدة مثل 812 رقمًا.

ملاحظة أخيرة: لأن CDFs يمكن تعريفها رياضيًا للكلمة تجريبي يضاف للتمييز عند استخدام البيانات. لذلك نستخدم مصطلح CDF التجريبي (eCDF).


Hogg-McKean-Craig ، الصفحة 158: 3.3.17 ، 3.3.26ab
Hogg-McKean-Craig ، الصفحة 170: 3.4.21
Hogg-McKean-Craig ، p201: 4.1.6 (التباين فقط) ، 4.1.12 ، 4.1.22

والمشكلات الإضافية التالية:

أ. يترك تي يكون متغيرًا عشوائيًا بتوزيع t له درجة حرية واحدة. باستخدام ملف pdf مباشرة (بدون استخدام جهاز كمبيوتر) ، ابحث عن ص( 0 2 ) ك ) من ض 2 .
ثانيا. استخدم وظائف توليد اللحظة والجزء (1) لإثبات النظرية 3.4.1.


2.9 المربعات الصغرى العادية

طريقة المربعات الصغرى هي بديل عن الاستيفاء لملاءمة دالة لمجموعة من النقاط. على عكس الاستيفاء ، فإنه لا يتطلب الوظيفة الملائمة لتقاطع كل نقطة. من المحتمل أن تكون طريقة المربعات الصغرى معروفة لاستخدامها في الانحدار الإحصائي ، ولكنها تُستخدم في العديد من السياقات غير المرتبطة بالإحصاءات. الطريقة تشمل العديد من التقنيات. نقدم نهجًا عامًا إلى حد ما يسمى المربعات الصغرى العادية.

2.9.1 مثال

افترض أن الباحثين جمعوا 10 نقاط بيانات (x [ك] , ذ [ك]) المتعلقة ببعض الظواهر. نقوم بإقحام كثير الحدود من الدرجة التاسعة بناءً على البيانات. انظر المعروضين 2.10 و 2.11.

لأن كثير الحدود يضطر لاعتراض كل نقطة ، فإنه ينسج لأعلى ولأسفل. في بعض التطبيقات ، قد تعكس البيانات أخطاء عشوائية أو مصادر "ضوضاء" أخرى. يؤدي إجبار منحنى على المرور عبر كل نقطة إلى أن يعكس شكله مثل هذه الضوضاء بقدر أي عملية أساسية تولد البيانات. نقول أن الدالة المقحمة هي زائدة للبيانات. كبديل ، قد نلائم منحنى البيانات دون الحاجة إلى اعتراض كل نقطة. تم توضيح ملاءمة متعددة الحدود من الدرجة الثانية بهذه الطريقة لبيانات الشكل التوضيحي 2.10 في الشكل التوضيحي 2.12.

تم بناء كثير حدود الشكل 2.12 باستخدام طريقة المربعات الصغرى العادية. تم تحديد شكل كثير الحدود كـ

والثوابت β1، β2و β3 تم تحديدها بطريقة تقلل من مجموع المربعات

2.9.2 منهجية المربعات الصغرى العادية

انصح ل نقاط (x [ك] , ذ [ك] ) أين x [ك] ن و ذ [ك] . نرغب في احتواء وظيفة F : نمن الشكل

إلى البيانات بطريقة تقلل من مجموع المربعات

كما هو الحال مع منهجية الاستيفاء للقسم 2.4 ، الوظائف Fي : />ن → /> يمكن أن يتخذ أي شكل. على عكس منهجية الاستيفاء ، فإننا نطلب ذلك الرقم م من الوظائف أقل من الرقم ل من النقاط.

دعونا نعبر عن مشكلتنا مع المصفوفات. حدد

هذا غير معروف. هذا ما نريد حله. حدد F مثل ل × م مصفوفة تشتمل على قيم كل دالة Fي تقييمها في كل نقطة x [ك] :

كلا المصفوفة F وناقلات ذ ثوابت. إنهم معروفون. نعبر عن صيغة مجموع المربعات [2.97] على النحو التالي

هذا هو كثير الحدود من الدرجة الثانية في β من النموذج [2.91] مع ج = FF. يمكن إثبات ذلك ، لأي مصفوفة ح التي لديها أعمدة مستقلة ، المنتج حح هو ايجابي واضح. هذا مشابه لحقيقة أن مربع أي رقم حقيقي غير صفري هو رقم موجب. تبعا لذلك ، طالما F تحتوي على أعمدة مستقلة خطيًا ، وصيغة مجموع المربعات [2.97] لها حد أدنى فريد. بحلول [2.92] ، يحدث هذا لـ

2.9.3 مثال (تابع)

بالاستمرار في مثالنا على ملاءمة كثير الحدود التربيعي لبيانات الشكل التوضيحي 2.10 ، فإننا نسعى إلى كثير الحدود

ومتعدد الحدود التربيعي هو

تمارين

استخدم المربعات الصغرى العادية لتناسب كثير الحدود الخطي

إلى النقاط الخمس المشار إليها في الشكل التوضيحي 2.13.

استخدم المربعات الصغرى العادية لتناسب دالة في النموذج

إلى النقاط الخمس المشار إليها في الشكل التوضيحي 2.14.

اثبات ذلك اذا كان الرقم م من الوظائف Fي يساوي الرقم ل من النقاط (x [ك] , ذ [ك]) ثم يتم تقليل حل المربعات الصغرى [2.103] إلى محلول الاستيفاء [2.49]. في هذا الصدد ، المربعات الصغرى العادية هي تعميم للاستيفاء العادي.
حل


8.4: مثال ملائم لمنحنى الممارسة - الرياضيات

تركيب المنحنى وطريقة المربعات الصغرى

"لأن ظاهرتين تظهران في نفس الوقت في أحسن الأحوال ،
التماسك لا يستلزم الضوء منهم لهذا السبب البسيط ".

غالبًا ما نرغب في معرفة العلاقة بين الظواهر المختلفة مثل السرعة العالية في السيارات والحوادث المميتة أو بين المطر الحمضي وموت الأخشاب. ربما ليس لدينا معرفة مؤكدة عن الأسباب الحقيقية ، ولكن بعد ذلك نتوقع أن يكون نوعًا من التفسير هو التفسير الصحيح. ماذا نفعل؟ هل نحن قادرون على تقليل المسافة بين المعرفة والإيمان أو الخيال. نظرًا لأن الأشياء تتطور أو تتفكك بشكل أسرع وأسرع ، تزداد الحاجة إلى معرفة الفرق بشكل متزايد.

سمعت على شاشة التلفزيون تقارير عن عدة تحقيقات مزعومة تظهر هذا أو ذاك. كيف يجرون مثل هذه التحقيقات ، وهل هم دائمًا يستحقون الثقة؟ نعتزم أن نقدم لك بعض النصائح الصادقة وأسس للحكم عليها.

إذا قبلنا تحويل المشاكل الحقيقية أو العلاقات إلى مشاكل متضمنة في نموذج رياضي ، فإننا قادرون على التعامل مع السؤال / المشاكل. لكن علينا أن نكون حذرين للغاية في فهم الاختلاف بين الواقع والنماذج الرياضية.

إذا صدقنا فقط ما يقوله لنا المراسلون ، لأننا لا نعرف كيف نتحكم في ما إذا كانوا يكذبون من أجل جعلنا نتبع الحكام للخير (أو السيئ) ، فنحن لسنا أفرادًا مستقلين نعرفهم ، ولكن في نهاية المطاف هذا عندما يستمر ، فنحن مجرد قطيع من الغنم يسير بالطريقة التي يريدها الحكام.

العلاقة بين المتغيرات
في كثير من الأحيان من الناحية العملية ، توجد علاقة بين متغيرين (أو أكثر). على سبيل المثال: تعتمد أوزان الذكور البالغين إلى حد ما على ارتفاعاتهم وتعتمد ظروف مناطق الدوائر على نصف قطرها وضغط كتلة معينة من الغاز يعتمد على درجة حرارته وحجمه.

يمكن إثبات النوعين المذكورين من العلاقة بشكل رياضي / فيزيائي بحت. ولكن ماذا عن نقص طبقة الأوزون وحدوث سرطان الجلد. أو ميل المرأة لإجراء عمليات إجهاض مرتبطة بمكان إقامتها ، في المدن والبلدات أو في الدولة.

غالبًا ما يكون من المرغوب فيه التعبير عن العلاقات في شكل رياضي عن طريق تحديد معادلة تربط المتغيرات.

منحنى المناسب
للمساعدة في تحديد معادلة تربط المتغيرات ، فإن الخطوة الأولى هي جمع البيانات التي تظهر القيم المقابلة للمتغيرات قيد الدراسة.

على سبيل المثال ، افترض أن X و Y تدلان على التوالي على طول ووزن الذكور البالغين. ثم تكشف عينة N من الأفراد عن الارتفاعات X 1 ، X 2 ، ... X N والوزن المقابل Y 1 ، Y 2 ، ..Y N

الخطوة التالية هي رسم النقاط (X 1، Y 1)، (X 2، Y 2) .. (X N، Y N) على نظام إحداثيات مستطيل. تسمى مجموعة النقاط الناتجة أحيانًا بالرسم التخطيطي المبعثر.

من الرسم التخطيطي المبعثر ، من الممكن غالبًا تصور منحنى سلس يقترب من البيانات. يسمى هذا المنحنى بالمنحنى التقريبي. في الرسم البياني التالي ، على سبيل المثال ، يبدو أن البيانات متقاربة جيدًا بخط مستقيم وربما توجد علاقة خطية بين المتغيرين. في الرسم البياني إلى اليمين ، يبدو أن هناك علاقة أخرى بين المتغيرين ، وربما بعض المنحنى.

تسمى المشكلة العامة لإيجاد معادلات المنحنيات التقريبية التي تناسب مجموعات معينة من البيانات بتركيب المنحنى.

معادلات تقريب المنحنيات
For purposes of reference we have listed below several common type of approximating curves and equations. All letters other than X and Y represent constants. The variables X and Y are often referred to as independent and dependent variables respectively, although these roles can be interchanging.

Y = a 0 + a 1 X + a 2 X^2 + a 3 X^3

Y = a 0 + a 1 X + a 2 X^2 + a 3 X^3 + a 4 X^4

Y = a 0 + a 1 X + a 2 X^2 + + a n X^n

Y= 1/( a 0 + a 1 X) or 1/Y = a 0 + a 1 X

Y = ab ^X or logY = log a + Xlog b = a 0 + a 1 X

Y = ab ^X or log Y = log a + b logX

Modified exponential curve

Y = pq ^ b ^X or logY = log p + b ^Xlog q = ab ^X + g

Y = 1/( ab ^X + g ) or 1/Y = ab ^X + g

Y = a 0 + a 1 (logX) + a 2 (logX)^2

The right sides of the above equations (1-5) are called polynomials of the first, second, third, fourth and n th degree respectively. The functions defined by the first four of these equations are sometimes called linear, squared, cubic and quartic functions respectively.

To decide which curve should be used, it is helpful to obtain scatter diagrams of transformed variables. For example, if a scatter diagram of Log Y vs X shows a linear relationship the equation has the form (7), while if Log Y vs Log X shows a linear relationship the equation has the form (8). Logarithmic or double-logarithmic paper to show the functions when one or both scales are calibrated logarithmically.

Freehand Method of Curve Fitting
Individual judgment can often be used to draw an approximating curve to fit a set of data. This is called a freehand method of curve fitting. If the type of equation of this curve is known, it is possible to obtain the constants in the equation by choosing as many points on the curve as there are constants in the equation. For example, if the curve is a straight line, two points a necessary, if it is a parabola, three points are necessary. This method has the disadvantage that different observers will obtain different curves and equation. The method is unequivocable .

The straight line
The simplest type of approximating curve is a straight line, whose equation can be written:

Given the two points (X 1 ,Y 1 ) and (X 2 ,Y 2 ) on the line, the constants a 0 and a 1 can be determined. The resulting equation can be writtten:

Y - Y 1 = (X X 1 )*(Y 2 -Y 1 )/(X 2 X 1 ) or Y - Y 1 = m (X - X 1 ), where m =(Y 2 Y 1 )/(X 2 X 1 ) is called the slope of the line and represents the change in Y divided by the corresponding change in X.

When the equation is written in the form (15) the constant a1 is the slope m . The constant a 0 , which is the value of Y when X = 0, is called the U intercept.

The Method of Least Squares

To avoid invidual judgment in constructing lines, parabolas or other approximating curves to fit sets of data, it is necessary to agree on a definition of a "best fitting line", "best fitting parabola", etc.

To motivate a possible definition, consider the next figure in which the data points are given by (X 1 ,Y 1 ), (X 2 , X 2 ) (X n ,Y n ). For a given value of X, say X 1 , there will be a difference between the value Y 1 and the corresponding value determined from the curve. As indicated in the figure we denote this difference by D 1 , D 2 , D 3 , D 4 , D 5 D n , which is sometimes referred to as a derivation, error or residual and may be positive, negative, or zero. Similarly, corresponding to the values X 1 , X n we obtain D 1 D n.

A measure of the "goodness of fit" of the curve to the given data is provided by the quantity D 1 ^2 + D 2 ^2 + D 3 ^2 + .D n ^2. Somebody might propose D 1 + D 2 +D 3 + .D n to calculate the total divergence.

But it does not work as it sums to zero, if the curve has drawn accurately, half of the Ds are as positive, as the rest are negative all together.

Best fitting curve: S D^2 is a minimum, where S sums all the D^2 from 1 to n. A curve having this property is said to fit the data in the least square sense and it is called the Least Square Curve.

Thus a line having this property is called the least square line, a parabola with this property is called a least square parabola, etc.

It is customary to employ the above definition when X is a independent variable and Y is the dependent variable. If X is the dependent variable the definition is modified by considering the horizontal instead of the vertical deviation, which amounts to an interchange of the X and Y axes. These two definitions in general lead to different least square curves. Unless otherwise specified we shall consider Y as the dependent and X as the independent variable.

It is possible to define another least square curve by considering perpendicular distances from each of the data points to the curve instead of either vertical or horizontal distances. However, this is not often used.

The Least Square Line
The least square line approximating the set of points (X 1 ,Y 1 ), (X 2 ,Y 2 ) (X n ,Y n ) has an equation:

where the constants a 0 and a 1 are determined by solving simultaneously the equations:

which are called the normal equations for the least square line (18)

a 1 = [N S XY ( S X)( S Y)]/[N S X^2 ( S X)^2] (20)

The normal equation (19) are easily remembered by observing that the first equation can be obtained formally by summing on both sides of (18), i.e. S Y = S ( a 0 + a 1 X) = a 0 N + a 1 S X, while the second equation is obtained by first multiplying both sides of (18) by X and then summing, S XY = S X( a 0 + a 1 X) = a 0 S X + a 1 S X^2 . Note that this is not a derivation of the normal equation but simply a mean for remembering them. For a derivation using the calculus. The sum of squared derivations is minimized by derivating this sum S and equalizing it to zero (that is a simple mathematical rule not to be proved here).

S = ( a 0 + a 1 X 1 - Y 1 )^2 + .+( a 0 + a 1 X n +Y n )^2

The labor involved in finding a least square line can sometimes be shortened by transforming the data so that x = X - X g and y = Y - Y g, where the notation g means average. The equation of the least square line can then be written :

y = ( S xy/ S x^2)x or x = ( S xy/ S y^2)y (21)

This is easily proved but not included here.

If particular X is such that S X = 0, i.e. X g =0, this becomes:

From these equations it is at once evident that the least square line passes through the point (X g ,Y g ), called the centroid or the center of gravity of data.

If the variable X is taken as dependent instead of independent variable, we write (18) X = b 0 + b 1 Y. Then the above results hold if X and Y are interchanged and a 0 and a 1 are replaced by b 0 and b 1 respectively. The resulting least square line, however, is in general not the same as that obtained above.

Non-linear Relationships
Non-linear relationships can sometimes be reduced to linear relationships by appropriate transformation of variables. The logarithm-function can sometimes be used. But it is often the problem to find out if the original data fit a known mathematical function

The least square Parabola
The least square parabola approximating the set of points (X 1 ,Y 1 ) (X n ,Y n ) has the equation:

where the constants a 0 , a 1 and a 2 are determined by solving simultaneously the equations:

S Y = a 0 N + a 1 S X + a 2 S X^2

S XY = a 0 S X + a 1 S X^2 + a 2 S X^3

S X^2Y = a 0 S X^2 + a 1 S X^3 + a 2 S X^4 (24)

called the normal equation for the least square parabola (23)

A least square cubic or quartic curve can easily be determined by extending the multiplying technic mentioned in the section following (20).

Regression
Often, on the basis of sample data, we wish to estimate the value of a variable Y corresponding to a given value of a variable X. This can be accomplished by estimating the value of Y from a least square curve which fits the sampled data. The resulting curve is called a regression curve of Y on X, since Y is estimated from X.

If we desired to estimate the value of X from a given value of Y we would use a regression curve of X on Y, which amounts to interchanging the variables in the scatter diagram so that X is the dependent variable and Y is the independent variable. This is equivalent to replacing vertical deviations in the definition of least square curve by horizontal deviations. The last is based on simple mathematic not included here. More about regression and correlation in another link.

Applications to Time Series
If the independent variable X is time, the data shows the values of Y at various times. Data arranged according to time are called time series. The regression line or curve of Y on X in this case is often called a trend line or trend curve and is often used for purposes of estimation, prediction or forecasting.

Problems Involving More Than Two Variables
Problems involving more than two variables can be treated in a manner analogious to that for two variables. For example, there may be a relationship between the three variables X, Y and Z which can be described by the equation:

which is called a linear equation in the variables X, Y and Z.

In the three dimensional rectangular coordinate system this equation represents a plan and the actual sample points (X 1 ,Y 1 ,Z 1 ), ..(X n ,Y n ,Z n ,) might "scatter" not too far from this plane which we can call an approximating plane.

By extension of the method of least squares, we can speak of a least square plane approximating data. If we are estimating Z from given values of X and Y, this would be called a regression plan of Z on X and Y. The normal equations corresponding to the least square plane (25) are given by:

S XZ = a 0 S X + a 1 S X^2 + a 2 S XY

S YZ = a 0 S Y + a 1 S XY + a 2 S Y^2 (26)

and can be remembered as obtained from (25) by multiplying by 1, X and Y succesively and then summing.

More complicated equations than (25) can also be considered. These represent regression surfaces. If the number of variables exceeds three, geometric intuition is lost since we then require four, five dimentional spaces.

Problems involving estimation of a variable from two or more variables are called problems of multi-regression and will be dealt with in more detail under another link.


This purpose of this appendix is to provide details of the scientific basis of the model. Specifically, we discuss the rationale for the functions NEP(ص(تي,جa(t)),ص(تي),جt(t)) and د(جa,جم) discussed in the main text. These functions are the core drivers of the model dynamics. We begin by developing the relationships between temperature, photosynthesis, and respiration, then link these relationships to fluxes between atmospheric and terrestrial carbon stocks (NEP(ص(تي,جa(t)),ص(تي),جt(t))). We then describe the model for carbon fluxes between atmospheric and marine stocks (د(جa,جم)). Finally, we illustrate the impact of different choices of some key parameters on the dynamics generated by the model.

A.1. Temperature relationships

The key relationships considered are between air temperature, photosynthesis and respiration (at the ecosystem level) and between air temperature (without considering complicating geophysical factors) and carbon concentration in the atmosphere. Photosynthesis and respiration are affected by many factors but at the most basic level, studies suggest that both respiration and photosynthesis rates will increase with temperature when temperatures are low and then begin to decrease beyond some physiologically set threshold. These relationships are formalized as follows.

Photosynthesis. The basic hump-shaped relationship between photosynthesis (net carbon assimilation rate in μmol m −2 s −1 ) and temperature has been demonstrated for a number of plant species [27–29]. Here we use a simple function,

to capture this relationship. The parameters a,ب، و ج, are chosen to fit the general features of temperature–photosynthesis relationships from the literature. Thus, we let ص(تي) = F(تيaص,بص,جص) where ص(تي) is photosynthesis as a function of temperature, تي. Note that this relationship can be specified in terms of leaf temperature (e.g. [28]) or air temperature in a controlled volume during photosynthesis (e.g. [29]). For our purposes, this must be adjusted to an annual mean temperature for consistency with temperature–respiration relationships as discussed below. An example of ص(تي) is shown by the solid curve in figure A.1(A).

Figure A.1. (A) Photosynthesis and respiration as functions of global annual mean temperature. Parameter values: a1 = 220, ب1 = 3, ج1 = 7, a2 = 110, ب2 = 4, ج2 = 5. Temperature scale is arbitrary and was chosen to correspond to data from the literature. The functions plotted are F((x + 5)/30. ). (B) Photosynthesis and respiration as a function of atmospheric carbon. The fertilization effect parameters are جF = 1.5, and بF = 0.3. Figure A.2 illustrates the effect of different choices of the fertilization parameters on the model.

Respiration. Mahecha et al [30] suggest that at the ecosystem level, temperature sensitivity of respiration rate is constant, i.e. س10 ≈ 1.4, globally. Thus respiration increases exponentially with increasing temperature. However, over shorter time scales (minutes to hours), س10 has been shown to decrease linearly with temperature [31–33]. In this case, the temperature–respiration relationship would have the shape of the dashed curve in figure A.1(A) for تي < 18. Cf [34]. Although the basic chemical reaction that drives respiration (e.g. [14]) may allow for respiration rates to increase indefinitely, at some point high temperatures may affect the physical system that supports the reaction thereby reducing the efficiency with which the reaction can be carried out. This suggests that the temperature–respiration would bend over at high temperatures as in the dashed curve in figure A.1(A) for تي > 18. Recent work by Yuan et al [35] provides evidence that this is indeed the case. Again, the function F(تيa,ب,ج) defined by (A.1) is sufficiently general to capture this relationship, and we let ص(تي) = F(تيaص,بص,جص). Where ص(تي) is the respiration rate per unit of plant biomass. The dashed curve in figure A.1(A) shows an example in which aص,بص,جص, and the temperature scaling have been chosen to match the basic relations reported in [35]. The temperature axes should be interpreted as mean annual nocturnal air temperature. It is important to note that the details of these functional forms is not critical to the qualitative dynamics for the system. The important feature is that for some temperature range ص(تي) > ص(تي). Otherwise, terrestrial ecosystems could never accumulate carbon (biomass), i.e. NEP would always be negative (see colored regions in graph A in figure 1 in the main document for a graphic depiction).

A.2. Atmospheric carbon and NEP

كو2 affects NEP in two ways: indirectly through temperature (both photosynthesis and respiration) and directly through a fertilization affect. Given the uncertainty associated with changes in radiative forcing associated with CO2 concentrations and changes in global and annual mean temperature [20], we make only the most basic assumption: annual mean temperature (in the absence of feedbacks between different carbon stocks) increases linearly with CO2. If we define جa(t) as the atmospheric carbon concentration at time t, then we have

where, again, aتي و بتي are arbitrary parameters. Substitution of (A.2) into the expressions for ص(تي) and ص(تي) leads to a family of mappings between جa, photosynthesis, and respiration, i.e.

that have the forms shown in figure A.1(B).

Regarding the fertilization effect of atmospheric carbon, the simplest assumption we can make as that increasing carbon increases photosynthetic activity, recognizing the fact that other limiting factors will eventually begin to reduce the effects of additional CO2 in the atmosphere. This implies that ∂ص/∂جa > 0 and . A very simple function that exhibits such behavior is

where 0 < بF < 1 and جF > 0 are parameters. This functional form has the basic shape associated with Michaelis–Menten kinetics assumed in Lenton [14]. Assuming a multiplicative relation between temperature and carbon fertilization effects (again, as in [14]) and writing

(suppressing parameters and time dependence for clarity) we can rewrite (A.3) and (A.4) as

A.3. Terrestrial carbon dynamics

Terrestrial carbon dynamics involve multiple stocks in plants and animals aboveground and in soil organisms below ground. Further, carbon dynamics are intimately related to other basic nutrients such as water, phosphorous, nitrogen, etc. Here, we provide additional detail to complement the discussion in the main text. Specifically, we consider the interaction between terrestrial and atmospheric carbon stocks alone to illustrate the importance of other nutrients and density dependence for a reasonable model.

Equations (A.7) and (A.8) define carbon flow rates per unit of plant biomass. Because we are working at the global scale and on time scales on the order of a century, we neglect the finer temporal and spatial scale complexities of the terrestrial carbon cycle associated with the movement of carbon between the aboveground and belowground stocks. Assuming that on the relatively large temporal and spatial scales of interest here aboveground plant biomass is roughly proportional to the total terrestrial carbon stock, by definition we have

as described in the main text. Obviously our model is a gross simplification—both photosynthesis and respiration would depend on ecosystem structure—i.e. the way جt is partitioned across species. On the other hand, our model is operating at the global level, so we assume that صز is a global average conversion factor across all ecosystems. Assuming no human impacts for the moment, the simplest model for the change in terrestrial carbon stores is then

This simple model, however, is too limited to produce realistic results. To see why, consider for the moment a system with only terrestrial and atmospheric stocks. Conservation of mass implies that جa + جt = ج أين جt و ج are the terrestrial and total carbons stocks, respectively. Substituting ججt for جa in (A.10) yields the following first-order, autonomous, non-linear ordinary differential equation

Figure A.2 shows the right-hand sides of (A.11) with total carbon normalized to 1. The different colors correspond to different parameter values as discussed below. The main point is that for the values of جt where this curve is below zero, , and the terrestrial carbon stock decreases, and vice versa (shown by arrows for red curve, figure A.2(B)). Thus the system tends to move away from the roots shown in squares—i.e. those equilibria are unstable. For initial conditions to the right of the unstable equilibria, the system will converge to the equilibria shown with circles—a state with high terrestrial carbon concentrations, in a cold climate, with a low carbon atmosphere, and very low rates of photosynthesis and respiration (e.g. perpetual tundra with lots of peat bogs and hydrocarbon reserves). For those to the left, the system converges to a state with no terrestrial organic carbon and an extremely hot climate (e.g. a global desert). The colors correspond to different values for بF (A) and جF (B) which characterize the fertilization effect. بF is a measure of the sensitivity of plants to changing atmospheric carbon concentration. Small values of بF imply that plants respond quickly to increasing carbon concentrations but saturate rapidly—i.e. become insensitive to carbon (blue curve, figure A.2(A)). For large values of بF, plants respond more slowly, but continue to respond across a larger range of carbon concentrations (red curve, top, figure A.2(A)). Figure A.2(B) illustrates the effect of fertilization. The curves range across the same values of بF (color coordinated) but جF is 50% larger in the bottom plots. The benefits of atmospheric carbon through fertilization allow for a broader terrestrial biomass survival range by shifting the unstable equilibrium to the left. The point here is that for a wide range of parameters the basic topology of the model is unchanged.

Figure A.2. Examples of right-hand sides of (A.11) for varying values of بF (A) and جF (B).

This dichotomy of either frozen tundra or burning desert is obviously unrealistic. NEP is influenced by many other factors than atmospheric carbon alone. Most important among these is competition for other scarce resources such as water, space, and soil nutrients. Describing such processes in an ecologically satisfying way increases model complexity extremely rapidly—and is well beyond the scope and objective of this letter. The most basic elements of the population growth process in ecology are (1) growth rates are limited by physiology when resources are abundant and (2) growth rates eventually become limited by competition as the population grows and resources become scarce. The most basic, widely accepted model in ecology that captures these two processes assumes growth rate decreases linearly as population density increases (i.e. the logistic model with density-dependent growth) as described in the main text. Here, we illustrate the importance of density dependence on the model by analyzing the two-dimensional case given by

Note, as mentioned in the main text, we can easily eliminate the parameter αag by choosing units. We can use units of aboveground biomass or total terrestrial carbon stock to measure the intrinsic growth rate and carrying capacity (because one is proportional to the other just as are pounds and kilograms). Thus, we can replace صtcαag و كag مع صtc و ك, respectively while making a note that we are using, for example, kilograms.

Examples of generated by (A.12) are shown in figure A.3(A). A comparison of figures A.3 and A.2 makes the effect and importance of density dependence clear: it introduces a new stable equilibrium at جa = ك. Without biological processes of density-dependent competition for resources other than carbon (or something like this process), the model would not exhibit an intermediate, present-day-Earth-like state between the extremes described above. The resulting Earth System dynamics are illustrated with arrows on figure A.3(A). Now there are four equilibria, two stable and two unstable. With this formulation, we can describe the idea of a planetary boundary in terms of land use. This simple model does not capture the complexity of land use, of course, but may (or slightly more complex models like it) correctly describe the issue of moving boundaries, and an SOS defined by feedbacks. The boundary and corresponding SOS shown correspond to the blue curve (strongest fertilization effect). The system can tolerate reductions in terrestrial carbon (and corresponding increases in atmospheric carbon) to roughly 0.41 (corresponding to 0.59 in atmosphere). Given that the equilibrium is 0.7, we can compute the size of the basin of attraction, or specified resilience as 0.29. Now are now in a position ask how human activities affect the boundary and the resilience of the system.

Figure A.3. Examples of right-hand sides of (A.12) for varying values of بF (A). Examples of right-hand sides of (A.13) for varying values of α (B).

Finally, we introduce human activity through a terrestrial carbon offtake term, ح(t), i.e. clearing, burning, or farming techniques that reduce the carbon sequestration capacity of terrestrial systems. We simply assume that humans release (or reduce uptake by) a proportion of the terrestrial carbon stock in each time period and let ح(t) = αجt(t) where αجt is the proportional rate. To illustrate the impact of ح(t) we can modify the model in (A.12) to read

Figure A.3(B) shows the effect of human carbon offtake. As α increases, the SOS shrinks and eventually vanishes. We can compute when this occurs (peak of curve falls below horizontal—e.g. red curve, figure A.3) using bifurcation techniques. If α exceeds 26% of terrestrial carbon stocks, the system enters the 'hot desert' (HD) basin.

A.4. Marine–atmospheric carbon dynamics

As mentioned in the main text, our model is based on the fact that carbon will diffuse across the atmosphere–ocean interface whenever concentrations deviate from equilibrium. Equilibrium concentrations are determined by Henry's law

أين ص(جa) is the partial pressure of CO2 in the atmosphere as a function of جa,جد(جم) is the concentration of dissolved CO2 in the ocean as a function of جم، و كH,pc is the appropriate constant of proportionality. إذا ص(جa) > كH,pcجد(جم), carbon will tend to diffuse from the atmosphere to the ocean and vice versa. As discussed in the main text, we use a linear model to relate the rate of diffusion to the size of the deviation from equilibrium—the simplest model possible that captures the essence of this dynamic.

نحن نحسب ص(جa) by assuming that the atmosphere behaves as an ideal gas. هكذا، ص(جa) = xصتي أين x is the mole fraction of carbon dioxide in the atmosphere and صتي is the total pressure. Assuming صتي = 1 atmosphere, we have ص(جa) = x. By definition

أين نكو2 is the number of moles of CO2 in the atmosphere and نoth is the total number of moles of other gases in the atmosphere. لأن نكو2 نoth, we can approximate (A.15) as

Stoichiometry dictates that نكو2 = نج which allows us to write

أين جa is the mass of carbon in the atmosphere measured in gigatons (the 10 15 term converts gigatons to grams) and MWج is the molecular weight of carbon. Given that the mass of the atmosphere is approximately 5.15 × 10 21 g we have

where MWoth is the weighted average molecular weight of the atmospheric gas mixture (≈29 g mol −1 ). هكذا،

These calculations show that ص(جa) can be approximated reasonably well, as claimed in the main text, by

where β1 ≈ 5 × 10 −7 . This approximation is consistent with the data—i.e. there are 760 Gt of carbon in the atmosphere, so the mole fraction (and, by assumption, the volume fraction) of CO2 is 760 × 5 × 10 −7 = 380 × 10 −6 = 380 ppm.

The relationship between dissolved CO2 and total carbon stock in the upper ocean is significantly more complex than that between total atmospheric carbon and partial pressure of CO2. To capture the relationship faithfully would require a model with several carbon pools by which carbon is tracked as it moves from a dissolved inorganic state, taken up by phytoplankton and moved into the food chain, respired back to the water column, or moved to the deep ocean as falling dead material. We can make two assumptions to simplify this story. (1) The population dynamics of phytoplankton (and thus the movement of carbon from dissolved CO2 to organisms) occurs on weekly time scales. On time scales of decades and longer of interest here, this process can be viewed as instantaneous. (2) We are interested in the capacity of the ocean to 'pump' carbon out of the atmosphere, and more specifically the معدل at which it can do so. Thus, the total amount of carbon in the marine stock (e.g. both upper and deep ocean) is less important than the concentration in the upper ocean (25–200 m) where the key mechanism of mixing and uptake by phytoplankton occurs (which controls the pumping rate). Finally the movement of carbon into the deep ocean is slow compared to our time scale of interest.

Based on assumption 2 we set the net flux from the upper ocean to the deep ocean to zero. Based on assumption 1, we represent the partitioning of carbon between the inorganic and organic states as a simple proportion. This allows us to write:

where αدي ≤ 1 is the fraction of the total carbon in the upper ocean that is dissolved CO2، و الخامس is the volume of the upper ocean. Given that the area of the ocean is roughly 361 × 10 12 square meters, we have

أين د is the average depth of the upper ocean in meters. If we assume د is order 100, then

Given these values of β1 and β2, we can simplify one step further by factoring β1 out, i.e.

This leads to our expression for د(جa,جم) in the main text. We vary aم in the analysis so the value of β1 is irrelevant in the expression for aم. However, it is worth commenting on the value of β. Given our calculations for β1 and β2,

بشرط كH,pc is order 10, and alpha is order 10 −1 (or smaller), then β is order 1. In order to keep the model analysis a clear as possible, we simply assume that β = 1.


شاهد الفيديو: السر.. لفهم مادة الرياضيات بكل سهولة #الرياضيات (ديسمبر 2021).