مقالات

8.2.5: استخدام المدرج التكراري للإجابة على الأسئلة الإحصائية


درس

دعونا نرسم الرسوم البيانية ونستخدمها للإجابة على الأسئلة.

تمرين ( PageIndex {1} ): أيهما لا ينتمي: الأسئلة

فيما يلي أربعة أسئلة حول سكان ألاسكا. أي سؤال لا ينتمي؟ كن مستعدًا لشرح أسبابك.

  1. بشكل عام ، في أي عمر يتقاعد سكان ألاسكا؟
  2. في أي عمر يستطيع ألاسكا التصويت؟
  3. ما هو فارق السن بين أصغر وأكبر سكان ألاسكا الذين يعملون بدوام كامل؟
  4. ما هي الفئة العمرية التي تمثل أكبر جزء من السكان: 18 عامًا أو أقل ، أو 19-25 عامًا ، أو 25-34 عامًا ، أو 35-44 عامًا ، أو 45-54 عامًا ، أو 55-64 عامًا ، أو 65 عامًا أو أكبر؟

تمرين ( PageIndex {2} ): قياس ديدان الأرض

قام مزارع ديدان الأرض بإعداد عدة حاويات لأنواع معينة من ديدان الأرض حتى يتمكن من التعرف على أطوالها. توفر أطوال ديدان الأرض معلومات عن أعمارها. قام المزارع بقياس أطوال 25 دودة أرض في إحدى الحاويات. تم قياس كل طول بالمليمترات.

  1. باستخدام المسطرة ، ارسم قطعة مستقيمة لكل طول:
    • 20 ملم
    • 40 ملم
    • 60 ملم
    • 80 ملم
    • 100 ملم
  2. ها هي أطوال ديدان الأرض الـ25 بالمليمتر.

(6 كواد 11 كواد 18 كواد 19 كواد 20 كواد 23 كواد 23 كواد 25 كواد 25 كواد 26 كواد 27 كواد 27 كواد 28 كواد 29 كواد 32 كواد 33 رباعي 41 كواد 42 كواد 48 كواد 52 كواد 54 كواد 59 كواد 60 كواد 77 كواد 93 )

أكمل الجدول الخاص بأطوال 25 ديدان الأرض.

الطولتردد
(0 ) ملليمتر إلى أقل من (20 ) ملليمتر
(20 ) ملليمتر إلى أقل من (40 ) ملليمتر
(40 ) ملليمتر إلى أقل من (60 ) ملليمتر
(60 ) ملليمتر إلى أقل من (80 ) ملليمتر
(80 ) مليمتر إلى أقل من (100 ) مليمتر
جدول ( PageIndex {1} )
  1. استخدم الشبكة والمعلومات الموجودة في الجدول لرسم رسم بياني لبيانات طول الدودة. تأكد من تسمية محاور المدرج التكراري.
  1. استنادًا إلى الرسم البياني ، ما هو الطول النموذجي لهذه الديدان الـ 25؟ اشرح كيف تعرف.
  2. اكتب جملة 1-2 لوصف انتشار البيانات. هل معظم الديدان لها أطوال قريبة من تقديرك للطول النموذجي ، أم أنها مختلفة جدًا في الطول؟

هل أنت مستعد لأكثر من ذلك؟

فيما يلي رسم بياني آخر لبيانات قياس دودة الأرض. في هذا الرسم البياني ، تكون القياسات في مجموعات مختلفة.

  1. بناءً على هذا الرسم البياني ، ما هو تقديرك لطول نموذجي لـ 25 ديدان الأرض؟
  2. قارن هذا الرسم البياني بالرسم الذي رسمته. كيف تتشابه توزيعات البيانات في المدرجين التكراريين؟ كيف هم مختلفون؟
  3. قارن تقديراتك لطول دودة الأرض النموذجي للرسمين البيانيين. هل توصلت إلى استنتاجات مختلفة حول طول دودة الأرض النموذجي من الرسمين البيانيين؟

تمرين ( PageIndex {3} ): اللاعبون طوال القامة

يميل لاعبو كرة السلة المحترفون إلى أن يكونوا أطول من لاعبي البيسبول المحترفين.

فيما يلي رسمان بيانيان يوضحان توزيعات ارتفاع 50 لاعب بيسبول محترفًا و 50 لاعب كرة سلة محترفًا.

  1. حدد الرسم البياني الذي يوضح ارتفاعات لاعبي البيسبول وأيها يوضح ارتفاعات لاعبي كرة السلة. كن مستعدًا لشرح أسبابك.
  1. اكتب 2-3 جمل تصف توزيع ارتفاعات لاعبي كرة السلة. التعليق على مركز وانتشار البيانات.
  2. اكتب 2-3 جمل تصف توزيع ارتفاعات لاعبي البيسبول. التعليق على مركز وانتشار البيانات.

ملخص

ها هي أوزان 30 كلبًا بالكيلوجرام.

(10 ​​ كواد 11 كواد 12 كواد 12 كواد 13 كواد 15 كواد 16 كواد 16 كواد 17 كواد 18 كواد 18 كواد 19 كواد 20 كواد 20 كواد 20 كواد 21 رباعي 22 كواد 22 كواد 22 كواد 23 كواد 24 كواد 24 كواد 26 كواد 26 كواد 28 كواد 30 كواد 32 كواد 32 كواد 34 كواد 34 )

قبل أن نرسم مدرجًا تكراريًا ، دعنا نفكر في سؤالين.

  • ما هي أصغر وأكبر القيم في مجموعة البيانات الخاصة بنا؟ يعطينا هذا فكرة عن المسافة على خط الأعداد التي سيغطيها المدرج التكراري. في هذه الحالة ، الحد الأدنى هو 10 والحد الأقصى هو 34 ، لذا يجب أن يمتد خط الأعداد من 10 إلى 35 على الأقل.

(تذكر الاصطلاح الذي نستخدمه لتمييز خط الأرقام لمدرج تكراري: نقوم بتضمين الحد الأيسر للشريط ولكننا نستبعد الحد الأيمن. إذا كان 34 هو الحد الأيمن للشريط الأخير ، فلن يتم تضمينه في هذا الشريط ، لذلك يجب أن يكون خط الأعداد أكبر بقليل من القيمة القصوى.)

  • ما هو حجم المجموعة أو حجم الصندوق الذي يبدو معقولًا هنا؟ يمكننا تنظيم الأوزان في صناديق من 2 كيلوجرام (10 ، 12 ، 14 ،.) ، 5 كيلوغرامات ، (10 ، 15 ، 20 ، 25 ،.) ، 10 كيلوغرامات (10 ، 20 ، 30 ،.) ، أو أي حجم آخر. كلما كانت الصناديق أصغر ، زاد عدد الأشرطة ، والعكس صحيح.

دعونا نستخدم صناديق سعة 5 كيلوغرامات لأوزان الكلاب. ستكون حدود صناديقنا هي: 10 ، 15 ، 20 ، 25 ، 30 ، 35. نتوقف عند 35 لأنها أكبر من الحد الأقصى.

بعد ذلك ، نجد تكرار القيم في كل مجموعة. من المفيد تنظيم القيم في جدول.

الأوزان بالكيلوغرامتردد
(10 ​​) إلى أقل من (15 )(5)
(15 ) إلى أقل من (20 )(7)
(20 ) إلى أقل من (25 )(10)
(25 ) إلى أقل من (30 )(3)
(30 ) إلى أقل من (35 )(5)
جدول ( PageIndex {2} )

الآن يمكننا رسم الرسم البياني.

يتيح لنا الرسم البياني معرفة المزيد عن توزيع وزن الكلب ووصف مركزه وانتشاره.

إدخالات المسرد

التعريف: المركز

مركز مجموعة من البيانات الرقمية هو قيمة في منتصف التوزيع. يمثل قيمة نموذجية لمجموعة البيانات.

على سبيل المثال ، مركز هذا التوزيع لأوزان القطط يتراوح بين 4.5 و 5 كيلوغرامات.

التعريف: التوزيع

يوضح التوزيع عدد المرات التي تحدث فيها كل قيمة في مجموعة بيانات. على سبيل المثال ، في مجموعة البيانات باللون الأزرق والأزرق والأخضر والأزرق والبرتقالي ، يكون التوزيع 3 درجات زرقاء و 1 أخضر و 1 برتقالي.

فيما يلي مخطط نقطي يوضح توزيع مجموعة البيانات 6 ، 10 ، 7 ، 35 ، 7 ، 36 ، 32 ، 10 ، 7 ، 35.

التعريف: التردد

تكرار قيمة البيانات هو عدد مرات حدوثها في مجموعة البيانات.

على سبيل المثال ، كان هناك 20 كلبًا في حديقة. يوضح الجدول تواتر كل لون.

اللونتردد
أبيض(4)
بنى(7)
أسود(3)
متعدد الألوان(6)
جدول ( PageIndex {3} )

التعريف: الرسم البياني

الرسم البياني هو طريقة لتمثيل البيانات على خط الأعداد. يتم تجميع قيم البيانات حسب النطاقات. يُظهر ارتفاع الشريط عدد قيم البيانات الموجودة في تلك المجموعة.

يوضح هذا الرسم البياني أن هناك 10 أشخاص حصلوا على تذكرتين أو 3 تذاكر. لا يمكننا تحديد عددهم الذين حصلوا على تذكرتين أو عدد ما ربحوه 3. يتضمن كل شريط قيمة الطرف الأيسر ولكن ليس قيمة النهاية اليمنى. (كان هناك 5 أشخاص ربحوا 0 أو 1 تذكرة و 13 شخصًا ربحوا 6 أو 7 تذاكر.)

التعريف: سبريد

يوضح انتشار مجموعة من البيانات الرقمية مدى تباعد القيم.

على سبيل المثال ، تُظهر المخططات النقطية أن أوقات السفر للطلاب في جنوب إفريقيا موزعة أكثر من نيوزيلندا.

ممارسة

تمرين ( PageIndex {4} )

يُظهر هذان الرسمان البيانيان عدد الرسائل النصية المرسلة في أسبوع واحد من مجموعتين من 100 طالب. يلخص الرسم البياني الأول البيانات من طلاب الصف السادس. يلخص المدرج التكراري الثاني البيانات من طلاب الصف السابع.

  1. هل مجموعتي البيانات لها نفس المركز تقريبًا؟ إذا كان الأمر كذلك ، اشرح مكان المركز. إذا لم يكن كذلك ، أيهما له المركز الأكبر؟
  2. أي مجموعة بيانات لها انتشار أكبر؟ اشرح أسبابك.
  3. بشكل عام ، ما مجموعة الطلاب - الصف السادس أو السابع - الذين أرسلوا المزيد من الرسائل النصية؟

تمرين ( PageIndex {5} )

ركض أربعون طالبًا في الصف السادس ميلًا واحدًا. هنا رسم بياني يلخص أوقاتهم بالدقائق. مركز التوزيع حوالي 10 دقائق.

على المحاور الفارغة ، ارسم مدرج تكراري ثاني يحتوي على:

  • توزيع الأوقات لمجموعة مختلفة من 40 طالب في الصف السادس.
  • مركز في 10 دقائق.
  • تباين أقل من التوزيع الموضح في الرسم البياني الأول.

تمرين ( PageIndex {6} )

جادا لديها (د ) دايم. لديها أكثر من 30 سنتًا ولكن أقل من دولار واحد.

  1. اكتب متراجعتين يمثلان عدد الدايمات في جادا.
  2. يمكن أن يكون (د ) 10؟
  3. كم عدد الحلول الممكنة التي تجعل كلا التفاوتين صحيحين؟ إذا أمكن ، صف الحلول أو ضع قائمة بها.

(من الوحدة 7.2.2)

تمرين ( PageIndex {7} )

رتب هذه الأرقام من الأكبر إلى الأقل: (- 4، frac {1} {4}، 0، 4، -3 frac {1} {2}، frac {7} {4}، - frac { 5} {4} )

(من الوحدة 7.1.4)


استخدم الرسم البياني للتردد للإجابة على كل سؤال.

تم مصادفة خطأ PHP

الرسالة: فهرس غير محدد: معرف المستخدم

الملف: /home/eoc11apgnrmy/public_html/application/views/question.php
الخط: 192
الوظيفة: _ error_handler

الملف: /home/eoc11apgnrmy/public_html/application/controllers/Questions.php
الخط: 416
الوظيفة: عرض

الملف: /home/eoc11apgnrmy/public_html/index.php
الخط: 315
الوظيفة: تتطلب مرة واحدة

statsguru Punditsdkoslkdosdkoskdo

كيفية إنشاء مدرج تكراري في Power BI للإجابة على أسئلة العمل

الرسم البياني هو أداة شائعة في الإحصائيات لوصف توزيع القيم عبر مجموعة البيانات. يمكنهم أن يعرضوا لك القيم الأكثر شيوعًا ، والقيم المتطرفة ، وانتشار قيمك ، كل ذلك في لمحة واحدة. يمكن أن تكون الرسوم البيانية مفيدة ليس فقط في الإحصائيات ، ولكن أيضًا للإجابة على أسئلة العمل. ومع ذلك ، ليس من الواضح على الفور كيفية إعدادها في Power BI ، لذلك سنخوض في بعض الأساليب لكيفية بنائها لمعالجة سيناريو العمل. سنبدأ بتطبيق بسيط ، ثم نبني تطبيقًا أكثر تعقيدًا مع مزيد من المرونة والرؤية في السيناريو الخاص بنا.

ما هو الرسم البياني مرة أخرى؟ أليس & # 8217t هذا مجرد مخطط عمودي؟

الرسوم البيانية ، بكل بساطة ، هي نوع من المخططات العمودية. بالنسبة للعديد من الأشخاص ، قد تبدو مثل واحدة في نفس الشيء ، ولكن في حين أن جميع الرسوم البيانية هي مخططات عمودية ، ليست كل المخططات العمودية عبارة عن مخططات بيانية (على غرار كيف أن جميع البشر من الثدييات ، ولكن ليس كل الثدييات بشر). على الرغم من أنك قد تستخدم في المخططات العمودية التي تعرض مقياسًا ماليًا مثل الأرباح ، فإن الرسوم البيانية هي مخططات عمودية توفر لك معلومات حول تكرار القيم ، وغالبًا ما تستخدم مقياس COUNT في Power BI. تحتوي المدرجات التكرارية على عدد من الميزات الخاصة التي لا تحتوي جميع المخططات العمودية على & # 8230

  • يحتوي المحور السيني على قيم مستمرة (أي أرقام) بدلاً من القيم الفئوية (أي أسماء التجمعات) ، ويحتوي المحور ص على بيانات التكرار / العدد.
  • يمكن أن تكون القيم على المحور x قيمًا فردية (الأعمار 0 ، 1 ، 2 ، 3 ، إلخ) أو قيمًا مجمعة (الأعمار 0-9 ، 10-19 ، 20-29 ، إلخ). يمكن أن يكون لعنصر ممثل في عمود مدرج تكراري أي قيمة داخل تلك الحاوية. سنركز فقط على المدرج التكراري باستخدام قيم أعداد صحيحة فردية ، نظرًا لوجود عدد من المقالات كتبها آخرون بالفعل حول استخدام binning للتجزئة.
  • تشتمل الرسوم البيانية على صناديق ذات عدد صفري. قد يجعل سياق الموقف من المعقول حذف الصناديق الفارغة في الطرف العلوي أو السفلي من التوزيع إذا لم تكن بين صندوقين غير فارغين ، على سبيل المثال لا تحتاج إلى تضمين الأعمار من 0 إلى 9 عند وصف الموظفين في الشركة.

استخدام الرسم البياني للإجابة على أسئلة العمل

لا تعد الرسوم البيانية مفيدة في الإحصائيات فحسب - بل يمكن استخدامها أيضًا بشكل فعال في سيناريوهات الأعمال لتقديم رؤى مفيدة. في هذا المثال ، سنجيب عن أسئلة حول شركة افتراضية للبيع بالتجزئة مقرها ملبورن ، أستراليا. لقد حصلنا على بيانات حول كيفية أداء كل متجر من متاجر الشركة & # 8217s 16 في كل شهر من السنة المالية 2019-2020. تحتوي مجموعة البيانات هذه على أهداف المبيعات والمبيعات ، مع جدول أساسي يبدو كهذا

نظرًا لأن الجدول يحتوي على لقطة للمبيعات حتى نهاية كل شهر ، دع & # 8217s نسمي هذا الجدول لقطة مبيعات حقيقية. لاحظ هنا أن عمود الشهر هو حقل نوع التاريخ ، لكني & # 8217 قمت بتغيير التنسيق لجعله أكثر قابلية للقراءة.

بناءً على البيانات الموجودة في لقطة مبيعات حقيقية، طلب منا & # 8217 الإجابة على هذا السؤال:

كم شهر بيع كل متجر بأقل من أهداف مبيعاته؟

إذا أردنا الإجابة على هذا السؤال ، فإننا نواجه مشكلة. عادة في Power BI ، نبني المرئيات عن طريق سحب الحقول وإفلاتها في صفحة التقرير لتشكيل المحور والقيم الخاصة بنا. ولكن إذا أردنا ظهور عدد الأشهر على محور مخطط العمود ، فما الحقل في مجموعة البيانات التي سنستخدمها لإنشاء هذا المحور؟ & # 8217s ليس واضحًا على الفور ، نظرًا لعدم وجود حقل في مجموعة البيانات الخاصة بنا بقيم صحيحة فقط لأعداد الشهور لدينا. للتعامل مع هذه المشكلة ، سنقوم ببناء جدول بقيم الشهر هذه بأنفسنا. وباستخدام هذا الجدول الجديد ، سنقوم ببناء مدرج تكراري يوضح عدد المتاجر مقابل عدد الأشهر التي كان أداؤها أقل من هدفهم.

& # 8217 سنقوم بمعالجة هذه المشكلة بطريقتين مختلفتين. سيكون النهج الأول هو ما يسمى بالحل الثابت ، والذي يعتمد على جدول محسوب يجمع جدول اللقطة الموجود لدينا. سيكون الثاني حلاً ديناميكيًا باستخدام معلمة What-If ومقياسًا مخصصًا بدلاً من ذلك. وأخيرًا ، قمنا & # 8217ll بتوسيع حلنا الديناميكي باستخدام تلميح أداة مخصص لإخبارنا بالمخازن الممثلة في كل عمود من المدرج التكراري الخاص بنا. بصفتك متذوقًا لما سيأتي ، إليك ما سيبدو عليه الحل النهائي ...

حل ثابت باستخدام الجداول المحسوبة

للإجابة على هذا السؤال ، نحتاج إلى حساب المبيعات المستهدفة لكل متجر و # 8217 مبيعات شهرية. للقيام بذلك ، يمكننا تحديد مقياس DAX بسيط على النحو التالي ، وتعريفه كنسبة مئوية.

المبيعات المستهدفة =
يقسم (
SUM (& # 8216Fact Sales Snapshot "[المبيعات]) ،
SUM (& # 8216Fact Sales Snapshot '[الهدف])
) +
// يضمن & # 8216 + 0 & # 8217 أن القيم الفارغة ترجع القيمة 0. هذا أكثر إيجازًا من دالة COALESCE

الآن باستخدام هذا المقياس الجديد ، سنقوم بإنشاء جدول محسوب جديد في DAX ، والذي يعرض قائمة فريدة بالمخازن ، ولكل متجر يتم حساب عدد الأشهر التي يكون فيها مقياس المبيعات المستهدفة أقل من 100٪.

أداء المتجر =
لخص (
& # 8216 لقطة مبيعات حقائق & # 8217 ،
// تجميع جدول لقطة لدينا & # 8230
& # 8216 لقطة مبيعات حقيقية "[المتجر] ،
// حسب المتجر & # 8230
& # 8220 أشهر دون الهدف & # 8221 ،
// وإرجاع عدد الشهور دون الهدف & # 8230
احسب (
COUNT (& # 8216Fact Sales Snapshot '[شهر]) ،
// عن طريق حساب عدد الأشهر المتبقية & # 8230
منقي (
القيم (& # 8216Fact Sales Snapshot '[شهر]) ،
// بعد تصفية الأشهر لدينا & # 8230
[المبيعات المستهدفة] & lt 1
// لتضمين الأشهر تحت الهدف فقط
)
) +
)

يبدو إخراج جدول أداء المتجر الجديد على هذا النحو & # 8230

ويمكننا سحب هذين الحقلين إلى الرسم البياني العمودي المرئي للحصول على شيء مشابه لما يلي ...

وهنا لدينا المدرج التكراري الخاص بنا! إنه يجيب بالتأكيد على سؤال أعمالنا حول عدد الأشهر التي تم بيع كل متجر فيها دون المستوى المستهدف. ولكن بها بعض العيوب مما يعني أنه قد لا يكون أفضل نهج بالنسبة لنا لتطبيقه على مواقف أخرى مماثلة ...

  • لقد أضفنا & # 8217 جدولًا جديدًا سيشغل مساحة أكبر في نموذجنا ويزيد حجم الملف ، خاصةً إذا كان لدينا الكثير من المتاجر أو كنا نقوم بهذا التحليل لشيء مثل المنتجات التي من المحتمل أن يكون لها العديد من القيم الفريدة المختلفة.
  • يمكننا & # 8217t تقسيم هذا الجدول إلى شرائح استنادًا إلى سمات أخرى مثل الشهر أو منطقة المتجر.
  • بالنسبة لنا ، يمكن أن نكتفي بعدم إظهار الشهرين 11 و 12 ، لكننا قد نرغب في منح جمهور تقريرنا الثقة بأنه لا توجد متاجر تعمل تحت الهدف لمدة تزيد عن 10 أشهر.

بالنظر إلى كل هذه العيوب ، سنقوم بمعالجة هذه المشكلة مرة أخرى ، ولكن هذه المرة باستخدام نهج أكثر قابلية للتوسع. لن يعالج نهجنا الجديد هذه المشكلات فحسب ، بل سيسمح لنا أيضًا بتضمين ميزات أخرى في الأقسام اللاحقة والتي ستكون ذات قيمة مضافة كبيرة لوصف وضع أعمالنا.

حل ديناميكي باستخدام معلمات وقياسات ماذا لو

سيعتمد هذا الحل الجديد على بناء مقياس ديناميكي سنظل قادرين على تقسيم نموذج البيانات الخاص بنا عليه. هذا نهج أكثر قوة من محاولتنا الأولى ، حيث يتم حساب قيمنا المجمعة على النحو المطلوب بناءً على سياق المرشح بدلاً من تخزينها كقيم ثابتة في النموذج. ومع ذلك ، لا يزال هذا الحل الجديد بحاجة إلى معالجة المشكلة التي حددناها سابقًا حول الحاجة إلى حقل لمحور المدرج التكراري الخاص بنا.

هذه المرة سنقوم بعمل جدول محسوب آخر ، وإن كان أبسط بكثير. سنحدد معلمة What If تسمى محور المدرج التكراري ، ونسمح لها بأخذ القيم بين 0 و 12.

لاحظ أننا ألغينا تحديد "إضافة أداة تقطيع إلى هذه الصفحة" ، نظرًا لأننا لن نقوم بتقسيم هذه القيمة إلى شرائح. لن نحتاج أيضًا إلى قياس قيمة محور المدرج التكراري الذي يتم إنشاؤه تلقائيًا ، حيث سننشئ مقياسًا مخصصًا جديدًا بدلاً من ذلك. نحن نستخدم المعلمة ببساطة لتحديد جدول محسوب بالقيم التي يجب أن تظهر على المحور x لمدرجات التكرارية لدينا ، والتي يمكن أن نحددها بشكل جيد يدويًا كجدول DAX.

الآن بعد أن أصبح لدينا محور المدرج التكراري الخاص بنا ، يمكننا تحديد المقياس الذي سنستخدمه لإنشاء قيم المدرج التكراري لدينا. في هذا المقياس ، سننشئ جدول أداء المتجر كمتغير افتراضي للجدول ، بحيث يتم تقييمه داخل المقياس بدلاً من تخزينه في النموذج. نقوم بعد ذلك بتصفية الجدول إلى المخازن ذات أداء المبيعات المطابق لقيمة محور الرسم البياني المحددة حاليًا. أخيرًا ، يُرجع المقياس عدد الصفوف لهذا الجدول المُفلتر.

عدد المتجر =
VAR المدرج التكراري
SELECTEDVALUE (& # 8216 محور الرسم البياني '[محور المدرج التكراري])

// قم بتخزين قيمة محور الرسم البياني المحدد حاليًا
أداء متجر VAR =
// تعريف الجدول الظاهري هو نفس الجدول المحسوب لدينا
لخص (
& # 8216 لقطة مبيعات حقائق & # 8217 ،
& # 8216 لقطة مبيعات حقيقية "[المتجر] ،
& # 8220 أشهر دون الهدف & # 8221 ،
احسب (
COUNT (& # 8216Fact Sales Snapshot '[شهر]) ،
عامل التصفية (القيم (& # 8216 لقطة مبيعات حقائق '[شهر]) ،

[المبيعات المستهدفة] & lt 1)
) +
)
إرجاع
البلدان (
// عد الصفوف & # 8230
منقي (
// بعد التصفية & # 8230
أداء المتجر ،
// الجدول الظاهري StorePerformance & # 8230
[أشهر أقل من الهدف] = HistogramColumn
// لمجرد المتاجر التي تنتمي إلى عمود المدرج التكراري الحالي
)
) +

يمكننا الآن استخدام هذا المقياس لإنشاء نفس المدرج التكراري كما كان من قبل ، ولكن نظرًا لأنه يتم حسابه ديناميكيًا من القيم الموجودة في لقطة مبيعات حقيقية، يمكننا الآن استخدام أدوات تقطيع الشرائح في الرسم البياني. على سبيل المثال قد نرغب في قصر تحليلنا على المتاجر الموجودة في منطقة معينة ، أو فقط لأشهر معينة من السنة.

لاحظ أنه عند استخدامنا لتقطيع الشرائح ، لا يتأثر حلنا الأصلي الثابت.

تنسيق الرسم البياني لدينا

بعد ذلك سنقوم بتنسيق المدرج التكراري الخاص بنا بطريقة تقليدية حيث لا توجد فجوات بين الأعمدة - يعمل هذا كإشارة بصرية لفرض فكرة أن الأعمدة تمثل قيمًا مستمرة.

للقيام بذلك ، علينا (ومن المفارقات) أن نغير محور x من النوع المستمر إلى النوع القاطع. بينما تمثل بياناتنا سلسلة مستمرة من الأرقام ، إلا أن الرسوم المرئية لمخطط العمود تسمح لك فقط لسبب غير معروف بضبط العرض بين الأعمدة عندما يتم تمييز البيانات الموجودة على المحور س على أنها فئوية. يمكننا تغيير هذا الإعداد في جزء التنسيق.

لكن لسوء الحظ ، عندما نجري هذا التغيير ، يتغير ترتيب الأعمدة! يتم الآن فرز المحور تنازليًا بناءً على قيمة القياس ، ولكن من السهل علينا تصحيح ذلك.

أخيرًا ، يمكننا ضبط العرض بين الأعمدة باستخدام خيار الحشو الداخلي في جزء التنسيق.

إضافة تلميح أداة إلى قائمة المخازن الممثلة في كل عمود

الآن بعد أن أصبح لدينا توزيع لأداء المتجر الشهري ، فإن الشيء التالي الذي ربما نريد أن نعرفه هو أي المتاجر تعمل بشكل جيد وأيها لا يعمل. الطريقة الفعالة لإظهار هذه المعلومات هي استخدام تلميح أداة يخبرنا بالمخازن التي يتم تمثيلها في كل عمود من المدرج التكراري الخاص بنا.

يمكننا القيام بذلك عن طريق إنشاء تلميح أداة مخصص. للقيام بذلك ، يمكننا إنشاء صفحة جديدة في تقريرنا ، ثم تحديد الصفحة كصفحة تلميح في جزء التنسيق وتقليل حجم الصفحة إلى شيء صغير بما يكفي لاستخدامه كتلميح أداة.

في صفحة التلميحات الخاصة بنا ، يمكننا إنشاء جدول مرئي بسيط باستخدام حقل المتجر في لقطة مبيعات حقيقية. بشكل افتراضي ، سيعرض هذا جميع متاجرنا ، لكننا نريد فقط عرض المتاجر لعمود الرسم البياني المحدد حاليًا. لتحقيق ذلك ، & # 8217 سننشئ مقياسًا آخر ، والذي سيتم استخدامه كمرشح على المستوى المرئي على مرئياتنا. لكل صف في جدول المتاجر لدينا ، سيحدد عدد الأشهر التي كان أداء المتجر فيها ضعيفًا. سيقارن ذلك بعد ذلك بعمود المدرج التكراري المحدد حاليًا في إنشاء تلميح الأدوات ، وسيشمل المتجر فقط إذا كان أداء المتجر & # 8217s يتطابق مع قيمة عمود المدرج التكراري.

عامل تصفية تلميح =
عمود الرسم البياني VAR =
SELECTEDVALUE (& # 8216 محور الرسم البياني '[محور المدرج التكراري])
VAR monthsBelowTarget =
// محدد كما كان من قبل
احسب (
COUNT (& # 8216Fact Sales Snapshot '[شهر]) ،
التصفية (القيم (& # 8216 لقطة مبيعات حقيقية '[شهر]) ، [المبيعات المستهدفة] & lt 1)
)
إرجاع
IF (MonthBelowTarget = HistogramColumn، 1،)

لتمكين منطق المرشح هذا ، يتعين علينا فقط سحب المقياس إلى مرشحات المستوى المرئي لجدول تلميحات الأدوات لدينا ، وتضمين القيم التي يرجع المقياس لها 1 فقط.

بعد إعداد كل هذا ، يمكننا العودة إلى صفحة التقرير الرئيسية ، وتنسيق الرسم البياني المرئي للإشارة إلى صفحة تلميح الأدوات الخاصة بنا كتلميح عن صفحة التقرير.

وبهذا ، يمكننا الآن رؤية المدرج التكراري الديناميكي مع تلميح الأداة أثناء العمل!

سيناريوهات أخرى لاستخدام الرسوم البيانية فيها

يمكن أن تكون تقنيات بناء الرسوم البيانية للتحليل قوية جدًا عند استخدامها بفعالية. من خلال هذه الأفكار ، قد يكون مستخدم التقرير قادرًا على تحديد المتاجر ذات أداء المبيعات الضعيف واستخدام ذلك للتحقيق (ونأمل في حل) العوامل الرئيسية التي تدفعهم إلى الأداء الضعيف. يمكنك حتى توسيع هذا السيناريو لتحليل مبيعات المنتجات الفردية وتحديد المتاجر التي كان أداء هذا المنتج فيها ضعيفًا (بدلاً من النظر في أداء المبيعات عبر جميع المنتجات في المتجر كما فعلنا). قد يقدم العملاء الذين يتسوقون في هذه المتاجر رؤى قيمة لمساعدة شركتك على تحسين عروض منتجاتها.

ملخص

في هذه المقالة ، أنشأنا رسمًا بيانيًا في Power BI أظهر لنا توزيع أداء المتجر ، بناءً على عدد الأشهر التي كانت مبيعات كل متجر أقل من الهدف. قمنا أولاً بإنشاء المدرج التكراري الخاص بنا باستخدام جدول مجمع في DAX ، ثم قمنا بتوسيع الحل الخاص بنا لاستخدام مقياس ومعلمة ماذا لو. قمنا بعد ذلك بتنسيق المدرج التكراري الخاص بنا لإزالة المسافة بين الأعمدة ، وأضفنا تلميحًا مخصصًا لإظهار المتاجر التي تم تمثيلها في كل عمود مدرج تكراري.

كملاحظة أخيرة ، ضع في اعتبارك أن الأساليب التي ناقشناها & # 8217 كليهما تعتمد على قدرتك على تحديد جدول محسوب في نموذجك. ومع ذلك ، إذا كنت تعمل من تقرير متصل بنموذج خدمات التحليل ، فمن المحتمل أنك لن تتمتع بنفس النوع من المرونة لإنشاء جداول إضافية. في منشور المدونة التالي الخاص بي ، سآخذك & # 8217 إلى تنفيذ يمكنك استخدامه لإنشاء الرسوم البيانية عندما يمكنك & # 8217t بالفعل إنشاء جدول جديد في نموذجك ، لذا ترقبوا!


الرسوم البيانية

الرسم البياني: عرض رسومي للبيانات باستخدام أشرطة ذات ارتفاعات مختلفة.

إنه مشابه للمخطط الشريطي ، لكن الرسم البياني يجمع الأرقام في نطاقات .

يوضح ارتفاع كل شريط عدد العناصر التي تقع في كل نطاق.

وأنت تقرر ما هي النطاقات التي يجب استخدامها!

مثال: ارتفاع أشجار البرتقال

تقيس ارتفاع كل شجرة في البستان بالسنتيمتر (سم)

وتتراوح ارتفاعاته من 100 سم إلى 340 سم

قررت وضع النتائج في مجموعات بحجم 50 سم:

  • ال 100 إلى أقل بقليل من 150 سم نطاق،
  • ال 150 إلى أقل بقليل من 200 سم نطاق،
  • إلخ.

لذلك تضاف الشجرة التي يبلغ طولها 260 سم إلى النطاق & quot250-300 & quot.

يمكنك أن ترى (على سبيل المثال) أن هناك 30 الأشجار من 150 سم إلى أقل بقليل من 200 سم

(ملاحظة: يمكنك إنشاء رسوم بيانية مثل ذلك باستخدام إنشاء المدرج التكراري الخاص بك)

لاحظ أن المحور الأفقي مستمر مثل خط الأعداد:

مثال: كم يكلف هذا الجرو ينمو؟

كل شهر تقيس مقدار الوزن الذي اكتسبه الجرو الخاص بك وتحصل على هذه النتائج:

0.5 ، 0.5 ، 0.3 ، وناقص 0.2 ، 1.6 ، 0 ، 0.1 ، 0.1 ، 0.6 ، 0.4

وهي تختلف من & ناقص 0.2 (فقد الجراء وزنه في ذلك الشهر) إلى 1.6

قم بالترتيب من الأقل إلى الأعلى في زيادة الوزن:

& ناقص 0.2 ، 0 ، 0.1 ، 0.1 ، 0.3 ، 0.4 ، 0.5 ، 0.5 ، 0.6 ، 1.6

قررت وضع النتائج في مجموعات من 0.5:

(لا توجد قيم من 1 إلى أقل بقليل من 1.5 ، لكننا ما زلنا نعرض المساحة.)

نطاق كل شريط يسمى أيضًا فترة الطبقة

في المثال أعلاه كل فصل دراسي هو 0.5

تعد الرسوم البيانية طريقة رائعة لعرض نتائج البيانات المستمرة ، مثل:

ولكن عندما تكون البيانات في التصنيفات (مثل الدولة أو الفيلم المفضل) ، يجب أن نستخدم مخطط شريطي.


أسئلة على غرار الامتحان في الإحصاء

قام بن بقياس طول وعرض كل من 10 أصداف بحرية من نفس النوع. النتائج معروضة أدناه.

(أ) أنشئ رسمًا بيانيًا مبعثرًا بهذه البيانات.

أبعاد محارة البحر
الطول (سم) العرض (سم)
7.3 2.7
9.7 3.2
7.5 2.6
6.1 2.9
9.0 2.9
8.7 3.0
7.5 2.5
10.3 3.5
9.5 3.3

النقطة التي تمثل نتائج إحدى الأصداف هي نقطة خارجية.

(ب) اشرح كيف تختلف نتائج هذه القشرة عن نتائج الأصداف الأخرى.

يتم إجراء الاستبيان عن طريق طرح أسئلة على الأشخاص عند خروجهم من مقهى.

يتم عرض جزء من الاستبيان أدناه.

ضع علامة & # 9745 في المربع الموجود أمام الإجابة التي اخترتها.

1. كم مرة تزور مقهى؟

& # 9744 كل يوم & # 9744 مرة أو مرتين كل أسبوع & # 9744 أبدًا.

(أ) اشرح سبب اعتبار هذا المسح متحيزًا.

(ب) ذكر انتقادين للأسئلة أو الخيارات المقدمة للإجابات.

يوضح الجدول معلومات حول ارتفاعات 85 صواعدًا.

الارتفاع ( (ح ) سم) تكرر
(10 ​​ لتر ساعة جنيه 15 )9
(15 لتر ساعة لو 20 )13
(20 لتر ساعة لو 25 )18
(25 لتر ساعة لو 30 )22
(30 لتر ساعة جنيه 35 )15
(35 لتر ساعة لو 40 )8

(أ) أوجد فترة الفصل التي تحتوي على الوسيط.

(ب) على الشبكة أدناه ، ارسم مضلع تردد للمعلومات الواردة في الجدول.

سُئل 155 شخصًا عن المبلغ الذي سيدفعونه مقابل وجبة معينة مكونة من ثلاثة أطباق في مطعم خاص.

يظهر الرسم البياني نتائج المسح.

(أ) أكمل جدول التردد للحصول على المعلومات الموضحة في الرسم البياني.

المبلغ (£ (x )) (0 lt x le 10 )
تكرر 20

(ب) استخدم جدول التردد الخاص بك لحساب تقدير لمتوسط ​​المبلغ الذي سيدفعه هؤلاء الأشخاص مقابل الوجبة.

يطلب جيمي القمصان للكورال المجتمعي الذي يضم 240 عضوًا.

سأل عينة من 36 عضوًا عن لون القمصان. يختار كل عضو لونًا واحدًا.

يعرض الجدول معلومات حول نتائجه.

لون عدد من أعضاء
أزرق 6
أحمر 3
أخضر 7
الأصفر 5
نفسجي 2
أسود 6
أبيض 7

(أ) حدد عدد الأعضاء الـ 240 الذين تعتقد أنهم يريدون قمصانًا سوداء.

(ب) اذكر أي افتراض قدمته واشرح كيف قد يؤثر ذلك على إجابتك.

يعطي الرسم البياني المبعثر معلومات حول الدرجات التي حصل عليها كل من 13 طالبًا في امتحان إحصائي وامتحان رياضيات.

تم رسم مخطط الصندوق لامتحان الرياضيات لـ 13 طالبًا على الشبكة أدناه.

(أ) ارسم مخطط الصندوق لامتحان الإحصاء.

(ب) قارن توزيع العلامات المسجلة في الاختبارين.

يوضح الجدول العلامات التي حصل عليها 200 طالب في امتحان الرياضيات.

مارك (ن) (0 lt n le 10 ) (10 ​​ lt n le 20 ) (20 lt n le 30 ) (30 lt n le 40 ) (40 lt n le 50 ) (50 lt n le 60 ) (60 lt n le 70 ) (70 lt n le 80 )
تكرر 3 7 33 42 54 35 20 6

(أ) استخدم البيانات الواردة في الجدول أعلاه لإكمال جدول التردد التراكمي التالي

مارك (ن) (n le 10 ) (n le 20 ) (n le 30 ) (n le 40 ) (n le 50 ) (n le 60 ) (n le 70 ) (n le 80 )
تردد التراكمي 200

(ب) ارسم منحنى التردد التراكمي على ورق الرسم البياني.

سيحصل أفضل 5٪ من الطلاب على درجة A. سيحصل 15 ٪ من الطلاب التاليين على درجة B وسيحصل 30 ٪ التاليون على درجة C.

(ج) استخدم الرسم البياني لتقدير أدنى علامة سيتم منحها درجة B.

يوضح الجدول مقدار الوقت ، بالأشهر ، الذي يستغرقه بيع المنازل في منطقة هابيلاند السكنية.

الوقت (شهر) تكرر
0 & lt m & le 2 10
2 & lt m & le 5 21
5 & ​​lt m & le 10 25
10 & lt m & le 15 20
15 & lt m & le 20 25

(أ) ارسم مدرج تكراري للمعلومات الواردة في الجدول.

(ب) أوجد تقديرًا للوسيط.

يوضح جدول التردد المُجمَّع التالي طول الوقت ، (t ) ، بالدقائق ، شاهد الزائرون أخطبوطًا يسبح حول حوض في حوض مائي.

الوقت ( (t ))الزائرين
(0 lt t le 5 )23
(5 lt t le 10 )13
(10 ​​ lt t le 15 )9
(15 lt t le 20 )6
(20 lt t le 25 )2
(25 lt t le 30 )1

(أ) اكتب العدد الإجمالي للزوار الذين تم تضمينهم في المسح.

(ب) اكتب قيمة منتصف الفترة للمجموعة (20 lt t le 25 ).

(ج) ابحث عن تقدير لمتوسط ​​الوقت الذي استغرقه الزائرون في مشاهدة الأخطبوط.

تمت إعادة كتابة المعلومات الواردة أعلاه كجدول تكراري تراكمي.

الوقت ( (t )) (t le 5 ) (t le 10 ) (t le 15 ) (t le 20 ) (t le 25 ) (t le 30 )
تردد التراكمي2336(أ)5153(ب)

(د) اكتب قيم (أ ) و (ب ).

تظهر هذه المعلومات في الرسم البياني التكراري التراكمي التالي.

(هـ) استخدم الرسم البياني لتقدير الوقت الأقصى الذي يستغرقه مشاهدة الأخطبوط لأول 32 زائرًا (مرتبة حسب زيادة وقت المشاهدة).

(و) استخدم الرسم البياني لتقدير عدد الزوار الذين أمضوا أقل من 13 دقيقة في مشاهدة الأخطبوط.

(ز) استخدم الرسم البياني لتقدير عدد الزوار الذين يستغرقون أكثر من 17 دقيقة في مشاهدة الأخطبوط.

توضح الرسوم البيانية أدناه نتائج التلاميذ في المجموعة السنوية الذين أجابوا على عشرين سؤالاً في الحساب الذهني.

ما هي المعلومات من الرسوم البيانية التي يمكن استخدامها لدعم أو معارضة كل من هذه العبارات؟

(أ) الفتيات أفضل في الحساب الذهني من الأولاد.

(ب) نطاق أوقات الأولاد أكبر من نطاق أوقات البنات.

يود مدير المدرسة استخدام هذه البيانات للإدلاء ببيانات حول جميع الطلاب في المدرسة.

(ج) علق على ما إذا كان يمكن استخلاص أي استنتاجات لجميع طلاب المدارس من نتائج مجموعة العام هذه.

يوضح الجدول التالي عدد المرات التي زار فيها أفراد مجموعة عينة السينما في فترة ستة أشهر.

أحد الترددات مفقود.

زيارات السينما تكرر المنتصف
0-4 20 2
5-9 24 7
10-14 12
15-19 7 17

تُستخدم نقاط المنتصف للتوصل إلى تقدير لمتوسط ​​عدد الزيارات.

المتوسط ​​محسوب على أنه 7.25.

احسب التردد المفقود.

يوضح الجدول التالي عدد الأيام التي تقضيها العائلات في فندق معين على شاطئ البحر في أغسطس من العام الماضي.

أيامتكررتردد التراكمي
233
51114
71529
10 (س )39
14544

يتم سرد الأوقات التي تستغرقها مجموعة من الطلاب بالثواني لإكمال تمرين عبر الإنترنت على النحو التالي.

$31, 34, 41, 33, 29, 31, 39, 35, 30, 40.$

(ب) احسب المدى الربيعي.

(ج) أوجد احتمال أن يستغرق الطالب الذي تم اختياره عشوائيًا من المجموعة 35 ثانية على الأقل لإكمال التمرين.

قام المدرب الشخصي بجمع البيانات من عينة عشوائية من الأيام. من هذا وجد أن عدد أكواب الماء التي يشربها في اليوم كان متوسطه 4.35.

نظارات1234567
تكرر2469 (س )94

(أ) أوجد عدد الأيام التي يمثلها (x )

(ب) اكتب الانحراف المعياري.

استطلعت شركة تلفزيونية 88 من موظفيها لمعرفة مقدار الوقت الذي يقضونه في السفر للعمل في يوم معين. تظهر نتائج المسح في الرسم البياني التكراري التراكمي التالي.

(أ) أوجد متوسط ​​عدد الدقائق التي قضاها في السفر إلى العمل.

(ب) أوجد المدى الربيعي.

(ج) أوجد عدد الموظفين الذين يكون وقت سفرهم في غضون 20 دقيقة من الوسيط.

(د) قضى 10٪ فقط من الموظفين أقل من k دقيقة في السفر إلى العمل. اعثر على قيمة K.

يمكن أيضًا عرض نتائج الاستطلاع على الرسم التخطيطي للصندوق والشعر التالي.

(هـ) اكتب قيمة a.

(ز) تعتبر أوقات السفر التي تقل عن p دقيقة قيمًا متطرفة. أوجد قيمة p.

يوضح الرسم البياني للتردد التراكمي السرعات بالكيلومتر في الساعة لراكبي الدراجات الذين يجتازون نقطة معينة على مسار السباق.

(أ) تقدير الحد الأدنى للسرعة الممكنة لأحد راكبي الدراجات هؤلاء.

(ب) أوجد متوسط ​​سرعة راكبي الدراجات.

(ج) اكتب المئين الخامس والستين.

(د) احسب المدى بين الشرائح الربعية.

(هـ) أوجد عدد راكبي الدراجات الذين كانوا يسافرون أسرع من 22 كيلومترًا في الساعة -1

يوضح الجدول سرعات راكبي الدراجات هؤلاء.

سرعة راكبي الدراجاتعدد راكبي الدراجات
(0 lt s le 5 )0
(5 لتر لو 10 )(أ)
(10 ​​ لتر 15 )8
(15 لتر لو 20 )20
(20 لتر لو 25 )16
(25 لتر لو 30 )5
(30 lt s 35 )(ب)

(و) أوجد قيمة (أ ) و (ب )

(ز) اكتب فئة الوسائط.

(ح) اكتب قيمة منتصف الفاصل الزمني للفئة المشروطة.

(ط) استخدم حاسبة عرض الرسوم البيانية لحساب تقدير متوسط ​​السرعة لراكبي الدراجات هؤلاء.

(ي) استخدم حاسبة عرض الرسوم البيانية لحساب تقدير الانحراف المعياري لسرعات راكبي الدراجات هؤلاء.

تحتوي مجموعة البيانات على (n ) عناصر. مجموع العناصر 650 ، والمتوسط ​​13 والانحراف المعياري 5.

إذا تم ضرب كل قيمة في المجموعة بـ 7:

(ب) اكتب قيمة المتوسط ​​الجديد

(ج) أوجد قيمة التباين الجديد.

إذا كنت تريد مساحة على يمين السؤال لكتابة الحل ، فجرّب ميزة التخفيف هذه. سيؤدي ذلك إلى طي النص إلى النصف الأيسر من شاشتك ، لكن الرسوم التخطيطية الكبيرة ستبقى بدون تغيير.

تستند أسئلة نمط الاختبار التي تظهر على هذا الموقع إلى تلك المحددة في الاختبارات السابقة (أو أوراق التقييم النموذجية للامتحانات المستقبلية) من قبل مجالس الامتحانات الرئيسية. The wording, diagrams and figures used in these questions have been changed from the originals so that students can have fresh, relevant problem solving practice even if they have previously worked through the related exam paper.

The solutions to the questions on this website are only available to those who have a Transum Subscription.

To search the entire Transum website use the search box in the grey area below.


Statistics, Histograms, and Probability

In all likelihood you have computed an average, for example, the average of all your test scores in a course. To find your average, you add your scores and divide by the number of tests. The mathematical term for this average is the mean. On the other hand, the median is the value in the of the data if the number of data points is odd. For example, if the test on a particular test in a class of 27 students have a median of 74, then 13 students scored below 74 13 scored above 74, and one student obtained a grade number of data points is even, the median is the mean of the two ‘values close the middle. The mean need not be the,same as the median. For example, for the data 65, 68, 74, 88, 95, the mean is 75, whereas the median Little mean of 68 and 74 or 71.

MATLAB provides the mean(x) median (x) functions to perform _these computations. If x is a vector, the mean (or median) value of the vector’s values is returned. However, if x is a matrix, a row vector is returned containing the mean (or median) value of each column of x. These functions do not require the elements in x to be sorted in ascending or descending order.

In many applications, the mean and the median do not adequately describe a data set. Two data sets can-have the same mean (or the same median) yet be very different. For example, the test scores 60, 65, 68, 74, 88,95 have the same mean , as the scores 71, 72, 73, 77, 78, 79, but the two sets describe very.different test outcomes. The first set of scores vary over large range, whereas in the second set-the scores are tightly grouped about the mean.

The way the data are spread around the mean can be described by a histogram plot. A histogram is a.plot of the frequency of occurrence of data values versus the values themselves. For example, suppose that in a class of 20 students the 20 scores on the first test were

61 61 65 67 69 72 74 74 76 77
83 83 85 88 89 92 93 93 95 98

On this test there are five scores in the 60-69 range, five in the 70-79 range, five in the 80-89 range, and five in the 90-100 range. The histogram for these scores is shown in the top graph in Figure 7.1-1. It is a bar plot of the number of scores that occur within each range, with the bar centered in the middle of the range (for example, the bar for the range 60-69 is centered at 64.5, and the asterisk on the plot’s abscissa shows the bar’s center).

Figure 7.1-1 Histograms of test scores for 20 students.

Suppose that on the second test the following 20 scores were achieved:

66 69 72 74 75 76 77 78 78 79
79 80 81 83 84 85 87 88 90 94

On this test there are two scores in the 60-69 range, nine in the 70-79 range, seven in the 80-89 range, and two in the 90-100 range. The histogram for these scores is shown in the bottom graph in Figure 7.1-1. The mean on both tests is identical and is 79.75. However, the distribution of the scores is very different. On the first test we.say that the scores are evenly, or “uniformly,” distributed between 60 and 100, whereas on the second test the scores are more clustered around the mean.

To plot a histogram, you must group the data into sub ranges, called bins. In this example the four bins are.the ranges 60-69,70-79, 80-89, and 90-100. The choice of the bin width and bin center can drastically change the shape of the histogram. If the number of data values is relatively small, the bin width can not be small because some of the bins will contain no data and the resulting histogram might not usefully illustrate the distribution of the data.

To obtain a histogram, first sort the data if it has not yet been sorted (you can use the sort function here). Then choose the bin ranges and. bin centers and count the number of values in each bin. Use the bar function to plot the number of values in each bin versus the bin centers as a bar chart. The function bar (x I Y> creates a bar chart of y versus x. The MATLAB script file that generates Figure 7.1-1 follows. We have selected the bin centers to be in the middle of the ranges 60-69, 70-79, 80-89, 90-99.

MATLAB provides the hi s t command to generate a histogram. This command has several forms. Its basic form is hi s t (y) ,where y is a vector containing the data. This form aggregates the data into 10 bins evenly spaced between the minimum and maximum values in y. The second form is hist (y, n ) , where . n is a user-specified scalar indicating the number of bins. The third form is hi s t (y r x) ,where x is a user-specified vector ,that determines the location. of the bin centers the bin widths are the distances between the centers.

Figure 7.1-3 Absolute frequency histogram for 100 thread tests.

will not be satisfactory. This case occurs when you want to obtain a relative frequency histogram. In such cases you can use the bar function to generate the histogram. The following script file generates the relative frequency histogram for the 100 thread tests. Note that if you use the bar function, you must aggregate the data first.

The result appears in Figure 7.1-4.

The fourth, fifth, and sixth forms of the hi s t function do not generate a plot, but are used to compute the frequency counts and bin locations. The bar function can then be used to plot the histogram. The syntax of the fourth form is [z , x] = hi s t (y) , where z is “the returned vector containing the frequency count and x is the returned vector containing the bin locations. The fifth and sixth forms are [z, x] = hist (y ,n) and [z , x] = hist (y, x). In the latter

Figure 7.1-4 Relative frequency histogram for 100 thread tests.

case the returned vector x is the same as the user-supplied vector. The following script file shows how the sixth form can be used to generate a relative frequency histogram for the thread example with 100 tests.

The plot generated by this M-file will be identical to that shown in Figure 7.1-4. These commands are summarized in Table 7.1-1.

Table 7.1-1 Histogram functions

The Data Statistics Tool

With the Data Statistics tool you can calculate statistics for data and add plots of the statistics to a graph of the data. The tool is accessed from the Figure window after you plot the data. Click on the Tools menu, then select Data Statistics. The menu appears as shown in Figure 7.1-5. To plot the mean of the dependent variable (y), click the box in the row labeled mean under the column labeled Y, as shown in the figure. You can plot other statistics as well these are shown in the figure. You can save the statistics to the workspace as a structure by clicking on the’Save to Workspace button. This opens a dialog box that prompts you for a name for the structure containing the x data, and a name for the y data structure.

احتمالا

Probability is expressed as a number between 0 and 1 or as a percentage between o percent and 100 percent. For example, because there are six possible outcomes from rolling a single die, the probability of obtaining a specific number on one roll is 1/6, or. 16.67 percent. Thus if you roll the die a large number of times, you expect to obtain a 2 one-sixth of the time. Figure 7.1-6 shows the theoretical uniform probabilities for rolling a single die, and the relative frequency histogram for the data from 100 die rolls. The number of times a 1,2,3,4,5, or Occurred was 21,14, 18, 16, 19,and 12 respectively. The plots of the theory and the data are very similar, but not identical. In general, if you had rolled the die 1000 times instead of 100 times, the histogram would look even more like the theoretical probability plot.
If you roll two balanced dice, each roll has 36 possible outcomes because each die can produce six numbers. There is only one way to obtain a sum of 2, but there are two ways to obtain a sum of 3, and so on. Thus the probability of rolling a sum of 2 is 1/36, and the probability of rolling a sum of 3 is 1/36 +1/36 = 2/36.

Figure 7.1-5 The Data Statistics, tool.

Figure 7.1-6 Comparison of theory end experiment for 100 rolls of a single die.

Continuing this line of reasoning, you can obtain the theoretical probabilities for the sum of two dice, as shown in the following table.

Probabilities Cor the sum of two dice
Sum 2 3 4 5 6 7 8 9 10 11 12
Probability (x 36) 1 2 3 4 5 6 5 4 3 2 1

An experiment was performed by rolling two dice 100 times and recording the sums. The data follows.

Data Cor two dice
Sum 2 3 4 5 6 7 8 9 10 11 12
Frequency 5 5 8 11 20 10 8 12 7 10 4

Figure 7.1-7 shows the relative frequency histogram and the theoretical probabilities on the same plot, If you had collected more data, the histogram would have been closer to the theoretical probabilities.
The theoretical probabilities can be used to predict the outcome of an experiment. Note that the sum of the theoretical probabilities for two dice equals I, because it is 100 percent certain to obtain a sum between 2 and 12. The sum of the probabilities corresponding to the outcomes 3, 4, and 5 is 2/36 +3/36 +4/36 1/4. This result corresponds to a probability of 25 percent. Thus if you roll two dice many times, 25 percent of the time you would expect to obtain a sum of either 3, 4, or 5.

Figure 7.1-7 Comparison of theory and experiment for 100 rolls of two dice.

In many applications the theoretical probabilities are not available because the underlying causes of the process are not understood well enough. In such applications you can use the histogram to make predictions. For example, if you did not have the theoretical probabilities for the sum of two dice, you could use the data to estimate the probability. Using the previously given data from 100 rolls, you can estimate the probability of obtaining a sum of either 3, 4, or 5 by summing the relative frequencies of these three outcomes. This sum is (5 +8 + 11)/100 = 0.24, or 24 percent. Thus on the basis of the data from 100 rolls, 24 percent of the time you can estimate that you would obtain a sum of either 3,4, or 5. The accuracy of the estimates so obtained is highly dependent on the number of trials used to collect the data the more trials, the better. Many sophisticated statistical methods are available to assess the accuracy of such predictions these methods are covered in advanced courses.

Test Your Understanding
17 .1-2 If you roll a pair of balanced dice 200 times, how many times would you expect to obtain a sum of 7? How many times would you expect to obtain a sum of either 9, 10, or II? How many times would you expect to obtain a sum less than 7? (Answer: 33 times, 50 times, and 83 times.)


Question 16.

Use the frequency histogram to answer each question.

  1. Determine the number of classes.
  2. Estimate the frequency of the class with the least frequency.
  3. Estimate the frequency of the class with the greatest frequency.
  4. Determine the class width.

Answer – a) Number of classes = 7

Leave a Reply إلغاء الرد

GeekyMynd.com is a learning website where students can learn topics related to Computer Science, Statistics, UPSC, SSC, and more free of cost.

الروابط

NEWSLETTER

Get all the latest content delivered to your email a few times a month. Updates and news about all categories will send to you.


When you should use a histogram

Histograms are good for showing general distributional features of dataset variables. You can see roughly where the peaks of the distribution are, whether the distribution is skewed or symmetric, and if there are any outliers.

In order to use a histogram, we simply require a variable that takes continuous numeric values. This means that the differences between values are consistent regardless of their absolute values. For example, even if the score on a test might take only integer values between 0 and 100, a same-sized gap has the same meaning regardless of where we are on the scale: the difference between 60 and 65 is the same 5-point size as the difference between 90 to 95.

Information about the number of bins and their boundaries for tallying up the data points is not inherent to the data itself. Instead, setting up the bins is a separate decision that we have to make when constructing a histogram. The way that we specify the bins will have a major effect on how the histogram can be interpreted, as will be seen below.

When a value is on a bin boundary, it will consistently be assigned to the bin on its right or its left (or into the end bins if it is on the end points). Which side is chosen depends on the visualization tool some tools have the option to override their default preference. In this article, it will be assumed that values on a bin boundary will be assigned to the bin to the right.

Example of data structure

One way that visualization tools can work with data to be visualized as a histogram is from a summarized form like above. Here, the first column indicates the bin boundaries, and the second the number of observations in each bin. Alternatively, certain tools can just work with the original, unaggregated data column, then apply specified binning parameters to the data when the histogram is created.


Statistics Test 1

Step 4. Choose the interval that contains the score, 61.7.

Step 1. Determine the relative frequency for the fifth class as a simplified fraction.
Answer: ____________________

Step 1. Find the lowest state Electoral College vote total.
Answer: _______________

Step 2. Find the highest state electoral college vote total.

Step 1. Find the number of ham pizzas sold each month. Round your answer to the nearest integer.
Answer: ____________________

Step 2. Find the number of ground beef pizzas sold each month. Round your answer to the nearest integer.
Answer: ____________________

Step 3. Find the number of bell pepper pizzas sold each month. Round your answer to the nearest integer.
Answer: ____________________

Step 4. Find the number of onion pizzas sold each month. Round your answer to the nearest integer.
Answer: ____________________

Name Scoring
Eddie Jones 20.1
Mario Elie 7.5
Antonio Davis 11.5
Karl Malone 25.5
Juwan Howard 14.9

Step 1. Determine the missing value on the vertical axis represented by [?].

Step 2. Determine the missing value on the vertical axis represented by [?].

Step 3. Create the bar representing the data for Karl Malone.

Step 4. Create the bar representing the data for Juwan Howard.

Step 1. Find the lowest per game scoring average for the six seasons shown.
Answer: _______________

Step 1. Find the number of the class containing the smallest number of house prices (1, 2, 3, 4, 5, or 6).
Answer: ____________________

Step 2. Find the lower class limit of the fifth class.
Answer: ____________________

Step 3. Find the class width for this histogram.
Answer: ____________________

Step 4. Find the number of houses being represented in this histogram.
Answer: ____________________

Step 1. Find the lower class boundary for the second class.
Answer: ____________________

Step 2. Find the upper class boundary for the third class.
Answer: ____________________

Step 3. Find the value that should be written at the location indicated by the [?] on the vertical axis of the graph.

Step 4. Find the value that should be written at the location indicated by the [?] on the horizontal axis of the graph.

Step 1. Determine the mean of the given data.
Answer: ____________________

Step 2. Determine the median of the given data.
Answer: ____________________

Body Temperatures (in ºF) of Adult Males
98.2 97.6 96.5 96.6 97.8
98.7 98.3 99.3 98.2 98.0
96.4 98.5 98.9 99.1 97.2
97.3 99.0 96.6 98.5 96.5

A) False the standard deviation can never be zero because it measures the distance from the mean and distances are always greater than zero.

B) True since the standard deviation is equal to the mean, all the data values must be zero.

C) False if the standard deviation is zero, then all of the data values are equal to the mean.

Based on the data and assuming these trends continue, which company would give Donna a stable long-term investment?

A) Perfect Plungers Plus the smaller standard deviation indicates that Perfect Plungers Plus has a greater mean closing price than Masterful Pocketwatches.

B) Masterful Pocketwatches the larger standard deviation indicates that Masterful Pocketwatches has less variability in its closing prices than Perfect Plungers Plus.

C) Perfect Plungers Plus the smaller standard deviation indicates that Perfect Plungers Plus has less variability in its closing prices than Masterful Pocketwatches.

Step 1. For each of the above sets of sample data, calculate the coefficient of variation, CV. Round to one decimal place.

CV for Data Set A: _______________%
CV for Data Set B: _______________%

Step 2. Which of the above sets of sample data has the larger spread?

Step 1. Based on the given information, determine if the following statement is true or false.
Approximately 64% of the salaries are above $29,700.

Step 2. Based on the given information, determine if the following statement is true or false.
Joe's salary of $34,430 is 1.10 standard deviations above the mean.

Step 3. Based on the given information, determine if the following statement is true or false.
The percentile rank of $25,800 is 50.

Step 4. Based on the given information, determine if the following statement is true or false.
Approximately 14% of the salaries are between $25,700 and $29,700.


Concept Review

أ histogram is a graphic version of a frequency distribution. The graph consists of bars of equal width drawn adjacent to each other. The horizontal scale represents classes of quantitative data values and the vertical scale represents frequencies. The heights of the bars correspond to frequency values. Histograms are typically used for large, continuous, quantitative data sets. A frequency polygon can also be used when graphing large data sets with data points that repeat. The data usually goes on ذ-axis with the frequency being graphed on the x-محور. Time series graphs can be helpful when looking at large amounts of data for one variable over a period of time.


شاهد الفيديو: 13 رسومات جدول التوزيع التكراري المدرج التكراري الاحصاء الفصل الثالث جدول التوزيع (ديسمبر 2021).