مقالات

1.6.11.1: البيانات النوعية


تذكر أن البيانات النوعية هي كلمات تصف إحدى سمات الفرد. تتضمن هذه الرسوم البيانية الرسوم البيانية الشريطية ومخططات باريتو والمخططات الدائرية.

تعد المخططات الدائرية والرسوم البيانية الشريطية أكثر الطرق شيوعًا لعرض البيانات النوعية. يمكن لبرنامج جداول البيانات مثل Excel إنشاء كلاهما. الخطوة الأولى لأي رسم بياني هي عمل ملف التردد أو جدول التردد النسبي. جدول التكرار هو ملخص للبيانات مع عدد مرات حدوث قيمة البيانات (أو الفئة).

مثال ( PageIndex {1} )

لنفترض أن لديك البيانات التالية لأي نوع من طلاب السيارات في القيادة الجامعية؟

فورد ، تشيفي ، هوندا ، تويوتا ، تويوتا ، نيسان ، كيا ، نيسان ، تشيفي ، تويوتا ، هوندا ، تشيفي ، تويوتا ، نيسان ، فورد ، تويوتا ، نيسان ، مرسيدس ، تشيفي ، فورد ، نيسان ، تويوتا ، نيسان ، فورد ، تشيفي ، تويوتا ، نيسان ، هوندا ، بورش ، هيونداي ، تشيفي ، تشيفي ، هوندا ، تويوتا ، تشيفي ، فورد ، نيسان ، تويوتا ، تشيفي ، هوندا ، تشيفي ، زحل ، تويوتا ، تشيفي ، تشيفي ، نيسان ، هوندا ، تويوتا ، تويوتا ، نيسان

حل

من الصعب جدًا النظر إلى قائمة البيانات وتحليلها ، لذلك تحتاج إلى تلخيصها. تحتاج أولاً إلى تحديد الفئات. في هذه الحالة يكون الأمر سهلًا نسبيًا ؛ فقط استخدم نوع السيارة. ومع ذلك ، هناك العديد من السيارات التي تحتوي على سيارة واحدة فقط في القائمة. في هذه الحالة يكون من الأسهل إنشاء فئة تسمى أخرى للفئة ذات القيم المنخفضة. الآن فقط احسب عدد السيارات الموجودة في كل نوع. على سبيل المثال ، هناك 5 سيارات فورد و 12 شيفروليه و 6 سيارات هوندا. يمكن وضع هذا في توزيع التردد:

كاتيوجريتكرر
معقل5
يزعج12
هوندا6
تويوتا12
نيسان10
آخر5
مجموع50
الجدول ( PageIndex {1} ): جدول التردد لنوع بيانات السيارة

يجب أن يكون إجمالي عمود التردد هو عدد المشاهدات في البيانات.

نظرًا لأن الأرقام الأولية ليست مفيدة لإخبار الآخرين ، فمن الأفضل إنشاء عمود ثالث يعطي التكرار النسبي لكل فئة. هذا هو التردد فقط مقسومًا على الإجمالي. كمثال لفئة فورد:

التردد النسبي (= dfrac {5} {50} = 0.10 )

يمكن كتابة هذا في صورة عدد عشري أو كسر أو نسبة مئوية. لديك الآن توزيع تكراري نسبي:

فئةتكررالتردد النسبي
معقل50.10
يزعج120.24
هوندا60.12
تويوتا120.24
نيسان100.20
آخر50.10
مجموع501.00
الجدول ( PageIndex {2} ): جدول التردد النسبي لنوع بيانات السيارة

يجب أن يصل عمود التكرار النسبي إلى 1.00. قد يكون متوقفًا قليلاً بسبب أخطاء التقريب.

الآن بعد أن أصبح لديك جدول التكرار والتكرار النسبي ، سيكون من الجيد عرض هذه البيانات باستخدام رسم بياني. هناك عدة أنواع مختلفة من الرسوم البيانية التي يمكن استخدامها: مخطط شريطي ومخطط دائري ومخططات باريتو.

الرسوم البيانية الشريطية أو المخططات تتكون من الترددات على أحد المحاور والفئات على المحور الآخر. ثم ترسم مستطيلات لكل فئة بارتفاع (إذا كان التردد على المحور الرأسي) أو طول (إذا كان التردد على المحور الأفقي) يساوي التردد. يجب أن تكون جميع المستطيلات بنفس العرض ، ويجب أن يكون هناك فجوات عرض متساوية بين كل شريط.

مثال ( PageIndex {2} ) رسم رسم بياني شريطي

ارسم مخططًا بيانيًا شريطيًا للبيانات في مثال ( PageIndex {1} ).

حل

فئةتكررالتردد النسبي
معقل50.10
يزعج120.24
هوندا60.12
تويوتا120.24
نيسان100.20
آخر50.10
مجموع501.00
الجدول ( PageIndex {2} ): جدول التردد النسبي لنوع بيانات السيارة

ضع التردد على المحور الرأسي والفئة على المحور الأفقي.

ثم ارسم فقط مربعًا فوق كل فئة يكون ارتفاعها هو التردد.

يتم رسم جميع الرسوم البيانية باستخدام (ص ). الأمر الموجود في (R ) لإنشاء رسم بياني شريطي هو:

متغير <-c (اكتب النسب المئوية أو الترددات لكل فئة مع وجود فاصلات بين القيم)

barplot (متغير ، names.arg = c ("اكتب اسم الفئة الأولى" ، "اكتب اسم الفئة الثانية" ، ... ، "اكتب اسم الفئة الأخيرة") ،

ylim = c (0 ، رقم فوق الحد الأقصى) ، xlab = "اكتب تسمية لمحور x" ، ylab = "اكتب في تسمية لمحور y" ، ylim = c (0 ، رقم أعلى قيمة y القصوى) ، main = "اكتب العنوان" ، col = "اكتب لونًا") - ينشئ رسمًا بيانيًا شريطيًا للبيانات بلون إذا كنت تريد ذلك.

في هذا المثال سيكون الأمر:

السيارة <-c (5، 12، 6، 12، 10، 5)

barplot (car، names.arg = c ("Ford"، "Chevy"، "Honda"، "Toyota"، "Nissan"، "Other")، xlab = "Type of Car"، ylab = "Frequency"، ylim = c (0،12)، main = "نوع السيارة التي يقودها طلاب الكلية"، col = "blue")

الشكل الخاص بنوع بيانات السيارة

لاحظ من الرسم البياني ، يمكنك أن ترى أن تويوتا وشيفي هما السيارة الأكثر شعبية ، مع نيسان ليست بعيدة. يبدو أن فورد هو نوع السيارة التي يمكنك أن تقول أنها الأقل إعجابًا ، على الرغم من أن السيارات في الفئة الأخرى ستكون أقل إعجابًا من فورد.

بعض الميزات الرئيسية للرسم البياني الشريطي:

  • تباعد متساوي على كل محور.
  • القضبان هي نفس العرض.
  • يجب أن تكون هناك تسميات على كل محور وعنوان للرسم البياني.
  • يجب أن يكون هناك مقياس على محور التردد ويجب إدراج الفئات على محور الفئة.
  • القضبان لا تلمس.

يمكنك أيضًا رسم رسم بياني شريطي باستخدام التردد النسبي على المحور الرأسي. يكون هذا مفيدًا عندما تريد مقارنة عينتين بأحجام عينات مختلفة. يجب أن يبدو الرسم البياني للتردد النسبي والرسم البياني للتردد متماثلين ، باستثناء القياس على محور التردد.

باستخدام R ، سيكون الأمر:

السيارة <-c (0.1 ، 0.24 ، 0.12 ، 0.24 ، 0.2 ، 0.1)

barplot (car، names.arg = c ("Ford"، "Chevy"، "Honda"، "Toyota"، "Nissan"، "Other")، xlab = "نوع السيارة"، ylab = "التردد النسبي"، main = "نوع السيارة التي يقودها طلاب الكلية" ، العمود = "أزرق" ، ylim = c (0، .25))

الشكل الخاص بنوع بيانات السيارة

هناك نوع آخر من الرسم البياني للبيانات النوعية وهو الرسم البياني الدائري. المخطط الدائري هو المكان الذي توجد فيه دائرة وتقوم بتقسيم أجزاء من الدائرة إلى أشكال دائرية تتناسب مع حجم التردد النسبي. هناك 360 درجة في دائرة كاملة. التردد النسبي هو مجرد النسبة المئوية كعدد عشري. كل ما عليك فعله لإيجاد الزاوية بضرب التردد النسبي في 360 درجة. تذكر أن 180 درجة نصف دائرة و 90 درجة ربع دائرة

مثال ( PageIndex {3} ) رسم مخطط دائري

ارسم مخططًا دائريًا للبيانات في مثال ( PageIndex {1} ).

تحتاج أولاً إلى الترددات النسبية.

فئةتكررالتردد النسبي
معقل50.10
يزعج120.24
هوندا60.12
تويوتا120.24
نيسان100.20
آخر50.10
مجموع501.00
الجدول ( PageIndex {2} ): جدول التردد النسبي لنوع بيانات السيارة

حل

ثم تقوم بضرب كل تردد نسبي ب 360 درجة للحصول على قياس الزاوية لكل فئة.

فئةالتردد النسبيالزاوية (بالدرجات (°))
معقل0.1036.0
يزعج0.2486.4
هوندا0.1243.2
تويوتا0.2486.4
نيسان0.2072.0
آخر0.1036.0
مجموع1.00360.0
الجدول ( PageIndex {3} ): زوايا المخطط الدائري لنوع بيانات السيارة

الآن ارسم المخطط الدائري باستخدام بوصلة ومنقلة وحافة مستقيمة. يفضل التكنولوجيا. إذا كنت تستخدم التكنولوجيا ، فلا داعي للترددات النسبية أو الزوايا.

يمكنك استخدام R لرسم المخطط الدائري. في R ، ستكون الأوامر:

فطيرة (متغير ، ملصقات = c ("اكتب اسم الفئة الأولى" ، "اكتب اسم الفئة الثانية" ، ... ، "اكتب اسم الفئة الأخيرة") ، main = "اكتب في العنوان" ، col = قوس قزح ( عدد الفئات)) - إنشاء مخطط دائري مع عنوان وقوس قزح من الألوان لكل فئة.

في هذا المثال ، ستكون الأوامر:

السيارة <-c (5، 12، 6، 12، 10، 5)

فطيرة (car، labels = c ("Ford، 10٪"، "Chevy، 24٪"، "Honda، 12٪"، "Toyota، 24٪"، "Nissan، 20٪"، "Other، 10٪") ، main = "نوع السيارة التي يقودها طلاب الكلية" ، العمود = قوس قزح (6))

الشكل ( PageIndex {3} ): مخطط دائري لنوع بيانات السيارة

كما ترون من الرسم البياني ، فإن تويوتا وشيفي أكثر شهرة ، في حين أن السيارات في الفئة الأخرى تحظى بشعبية أقل. من بين السيارات التي يمكنك تحديدها من الرسم البياني ، فإن Ford أقل إعجابًا من السيارات الأخرى.

المخططات الدائرية مفيدة لمقارنة أحجام الفئات. تظهر المخططات الشريطية معلومات مماثلة. لا يهم حقًا أيهما تستخدمه. إنه حقًا تفضيل شخصي وأيضًا المعلومات التي تحاول معالجتها. ومع ذلك ، تكون المخططات الدائرية هي الأفضل عندما يكون لديك فئات قليلة فقط ويمكن التعبير عن البيانات كنسبة مئوية. ليس من الضروري أن تكون البيانات نسبًا لرسم المخطط الدائري ، ولكن إذا كانت قيمة البيانات يمكن أن تتناسب مع فئات متعددة ، فلا يمكنك استخدام مخطط دائري. على سبيل المثال ، إذا كنت تسأل الناس عن منتزههم الوطني المفضل ، وقلت لاختيار أفضل ثلاثة خيارات ، فإن العدد الإجمالي للإجابات يمكن أن يصل إلى أكثر من 100٪ من الأشخاص المعنيين. لذلك لا يمكنك استخدام مخطط دائري لعرض الحديقة الوطنية المفضلة.

النوع الثالث من الرسم البياني للبيانات النوعية هو أ مخطط باريتو، وهو مجرد مخطط شريطي به الأشرطة مرتبة بأعلى ترددات على اليسار. فيما يلي مخطط باريتو للبيانات في مثال ( PageIndex {1} ).

الشكل ( PageIndex {4} ): مخطط باريتو لنوع بيانات السيارة

ميزة مخططات باريتو هي أنه يمكنك أن ترى بصريًا الإجابة الأكثر شيوعًا للإجابة الأقل شيوعًا. هذا مفيد بشكل خاص في تطبيقات الأعمال ، حيث تريد معرفة الخدمات التي يفضلها عملاؤك أكثر ، وما هي العمليات التي تؤدي إلى المزيد من الإصابات ، والمشكلات التي يجدها الموظفون أكثر أهمية ، ونوع آخر من الأسئلة مثل هذه.

هناك العديد من الأنواع الأخرى من الرسوم البيانية التي يمكن استخدامها في البيانات النوعية. هناك حزم برامج جداول بيانات ستنشئ معظمها ، ومن الأفضل النظر إليها لمعرفة ما يمكن فعله. يعتمد ذلك على بياناتك التي قد تكون مفيدة. يوضح المثال التالي أحد هذه الأنواع المعروفة باسم الرسم البياني متعدد الأعمدة.

مثال ( PageIndex {4} ) رسم بياني شريطي متعدد

في لعبة Wii Fit ، يمكنك أداء أربعة أنواع مختلفة من التمارين: اليوجا ، والقوة ، والأيروبيك ، والتوازن. يتتبع نظام Wii عدد الدقائق التي تقضيها في كل تمرين يوميًا. الرسم البياني التالي هو بيانات ديلان على مدى أسبوع واحد. ناقش أي مؤشر يمكنك الاستدلال عليه من الرسم البياني.

الشكل ( PageIndex {5} ): مخطط شريطي متعدد لبيانات Wii Fit

حل

يبدو أن ديلان يقضي وقتًا أطول في تمارين التوازن أكثر من أي تمارين أخرى في أي يوم. يبدو أنه يقضي وقتًا أقل في تمارين القوة في يوم معين. هناك عدة أيام يكون فيها مقدار التمرين في الفئات المختلفة متساويًا تقريبًا.

فائدة الرسم البياني الشريطي المتعدد هي القدرة على مقارنة عدة فئات مختلفة على متغير آخر ، في المثال ( PageIndex {4} ) سيكون المتغير هو الوقت. هذا يسمح للشخص بتفسير البيانات بسهولة أكبر.

الواجب المنزلي

تمرين ( PageIndex {1} )

  1. تقوم شركة Eyeglassomatic بتصنيع النظارات لمختلف تجار التجزئة. عدد العدسات للأنشطة المختلفة موجود في مثال ( PageIndex {4} ).
    نشاططحنمتعدد الطبقاتجمعيهاصنع إطاراتانتهى الاستلاممجهول
    عدد العدسات1887212105433325880269911508

    جدول ( PageIndex {4} ): بيانات Eyeglassomatic
    الطحن يعني أنها تقوم بتأريض العدسات ووضعها في إطارات ، وتعني طبقة الطلاء المتعددة أنها تضع طلاءًا مقاومًا للخدش أو الصبغ على العدسات ثم تضعها في إطارات ، وتجميعها يعني أنها تتلقى إطارات وعدسات من مصادر أخرى وتجمعها معًا ، وتصنع إطارات يعني أنهم يصنعون الإطارات ويضعون العدسات من مصادر أخرى ، ويتلقون الوسائل النهائية أنهم تلقوا نظارات من مصدر آخر ، ويعني غير معروف أنهم لا يعرفون من أين أتت العدسات. قم بعمل مخطط شريطي ومخطط دائري لهذه البيانات. اذكر أي نتائج يمكنك رؤيتها من الرسوم البيانية.

  2. لتحليل كيفية سفر عمال أريزونا الذين تبلغ أعمارهم 16 عامًا أو أكثر للعمل ، تم جمع النسبة المئوية للعمال الذين يستخدمون مرافقي السيارات والمركبات الخاصة (وحدها) ووسائل النقل العام. قم بإنشاء مخطط شريطي ومخطط دائري للبيانات في مثال ( PageIndex {5} ). اذكر أي نتائج يمكنك رؤيتها من الرسوم البيانية.
    نوع وسيلة النقلنسبة مئوية
    كاربول11.6%
    مركبة خاصة (وحدها)75.8%
    وسائل النقل العامة2.0%
    آخر10.6%
    الجدول ( PageIndex {5} ): بيانات وضع السفر لعمال أريزونا
  3. عدد الوفيات في الولايات المتحدة بسبب التسمم بأول أكسيد الكربون (CO) من المولدات من 1999 إلى 2011 في الجدول رقم 2.1.6 (Hinatov ، 2012). قم بإنشاء مخطط شريطي ومخطط دائري لهذه البيانات. اذكر أي نتائج تراها من الرسوم البيانية.
    منطقةعدد الوفيات من أول أكسيد الكربون أثناء استخدام مولد
    الأساسية الحضرية401
    من الضواحى97
    ريف كبير86
    ريف صغير / منعزل111
    الجدول ( PageIndex {6} ): بيانات عدد الوفيات الناجمة عن التسمم بأول أكسيد الكربون
  4. تستخدم المنازل في ولاية كونيتيكت الغاز أو زيت الوقود أو الكهرباء كمصدر للتدفئة. يوضح المثال ( PageIndex {7} ) النسبة المئوية للأسر التي تستخدم أحد هذه المنازل كمصادر أساسية للتدفئة ("استخدام الكهرباء ،" 2013) ، ("استخدام زيت الوقود ،" 2013) ، ("استخدام الغاز ،" 2013). اذكر أي نتائج تراها من الرسوم البيانية.
    مصدر التسخيننسبة مئوية
    كهرباء15.3%
    زيت الوقود46.3%
    غاز35.6%
    آخر2.85
    الجدول ( PageIndex {7} ): بيانات مصادر التدفئة المنزلية
  5. تقوم شركة Eyeglassomatic بتصنيع النظارات لمختلف تجار التجزئة. إنهم يختبرون لمعرفة عدد العدسات المعيبة التي صنعوها خلال الفترة الزمنية من 1 كانون الثاني (يناير) إلى 31 آذار (مارس). يوضح المثال ( PageIndex {8} ) العيب وعدد العيوب. قم بإنشاء مخطط باريتو للبيانات ثم قم بوصف ما يخبرك به هذا حول أسباب معظم العيوب.
    نوع العيبعدد العيوب
    خدش5865
    الشكل الصحيح - صغير4613
    مقشر1992
    المحور الخاطئ1838
    شطب خطأ1596
    جنون ، شقوق1546
    شكل خاطئ1485
    PD خاطئ1398
    البقع والفقاعات1371
    ارتفاع خاطئ1130
    الشكل الصحيح - كبير1105
    فقدت في المختبر976
    البقع / الفقاعة - المتدرب976
    الجدول ( PageIndex {8} ): بيانات نوع العيب
  6. طُلب من الناس في بنغلاديش تحديد نوع طريقة تحديد النسل التي يستخدمونها. النسب المئوية معطاة في مثال ( PageIndex {9} ) ("استخدام وسائل منع الحمل ،" 2013). قم بإنشاء مخطط باريتو للبيانات ثم اذكر أي نتائج يمكنك الحصول عليها من الرسم البياني.
    طريقةنسبة مئوية
    واق ذكري4.50%
    حبوب منع الحمل28.50%
    الامتناع الدوري4.90%
    حقنة7.00%
    تعقيم النساء5.00%
    اللولب0.90%
    تعقيم الذكور0.70%
    انسحاب2.90%
    طرق حديثة أخرى0.70%
    طرق تقليدية أخرى0.60%
    الجدول ( PageIndex {9} ): بيانات نوع تحديد النسل
  7. يتم عرض النسب المئوية للأشخاص الذين يستخدمون بعض وسائل منع الحمل في بلدان أمريكا الوسطى في الرسم البياني 2.1.6 ("استخدام وسائل منع الحمل ،" 2013). اذكر أي نتائج يمكنك الحصول عليها من الرسم البياني.

الشكل ( PageIndex {6} ): مخطط شريطي متعدد لأنواع وسائل منع الحمل

إجابه

انظر الحلول


شاهد الفيديو: مبادئ الاحصاء: البيانات وأنواعها تعريفها ومصادر الحصول عليها (شهر نوفمبر 2021).