علامة الدرجة لما يخدم ، وكيف يتم أخذها وأمثلة



ال العلامة التجارية الطبقة, تُعرف أيضًا بالنقطة الوسطى ، هي القيمة الموجودة في وسط الفصل ، والتي تمثل جميع القيم الموجودة في هذه الفئة. في الأساس ، يتم استخدام علامة فئة لحساب معلمات معينة ، مثل الوسط الحسابي أو الانحراف المعياري.

ثم ، علامة الفئة هي نقطة الوسط في أي فاصل. هذه القيمة مفيدة جدًا أيضًا للعثور على تباين مجموعة من البيانات التي تم تجميعها بالفعل في الفصول ، مما يتيح لنا بدوره فهم مدى بعيدًا عن العثور على هذه البيانات المحددة.

مؤشر

  • 1 توزيع التردد
    • 1.1 كم عدد الطبقات في الاعتبار?
  • 2 كيف تحصل?
    • 2.1 مثال
  • 3 ما هذا؟?
    • 3.1 مثال
  • 4 المراجع

توزيع التردد

لفهم ماهية العلامة التجارية للفئات ، يعد مفهوم توزيع التردد ضروريًا. في حالة وجود مجموعة بيانات ، يكون توزيع التردد عبارة عن جدول يقسم هذه البيانات إلى عدد من الفئات تسمى الفئات.

يوضح هذا الجدول ما هو عدد العناصر التي تنتمي إلى كل فئة ؛ هذا الأخير هو المعروف باسم التردد.

في هذا الجدول ، يتم التضحية بجزء من المعلومات التي نحصل عليها من البيانات ، لأنه بدلاً من الحصول على القيمة الفردية لكل عنصر ، فإننا نعرف فقط أنها تنتمي إلى الفصل المذكور..

من ناحية أخرى ، نكتسب فهمًا أفضل لمجموعة البيانات ، لأنه بهذه الطريقة يكون من الأسهل تقدير الأنماط الثابتة ، مما يسهل معالجة البيانات المذكورة..

كم عدد الطبقات للنظر?

لإجراء توزيع للترددات ، يجب أولاً تحديد عدد الفئات التي نريد أن نأخذها واختيار حدودها.

يجب أن يكون اختيار عدد الفصول الدراسية مناسبًا ، مع الأخذ في الاعتبار أن عددًا صغيرًا من الفصول يمكنه إخفاء معلومات حول البيانات التي نريد دراستها وأن فئة كبيرة جدًا يمكنها توليد الكثير من التفاصيل غير المفيدة بالضرورة.

العوامل التي يجب أن نأخذها في الاعتبار عند اختيار عدد الفصول الدراسية التي يجب أخذها عديدة ، ولكن من بين هاتين الفئتين تبرز: الأول هو أن نأخذ في الاعتبار كمية البيانات التي يجب أخذها في الاعتبار ؛ والثاني هو معرفة حجم التوزيع (أي الفرق بين الملاحظة الأكبر والأصغر).

بعد تحديد الفئات بالفعل ، ننتقل إلى حساب كمية البيانات الموجودة في كل فصل. يُسمى هذا الرقم تردد الفئة ويُشار إليه بواسطة fi.

كما قلنا سابقًا ، لدينا توزيع تردد يفقد المعلومات التي تأتي بشكل فردي من كل البيانات أو الملاحظة. لذلك ، يتم البحث عن قيمة تمثل الفصل بأكمله الذي ينتمي إليه ؛ هذه القيمة هي العلامة التجارية للفئات.

كيف تحصل?

علامة الفئة هي القيمة المركزية التي تمثلها الفئة. يتم الحصول عليها عن طريق إضافة حدود الفاصل الزمني وتقسيم هذه القيمة على اثنين. هذا يمكننا التعبير رياضيا على النحو التالي:

سأنا= (الحد الأدنى + الحد الأعلى) / 2.

في هذا التعبير سأنا يدل على علامة الطبقة إيث.

مثال

بالنظر إلى مجموعة البيانات التالية ، أعط توزيعًا تمثيليًا للتردد واحصل على العلامة المميزة المقابلة.

بما أن البيانات ذات القيمة العددية الأكبر هي 391 والأصغر هي 221 ، لدينا أن النطاق هو 391 -221 = 170.

سنختار 5 فصول ، بنفس الحجم. طريقة واحدة لاختيار الفئات هي كما يلي:

لاحظ أن كل البيانات موجودة في الفصل ، وهي مفككة ولها نفس القيمة. هناك طريقة أخرى لاختيار الفئات وهي النظر في البيانات كجزء من متغير مستمر ، والذي قد يصل إلى أي قيمة حقيقية. في هذه الحالة ، يمكننا النظر في فئات النموذج:

205-245 ، 245-285 ، 285-325 ، 325-365 ، 365-405

ومع ذلك ، يمكن لطريقة تجميع البيانات هذه تقديم أوجه غموض معينة بحدود. على سبيل المثال ، في حالة 245 ، السؤال الذي يطرح نفسه: إلى أي فئة تنتمي إليها ، إلى الأولى أو الثانية؟?

لتجنب هذه الالتباسات ، يتم عقد اتفاقية من النقاط المتطرفة. بهذه الطريقة ، ستكون الفئة الأولى هي الفاصل الزمني (205،245) ، والثاني (245،285) ، وهكذا.

بمجرد تعريف الفئات ، ننتقل إلى حساب التكرار ولدينا الجدول التالي:

بعد الحصول على توزيع تردد البيانات ، ننتقل إلى العثور على علامات فئة كل فاصل. في الواقع ، يتعين علينا:

س1= (205+ 245) / 2 = 225

س2= (245+ 285) / 2 = 265          

س3= (285 + 325) / 2 = 305

س4= (325+ 365) / 2 = 345

س5= (365+ 405) / 2 = 385

يمكننا تمثيل ذلك بالرسم التالي:

ما هذا؟?

كما ذكرنا سابقًا ، تعد علامة الفصل وظيفية للغاية للعثور على الوسط الحسابي والتباين لمجموعة من البيانات التي تم تجميعها بالفعل في فئات مختلفة.

يمكننا تحديد المتوسط ​​الحسابي كمجموع الملاحظات التي تم الحصول عليها بين حجم العينة. من وجهة نظر مادية ، فإن تفسيرها يشبه نقطة التوازن لمجموعة البيانات.

قد يكون تحديد مجموعة كاملة من البيانات برقم واحد أمرًا محفوفًا بالمخاطر ، لذلك يجب علينا أيضًا مراعاة الفرق بين نقطة التوازن والبيانات الحقيقية. تُعرف هذه القيم باسم الانحراف عن الوسط الحسابي ، وبهذه القيم نسعى إلى تحديد مقدار اختلاف الوسط الحسابي للبيانات.

الطريقة الأكثر شيوعًا للعثور على هذه القيمة هي التباين ، وهو متوسط ​​مربعات الانحرافات عن المتوسط ​​الحسابي.

لحساب المتوسط ​​الحسابي وتباين مجموعة من البيانات التي تم تجميعها في الفصل ، نستخدم الصيغ التالية ، على التوالي:

في هذه التعبيرات xأنا  هي العلامة التجارية من الدرجة الأولى ، وأنا يمثل التردد المقابل و k عدد الفئات التي تم تجميع البيانات فيها.

مثال

باستخدام البيانات الواردة في المثال السابق ، يمكننا توسيع بيانات جدول توزيع التردد أكثر قليلاً. تحصل على ما يلي:

ثم ، عند استبدال البيانات في الصيغة ، تركنا أن المتوسط ​​الحسابي هو:

التباين والانحراف المعياري هما:

من هذا يمكننا أن نستنتج أن البيانات الأصلية لها متوسط ​​حسابي قدره 306.6 وانحراف معياري قدره 39.56.

مراجع

  1. فرنانديز ف. سانتياغو ، قرطبة ل. أليخاندرو ، كورديرو س. خوسيه م. Esic الافتتاحية.
  2. جونسون ريتشارد أ. ميلر و Freund الاحتمالات ورجال الدولة للمهندسين. التعليم بيرسون.
  3. ميلر الأول و Freund J. الاحتمالات ورجال الدولة للمهندسين. REVERTE.
  4. سارابيا أ. خوسيه ماريا ، باسكوال مارتا. دورة الإحصاء الأساسية للشركات
  5. Llinás S. Humberto، Rojas A. Carlos وصفي إحصائي وتوزيعات الاحتمال. جامعة ديل نورت الافتتاحية