logo

logo

logo

logo

logo

المقاييس الإحصائية

مقاييس احصاييه

Statistical measures - Mesures statistiques

المقاييس الإحصائية

 

الإحصاء statistics علم نظري وتطبيقي حديث من علوم القرن العشرين يبحث في تقنيات جمع البيانات وتحليلها واستخلاص النتائج منها. وتطبيقاته في الطريقة العلمية كثيرة، وتم تطويره من أجلها. وهي تمثل في الأوجه المتعددة لتصميم التجارب، بدءاً من تخطيطها الأولي، إلى تنفيذها وجمع بياناتها data ثم تحليل نتائجها للوصول إلى استقراء إحصائي سليم يُستخلص منها. ويرى كثير من العلماء، وخاصة الباحثين منهم في العلوم الحيوية المختلفة أن هذا العلم بدأ فعلاً نحو عام 1925 عندما نشر رونالد فيشر[ر] Ronald Fisher كتابه المسمى «الطرائق الإحصائية للعاملين في البحث» Statistical Methods for Research Workers.

تشترك الطرائق العلمية scientific methods بصفات أساسية، فهي تهدف إلى مراجعة الحقائق والنظريات والمقترحات، مع الاهتمام بتكوين فرضيات hypothesis منطقية جديدة لاختبارها بطرائق تجريبية experimental methods، وتقويمها تقويماً موضوعياً مستنِداً إلى النتائج التجريبية. ويضع الإحصائيون في الحسبان أن العلم science فرع دراسي يتعامل مع الملاحظات observations وتصنيف الحقائق، ومن ثم فإن العالِم scientist يجب أن يكون قادراً على ملاحظة واقعة event أو مجموعة من الوقائع الناتجة من مخطط plan أو تصميم design، وهذه هي التجربة experiment، ومن ثم فإن التصميم التجريبي experimental design هو فرع رئيس من فروع علم الإحصاء.

يتعامل الباحثون مع بيانات رقمية تعدّ المادة الخام لدراساتهم، ففي إنتاج الحليب مثلاً قد يكون الباحث مهتماً بكمية الحليب أو بنسبة الدسم أو بمعرفة تأثير نقص عنصر غذائي في معدلات الإنتاج. وقد يهتم باحث آخر بتحديد درجة مقاومة خلائط معدنية معينة لدرجات الحرارة المرتفعة، وهكذا.. ويعلم الباحثون دوماً أنهم يتعاملون مع بيانات رقمية سمتها الرئيسة هي التشتت أو التباين variation.

يستخدم الباحثون واحداً أو أكثر من المقاييس الإحصائية statistical measures لوصف البيانات التي يحصلون عليها من تجربة استخدموا فيها عينة عشوائية random sample أو أكثر حصلوا عليها من المجموع population المدروس. ويمكن تصنيف هذه المقاييس في مجموعتين رئيسيتين:

1 - مقاييس النزعة المركزية central tendency measures

وهي مؤشرات إحصائية مهمة وواسعة الانتشار، توفر للباحث فكرة سريعة وجيدة عن السلوك المركزي لبيانات تتعلق بصفة درسها، أو بعدة صفات. وقد أُطلق عليها هذا الاسم لأن المجموعات الطبيعية natural populations الكبيرة العدد كافة تسلك سلوكاً محدداً من حيث توزع أفرادها، والتي تتجمع حول القيمة الوسطى أو تبقى المتوسط الحسابي. ومن أهمها ما يأتي:

أ- المتوسط الحسابي arithmetic mean (average): وهو من أكثر المقاييس الإحصائية شيوعاً واستعمالاً، ومن أفضلها في كثير من الأحوال. يُرمز له بـ ويُحسب بقسمة مجموع قيم أفراد العينة على عدد هذه القيم (n):

كانت أطوال عينة مؤلفة من 10 رجال في عمر 45 عاماً على النحو الآتي:

148، 158،161 ،160 ،190 ،170 ،166 ،162 ،154 ،182 سم، وبذلك يكون متوسطها الحسابي:

يتميز متوسط المجموع بكونه قيمة ثابتة لا تتغير إلا إذا حدث تغير في أفراده (قيمه)، ولا يمكن قياس هذا المتوسط مباشرة في حال المجموعات الكبيرة، لذلك فإنه يُخمَّن بوساطة متوسط العينة أو العينات، وهذه المتوسطات غير ثابتة بل عرضة للتغيير. ويُقاس المتوسط الحسابي الوحدات بنفسها المستخدمة في قياس أفراد العينة (كغ، سم، فولط، …). كما يتميز بأن مجموع انحرافات قيمه عن قيمته تساوي الصفر، أي أن:

وبالنسبة للمثال السابق:

ب- المتوسط الهندسي geometric mean (G) والمتوسط التوافقي harmonic mean (H): يفيد استخدام هذين المتوسطين في حالة الأرقام الموجبة، وإن استخداماتهما الأساسية تنحصر في حساب قيم نسبية مثل الأدلة indexes والنسب ratios والمعَدَّلات rates. ويمكن حسابهما بالمعادلتين الآتيتين:

المتوسط الهندسي:

مثال: ازدادت أرباح مبيعات شركة إنتاج الملابس من 200 ألف ليرة سورية عام 1995 إلى 350 ألف ليرة سورية عام 2000، ومن ثم فإن المتوسط الهندسي في هذه الفترة هو:

المتوسط التوافقي:

مثال: المتوسط التوافقي للقيم: 12، 10، 7، 6، 6، 5، 3، هو:

H= 5.28

ج- الوسيط median: وهو القيمة التي يقع 50% من قيم العينات على كل من طرفيها حين ترتيبها تصاعدياً أو تنازلياً.

- إذا كان عدد القيم إفرادياً: 25، 23، 19، 18،19 ،16، 15، الوسيط هو القيمة 19.

- إذا كان عدد القيم زوجياً: 46، 44، 41، 32، 29، 28، الوسيط هو: 2/(41 + 32) = 36.5.

د- المنوال mode: وهي القيمة الأكثر تردداً في العينة المدروسة، وهي 45 في البيانات الآتية: 10، 45، 33، 33، 16، 45، 22، 18، 45.

العلاقة بين المتوسط الحسابي والوسيط والمنوال:

يبين الشكل (1) المواقع النسبية بين قيم المتوسط الحسابي والوسيط والمنوال على منحنيات تكرارية منحرفة skewed إلى اليمين وإلى اليسار، وتتطابق هذه القيم في حالة المنحنيات التكرارية المتناظرة symmetrical.

   

الشكل (1)

   

2 - مقاييس التباين (التشتت) measures of variation:

تتضح الحاجة إلى مقياس أو مقاييس للتباين الخاص ببيانات ما من دراسة المثال الآتي الموضح لبيانات ثلاث عينات (بالمتر):

أ) 12، 12، 11، 10، 9، 8، 8.

ب) 15، 14، 12، 10، 8، 6، 5.

ج) 19، 18، 15، 10، 5، 2، 1.

المتوسط الحسابي لكل من هذه العينات هو 10 أمتار، لكن الملاحظ وجود تباينات واضحة بين قيم أفراد كل عينة، لا يقدم المتوسط الحسابي أي بيانات عنها، وبالتالي يلجأ الباحثون إلى استخدام أحد مقاييس التباين، أو أكثر من واحد منها، بغية وصف العينة وصفاً دقيقاً، ومن أهمها ما يأتي:

أ - المدى range: وهو قيمة الفرق بين أكبر وأصغر قيمتين في العينة، ومن ثم فإنه يبلغ 12-8=4 م، 15-5=10 م، و19-1=18 م، في العينات السابقة الثلاث.

ليس المدى مقياساً كفوءاً للتباين، إذ إن قيمته تتأثر بقيمتين فقط هما الكبرى والصغرى، ولا تتأثر إطلاقاً بأي من القيم الأخرى ضمن العينة، حتى لو تم تغيير قيم ضمن بيانات العينة أو حذفها أو إضافتها، مادام أنها لم تتعدى القيمتين الصغرى والكبرى فيها.

ب - التباين (الفاريانس) variance والانحراف القياسي (أو المعياري) standard deviation: وهما المقياسان الأكثر استعمالاً والأكثر كفاءة لقياس مقدار التباين في البيانات المدروسة. ويرمز لهما بـ σ2 لتباين (تشتت) المجموع وσ للانحراف القياسي للمجموع، ويقابلهما s 2 لتباين العينة وs للانحراف القياسي للعينة.

يُعرف التباين بأنه مجموع مربعات الانحرافات sum of squares (S S) (مربعات انحرافات قيم العينة عن متوسطها الحسابي) مقسوماً على عدد درجات الحرية (df)، وهذه تـساوي عدد القيم ناقص 1 أي n = df -1.

مثال: التباين (الفاريانس) لبيانات العينة الأولى من العينات الثلاث السابقة الذكر هو:

ويكون التباين للعينتين الثانية والثالثة منها: 15.0م و56.7م، على التوالي.

أما الانحراف القياسي فهو الجذر التربيعي للتباين:

ومن ثم فإن الانحرافات القياسية للعينات الثلاث هي:  m  1.73m وm 3.87mوm53m. ويمكن الآن وصف هذه العينات بمتوسطاتها الحسابية وانحرافاتها القياسية على النحو الآتي:

وهذا يوضح أن بيانات العينة الأولى كانت الأقل تبايناً (ومن ثم فهي الأكثر تمركزاً على جانبي المتوسط الحسابي)، في حين كانت العينة الثالثة الأكثر تبايناً وتشتتاً والأقل تمركزاً حول المتوسط الحسابي.

يتميز التباين والانحراف القياسي بإعطاء قيمة صغيرة إذا كانت بيانات العينة قليلة التشتت، أي تتمركز قريبة من المتوسط الحسابي، والعكس بالعكس. وهما سهلتا الحساب، وتعتمدان على جميع قيم العينة وليس على بعض منها. ويُحسب الانحراف القياسي بالوحدات نفسها المستخدمة في جمع البيانات (في حين هي مربعة squared في التباين).

إذا كانت العينة كبيرة العدد ومأخوذة من مجموع موزع توزيعاً طبيعياً normally-distributed population فإن العلاقات الآتية تكون صحيحة (الشكل2):

   

الشكل (2)

   

ج - الخطأ القياسي للمتوسطات الحسابية standard error of means

إن المتوسطات الحسابية والانحرافات القياسية هي ذاتها معرضة للتباين وهي تُشكل مجموعات من المتوسطات الحسابية للعينات وانحرافاتها القياسية. وإذا نظر الباحث إلى مجموعة من المتوسطات - كل منها مبني على عدد من القيم - فإنه سيتوقع أن تكون المتوسطات المحسوبة من عدد أكبر من القيم أقل تبايناً عن تلك المبنية على عدد أصغر منها، ومن ثم يمكن إيجاد علاقة بين هذه القيم على النحو الآتي:

وهذا هو الخطأ القياسي للمتوسط الحسابي (ويدعى أحياناً الانحراف القياسي للمتوسط الحسابي)، وبحساب قيمته للعينات الثلاث السابق ذكرها فإنها تكون: 0.65 م و1.46 م و2.84 م. وكل منها هي تخمين لنظيرتها الخاصة بالمجموع الذي أخذت العينة منه.

د - معامل التباين coefficient of variation (C V): يُفيد هذا المعامل في تقويم ومقارنة نتائج حُصِل عليها من تجارب مختلفة بشأن إحدى الصفات، أو صفات مختلفة، أو نفذها باحثون مختلفون. ويُعرَّف بكونه الانحراف القياسي للعينة مقدَّراً كنسبة مئوية من متوسطها الحسابي:

وهو بالتالي مقياس نسبي للتباين، يعبر عنه بكسر عشري أو بنسبة مئوية، وليس بوحدات القياس المستخدمة في التجربة، وهذه ميزة مهمة له، إذ يكون نسبة مستقلة عن وحدات القياس مهما كانت.

مثال: البيانات الآتية محسوبة من دراسة لأطوال 1052 امرأة و8585 رجلاً، ويتضح من قيمتي معامل التباين أن التباين كان متماثلاً إلى حد كبير في العينتين المدروستين:

 

المتوسط الحسابي (بوصة)

المتوسط الحسابي (بوصة)

 CV (%)

النساء 62.5 2.3 3.7
الرجال 67.5 2.6 3.8

هـ - مقاييس أخرى: هنالك مقاييس أخرى للتباين، أقل أهمية واستخداماً من السابق ذكرها، ومنها المتوسط الحسابي للقيم المطلقة mean of absolute values، ويُدعى متوسط الانحراف المطلق absolute mean deviation، أو الانحراف المتوسط (AD) average deviation ويحسب من المعادلة الآتية:

ويعني الخطان العموديان في بسط الكسر أن تأخذ جميع الانحرافات قيماً موجبة.

 أسامة عارف العوا

مراجع للاستزادة:

ـ عبده قاسم، الإحصاء الزراعي (مطبوعات جامعة دمشق 1981).

- G.W. SNEDECOR & W.G. COCHRAN, Statistical Methods (The Iowa State University Press 1980).

- A. AGRESTI & CH. A. FRANKLIN, Statistics: The Art and Science of Learning from Data (Prentice - Hall 2006).

- D. FREEDMAN¨ R. PISANI & R. PURVES, Statistics (W. W. Norton & Co 1997).

 


التصنيف : الزراعة و البيطرة
المجلد: المجلد التاسع عشر
رقم الصفحة ضمن المجلد : 256
مشاركة :

اترك تعليقك



آخر أخبار الهيئة :

البحوث الأكثر قراءة

هل تعلم ؟؟

عدد الزوار حاليا : 1081
الكل : 40508870
اليوم : 38685

الكريكت

الكريكت   الكريكت cricket رياضة الإنكليز المحببة، ولها عشاقها في أستراليا ودول شرقي آسيا مثل اليابان والهند والباكستان. عرفت في فرنسا أولاً عام 1478، ثم في إنكلترا عام 1493 وأُسس فيها أول نادٍ للكريكت عام 1666، وبدأ التنافس بها عام 1719، ووضعت قواعدها الأولى عام 1744. ثم انتشرت في كثير من دول العالم، ولها بطولاتها الداخلية والخارجية.
المزيد »