في الإحصاء، القيمة المتطرفة هي قيمة تقع بعيدًا عن معظم القيم الأخرى في مجموعة البيانات. يمكن أن تكون القيم المتطرفة موجبة أو سالبة، ويمكن أن تكون موجودة في أي مجموعة بيانات، بغض النظر عن حجمها أو الشكل.
هناك طريقتان شائعتان لتحديد القيم المتطرفة:
- استخدام المدى الرُّبيعي: يتم حساب المدى الرُّبيعي بقسمة مجموعة البيانات إلى أربعة أجزاء متساوية، ثم حساب الفرق بين المقدار الرُّبيع الأعلى والمقدار الرُّبيع الأدنى. يتم اعتبار القيم التي تقع خارج حدود المدى الرُّبيعي زائد أو ناقص واحد ونصف من القيم المتطرفة.
- استخدام الانحراف المعياري: يتم حساب الانحراف المعياري بقياس مدى تباعد القيم في مجموعة البيانات عن المتوسط الحسابي. يتم اعتبار القيم التي تقع خارج حدود المتوسط الحسابي زائد أو ناقص ثلاثة أضعاف الانحراف المعياري من القيم المتطرفة.
تستخدم القيم المتطرفة في مجموعة متنوعة من التطبيقات الإحصائية، بما في ذلك:
- التصنيف: يمكن استخدام القيم المتطرفة لتحديد الفئات المختلفة في مجموعة البيانات. على سبيل المثال، يمكن استخدام القيم المتطرفة لتحديد الفئات المختلفة للدخل أو العمر أو الوزن.
- التحليل الإحصائي: يمكن استخدام القيم المتطرفة لتقليل تأثير القيم الشاذة على نتائج التحليل الإحصائي. على سبيل المثال، يمكن استخدام القيم المتطرفة لتحسين دقة تقديرات المتوسط الحسابي والانحراف المعياري.
- الاكتشافات الإحصائية: يمكن استخدام القيم المتطرفة لتحديد الأنماط أو الاتجاهات غير المتوقعة في مجموعة البيانات. على سبيل المثال، يمكن استخدام القيم المتطرفة لتحديد التغيرات في اتجاه الأسعار أو سلوك المستهلك.
فيما يلي بعض الأمثلة على القيم المتطرفة:
- في مجموعة بيانات تضم درجات الطلاب في الامتحان، قد تكون القيمة المتطرفة هي درجة 99.9%.
- في مجموعة بيانات تضم درجات الحرارة في يوم معين، قد تكون القيمة المتطرفة هي درجة حرارة 45 درجة مئوية.
- في مجموعة بيانات تضم مبيعات المنتجات في عام معين، قد تكون القيمة المتطرفة هي مبيعات منتج بلغت 100 مليون دولار.
من المهم ملاحظة أن القيم المتطرفة ليست دائمًا خطأ. في بعض الحالات، قد تكون القيم المتطرفة حقيقية وذات مغزى. على سبيل المثال، قد تكون درجة 99.9% في مجموعة بيانات تضم درجات الطلاب في الامتحان قيمة حقيقية إذا كان أحد الطلاب قد أتقن المادة بشكل استثنائي. ومع ذلك، من المهم أيضًا توخي الحذر من القيم المتطرفة التي قد تكون ناتجة عن أخطاء في البيانات أو عوامل أخرى غير معروفة.