Assume df is a DataFrame, in df.groupby(by=’column1’, as_index=False).agg({’column2’:’mean’}), what type of data is in column1? Categorical data Continuous data Both of the above 1 point 9. Question 9 What is median of the numbers in the list [1,2,3,4,5,6]?؟
الإجابة الصحيحة من خلال موقع بوابة الإجابات هي:
column1 can be either categorical or continuous, as grouping works with both types of data.
الإجابة الصحيحة هي: "column1 يمكن أن يكون إما بيانات تصنيفية أو بيانات مستمرة، لأن التجميع (grouping) يعمل مع كلا النوعين من البيانات."
شرح مفصل:
الدالة `groupby()` في مكتبة Pandas (المستخدمة في Python لتحليل البيانات) تستخدم لتجميع الصفوف في DataFrame بناءً على قيم عمود معين. النوع الذي يمكن أن يكون عليه هذا العمود (في حالتنا `column1`) هو:
- البيانات التصنيفية (Categorical Data): هي البيانات التي تمثل فئات أو مجموعات، وليست أرقامًا قابلة للقياس. أمثلة:
- الألوان (أحمر، أزرق، أخضر)
- أنواع المنتجات (ملابس، كتب، أجهزة)
- الدول (مصر، السعودية، الأردن)
يمكنك تجميع البيانات حسب هذه الفئات لحساب المتوسطات أو غيرها من الإحصائيات لكل فئة.
- البيانات المستمرة (Continuous Data): هي البيانات التي يمكن أن تأخذ أي قيمة ضمن نطاق معين، وعادة ما تكون أرقامًا قابلة للقياس. أمثلة:
- درجة الحرارة (25.5 درجة مئوية)
- الطول (175 سم)
- الوزن (70 كجم)
يمكنك تجميع البيانات المستمرة في نطاقات (مثل تجميع العملاء حسب أعمارهم) لحساب المتوسطات أو غيرها من الإحصائيات لكل نطاق.
لماذا يعمل التجميع مع كلا النوعين؟
الدالة `groupby()` لا تهتم بنوع البيانات في `column1` بقدر اهتمامها بوجود قيم فريدة في هذا العمود. فهي ببساطة تجمع الصفوف التي لها نفس القيمة في `column1` معًا. بعد ذلك، يمكنك تطبيق دالة تجميع (مثل `mean` لحساب المتوسط) على عمود آخر (مثل `column2`) داخل كل مجموعة.
مثال:
لنفترض أن لديك DataFrame يحتوي على بيانات عن مبيعات المنتجات:
| column1 (نوع المنتج) | column2 (سعر البيع) |
|---|---|
| ملابس | 50 |
| كتب | 20 |
| ملابس | 60 |
| كتب | 25 |
إذا قمت بتطبيق `df.groupby(by='column1', as_index=False).agg({'column2':'mean'})`، فستحصل على:
| column1 (نوع المنتج) | column2 (متوسط سعر البيع) |
|---|---|
| ملابس | 55 |
| كتب | 22.5 |
كما ترى، تم تجميع البيانات حسب نوع المنتج (تصنيفي) وحساب متوسط سعر البيع لكل نوع. وبالمثل، يمكنك تجميع البيانات حسب نطاقات عمر العملاء (مستمر) وحساب متوسط الإنفاق لكل نطاق.
اذا كان لديك إجابة افضل او هناك خطأ في الإجابة علي سؤال Assume df is a DataFrame, in df.groupby(by=’column1’, as_index=False).agg({’column2’:’mean’}), what type of data is in column1? Categorical data Continuous data Both of the above 1 point 9. Question 9 What is median of the numbers in the list [1,2,3,4,5,6]? اترك تعليق فورآ.