يحصل النموذج فيه على مكافآت (1 نقطة) الموجه الغير موجه التعزيزي (2 نقطة)؟
الإجابة الصحيحة من خلال موقع بوابة الإجابات هي:
التعزيزي
الإجابة الصحيحة هي "التعزيزي".
يشير السؤال إلى نوع من أنواع النماذج أو العمليات التي تتلقى مكافآت بناءً على أدائها. لنشرح ذلك بالتفصيل:
- النموذج: هو نظام أو برنامج يحاول تعلم مهمة معينة.
- المكافآت: هي إشارات تُعطى للنموذج لتقييم أدائه. إذا قام النموذج بعمل جيد، يحصل على مكافأة. إذا لم يقم بعمل جيد، فقد لا يحصل على مكافأة أو قد يحصل على عقوبة (وهذا أقل شيوعاً في التعلم التعزيزي).
- الموجه (Supervised): في التعلم الموجه، يتم تزويد النموذج ببيانات مُعلّمة مسبقاً، أي أن النموذج يعرف الإجابة الصحيحة لكل مثال. يتعلم النموذج من خلال مقارنة تنبؤاته بالإجابات الصحيحة.
- الغير موجه (Unsupervised): في التعلم غير الموجه، يتم تزويد النموذج ببيانات غير مُعلّمة. يتعلم النموذج من خلال اكتشاف الأنماط والعلاقات في البيانات بنفسه.
- التعزيزي (Reinforcement): في التعلم التعزيزي، يتعلم النموذج من خلال التفاعل مع بيئة ما. يتلقى النموذج مكافآت أو عقوبات بناءً على أفعاله في هذه البيئة. الهدف هو أن يتعلم النموذج كيفية اتخاذ القرارات التي تزيد من مكافآته على المدى الطويل.
مثال:تخيل أنك تدرب كلباً.
- التعلم الموجه: أنت تُظهر للكلب ما هو "اجلس" وتعطيه مكافأة عندما يجلس بشكل صحيح.
- التعلم غير الموجه: أنت تترك الكلب يستكشف عالمه بنفسه.
- التعلم التعزيزي: أنت تعطي الكلب مكافأة عندما يقوم بفعل تريده (مثل الجلوس) وتتجاهله أو تعاقبه (بشكل لطيف) عندما يقوم بفعل لا تريده.
في السؤال، بما أن النموذج يحصل على مكافآت (1 نقطة) بناءً على أفعاله، فهذا يشير إلى أن النموذج يستخدم التعلم
التعزيزي (2 نقطة).
اذا كان لديك إجابة افضل او هناك خطأ في الإجابة علي سؤال يحصل النموذج فيه على مكافآت (1 نقطة) الموجه الغير موجه التعزيزي (2 نقطة) اترك تعليق فورآ.