تقوم آلة بتعلم أن تحرك ذراعها لتصل إلى هدف معين وتحصل على مكافأة عند النجاح. ما نوع هذا التعلم؟ أ) تعلم خاضع للإشراف ب) تعلم غير خاضع للإشراف ج) تعلم معزز د) تعلم عشوائي ؟؟
الإجابة الصحيحة من خلال موقع بوابة الإجابات هي:
ج) تعلم معزز
الإجابة الصحيحة هي: ج) تعلم معزز (Reinforcement Learning).
شرح الإجابة:
التعلم المعزز هو أحد أنواع تعلم الآلة الذي يعتمد على مبدأ "التجربة والخطأ". في هذا النوع، لا يتم إعطاء الآلة تعليمات مباشرة أو إجابات جاهزة، بل تُترك لتتفاعل مع البيئة المحيطة بها لتعلم السلوك الصحيح.
كيف يعمل التعلم المعزز في هذا المثال؟
- التجربة: تقوم الآلة بتحريك ذراعها بشكل عشوائي في البداية.
- النتيجة: إذا قامت بحركة تقربها من الهدف، تحصل على "مكافأة" (وهي قيمة رقمية إيجابية يبرمجها المطور).
- التعلم: تدرك الآلة أن الحركات التي أدت إلى الحصول على المكافأة هي "حركات صحيحة"، فتبدأ بتكرارها وتطويرها للوصول إلى الهدف بأسرع وأدق طريقة ممكنة.
مثال لتبسيط الفكرة:يشبه التعلم المعزز طريقة تدريب الحيوانات الأليفة؛ فعندما يقوم الكلب بحركة صحيحة يطلبها منه المدرب، يعطيه المدرب "قطعة حلوى" (مكافأة)، مما يجعل الكلب يربط بين تلك الحركة وبين المكافأة، فيكررها في المرات القادمة.
لماذا الخيارات الأخرى غير صحيحة؟
- التعلم الخاضع للإشراف: يتطلب وجود "معلم" يقدم للآلة بيانات مصنفة مسبقاً (إجابات صحيحة) لتقلدها، وهذا لا يحدث في مثال ذراع الآلة.
- التعلم غير الخاضع للإشراف: يهدف إلى اكتشاف أنماط أو مجموعات متشابهة داخل البيانات دون وجود هدف محدد أو مكافأة.
- التعلم العشوائي: ليس نوعاً من أنواع تعلم الآلة المعتمدة، لأن الهدف من الذكاء الاصطناعي هو الانتقال من العشوائية إلى الدقة والمنطق.
اذا كان لديك إجابة افضل او هناك خطأ في الإجابة علي سؤال تقوم آلة بتعلم أن تحرك ذراعها لتصل إلى هدف معين وتحصل على مكافأة عند النجاح. ما نوع هذا التعلم؟ أ) تعلم خاضع للإشراف ب) تعلم غير خاضع للإشراف ج) تعلم معزز د) تعلم عشوائي ؟ اترك تعليق فورآ.