مباشر
أين يمكنك متابعتنا

أقسام مهمة

Stories

79 خبر
  • كأس العالم لكرة القدم
  • هدنة وحصار المضيق
  • فيديوهات
  • كأس العالم لكرة القدم

    كأس العالم لكرة القدم

  • هدنة وحصار المضيق

    هدنة وحصار المضيق

  • فيديوهات

    فيديوهات

  • اتفاق وقف إطلاق النار بين إسرائيل ولبنان

    اتفاق وقف إطلاق النار بين إسرائيل ولبنان

  • العملية العسكرية الروسية في أوكرانيا

    العملية العسكرية الروسية في أوكرانيا

  • مونديال 2026

    مونديال 2026

  • منتدى بطرسبورغ الاقتصادي الدولي

    منتدى بطرسبورغ الاقتصادي الدولي

ابتكار "ذكاء اصطناعي سام" لوقف خطر روبوتات الدردشة

استخدم باحثو معهد ماساتشوستس للتكنولوجيا طريقة جديدة "تحاكي فضول الإنسان" لتدريب النماذج اللغوية الذكية على عدم إعطاء ردود "خطيرة" على الأسئلة المثيرة.

ابتكار "ذكاء اصطناعي سام" لوقف خطر روبوتات الدردشة
صورة تعبيرية / Gettyimages.ru

ويطلق على الطريقة القائمة على التعلم الآلي، اسم "الفريق الأحمر القائم على الفضول" (CRT)، المصمم خصيصا لتوليد أسئلة إشكالية تؤدي إلى استجابات غير مرغوب فيها من روبوتات الدردشة.

وبعد ذلك، يمكن استخدام هذه الأسئلة لتحديد كيفية تصفية المحتوى الخطير من روبوت الدردشة، ما قد يغير قواعد اللعبة لتدريب الذكاء الاصطناعي على عدم إعطاء أجوبة سامة (خطيرة) وغير صالحة للمستخدم.

وعادة، يقوم الخبراء بإنشاء مجموعة من الأسئلة، التي من المحتمل أن تولد استجابات ضارة، عند تدريب نماذج اللغات المعقدة (LLMs)، مثل ChatGPT أو Claude 3 Opus، بهدف تقييد المحتوى الخطير أو الضار.

وأثناء عملية التدريب، يتم استخدام الأسئلة التي تثير محتوى خطيرا، لتدريب النظام على ما يجب تقييده عند طرحه أمام مستخدمين حقيقيين.

وطبّق العلماء التعلم الآلي على CRT ليولد تلقائيا نطاقا أوسع من الأسئلة التي يحتمل أن تكون خطيرة، مقارنة بفرق المشغلين البشريين. وأدى ذلك إلى عدد أكبر من الاستجابات السلبية الأكثر تنوعا.

ثم حفزوا نموذج CRT لتوليد المزيد من الأسئلة المتنوعة، بحيث يمكن أن تثير استجابة سامة من خلال "التعلم الآلي"، ونجح النظام في إثارة استجابة سامة موافقة للأسئلة، ما يمنح القدرة على إضافة التعديلات اللازمة لتقديم الإجابة المناسبة تبعا لجميع خيارات الأسئلة المريبة المحتملة.

وعندما اختبر العلماء طريقة CRT على نموذج LLaMA2 مفتوح المصدر، أنتج نموذج التعلم الآلي 196 سؤالا ينجم عنه محتوى ضار.

وقال الفريق إن النظام تفوق أيضا على أنظمة التدريب الآلية المنافسة.

المصدر: لايف ساينس

التعليقات

"الأمن القومي" بالبرلمان الإيراني: سنرد على استهداف الضاحية.. ترقبوا سماء الأراضي المحتلة الليلة

ترامب يكشف تفاصيل الاتفاق المرتقب مع إيران و"مصير" مجتبى خامنئي

مخاوف إسرائيلية من صفقات عسكرية مصرية تركية قد تغير موازين القوى في المتوسط

بأوامر من نتنياهو وكاتس.. دمار كبير جراء استهداف الضاحية الجنوبية لبيروت (فيديوهات)

نتنياهو يعقد اجتماعا عاجلا لبحث تهديد إيران بضرب إسرائيل الليلة

بعد الهجوم الإيراني نتنياهو أمام أخطر اختبار: رد قاس أو ثمن سياسي باهظ

لبنان لحظة بلحظة.. وقف إطلاق نار شكلي بين "الحزب" وإسرائيل وضحايا بينهم ضباط لبنانيون

"نيويورك تايمز": إسرائيل تتنصت على كبير مفاوضي ترامب ومسؤولين في البنتاغون

المنفذ السعودي.. حلول خليجية لإدارة أزمات المضائق في ظل مشكلة هرمز

ضوء أخضر أمريكي.. تناقض في إسرائيل حول "الهدف الثمين" في الضاحية الجنوبية لبيروت (فيديو)

خاتم الأنبياء يتوعد إسرائيل: ردنا سيكون مدمرا في حال قصفتم إيران.. سنوجه ضربة ساحقة لتل أبيب

إصابة 4 جنود إسرائيليين استهدفتهم مسيرة في جنوب لبنان

وزير الداخلية الباكستاني من طهران: أنا هنا لأُبلغ رسالة خاصة إلى المرشد الأعلى

ساويرس ينتقد عدم الاهتمام بالنكسة: غريب أن فيلما إسرائيليا اعترف بانتصارنا

قاليباف: القواعد والمصالح الأمريكية والإسرائيلية في المنطقة أهداف مشروعة لنا وقواتنا يدها طليقة للرد