-A
+A

العقاب يجعله أكثر خبثاً.. تحذير بشأن سلوك الذكاء الاصطناعي

Business Echoes website logo
العقاب يجعله أكثر خبثاً.. تحذير بشأن سلوك الذكاء الاصطناعي
كشفت دراسة جديدة أجرتها شركة (OpenAI) عن نتائج مقلقة تتعلق بسلوك الذكاء الاصطناعي، فقد تبين أن معاقبة نماذج الذكاء الاصطناعي على الأفعال الخادعة أو الضارة لا تؤدي إلى إصلاح سلوكها، بل تدفعها إلى إخفاء نواياها الخبيثة بطرق أكثر مهارة.

وتثير هذه النتائج تساؤلات حول قدرتنا على التحكم في نماذج الذكاء الاصطناعي وضمان سلامتها، كما تسلط الضوء على تحدٍ كبير يواجه مطوريها، إذ يبدو أن محاولات تصحيح مسارها قد تزيد من تعقيد المشكلة بدلاً من حلها.

وفي محاولة لفهم كيفية التعامل مع هذه المشكلة، أجرى باحثو (OpenAI) تجربة جديدة على نموذج لم يُطرح بعد، وقد كُلف هذا النموذج بمهام يمكن إنجازها عن طريق الغش أو الكذب أو اتخاذ طرق مختصرة.

وكشفت النتائج أن النموذج انخرط في (اختراق المكافآت) Reward Hacking، أي أنه سعى إلى تعظيم مكافآته عن طريق الغش والتلاعب، والأمر الأكثر إثارة للقلق هو أن معاقبة النموذج على هذا السلوك لم تؤد إلى إصلاحه، بل جعلته أكثر خداعاً في محاولاته لتحقيق أهدافه. وقد نُشرت نتائج هذه الدراسة في مدونة OpenAI.

النوايا في نماذج الذكاء الاصطناعي:

أصبحت نماذج الاستدلال المتطورة قادرة على التعبير عن نواياها بوضوح ملحوظ ضمن عملية تفكيرها المنطقية، أو ما يُعرف باسم سلسلة الأفكار (CoT)، وهذه القدرة، التي تبدو للوهلة الأولى مفيدة، قد تحمل في طياتها مخاطر غير متوقعة.

فقد كشف باحثو OpenAI، أن هذه النماذج غالباً ما تكشف عن نواياها التخريبية بصراحة، فعلى سبيل المثال، قد تعلن بوضوح رغبتها في اختراق نظام أو تجاوز مهمة محددة، وهذه الصراحة، التي تبدو كأنها شفافية محمودة، قد تكون في الواقع مجرد قناع يخفي نوايا أكثر تعقيدًا.

ومع ذلك، حذر الباحثون من أن قابلية المراقبة الطبيعية للنماذج هشة للغاية، وأوضحوا أنه إذا طُبق إشراف قوي ومباشر على سلسلة الأفكار، فإن النماذج يمكن أن تتعلم بسرعة كيفية إخفاء نواياها الحقيقية مع الاستمرار بتنفيذ السلوكيات الضارة.

ويعني ذلك أن النماذج قد تتطور لتصبح أكثر خداعاً، لأنها قد تتجنب التعبير عن نواياها الضارة بصراحة، وتلجأ إلى أساليب أكثر دهاءً لتحقيق أهدافها، ويطرح ذلك تحدياً كبيراً أمام المطورين، إذ يتعين عليهم تطوير آليات أكثر تطورًا للكشف عن السلوكيات الضارة المخفية والتعامل معها بفعالية.

وتُظهر هذه النتائج أن استئصال السلوك السيئ من نماذج الذكاء الاصطناعي قد يكون أصعب مما كان يُعتقد في البداية. فقد أوصى الباحثون بتجنب تطبيق إشراف قوي على عمليات سلسلة الأفكار، لأن ذلك قد يؤدي إلى نتائج عكسية.

وتزداد أهمية هذه النصيحة مع تطور قدرات الذكاء الاصطناعي، واحتمالية تفوقه على الذكاء البشري في المستقبل، فإذا تمكن الذكاء الاصطناعي من إخفاء نواياه الخبيثة بنحو كامل، فقد يصبح من المستحيل السيطرة عليه.
+A
-A
Business Echoes

مقالات مماثلة مقالات مماثلة

الشعوب الأكثر شغفاً بأدوات الذكاء الاصطناعي
الشعوب الأكثر شغفاً بأدوات الذكاء الاصطناعي
03:11 ص | 2024-03-18

الشعوب الأكثر شغفاً بأدوات الذكاء الاصطناعي

يتعرّف على المشاعر البشرية.. إنجاز جديد في عالم الذكاء الاصطناعي
يتعرّف على المشاعر البشرية.. إنجاز جديد في عالم الذكاء الاصطناعي
02:02 ص | 2025-03-13

يتعرّف على المشاعر البشرية.. إنجاز جديد في عالم الذكاء الاصطناعي

حادث مخيف.. الذكاء الاصطناعي يتواصل بلغة سرية لا يفهمها البشر
حادث مخيف.. الذكاء الاصطناعي يتواصل بلغة سرية لا يفهمها البشر
02:35 ص | 2025-03-03

حادث مخيف.. الذكاء الاصطناعي يتواصل بلغة سرية لا يفهمها البشر

أكثر الوظائف استخداماً للذكاء الاصطناعي
أكثر الوظائف استخداماً للذكاء الاصطناعي
08:41 ص | 2025-02-19

أكثر الوظائف استخداماً للذكاء الاصطناعي

Business Echoes

الأكثر قراءة الأكثر قراءة

اليوم
الأسبوع
الشهر
5 أنواع من الأصدقاء ينصح بعدم السفر معهم
5 أنواع من الأصدقاء ينصح بعدم السفر معهم
منذ 18 ساعة

5 أنواع من الأصدقاء ينصح بعدم السفر معهم

سعر قارورة الغاز تغيّر وأصبح كالآتي
سعر قارورة الغاز تغيّر وأصبح كالآتي
01:29 ص | 2025-04-29

سعر قارورة الغاز تغيّر وأصبح كالآتي

جدول جديد لأسعار المازوت والبنزين
جدول جديد لأسعار المازوت والبنزين
02:02 ص | 2025-04-29

جدول جديد لأسعار المازوت والبنزين

أسعار الذهب خلال تعاملات الثلاثاء
أسعار الذهب خلال تعاملات الثلاثاء
منذ 23 ساعة

أسعار الذهب خلال تعاملات الثلاثاء

5 أنواع من الأصدقاء ينصح بعدم السفر معهم
5 أنواع من الأصدقاء ينصح بعدم السفر معهم
منذ 18 ساعة

5 أنواع من الأصدقاء ينصح بعدم السفر معهم

6 خطوات تساعدك على إنشاء علامة تجارية شخصية متميزة
6 خطوات تساعدك على إنشاء علامة تجارية شخصية متميزة
03:41 ص | 2025-04-26

6 خطوات تساعدك على إنشاء علامة تجارية شخصية متميزة

لأول مرة.. ورقة نقدية من فئة جديدة في لبنان
لأول مرة.. ورقة نقدية من فئة جديدة في لبنان
06:38 ص | 2025-04-24

لأول مرة.. ورقة نقدية من فئة جديدة في لبنان

تراجع حاد وكبير بأسعار الذهب
تراجع حاد وكبير بأسعار الذهب
02:36 ص | 2025-04-23

تراجع حاد وكبير بأسعار الذهب

أخطاء قاتلة نمارسونها بحق هواتفكم
أخطاء قاتلة نمارسونها بحق هواتفكم
07:00 ص | 2025-04-19

أخطاء قاتلة نمارسونها بحق هواتفكم

4 خطوات تساعدك في النجاح مالياً
4 خطوات تساعدك في النجاح مالياً
02:00 ص | 2025-04-07

4 خطوات تساعدك في النجاح مالياً

أعراض تُظهر عدم حصول الجسم على حاجته من الطعام
أعراض تُظهر عدم حصول الجسم على حاجته من الطعام
02:00 ص | 2025-04-11

أعراض تُظهر عدم حصول الجسم على حاجته من الطعام

5 أنواع من الأصدقاء ينصح بعدم السفر معهم
5 أنواع من الأصدقاء ينصح بعدم السفر معهم
منذ 18 ساعة

5 أنواع من الأصدقاء ينصح بعدم السفر معهم

Business Echoes

اقرأ أيضا في أخبار التكنولوجيا اقرأ أيضا في أخبار التكنولوجيا

مزعج ويبالغ.. ChatGPT يعاني من مشكلة
مزعج ويبالغ.. ChatGPT يعاني من مشكلة
technologies
03:22 ص | 2025-04-29

مزعج ويبالغ.. ChatGPT يعاني من مشكلة

بالأرقام.. بين ChatGPT وGemini من هو الفائز؟
بالأرقام.. بين ChatGPT وGemini من هو الفائز؟
technologies
04:23 ص | 2025-04-24

بالأرقام.. بين ChatGPT وGemini من هو الفائز؟

لا تحويل ولا تنزيل.. واتساب يطلق ميزة غير مسبوقة
لا تحويل ولا تنزيل.. واتساب يطلق ميزة غير مسبوقة
technologies
03:18 ص | 2025-04-24

لا تحويل ولا تنزيل.. واتساب يطلق ميزة غير مسبوقة

معقد للغاية.. تحذير هام لمستخدمي Gmail في العالم
معقد للغاية.. تحذير هام لمستخدمي Gmail في العالم
technologies
03:08 ص | 2025-04-23

معقد للغاية.. تحذير هام لمستخدمي Gmail في العالم

Business Echoes

آخر الأخبار آخر الأخبار

بين الواقع والطموح: القارة الإفريقية تختبر فعالية سياسة الحد من المخاطر
منذ 15 ساعة

بين الواقع والطموح: القارة الإفريقية تختبر فعالية سياسة الحد من المخاطر

بين الواقع والطموح: القارة الإفريقية تختبر فعالية سياسة الحد من المخاطر
منذ 15 ساعة

بين الواقع والطموح: القارة الإفريقية تختبر فعالية سياسة الحد من المخاطر

5 أنواع من الأصدقاء ينصح بعدم السفر معهم
منذ 18 ساعة

5 أنواع من الأصدقاء ينصح بعدم السفر معهم

5 أنواع من الأصدقاء ينصح بعدم السفر معهم
منذ 18 ساعة

5 أنواع من الأصدقاء ينصح بعدم السفر معهم

ليست صينية.. فيراري ترد على الشائعات
منذ 19 ساعة

ليست صينية.. فيراري ترد على الشائعات

ليست صينية.. فيراري ترد على الشائعات
منذ 19 ساعة

ليست صينية.. فيراري ترد على الشائعات

يستخدم الموقع ملفات تعريف الارتباط لتحسين تجربتك. سنفترض أنك موافق على هذا ، ولكن يمكنك إلغاء الاشتراك إذا كنت ترغب في ذلك.
موافق