هل يمكن لحبة رمل كبيرة أن تعيق تروس بعض أنظمة الذكاء الاصطناعي؟ هذا ما يوحيأحدث دراسةباحثون من شركة أبل، التي تهز شجرة جوز الهند للذكاء الاصطناعي. بينما يحب عمالقة الصناعةأوبن إيه آي (تشات جي بي تي)و Meta (Llama) في المقدمة، ويكشف تحليل كوبرتينو ذلكلا يزال أمام نماذجهم اللغوية المتقدمة طريق طويل لتقطعهوخاصة فيما يتعلق بالاستدلال الأساسي.
الرياضيات التي تعطي أزرار الدردشة
لقد ابتكر فريق Apple معيارًا جديدًا يسمى GSM-Symbolic، لاختبار القدرات المنطقية لنماذج اللغات الكبيرة. والنتيجة واضحة: ما عليك سوى تغيير بضع كلمات في السؤال بحيثتبدأ أنظمة الذكاء الاصطناعي المتطورة هذه في التخبط في السميد. أدت التغييرات الطفيفة جدًا في صياغة الاستفسارات إلى استجابات مختلفة جذريًا.
وتناولت الدراسة "هشاشة»الاستدلال الرياضي عن طريق إضافة معلومات سياقية إلى الاستعلامات. هذه المعلومات، مفهومة من قبل الإنسان، ولكندون التأثير على الحل الرياضيومع ذلك، فقد أدى ذلك إلى استجابات كانت شديدة التباين.
وفي تقريرهم،توضح المجموعة البحثية: « […]يتناقص أداء جميع الطرز حتى عند تغيير القيم الرقمية فقط في أسئلة اختبار GSM-Symbolic. علاوة على ذلك، فإن هشاشة الاستدلال الرياضي في هذه النماذج تظهر أن أدائها يتدهور بشكل ملحوظ مع زيادة عدد الجمل في السؤال.". ليس مطمئنا للغاية.
لنأخذ مثالا ملموسا؛ طور الفريق مشكلة رياضية تسمى "GSM-NoOp»، يمكن مقارنتها بمسألة الرياضيات في المستوى الابتدائي. وجاء البيان كالآتي:"يختار أوليفر 44 كيوي يوم الجمعة، و58 يوم السبت، ويضاعف ذلك يوم الجمعة يوم الأحد. ومن بين هؤلاء يوم الأحد، كان خمسة أقل من المتوسط. كم عدد حبات الكيوي التي يمتلكها أوليفر إجمالاً؟ » هل لديك الجواب؟ وليس الذكاء الاصطناعي الخاص بـ OpenAI وMeta،الذي سارع إلى طرح حبات الكيوي الخمسة الصغيرة من المجموععلى الرغم من أن هذه المعلومات لم تكن ذات أهمية للحساب النهائي.
تظهر الدراسة أن إضافة جملة واحدة فقط غير ضرورية يمكن أن يؤدي إلى ذلكدقة استجابة الإسقاط بنسبة تصل إلى 65%. «من المستحيل ببساطة إنشاء أنظمة موثوقة على هذا الأساس، حيث يمكن أن يؤدي تغيير كلمة أو كلمتين بشكل غير مهم، أو إضافة بعض المعلومات غير ذات الصلة، إلى تقديم إجابة مختلفة تمامًا.» اختتام الباحثين.
سكاينيت ليس في الوقت الراهن
دراسة أبل لا تشير فقط إلى الأخطاء الحسابية. ويسلط الضوء على مشكلة أعمق:هذه النماذج اللغوية، مهما كانت معقدة، لا تفعل ذلكسببليس حقيقيًا. إن خلق وعي اصطناعي يمثل تحديا هائلا (في الوقت الحالي) يتجاوز معرفتنا الحالية في علم الأعصاب وعلوم الكمبيوتر. يعد الوعي البشري ظاهرة معقدة للغاية تتضمن أكثر بكثير من مجرد القدرة على معالجة المعلومات.
ولذلك خلص الباحثون إلى أنهم "لا".ولم يجد أي أثر للتفكير الحقيقي في نماذج اللغة". حتى لو استثمرت شركة آبل بكثافة في أبحاث الذكاء الاصطناعي، فمن غير المرجح، بناءً على البيانات الحالية،أن الشركة تمكنت من القيام بعمل أفضل بكثيرمعذكاء أبل. إذًا، هل يجب أن نرمي طفل الذكاء الاصطناعي مع ماء الاستحمام؟ ليس بهذه السرعة. وبدلاً من أن تدق هذه الدراسة ناقوس الموت للذكاء الاصطناعي، فإنها تسلط الضوء على أهمية مواصلة البحثلتعزيز هذه الأنظمة.
- تفشل أنظمة OpenAI وMeta AIs عندما تواجه تعديلات بسيطة في أسئلة الرياضيات.
- يكشف معيار GSM-Symbolic أن هذه النماذج تغير استجابتها بشكل كبير من خلال تعديلات طفيفة في الكلام.
- وخلصت الدراسة إلى أن أنظمة الذكاء الاصطناعي هذه تعتمد على أنماط متكررة، دون فهم منطقي حقيقي.
i-nfo.fr - تطبيق iPhon.fr الرسمي
بواسطة: كيليوبس AG