اكتشاف سبب محوري لـ"تحيّز" الشبكات العصبية في معالجة المعلومات

كشف باحثون من معهد “ماساتشوستس” عن سبب ميل النماذج اللغوية الكبيرة مثل ChatGPT أو DeepSeek إلى المبالغة في تقدير المعلومات الموجودة في بداية ونهاية النص مع إهمال منتصفه.

وهذه الظاهرة التي تُسمى “تحيز الموضع” قد تعيق المستخدمين الذين يبحثون عن عبارات مفتاحية في المستندات الطويلة.

وطور فريق علمي بقيادة الباحث شين يي وو من معهد “ماساتشوستس” التكنولوجي نمطا يفسر سبب تركيز النماذج اللغوية الكبيرة مثل ChatGPT على بداية ونهاية النص.

فهي تقرأ النص على أجزاء و”تُركز” على الكلمات الأكثر أهمية لفهمه، لكن بعض الإعدادات التقنية، مثل قدرتها على رؤية الكلمات السابقة فقط أو توجيهات ترتيب الكلمات، تخلق تحيزا.

السبب الرئيسي لاهتمامها ببداية النص مرتبط بالمعالجة التسلسلية، حيث تأخذ النماذج في الاعتبار الكلمات السابقة فقط، مما يجعل الأجزاء الأولية تبدو أكثر تأثيرا. وعلى سبيل المثال ففي وثيقة متكونة من 30 صفحة، تصل احتمالية العثور على المعلومة المطلوبة في البداية أو النهاية إلى 85%، بينما في المنتصف لا تتجاوز 60%.

وكشفت الدراسات أن دقة التحليل أعلى عند حوافي النص وتنخفض بشكل ملحوظ في منتصفه، وهي ظاهرة سُميت “تأثير الشكل U، ويتجلى ذلك أكثر في النماذج المعقدة مثل GPT-4 بطبقاتها الـ96 للمعالجة. وعلى الرغم من أن آليات مثل “التلميحات الموضعية” تساعد في فهم السياق، إلا أن فعاليتها محدودة في النماذج الضخمة. (روسيا اليوم)