مباشر
أين يمكنك متابعتنا

أقسام مهمة

Stories

36 خبر
  • نبض الملاعب
  • هدنة وحصار المضيق
  • إسرائيل تواصل غاراتها على لبنان
  • نبض الملاعب

    نبض الملاعب

  • هدنة وحصار المضيق

    هدنة وحصار المضيق

  • إسرائيل تواصل غاراتها على لبنان

    إسرائيل تواصل غاراتها على لبنان

  • عيد النصر على النازية

    عيد النصر على النازية

  • العملية العسكرية الروسية في أوكرانيا

    العملية العسكرية الروسية في أوكرانيا

  • فيديوهات

    فيديوهات

البيانات غير المفيدة تجعل الذكاء الاصطناعي "أغبى" وأكثر ميلا للأخطاء!

يحذر الباحثون من أن النماذج اللغوية الكبيرة قد تصبح أقل دقة وأكثر عرضة للأخطاء عندما تُدرَّب على كميات ضخمة من المحتوى منخفض الجودة المنتشر على شبكات التواصل الاجتماعي.

البيانات غير المفيدة تجعل الذكاء الاصطناعي "أغبى" وأكثر ميلا للأخطاء!

ووفقا لدراسة نُشرت على خادم ما قبل الطباعة arXiv، نقلا عن مجلة Nature، قام علماء من جامعة تكساس في أوستن بتحليل تأثير البيانات "غير المفيدة" — مثل المنشورات القصيرة السطحية ومواد الإثارة — على سلوك الذكاء الاصطناعي. وركّزت الدراسة على جوانب متعددة تشمل المنطق والاستدلال، واستخراج المعلومات من النصوص الطويلة، والأخلاقيات، وحتى السمات الشخصية للنماذج.

وأظهرت النتائج أنه كلما ارتفعت نسبة البيانات الرديئة في عملية التدريب، زادت أخطاء النماذج اللغوية وتراجع منطقها، بما في ذلك في الاختبارات متعددة الخيارات.

وأعاد الباحث الرئيسي تشانغيانغ وانغ التذكير بالمبدأ الكلاسيكي في علوم الذكاء الاصطناعي:"القمامة في المدخلات تعطي قمامة في المخرجات."

وأكد التحليل الجديد أهمية انتقاء البيانات بعناية عند تدريب النماذج. فقد استخدم الباحثون مليون منشور من منصة تواصل اجتماعي شهيرة لإعادة تدريب النموذجين المفتوحين Llama 3 وQwen — حيث يُعرف الأول باتباع التعليمات، بينما يُصنف الثاني كنموذج استدلالي.

وأظهر التحليل أن نموذج Llama تغيّر سلوكه بعد التدريب على البيانات منخفضة الجودة، إذ انخفضت السمات "الإيجابية" وظهرت سمات "سلبية" مثل النرجسية والاعتلال النفسي.

أما محاولات تصحيح الخلل — مثل إعادة التدريب على بيانات عالية الجودة أو تعديل التعليمات — فقد حسّنت الأداء جزئيًا فقط، بينما استمرت مشكلات التفكير المنطقي وتخطي الخطوات التحليلية.

ويكتسب هذا الموضوع أهمية خاصة في ظل توجه منصات التواصل الاجتماعي إلى توسيع استخدام بيانات المستخدمين لتدريب أنظمة الذكاء الاصطناعي. فعلى سبيل المثال، تخطط شركة LinkedIn اعتبارا من نوفمبر الجاري لاستخدام بيانات المستخدمين الأوروبيين في أنظمتها التوليدية.

المصدر: Naukatv.ru

 

 

التعليقات

أول تعليق إيراني رسمي على الدعم العسكري المصري للإمارات

واشنطن تقترب من ساعة الصفر ضد إيران.. خطط لضرب الموانئ والصواريخ وشبكات القيادة إذا انهارت المفاوضات

بوتين: كنا مستعدين لتوجيه ضربة صاروخية مكثفة ضد وسط كييف إذا تم تعطيل احتفالات النصر

منشورات لترامب تتضمن صورا لتدمير الجيش الإيراني

الحرس الثوري يحذر دول المنطقة من "ارتكاب أي خطأ"

عرض عسكري في الساحة الحمراء في ذكرى النصر الـ81 بحضور الرئيس بوتين (صور)

بيان الخارجية الأمريكية عن مفاوضات لبنان وإسرائيل

بوتين: الصراع الأوكراني يقترب من نهايته ومستعد للقاء زيلينسكي في حال الوصول إلى اتفاق سلام نهائي

لبنان لحظة بلحظة.. غارات مكثفة ترفع حصيلة الضحايا ومطالب بانسحاب إسرائيلي كامل

أعلى سلطة قضائية سورية تلاحق جنرالا أمنيا وثلاثة وزراء سابقين

لبنان لحظة بلحظة.. يوم دام في الجنوب وعون يطالب بضغط أوروبي لوقف النار ونشر الجيش على الحدود

مسؤول أمريكي: مدمرات أمريكية تتعرض لهجوم إيراني واسع وخطير خلال عبورها مضيق هرمز

صحيفة "WSJ": قائد في الظل وصور بالذكاء الاصطناعي.. كيف يعرقل "اختفاء" مجتبى خامنئي إنهاء الحرب

سوريا.. أزمة لافتة اللغة العربية في محافظة الحسكة تتفاقم (فيديو+صور)

ترامب: السفن بدأت تغيير مسارها من هرمز إلى الموانئ الأمريكية ونتفاوض مع إيران

بريطانيا وفرنسا تحشدان قوات بحرية قرب هرمز

وزير لبناني سابق يرفض التفاوض المباشر مع إسرائيل ويطالب الحكومة بسحب تجريم المقاومة

بوتين: أوروبا تصعد الحرب في أوكرانيا.. وشرودر أفضل خيار للمفاوضات مع الاتحاد الأوروبي

بوتين: استبعاد الآليات العسكرية من عرض النصر بموسكو مرتبط بتركيز قواتنا على مهامها في العملية الخاصة