مجموعة بيانات عربية متعددة الوسائط لتوعية النماذج الذكية بالثقافة العربية
✴️ تقدم PEARL أكثر من 309 ألف مثال متعدد الوسائط يغطي 10 مجالات ثقافية أساسية (اللباس، العمارة، الطعام، العادات… إلخ)، وهو ما يملأ فراغ تمثيل الثقافة العربية في نماذج الرؤية-اللغة ويساعد على تقليل الانحيازات الثقافية في LVLMs !!
✴️ هناك :
~ PEARL (النسخة الكاملة):
مجموعة كبيرة للبحث والتدريب.
~ PEARL-LITE:
نسخة خفيفة للتجارب السريعة والاختبارات.
~ PEARL-X :
معيار متخصص لفحص الفروق الدقيقة بين المفاهيم المشتركة عبر الدول العربية.
💡 عند تغذية النماذج بتعليمات تركز على الاستدلال الثقافي يتحسن أداؤها في تقييمات الفهم الثقافي، وهو ما أظهرتْه تجارب عديدة على LVLMs الحديثة؛ وهذه هي القيمة العلمية الحقيقية لـPEARL .. !!
روابط 💎
الموفع 🔗
موقع المشروع والمستندات البحثية (EMNLP 2025) 🔗
سوريا
مصر
الإمارات
السعودية
قطر