إطلاق Encord لمجموعة بيانات E-MM1: أكبر بمئة مرة من أي مجموعة بيانات موجودة
تطور تاريخي يشهده عالم بيانات الذكاء الاصطناعي مع إطلاق Encord لمجموعة بيانات E-MM1، والتي تمثل قفزة نوعية بحجمها الهائل الذي يصل إلى (107) مليون مجموعة بيانات متعددة الوسائط، ما يجعلها أكبر بمئة مرة من أي مجموعة بيانات موجودة سابقاً !!
تتضمن هذه المجموعة بيانات في خمسة أنماط وهي ::
[ الصور – مقاطع الفيديو – الصوت – النصوص – سحابات النقاط ثلاثية الأبعاد (3D point clouds). ]
✴️ تأتي أهمية هذه المجموعة في تسهيل عملية تدريب نماذج الذكاء الاصطناعي التوليدي (GenAI) ونماذج الروبوتات والذكاء المادي (Embodied AI)، حيث أنها توفر قاعدة بيانات ضخمة ومصنفة مسبقاً بما يقارب مليون مثال مُعلم بشرياً، جاهزة للاستخدام دون الحاجة إلى تنظيف وتنقية.
✴️ تختلف هذه المجموعة عن أمثال LAION-5B التي اقتصرت على (5) مليار زوج من النصوص والصور فقط.
✴️ تساهم مجموعة E-MM1 في تسريع تطوير فهم النماذج متعددة الأنماط للعلاقات المتقاطعة بين الوسائط المختلفة.
💡 يشير هذا الإطلاق إلى أن التركيز على جودة وحجم البيانات متعددة الأنماط هو ساحة المعركة الحقيقية، والتي ستمهد الطريق لجيل جديد من التطبيقات الذكية ..
اكتشف التفاصيل التقنية
سوريا
مصر
الإمارات
السعودية
قطر