
بلسم هو مبادرة تعاون بين مؤسسات أكاديمية وحكومية مرموقة في الشرق الأوسط. يهدف بلسم إلى قيادة تطوير وتجهيز مجموعات بيانات اختبار متخصصة تُعتبر ضرورية لتقييم أداء النماذج اللغوية الضخمة (LLMs) في مجموعة متنوعة من مهام معالجة اللغة الطبيعية (NLP) للغة العربية.
10+
جهة مشاركة
50,000+
ســــؤال
78
مهمة مغطاة
1000+
مجموعة بيانات
جمع الموارد والخبرات لإنشاء مجموعات بيانات عالية الجودة في مستويات مختلفة للعربية وبمجالات متنوعة مصممة خصيصًا لاختبارات الذكاء الاصطناعي؛ لتعزيز قوة نماذج اللغة الضخمة (LLMs) وتنوعها.
وضع أطر ومعايير تقييم موحدة لتقييم أداء نماذج اللغة الضخمة التي يطورها المساهمون بما يتيح المقارنات الواضحة، ويحفز التحسينات المستمرة.
عرض أحدث نتائج التقييم لأفضل النماذج اللغوية الضخمة أداءً لمهام معالجة اللغة العربية الطبيعية.
إعطاء الأولوية للاعتبارات الأخلاقية والمما رسات المسؤولة للذكاء الاصطناعي طوال عملية التطوير لضمان العدالة، والشفافية.
توحيد رؤى المجتمعات البحثية في معالجة اللغة العربية الطبيعية، ببناء مجموعات بيانات مشتركة ومعايير تقييم واحدة.