نماذج Gemma المفتوحة
مجموعة من أحدث النماذج المتطوّرة والخفيفة المتاحة للجميع، والتي تم إنشاؤها بناءً على الأبحاث والتكنولوجيا نفسها المستخدَمة في إنشاء نماذج Gemini
نعرّفك على
Gemma 2
تمّت إعادة تصميم Gemma 2 لتحقيق أداء استثنائي وكفاءة لا مثيل لها، وهي محسّنة لإجراء عمليات استنتاج سريعة جدًا على الأجهزة المتنوعة.
5 لقطات
MMLU
مقياس MMLU هو اختبار يقيس مدى اتساع المعرفة وقدرة حلّ المشاكل التي اكتسبتها النماذج اللغوية الكبيرة أثناء التدريب المُسبَق.
25 لقطة
ARC-C
معيار ARC-c هو مجموعة فرعية أكثر تركيزًا من مجموعة بيانات ARC-e، ولا يحتوي إلا على الأسئلة التي تمت الإجابة عنها بشكل غير صحيح من خلال الخوارزميات الشائعة (قاعدة استرجاعية وظهور الكلمات).
5 لقطات
GSM8K
يختبر مقياس GSM8K أداء نموذج اللغة في حلّ المسائل الحسابية على مستوى الصفوف المدرسية التي تتطلّب غالبًا خطوات متعددة من الاستدلال.
3-5-shot
AGIEval
يختبر مقياس AGIEval الذكاء العام لنموذج لغوي باستخدام أسئلة مستمدة من اختبارات حقيقية مصمّمة لتقييم القدرات الفكرية للبشر.
3-shot، CoT
BBH
يركز مقياس BBH (BIG-Bench Hard) على المهام التي يُعتقد أنّها تتجاوز قدرات النماذج اللغوية الحالية، ما يُظهر حدودها في نطاقات مختلفة من الاستدلال والفهم.
لقطة بثلاثة صور، F1
الانبطاح
اختبار DROP هو مقياس لفهم القراءة يتطلّب التفكير الدقيق في الفقرات.
5 لقطات
Winogrande
يختبر مقياس Winogrande أداء نموذج اللغة في حلّ مهام ملء الفراغات الغامضة باستخدام خيارات ثنائية، ما يتطلّب استخدام المنطق العام الشائع.
10 لقطات
HellaSwag
يشكّل مقياس HellaSwag تحدّيًا لقدرة نموذج اللغة على فهم المنطق العام وتطبيقه من خلال اختيار النهاية الأكثر منطقية للقصة.
لقطة من 4 صور
MATH
يُقيّم MATH قدرة نموذج لغوي على حلّ المسائل الكلامية الرياضية المعقّدة التي تتطلّب التفكير المنطقي وحلّ المشاكل المتعدّدة الخطوات وفهم المفاهيم الرياضية.
طلب بلا مثال
ARC-e
يختبر مقياس ARC-e الأداء المتقدّم لنموذج لغوي في الإجابة عن الأسئلة من خلال أسئلة علمية حقيقية متعددة الخيارات على مستوى المدرسة الابتدائية.
طلب بلا مثال
PIQA
يختبر معيار PIQA قدرة النموذج اللغوي على فهم وتطبيق المنطق السليم من خلال الإجابة عن أسئلة حول التفاعلات الجسدية اليومية.
طلب بلا مثال
SIQA
يقيّم مقياس أداء SIQA مدى فهم النموذج اللغوي للتفاعلات الاجتماعية والحس السليم الاجتماعي من خلال طرح أسئلة حول تصرفات الأشخاص وآثارها الاجتماعية.
طلب بلا مثال
Boolq
يختبر مقياس BoolQ أداء نموذج اللغة في الإجابة عن أسئلة نعم/لا بشكل طبيعي، ما يُظهر قدرة النماذج على تنفيذ مهام الاستنتاج في اللغة الطبيعية في الحياة الواقعية.
5 لقطات
TriviaQA
يختبر مقياس TriviaQA الأداء في مهارات فهم القراءة باستخدام ثلاثيات السؤال والإجابة والدليل.
5 لقطات
NQ
يختبر مقياس قياس الأداء (NQ) قدرة النموذج اللغوي على إيجاد الإجابات وفهمها في مقالات ويكيبيديا كاملة، من خلال محاكاة سيناريوهات الإجابة عن الأسئلة الواقعية.
pass@1
HumanEval
يختبر معيار HumanEval قدرات إنشاء الرموز البرمجية في نموذج لغوي من خلال تقييم ما إذا كانت حلوله تجتاز اختبارات الوحدة الوظيفية لمشكلات البرمجة.
3 لقطات
MBPP
يختبر مقياس MBPP قدرة نموذج اللغة على حلّ المشاكل الأساسية في برمجة بايثون، مع التركيز على مفاهيم البرمجة الأساسية واستخدام المكتبة العادية.
100%
75%
50%
25%
0%
100%
75%
50%
25%
0%
Gemma 1
2.5 مليار
Gemma 2
2.6 مليار
Mistral
7 مليار
اللاما 3
8B
Gemma 1
7 مليار
Gemma 2
9 مليار
Gemma 2
27 مليار
Gemma 1
2.5 مليار
Gemma 2
2.6 مليار
Mistral
7 مليار
LLAMA 3
8 مليار
Gemma 1
7 مليار
Gemma 2
9B
Gemma 2
27 مليار
Gemma 1
2.5 مليار
Gemma 2
2.6 مليار
Mistral
7 مليار
LLAMA 3
8B
Gemma 1
7 مليار
Gemma 2
9 مليار
Gemma 2
27 مليار
Gemma 1
2.5 مليار
Gemma 2
2.6 مليار
Mistral
7 مليار
LLAMA 3
8B
Gemma 1
7 مليار
Gemma 2
9B
Gemma 2
27 مليار
Gemma 1
2.5 مليار
Gemma 2
2.6 مليار
Mistral
7 مليار
LLAMA 3
8B
Gemma 1
7 مليار
Gemma 2
9 مليار
Gemma 2
27 مليار
Gemma 1
2.5 مليار
Gemma 2
2.6 مليار
Mistral
7 مليار
LLAMA 3
8B
Gemma 1
7 مليار
Gemma 2
9B
Gemma 2
27 مليار
Gemma 1
2.5 مليار
Gemma 2
2.6 مليار
Mistral
7 مليار
LLAMA 3
8B
Gemma 1
7 مليار
Gemma 2
9B
Gemma 2
27 مليار
Gemma 1
2.5 مليار
Gemma 2
2.6 مليار
Mistral
7 مليار
اللاما 3
8B
Gemma 1
7 مليار
Gemma 2
9 مليار
Gemma 2
27 مليار
Gemma 1
2.5 مليار
Gemma 2
2.6 مليار
Mistral
7 مليار
Gemma 1
7 مليار
Gemma 2
9B
Gemma 2
27 مليار
Gemma 1
2.5 مليار
Gemma 2
2.6 مليار
Mistral
7 مليار
Gemma 1
7 مليار
Gemma 2
9B
Gemma 2
27 مليار
Gemma 1
2.5 مليار
Gemma 2
2.6 مليار
Mistral
7 مليار
Gemma 1
7 مليار
Gemma 2
9 مليار
Gemma 2
27 مليار
Gemma 1
2.5 مليار
Gemma 2
2.6 مليار
Mistral
7 مليار
Gemma 1
7 مليار
Gemma 2
9 مليار
Gemma 2
27 مليار
Gemma 1
2.5 مليار
Gemma 2
2.6 مليار
Mistral
7 مليار
Gemma 1
7 مليار
Gemma 2
9 مليار
Gemma 2
27 مليار
Gemma 1
2.5 مليار
Gemma 2
2.6 مليار
Mistral
7 مليار
Gemma 1
7 مليار
Gemma 2
9 مليار
Gemma 2
27 مليار
Gemma 1
2.5 مليار
Gemma 2
2.6 مليار
Mistral
7 مليار
Gemma 1
7 مليار
Gemma 2
9B
Gemma 2
27 مليار
Gemma 1
2.5 مليار
Gemma 2
2.6 مليار
Mistral
7 مليار
Gemma 1
7 مليار
Gemma 2
9B
Gemma 2
27 مليار
Gemma 1
2.5 مليار
Gemma 2
2.6 مليار
Mistral
7 مليار
Gemma 1
7 مليار
Gemma 2
9B
Gemma 2
27 مليار
*في ما يلي مقاييس الأداء للنماذج المدرَّبة مسبقًا. يُرجى الاطّلاع على التقرير الفني للحصول على تفاصيل عن الأداء باستخدام أساليب أخرى.
مجموعة نماذج Gemma
أدلة البدء السريع للمطوّرين
أدلة البدء السريع للشركاء
Gemma Cookbook
استكشِف مجموعة من الوصفات والأمثلة العملية التي تعرض فعالية Gemma وتنوعها في مهام مثل إضافة ترجمة وشرح للصور باستخدام PaliGemma، وإنشاء الرموز البرمجية باستخدام CodeGemma، وإنشاء محادثات آلية باستخدام نماذج Gemma المحسَّنة.
تطوير الذكاء الاصطناعي بشكل مسؤول
المسؤولية من خلال التصميم
تم تدريبها مسبقًا على بيانات منسَّقة بعناية وتم ضبطها لضمان الأمان، ما يساعد في تعزيز تطوير الذكاء الاصطناعي الآمن والمسؤول استنادًا إلى نماذج Gemma.
تقييم فعّال وشفاف
تكشف التقييمات الشاملة وإعداد التقارير الشفافة عن قيود النموذج لاعتماد نهج مسؤول لكل حالة استخدام.
تعزيز التطوير المسؤول
تساعد "مجموعة أدوات الذكاء الاصطناعي التوليدي المسؤول" المطوّرين في تصميم أفضل ممارسات الذكاء الاصطناعي المسؤول وتنفيذها.
محسَّنة لخدمات Google Cloud
باستخدام نماذج Gemma على Google Cloud، يمكنك تخصيص النموذج بشكلٍ معمّق لتلبية احتياجاتك المحدّدة باستخدام أدوات Vertex AI المُدارة بالكامل أو خيار الإدارة الذاتية في GKE، ونشره على بنية أساسية مرنة وفعّالة من حيث التكلفة ومحسّنة بالاستناد إلى الذكاء الاصطناعي.
تسريع الأبحاث الأكاديمية باستخدام أرصدة Google Cloud
أنهى برنامج الأبحاث الأكاديمية مؤخرًا فترة تقديم الطلبات، ومنح أرصدة Google Cloud لدعم الباحثين في توسيع حدود الاكتشاف العلمي باستخدام نماذج Gemma. نحن متحمّسون للاطّلاع على الأبحاث الرائدة التي ستنتج عن هذه المبادرة.
انضم إلى المنتدى
يمكنك التواصل مع الآخرين في مجتمع نماذج تعلُّم الآلة وتصفّحها ومشاركتها.