Посетите репозиторий Gemma Cookbook, где можно найти примеры генерации и настройки! Узнать больше

Эта страница переведена с помощью Cloud Translation API.

Джемма открытые модели

Семейство легких современных открытых моделей, созданных на основе тех же исследований и технологий, которые использовались при создании моделей Gemini.

Начать

Ответственный по дизайну

Эти модели, включающие в себя комплексные меры безопасности, помогают обеспечить ответственные и надежные решения в области искусственного интеллекта посредством тщательно подобранных наборов данных и тщательной настройки.

Значок непревзойденной производительности

Непревзойденная производительность при таком размере

Модели Gemma достигают исключительных результатов в тестах размеров 2B, 7B, 9B и 27B, превосходя даже некоторые более крупные открытые модели.

Гибкая структура

Keras 3.0 обеспечивает полную совместимость с JAX, TensorFlow и PyTorch, что позволяет вам легко выбирать и переключать платформы в зависимости от вашей задачи.

Представляем
Джемма 2

Gemma 2, переработанная для достижения непревзойденной производительности и непревзойденной эффективности, оптимизируется для молниеносного вывода на разнообразном оборудовании.

Попробуйте Gemma 2 в Google AI Studio

5 выстрелов

ММЛУ

Тест MMLU — это тест, который измеряет широту знаний и способность решать проблемы, приобретенные большими языковыми моделями во время предварительного обучения.

25 выстрелов

АРК-С

Тест ARC-c представляет собой более специализированную подгруппу набора данных ARC-e, содержащую только вопросы, на которые неправильно ответили обычные алгоритмы (база поиска и совпадение слов).

5 выстрелов

GSM8K

Тест GSM8K проверяет способность языковой модели решать математические задачи на уровне начальной школы, которые часто требуют нескольких этапов рассуждения.

3-5 выстрелов

AGIEval

Тест AGIEval проверяет общий интеллект языковой модели, используя вопросы, полученные из реальных экзаменов, предназначенных для оценки интеллектуальных способностей человека.

3 выстрела, ЦТ

ББХ

Тест BBH (BIG-Bench Hard) фокусируется на задачах, которые выходят за рамки возможностей существующих языковых моделей, проверяя их пределы в различных областях рассуждения и понимания.

3 выстрела, F1

УРОНИТЬ

DROP — это тест на понимание прочитанного, который требует дискретного рассуждения по абзацам.

5 выстрелов

Виногранде

Тест Виногранде проверяет способность языковой модели решать неоднозначные задачи с заполнением пробелов с помощью двоичных опций, требующие обобщенных рассуждений, основанных на здравом смысле.

10 выстрелов

HellaSwag

Тест HellaSwag проверяет способность языковой модели понимать и применять здравый смысл, выбирая наиболее логичный конец истории.

4 выстрела

МАТЕМАТИКА

MATH оценивает способность языковой модели решать сложные математические словесные задачи, требующие рассуждения, многоэтапного решения задач и понимания математических концепций.

0 выстрелов

АРК-е

Тест ARC-e проверяет продвинутые навыки ответа на вопросы языковой модели с помощью естественных научных вопросов уровня начальной школы с несколькими вариантами ответов.

0 выстрелов

ПИКА

Тест PIQA проверяет способность языковой модели понимать и применять физические знания, отвечая на вопросы о повседневных физических взаимодействиях.

0 выстрелов

СИКА

Тест SIQA оценивает понимание языковой моделью социальных взаимодействий и социального здравого смысла, задавая вопросы о действиях людей и их социальных последствиях.

0 выстрелов

Булк

Тест BoolQ проверяет способность языковой модели отвечать на естественные вопросы типа «да/нет», проверяя способность модели выполнять реальные задачи вывода на естественном языке.

5 выстрелов

ВикторинаQA

Тест TriviaQA проверяет навыки понимания прочитанного с помощью тройки вопросов-ответов-доказательств.

5 выстрелов

НК

Тест NQ (Естественные вопросы) проверяет способность языковой модели находить и понимать ответы в целых статьях Википедии, моделируя реальные сценарии ответов на вопросы.

пройти@1

HumanEval

Тест HumanEval проверяет возможности языковой модели по генерации кода, оценивая, проходят ли ее решения функциональные модульные тесты для решения проблем программирования.

3 выстрела

МБПП

Тест MBPP проверяет способность языковой модели решать основные задачи программирования на Python, уделяя особое внимание фундаментальным концепциям программирования и использованию стандартной библиотеки.

100%

75%

50%

25%

100%

75%

50%

25%

Джемма 1

2,5Б

42,3

Джемма 2

2.6Б

51,3

Мистраль

7Б

62,5

ЛЛАМА 3

8Б

66,6

Джемма 1

7Б

64,4

Джемма 2

9Б

71,3

Джемма 2

27Б

75,2

Джемма 1

2,5Б

48,5

Джемма 2

2.6Б

55,4

Мистраль

7Б

60,5

ЛЛАМА 3

8Б

59,2

Джемма 1

7Б

61,1

Джемма 2

9Б

68,4

Джемма 2

27Б

71,4

Джемма 1

2,5Б

15.1

Джемма 2

2.6Б

23,9

Мистраль

7Б

39,6

ЛЛАМА 3

8Б

45,7

Джемма 1

7Б

51,8

Джемма 2

9Б

68,6

Джемма 2

27Б

74,0

Джемма 1

2,5Б

24.2

Джемма 2

2.6Б

30,6

Мистраль

7Б

44,0

ЛЛАМА 3

8Б

45,9

Джемма 1

7Б

44,9

Джемма 2

9Б

52,8

Джемма 2

27Б

55,1

Джемма 1

2,5Б

35,2

Джемма 2

2.6Б

41,9

Мистраль

7Б

56,0

ЛЛАМА 3

8Б

61,1

Джемма 1

7Б

59,0

Джемма 2

9Б

68,2

Джемма 2

27Б

74,9

Джемма 1

2,5Б

48,5

Джемма 2

2.6Б

52,0

Мистраль

7Б

63,8

ЛЛАМА 3

8Б

58,4

Джемма 1

7Б

56,3

Джемма 2

9Б

69,4

Джемма 2

27Б

74,2

Джемма 1

2,5Б

66,8

Джемма 2

2.6Б

70,9

Мистраль

7Б

78,5

ЛЛАМА 3

8Б

76,1

Джемма 1

7Б

79,0

Джемма 2

9Б

80,6

Джемма 2

27Б

83,7

Джемма 1

2,5Б

71,7

Джемма 2

2.6Б

73,0

Мистраль

7Б

83,0

ЛЛАМА 3

8Б

82,0

Джемма 1

7Б

82,3

Джемма 2

9Б

81,9

Джемма 2

27Б

86,4

Джемма 1

2,5Б

11,8

Джемма 2

2.6Б

15,0

Мистраль

7Б

12,7

Джемма 1

7Б

24,3

Джемма 2

9Б

36,6

Джемма 2

27Б

42,3

Джемма 1

2,5Б

73,2

Джемма 2

2.6Б

80,1

Мистраль

7Б

80,5

Джемма 1

7Б

81,5

Джемма 2

9Б

88,0

Джемма 2

27Б

88,6

Джемма 1

2,5Б

77,3

Джемма 2

2.6Б

77,8

Мистраль

7Б

82,2

Джемма 1

7Б

81,2

Джемма 2

9Б

81,7

Джемма 2

27Б

83,2

Джемма 1

2,5Б

49,7

Джемма 2

2.6Б

51,9

Мистраль

7Б

47,0

Джемма 1

7Б

51,8

Джемма 2

9Б

53,4

Джемма 2

27Б

53,7

Джемма 1

2,5Б

69,4

Джемма 2

2.6Б

72,5

Мистраль

7Б

83,2

Джемма 1

7Б

83,2

Джемма 2

9Б

84,2

Джемма 2

27Б

84,8

Джемма 1

2,5Б

53,2

Джемма 2

2.6Б

59,4

Мистраль

7Б

62,5

Джемма 1

7Б

63,4

Джемма 2

9Б

76,6

Джемма 2

27Б

83,7

Джемма 1

2,5Б

12,5

Джемма 2

2.6Б

16,7

Мистраль

7Б

23.2

Джемма 1

7Б

23,0

Джемма 2

9Б

29,2

Джемма 2

27Б

34,5

Джемма 1

2,5Б

22,0

Джемма 2

2.6Б

17,7

Мистраль

7Б

26,2

Джемма 1

7Б

32,3

Джемма 2

9Б

40,2

Джемма 2

27Б

51,8

Джемма 1

2,5Б

29,2

Джемма 2

2.6Б

29,6

Мистраль

7Б

40,2

Джемма 1

7Б

44,4

Джемма 2

9Б

52,4

Джемма 2

27Б

62,6

*Это тесты для предварительно обученных моделей. Подробную информацию о производительности с другими методологиями см. в техническом отчете.

Читать технический отчет

Модельная семья Джеммы

Новый выпуск

Джемма 2

Gemma 2 предлагает три новые, мощные и эффективные модели, доступные с размерами 2, 9 и 27 миллиардов параметров, все со встроенными улучшениями безопасности.

Начать работу с Hugging Face Начать работу с Kaggle

Новый выпуск

ДанныеГемма

DataGemma — это первые открытые модели, предназначенные для подключения LLM к обширным реальным данным, полученным из Google Data Commons.

Начните работу с Kaggle

Джемма 1

Модели Gemma — это легкие большие языковые модели преобразования текста в текст, предназначенные только для декодера, обученные на огромном наборе данных текста, кода и математического контента для различных задач обработки естественного языка.

Начните работу с Kaggle

Рекуррентная Джемма

RecurrentGemma — это технически отличная модель, которая использует рекуррентные нейронные сети и локальное внимание для повышения эффективности памяти.

Начните работу с Kaggle

ПалиДжемма

PaliGemma — это модель открытого языка видения, вдохновленная PaLI-3, использующая SigLIP и Gemma, разработанная как универсальная модель для переноса на широкий спектр задач языка видения.

Начните работу с Kaggle

КодGemma

Используя основу наших оригинальных предварительно обученных моделей Gemma, CodeGemma предоставляет мощные возможности завершения и генерации кода в размерах, подходящих для вашего локального компьютера.

Начните работу с Kaggle

Изучите наши инструменты

ЩитДжемма

ShieldGemma — это набор моделей классификаторов контента безопасности, созданный на основе Gemma 2 для фильтрации входных и выходных данных моделей искусственного интеллекта и обеспечения безопасности пользователя.