Tham khảo kho lưu trữ Sách nấu ăn Gemma để xem các ví dụ về cách tạo và điều chỉnh! Tìm hiểu thêm

Trang này được dịch bởi Cloud Translation API.

Mô hình Gemma Open

Một dòng mô hình mở, gọn nhẹ, hiện đại, được xây dựng dựa trên chính nghiên cứu và công nghệ dùng để tạo ra các mô hình Gemini

Bắt đầu

Trách nhiệm từ trong thiết kế

Bằng cách kết hợp các biện pháp an toàn toàn diện, những mô hình này giúp đảm bảo các giải pháp AI có trách nhiệm và đáng tin cậy thông qua các tập dữ liệu được tuyển chọn và điều chỉnh nghiêm ngặt.

Hiệu suất tuyệt vời ở quy mô lớn

Các mô hình Gemma đạt được kết quả điểm chuẩn vượt trội ở kích thước 2B, 7B, 9B và 27B, thậm chí vượt trội hơn một số mô hình mở lớn hơn.

Khung linh hoạt

Với Keras 3.0, bạn có thể tận hưởng khả năng tương thích liền mạch với JAX, TensorFlow và PyTorch, giúp bạn dễ dàng chọn và chuyển đổi khung tùy theo nhiệm vụ của mình.

Giới thiệu
Gemma 2

Được thiết kế lại để mang lại hiệu suất vượt trội và hiệu quả không thể so sánh, Gemma 2 tối ưu hoá để dự đoán nhanh chóng trên nhiều loại phần cứng.

Dùng thử Gemma 2 trong Google AI Studio

5 lần chụp

MMLU

Điểm chuẩn MMLU là một bài kiểm tra đo lường phạm vi kiến thức và khả năng giải quyết vấn đề mà các mô hình ngôn ngữ lớn có được trong quá trình huấn luyện trước.

25 bức ảnh

ARC-C

Điểm chuẩn ARC-c là một tập hợp con tập trung hơn của tập dữ liệu ARC-e, chỉ chứa những câu hỏi mà các thuật toán phổ biến (dựa trên truy xuất và đồng xuất hiện từ) trả lời không chính xác.

5 lần chụp

GSM8K

Điểm chuẩn GSM8K kiểm tra khả năng giải các bài toán toán học ở cấp trường của một mô hình ngôn ngữ thường yêu cầu nhiều bước lập luận.

3-5-shot

AGIEval

Điểm chuẩn AGIEval kiểm tra trí thông minh chung của một mô hình ngôn ngữ bằng cách sử dụng các câu hỏi bắt nguồn từ các bài kiểm tra thực tế được thiết kế để đánh giá khả năng trí tuệ của con người.

3 lần chụp, CoT

BBH

Điểm chuẩn BBH (BIG-Bench Hard) tập trung vào những nhiệm vụ được xem là vượt quá khả năng của các mô hình ngôn ngữ hiện tại, kiểm tra các giới hạn của những nhiệm vụ đó trên nhiều miền lý luận và hiểu biết.

3 shot, F1

CÚI THẤP

DROP là điểm chuẩn về khả năng đọc hiểu, đòi hỏi khả năng suy luận riêng biệt về các đoạn văn.

5 lần chụp

Winogrande

Điểm chuẩn Winogrande kiểm tra khả năng giải quyết các công việc điền vào chỗ trống không rõ ràng của mô hình ngôn ngữ bằng quyền chọn nhị phân, đòi hỏi khả năng lập luận chung tổng quát.

10 cảnh quay

HellaSwag

Điểm chuẩn HellaSwag thử thách khả năng hiểu và áp dụng lập luận theo lý luận thông thường của một mô hình ngôn ngữ bằng cách chọn phần kết hợp lý nhất cho câu chuyện.

4 cảnh quay

MATH

MATH đánh giá khả năng của một mô hình ngôn ngữ trong việc giải các bài toán đố toán học phức tạp, đòi hỏi phải suy luận, giải quyết vấn đề theo nhiều bước và hiểu các khái niệm toán học.

ảnh 0

ARC-e

Điểm chuẩn ARC-e kiểm tra kỹ năng trả lời câu hỏi nâng cao của một mô hình ngôn ngữ bằng các câu hỏi khoa học dạng trắc nghiệm ở cấp tiểu học.

ảnh 0

PIQA

Điểm chuẩn PIQA kiểm tra khả năng hiểu và áp dụng kiến thức vật lý thông thường của một mô hình ngôn ngữ bằng cách trả lời các câu hỏi về các tương tác vật lý thường ngày.

ảnh 0

SIQA

Điểm chuẩn SIQA đánh giá khả năng hiểu biết của một mô hình ngôn ngữ về các hoạt động tương tác xã hội và tri thức xã hội thông thường bằng cách đặt câu hỏi về hành động của con người và tác động xã hội của hành động đó.

0-shot

Boolq

Điểm chuẩn BoolQ kiểm tra khả năng của mô hình ngôn ngữ trong việc trả lời các câu hỏi có/không xuất hiện tự nhiên, kiểm tra khả năng của mô hình trong việc thực hiện các nhiệm vụ suy luận bằng ngôn ngữ tự nhiên trong thực tế.

5 lần chụp

TriviaQA

Điểm chuẩn TriviaQA kiểm tra kỹ năng đọc hiểu bằng bộ ba câu hỏi-đáp án-bằng chứng.

5 lần chụp

Điểm chuẩn NQ (Câu hỏi tự nhiên) kiểm tra khả năng của một mô hình ngôn ngữ trong việc tìm và hiểu câu trả lời trong toàn bộ bài viết trên Wikipedia, mô phỏng các tình huống trả lời câu hỏi trong thực tế.

pass@1

HumanEval

Điểm chuẩn HumanEval kiểm tra khả năng tạo mã của mô hình ngôn ngữ bằng cách đánh giá xem các giải pháp của mô hình có vượt qua các bài kiểm thử đơn vị chức năng cho các vấn đề lập trình hay không.

3 lần chụp

MBPP

Điểm chuẩn MBPP kiểm tra khả năng của một mô hình ngôn ngữ trong việc giải quyết các vấn đề lập trình cơ bản bằng Python, tập trung vào các khái niệm lập trình cơ bản và cách sử dụng thư viện chuẩn.

100%

75%

50%

25%

100%

75%

50%

25%

Gemma 1

2,5 tỷ

42.3

Gemma 2

2,6 tỷ

51,3

Mistral

7 tỷ

62,5

LLAMA 3

66,6

Gemma 1

7 tỷ

64,4

Gemma 2

71,3

Gemma 2

27 TỶ

75,2

Gemma 1

2,5 tỷ

48,5

Gemma 2

2,6 tỷ

55,4

Mistral

7 TỶ

60,5

LLAMA 3

59,2

Gemma 1

7 TỶ

61,1

Gemma 2

68,4

Gemma 2

27 tỷ

71,4

Gemma 1

2,5 tỷ

15,1

Gemma 2

2,6 TỶ

23,9

Mistral

7 tỷ

39,6

LLAMA 3

45,7

Gemma 1

7 tỷ

51,8

Gemma 2

68,6

Gemma 2

27 tỷ

Gemma 1

2,5 tỷ

24,2

Gemma 2

2,6 tỷ

30,6

Mistral

7 tỷ

44,0

LLAMA 3

8 TỶ

45,9

Gemma 1

7 tỷ

44,9

Gemma 2

9 TỶ

52,8

Gemma 2

27 tỷ

55.1

Gemma 1

2,5 tỷ

35,2

Gemma 2

2,6 TỶ

41,9

Mistral

7 tỷ

56,0

LLAMA 3

61,1

Gemma 1

7 tỷ

59,0

Gemma 2

9 TỶ

68.2

Gemma 2

27 TỶ

74,9

Gemma 1

2,5 tỷ

48,5

Gemma 2

2,6 TỶ

52.0

Mistral

7 tỷ

63,8

LLAMA 3

58,4

Gemma 1

7 tỷ

56,3

Gemma 2

9 TỶ

69,4

Gemma 2

27 tỷ

74,2

Gemma 1

2,5 tỷ

66,8

Gemma 2

2,6 TỶ

70,9

Mistral

7 tỷ

78,5

LLAMA 3

8 TỶ

76,1

Gemma 1

7 tỷ

Gemma 2

9 TỶ

80,6

Gemma 2

27 TỶ

83,7

Gemma 1

2,5 tỷ

71,7

Gemma 2

2,6 TỶ

Mistral

7 tỷ

LLAMA 3

Gemma 1

7 tỷ

82,3

Gemma 2

81,9

Gemma 2

27 tỷ

86,4

Gemma 1

2,5 tỷ

11.8

Gemma 2

2,6 tỷ

Mistral

7 tỷ

12,7

Gemma 1

7 tỷ

24,3

Gemma 2

9 TỶ

36,6

Gemma 2

27 TỶ

42,3

Gemma 1

2,5 tỷ

73,2

Gemma 2

2,6 tỷ

80,1

Mistral

7 tỷ

80,5

Gemma 1

7 tỷ

81,5

Gemma 2

88,0

Gemma 2

27 tỷ

88,6

Gemma 1

2,5 tỷ

77,3

Gemma 2

2,6 tỷ

77,8

Mistral

7 tỷ

82,2

Gemma 1

7 tỷ

81,2

Gemma 2

81,7

Gemma 2

27 tỷ

83,2

Gemma 1

2,5 tỷ

49,7

Gemma 2

2,6 tỷ

51,9

Mistral

7 tỷ

47,0

Gemma 1

7 tỷ

51,8

Gemma 2

53,4

Gemma 2

27 tỷ

53,7

Gemma 1

2,5 tỷ

69,4

Gemma 2

2,6 TỶ

72,5

Mistral

7 tỷ

83,2

Gemma 1

7 tỷ

83,2

Gemma 2

84,2

Gemma 2

27 TỶ

84,8

Gemma 1

2,5 tỷ

53,2

Gemma 2

2,6 tỷ

59,4

Mistral

7 tỷ

62,5

Gemma 1

7 tỷ

63,4

Gemma 2

9 TỶ

76,6

Gemma 2

27 TỶ

83,7

Gemma 1

2,5 tỷ

12,5

Gemma 2

2,6 TỶ

16,7

Mistral

7 TỶ

23,2

Gemma 1

7 tỷ

23.0

Gemma 2

9 TỶ

29,2

Gemma 2

27 tỷ

34,5

Gemma 1

2,5 tỷ

22,0

Gemma 2

2,6 tỷ

17,7

Mistral

7 tỷ

26,2

Gemma 1

7 TỶ

32.3

Gemma 2

40,2

Gemma 2

27 tỷ

51,8

Gemma 1

2,5 tỷ

29,2

Gemma 2

2,6 tỷ

29,6

Mistral

7 TỶ

40,2

Gemma 1

7 TỶ

44,4

Gemma 2

52,4

Gemma 2

27 tỷ

62,6

*Đây là điểm chuẩn cho các mô hình được huấn luyện trước, hãy xem báo cáo kỹ thuật để biết thông tin chi tiết về hiệu suất với các phương pháp khác.

Đọc báo cáo kỹ thuật

Nhóm mô hình Gemma

Bản phát hành mới

Gemma 2

Gemma 2 cung cấp 3 mô hình mới, mạnh mẽ và hiệu quả có kích thước tham số là 2, 9 và 27 tỷ, tất cả đều tích hợp các tính năng an toàn nâng cao.

Bắt đầu sử dụng Hugging Face Bắt đầu sử dụng Kaggle

Bản phát hành mới

DataGemma

DataGemma là mô hình mở đầu tiên được thiết kế để kết nối các mô hình ngôn ngữ lớn (LLM) với dữ liệu thực tế phong phú được rút ra từ Data Commons của Google.

Bắt đầu trên Kaggle

Gemma 1

Mô hình Gemma là các mô hình ngôn ngữ lớn, nhẹ, chỉ có bộ giải mã, từ văn bản sang văn bản, được huấn luyện dựa trên một tập dữ liệu khổng lồ gồm văn bản, mã và nội dung toán học cho nhiều nhiệm vụ xử lý ngôn ngữ tự nhiên.

Bắt đầu trên Kaggle

RecurrentGemma

RecurrentGemma là một mô hình khác biệt về mặt kỹ thuật, tận dụng mạng nơron tái sinh và sự chú ý cục bộ để cải thiện hiệu quả bộ nhớ.

Bắt đầu trên Kaggle

PaliGemma

PaliGemma là một mô hình ngôn ngữ thị giác mở lấy cảm hứng từ PaLI-3, tận dụng SigLIP và Gemma, được thiết kế như một mô hình linh hoạt để chuyển sang nhiều nhiệm vụ ngôn ngữ thị giác.

Bắt đầu trên Kaggle

CodeGemma

Khai thác nền tảng của các mô hình Gemma được huấn luyện trước ban đầu, CodeGemma mang đến các tính năng tạo và hoàn thành mã mạnh mẽ ở kích thước phù hợp với máy tính cục bộ của bạn.

Bắt đầu trên Kaggle

Khám phá các công cụ của chúng tôi

ShieldGemma

ShieldGemma là một bộ mô hình phân loại nội dung an toàn được xây dựng dựa trên Gemma 2 để lọc dữ liệu đầu vào và đầu ra của các mô hình AI, đồng thời đảm bảo an toàn cho người dùng.

Phạm vi Gemma

Gemma Scope cung cấp cho các nhà nghiên cứu thông tin minh bạch chưa từng có về quy trình ra quyết định của các mô hình Gemma 2.

Hướng dẫn bắt đầu nhanh dành cho nhà phát triển

Khám phá các hướng dẫn bắt đầu nhanh trên Kaggle

Truy cập vào trang Mô hình Kaggle để tìm hướng dẫn bắt đầu nhanh, ví dụ về mã và nội dung thảo luận về Gemma.

Mở trong Kaggle

Huấn luyện và triển khai trên Google Cloud

Gemma 2 hoạt động tốt nhất trên Google Cloud, với tính năng tối ưu hoá TPU toàn diện để đạt được hiệu suất hàng đầu trên thị trường và tổng chi phí sở hữu trên Vertex.

Mở trong Vertex AI

Dùng thử tính năng chuyển đổi cấp thấp bằng JAX qua Keras 3

Điều chỉnh các mô hình Gemma cho phù hợp với miền và dữ liệu riêng của bạn bằng khung phụ trợ mà bạn chọn thông qua Keras 3.

Mở trong Colab

Xem tất cả các hướng dẫn bắt đầu nhanh trong tài liệu của chúng tôi Xem tất cả các hướng dẫn bắt đầu nhanh

Hướng dẫn bắt đầu nhanh dành cho đối tác

Ôm

Sử dụng Hugging Face Transformers và TRL để tinh chỉnh và dự đoán các tác vụ bằng mô hình Gemma.

NVIDIA

Điều chỉnh mô hình Gemma bằng Khung NVIDIA NeMo và xuất sang TensorRT-LLM để phát hành công khai.

LangChain

Hướng dẫn này chỉ cho bạn cách bắt đầu sử dụng Gemma và LangChain, chạy trong Google Cloud hoặc trong môi trường Colab.

Mọi tỷ lệ

Các tài liệu này hướng dẫn cách sử dụng Gemma qua Điểm cuối Anyscale làm điểm cuối API được quản lý toàn diện.

MongoDB

Bài viết này trình bày cách tận dụng Gemma làm mô hình cơ sở trong quy trình hoặc hệ thống tạo dữ liệu được tăng cường bằng tính năng truy xuất.

Trọng lượng và độ lệch

Tìm hiểu sâu về công cụ Khởi chạy và Đăng ký mô hình của W&B thông qua ví dụ từng bước sử dụng các mô hình Gemma của Google.

Sổ tay nấu ăn của Gemma

Khám phá bộ sưu tập các công thức và ví dụ thực tế thể hiện sức mạnh và tính linh hoạt của Gemma cho các tác vụ như chú thích hình ảnh bằng PaliGemma, tạo mã bằng CodeGemma và xây dựng chatbot bằng các mô hình Gemma được tinh chỉnh.

Bắt đầu nấu ăn

Sử dụng các mô hình của Gemma ngay hôm nay

Mô hình Kaggle

Truy cập vào các mô hình Gemma 2 trên Kaggle

Vertex AI Model Garden

Tuỳ chỉnh Gemma 2 bằng dữ liệu của riêng bạn

Mô hình khuôn mặt ôm

Truy cập, tinh chỉnh và triển khai Gemma

Phát triển AI có trách nhiệm

Thiết kế để làm tròn trách nhiệm

Được đào tạo trước dựa trên dữ liệu được tuyển chọn kỹ lưỡng và luôn chú trọng đến vấn đề an toàn, qua đó hỗ trợ phát triển AI một cách an toàn và có trách nhiệm thông qua các mô hình của Gemma.

Quy trình đánh giá mạnh mẽ và minh bạch

Hoạt động đánh giá toàn diện và báo cáo minh bạch cho thấy các giới hạn của mô hình để áp dụng cách tiếp cận có trách nhiệm cho từng trường hợp sử dụng.

Thúc đẩy phát triển có trách nhiệm

Bộ công cụ AI tạo sinh có trách nhiệm hỗ trợ nhà phát triển thiết kế và triển khai các phương pháp hay nhất về AI có trách nhiệm.

Khám phá Bộ công cụ AI tạo sinh có trách nhiệm

Được tối ưu hoá cho Google Cloud

Với các mô hình Gemma trên Google Cloud, bạn có thể tuỳ chỉnh sâu mô hình theo nhu cầu cụ thể của mình bằng các công cụ được quản lý toàn bộ của Vertex AI hoặc tuỳ chọn tự quản lý của GKE, đồng thời triển khai mô hình đó cho cơ sở hạ tầng được tối ưu hoá cho AI, linh hoạt và tiết kiệm chi phí.

Tìm hiểu thêm trong blog của Google Cloud

Thúc đẩy hoạt động nghiên cứu học thuật bằng tín dụng Google Cloud

Chương trình Nghiên cứu học thuật gần đây đã kết thúc thời gian đăng ký, trao khoản tín dụng Google Cloud để hỗ trợ các nhà nghiên cứu đẩy xa ranh giới của khám phá khoa học bằng cách sử dụng các mô hình Gemma. Chúng tôi rất mong chờ những nghiên cứu đột phá xuất phát từ sáng kiến này.

Hãy chú ý theo dõi để không bỏ lỡ các cơ hội trong tương lai để phát triển nghiên cứu của bạn với Google Cloud.

Tham gia cộng đồng

Kết nối, khám phá và chia sẻ kiến thức với những người khác trong cộng đồng mô hình học máy.

Mô hình Gemma Open

Trách nhiệm từ trong thiết kế

Hiệu suất tuyệt vời ở quy mô lớn

Khung linh hoạt

Giới thiệu
Gemma 2

Nhóm mô hình Gemma

Gemma 2

DataGemma

Gemma 1

RecurrentGemma

PaliGemma

CodeGemma

Khám phá các công cụ của chúng tôi

Hướng dẫn bắt đầu nhanh dành cho nhà phát triển

Khám phá các hướng dẫn bắt đầu nhanh trên Kaggle

Huấn luyện và triển khai trên Google Cloud

Dùng thử tính năng chuyển đổi cấp thấp bằng JAX qua Keras 3

Hướng dẫn bắt đầu nhanh dành cho đối tác

Sổ tay nấu ăn của Gemma

Sử dụng các mô hình của Gemma ngay hôm nay

Phát triển AI có trách nhiệm

Được tối ưu hoá cho Google Cloud

Thúc đẩy hoạt động nghiên cứu học thuật bằng tín dụng Google Cloud

Tham gia cộng đồng

Kaggle

Discord

Blog

Mô hình Gemma Open

Trách nhiệm từ trong thiết kế

Hiệu suất tuyệt vời ở quy mô lớn

Khung linh hoạt

Giới thiệu Gemma 2

Nhóm mô hình Gemma

Gemma 2

DataGemma

Gemma 1

RecurrentGemma

PaliGemma

CodeGemma

Khám phá các công cụ của chúng tôi

Hướng dẫn bắt đầu nhanh dành cho nhà phát triển

Khám phá các hướng dẫn bắt đầu nhanh trên Kaggle

Huấn luyện và triển khai trên Google Cloud

Dùng thử tính năng chuyển đổi cấp thấp bằng JAX qua Keras 3

Hướng dẫn bắt đầu nhanh dành cho đối tác

Sổ tay nấu ăn của Gemma

Sử dụng các mô hình của Gemma ngay hôm nay

Phát triển AI có trách nhiệm

Được tối ưu hoá cho Google Cloud

Thúc đẩy hoạt động nghiên cứu học thuật bằng tín dụng Google Cloud

Tham gia cộng đồng

Kaggle

Discord

Blog

Giới thiệu
Gemma 2