Mô hình Gemma Open
Một dòng mô hình mở, gọn nhẹ, hiện đại, được xây dựng dựa trên chính nghiên cứu và công nghệ dùng để tạo ra các mô hình Gemini
Giới thiệu
Gemma 2
Được thiết kế lại để mang lại hiệu suất vượt trội và hiệu quả không thể so sánh, Gemma 2 tối ưu hoá để dự đoán nhanh chóng trên nhiều loại phần cứng.
5 lần chụp
MMLU
Điểm chuẩn MMLU là một bài kiểm tra đo lường phạm vi kiến thức và khả năng giải quyết vấn đề mà các mô hình ngôn ngữ lớn có được trong quá trình huấn luyện trước.
25 bức ảnh
ARC-C
Điểm chuẩn ARC-c là một tập hợp con tập trung hơn của tập dữ liệu ARC-e, chỉ chứa những câu hỏi mà các thuật toán phổ biến (dựa trên truy xuất và đồng xuất hiện từ) trả lời không chính xác.
5 lần chụp
GSM8K
Điểm chuẩn GSM8K kiểm tra khả năng giải các bài toán toán học ở cấp trường của một mô hình ngôn ngữ thường yêu cầu nhiều bước lập luận.
3-5-shot
AGIEval
Điểm chuẩn AGIEval kiểm tra trí thông minh chung của một mô hình ngôn ngữ bằng cách sử dụng các câu hỏi bắt nguồn từ các bài kiểm tra thực tế được thiết kế để đánh giá khả năng trí tuệ của con người.
3 lần chụp, CoT
BBH
Điểm chuẩn BBH (BIG-Bench Hard) tập trung vào những nhiệm vụ được xem là vượt quá khả năng của các mô hình ngôn ngữ hiện tại, kiểm tra các giới hạn của những nhiệm vụ đó trên nhiều miền lý luận và hiểu biết.
3 shot, F1
CÚI THẤP
DROP là điểm chuẩn về khả năng đọc hiểu, đòi hỏi khả năng suy luận riêng biệt về các đoạn văn.
5 lần chụp
Winogrande
Điểm chuẩn Winogrande kiểm tra khả năng giải quyết các công việc điền vào chỗ trống không rõ ràng của mô hình ngôn ngữ bằng quyền chọn nhị phân, đòi hỏi khả năng lập luận chung tổng quát.
10 cảnh quay
HellaSwag
Điểm chuẩn HellaSwag thử thách khả năng hiểu và áp dụng lập luận theo lý luận thông thường của một mô hình ngôn ngữ bằng cách chọn phần kết hợp lý nhất cho câu chuyện.
4 cảnh quay
MATH
MATH đánh giá khả năng của một mô hình ngôn ngữ trong việc giải các bài toán đố toán học phức tạp, đòi hỏi phải suy luận, giải quyết vấn đề theo nhiều bước và hiểu các khái niệm toán học.
ảnh 0
ARC-e
Điểm chuẩn ARC-e kiểm tra kỹ năng trả lời câu hỏi nâng cao của một mô hình ngôn ngữ bằng các câu hỏi khoa học dạng trắc nghiệm ở cấp tiểu học.
ảnh 0
PIQA
Điểm chuẩn PIQA kiểm tra khả năng hiểu và áp dụng kiến thức vật lý thông thường của một mô hình ngôn ngữ bằng cách trả lời các câu hỏi về các tương tác vật lý thường ngày.
ảnh 0
SIQA
Điểm chuẩn SIQA đánh giá khả năng hiểu biết của một mô hình ngôn ngữ về các hoạt động tương tác xã hội và tri thức xã hội thông thường bằng cách đặt câu hỏi về hành động của con người và tác động xã hội của hành động đó.
0-shot
Boolq
Điểm chuẩn BoolQ kiểm tra khả năng của mô hình ngôn ngữ trong việc trả lời các câu hỏi có/không xuất hiện tự nhiên, kiểm tra khả năng của mô hình trong việc thực hiện các nhiệm vụ suy luận bằng ngôn ngữ tự nhiên trong thực tế.
5 lần chụp
TriviaQA
Điểm chuẩn TriviaQA kiểm tra kỹ năng đọc hiểu bằng bộ ba câu hỏi-đáp án-bằng chứng.
5 lần chụp
NQ
Điểm chuẩn NQ (Câu hỏi tự nhiên) kiểm tra khả năng của một mô hình ngôn ngữ trong việc tìm và hiểu câu trả lời trong toàn bộ bài viết trên Wikipedia, mô phỏng các tình huống trả lời câu hỏi trong thực tế.
pass@1
HumanEval
Điểm chuẩn HumanEval kiểm tra khả năng tạo mã của mô hình ngôn ngữ bằng cách đánh giá xem các giải pháp của mô hình có vượt qua các bài kiểm thử đơn vị chức năng cho các vấn đề lập trình hay không.
3 lần chụp
MBPP
Điểm chuẩn MBPP kiểm tra khả năng của một mô hình ngôn ngữ trong việc giải quyết các vấn đề lập trình cơ bản bằng Python, tập trung vào các khái niệm lập trình cơ bản và cách sử dụng thư viện chuẩn.
100%
75%
50%
25%
0%
100%
75%
50%
25%
0%
Gemma 1
2,5 tỷ
Gemma 2
2,6 tỷ
Mistral
7 tỷ
LLAMA 3
8B
Gemma 1
7 tỷ
Gemma 2
9B
Gemma 2
27 TỶ
Gemma 1
2,5 tỷ
Gemma 2
2,6 tỷ
Mistral
7 TỶ
LLAMA 3
8B
Gemma 1
7 TỶ
Gemma 2
9B
Gemma 2
27 tỷ
Gemma 1
2,5 tỷ
Gemma 2
2,6 TỶ
Mistral
7 tỷ
LLAMA 3
8B
Gemma 1
7 tỷ
Gemma 2
9B
Gemma 2
27 tỷ
Gemma 1
2,5 tỷ
Gemma 2
2,6 tỷ
Mistral
7 tỷ
LLAMA 3
8 TỶ
Gemma 1
7 tỷ
Gemma 2
9 TỶ
Gemma 2
27 tỷ
Gemma 1
2,5 tỷ
Gemma 2
2,6 TỶ
Mistral
7 tỷ
LLAMA 3
8B
Gemma 1
7 tỷ
Gemma 2
9 TỶ
Gemma 2
27 TỶ
Gemma 1
2,5 tỷ
Gemma 2
2,6 TỶ
Mistral
7 tỷ
LLAMA 3
8B
Gemma 1
7 tỷ
Gemma 2
9 TỶ
Gemma 2
27 tỷ
Gemma 1
2,5 tỷ
Gemma 2
2,6 TỶ
Mistral
7 tỷ
LLAMA 3
8 TỶ
Gemma 1
7 tỷ
Gemma 2
9 TỶ
Gemma 2
27 TỶ
Gemma 1
2,5 tỷ
Gemma 2
2,6 TỶ
Mistral
7 tỷ
LLAMA 3
8B
Gemma 1
7 tỷ
Gemma 2
9B
Gemma 2
27 tỷ
Gemma 1
2,5 tỷ
Gemma 2
2,6 tỷ
Mistral
7 tỷ
Gemma 1
7 tỷ
Gemma 2
9 TỶ
Gemma 2
27 TỶ
Gemma 1
2,5 tỷ
Gemma 2
2,6 tỷ
Mistral
7 tỷ
Gemma 1
7 tỷ
Gemma 2
9B
Gemma 2
27 tỷ
Gemma 1
2,5 tỷ
Gemma 2
2,6 tỷ
Mistral
7 tỷ
Gemma 1
7 tỷ
Gemma 2
9B
Gemma 2
27 tỷ
Gemma 1
2,5 tỷ
Gemma 2
2,6 tỷ
Mistral
7 tỷ
Gemma 1
7 tỷ
Gemma 2
9B
Gemma 2
27 tỷ
Gemma 1
2,5 tỷ
Gemma 2
2,6 TỶ
Mistral
7 tỷ
Gemma 1
7 tỷ
Gemma 2
9B
Gemma 2
27 TỶ
Gemma 1
2,5 tỷ
Gemma 2
2,6 tỷ
Mistral
7 tỷ
Gemma 1
7 tỷ
Gemma 2
9 TỶ
Gemma 2
27 TỶ
Gemma 1
2,5 tỷ
Gemma 2
2,6 TỶ
Mistral
7 TỶ
Gemma 1
7 tỷ
Gemma 2
9 TỶ
Gemma 2
27 tỷ
Gemma 1
2,5 tỷ
Gemma 2
2,6 tỷ
Mistral
7 tỷ
Gemma 1
7 TỶ
Gemma 2
9B
Gemma 2
27 tỷ
Gemma 1
2,5 tỷ
Gemma 2
2,6 tỷ
Mistral
7 TỶ
Gemma 1
7 TỶ
Gemma 2
9B
Gemma 2
27 tỷ
*Đây là điểm chuẩn cho các mô hình được huấn luyện trước, hãy xem báo cáo kỹ thuật để biết thông tin chi tiết về hiệu suất với các phương pháp khác.
Nhóm mô hình Gemma
Khám phá các công cụ của chúng tôi
Hướng dẫn bắt đầu nhanh dành cho nhà phát triển
Hướng dẫn bắt đầu nhanh dành cho đối tác
Sổ tay nấu ăn của Gemma
Khám phá bộ sưu tập các công thức và ví dụ thực tế thể hiện sức mạnh và tính linh hoạt của Gemma cho các tác vụ như chú thích hình ảnh bằng PaliGemma, tạo mã bằng CodeGemma và xây dựng chatbot bằng các mô hình Gemma được tinh chỉnh.
Phát triển AI có trách nhiệm
Thiết kế để làm tròn trách nhiệm
Được đào tạo trước dựa trên dữ liệu được tuyển chọn kỹ lưỡng và luôn chú trọng đến vấn đề an toàn, qua đó hỗ trợ phát triển AI một cách an toàn và có trách nhiệm thông qua các mô hình của Gemma.
Quy trình đánh giá mạnh mẽ và minh bạch
Hoạt động đánh giá toàn diện và báo cáo minh bạch cho thấy các giới hạn của mô hình để áp dụng cách tiếp cận có trách nhiệm cho từng trường hợp sử dụng.
Thúc đẩy phát triển có trách nhiệm
Bộ công cụ AI tạo sinh có trách nhiệm hỗ trợ nhà phát triển thiết kế và triển khai các phương pháp hay nhất về AI có trách nhiệm.
Được tối ưu hoá cho Google Cloud
Với các mô hình Gemma trên Google Cloud, bạn có thể tuỳ chỉnh sâu mô hình theo nhu cầu cụ thể của mình bằng các công cụ được quản lý toàn bộ của Vertex AI hoặc tuỳ chọn tự quản lý của GKE, đồng thời triển khai mô hình đó cho cơ sở hạ tầng được tối ưu hoá cho AI, linh hoạt và tiết kiệm chi phí.
Thúc đẩy hoạt động nghiên cứu học thuật bằng tín dụng Google Cloud
Chương trình Nghiên cứu học thuật gần đây đã kết thúc thời gian đăng ký, trao khoản tín dụng Google Cloud để hỗ trợ các nhà nghiên cứu đẩy xa ranh giới của khám phá khoa học bằng cách sử dụng các mô hình Gemma. Chúng tôi rất mong chờ những nghiên cứu đột phá xuất phát từ sáng kiến này.
Tham gia cộng đồng
Kết nối, khám phá và chia sẻ kiến thức với những người khác trong cộng đồng mô hình học máy.