Đêm 6/12 (giờ Việt Nam), Google đã chính thức ra mắt Gemini - mô hình trí tuệ nhân tạo (AI) được cho là lớn nhất và tối ưu nhất của hãng.
Gemini được xây dựng theo hướng đa phương thức, có thể khái quát, vận hành và kết hợp trên nhiều loại thông tin khác nhau bao gồm văn bản, code, âm thanh, hình ảnh và video.
"Gemini được tối ưu hóa với ba kích cỡ khác nhau: Ultra, Pro và Nano để có thể hoạt động trên mọi thứ, từ trung tâm dữ liệu đến thiết bị di động", Bà Sissie Hsiao - Phó chủ tịch sản phẩm Google, phụ trách Bard cho hay.
Bà Sissie Hsiao cho biết thêm, từ hôm nay, Bard sẽ sử dụng phiên bản Gemini Pro để có thể lập luận nâng cao, lên kế hoạch, hiểu và hơn thế nữa. Công ty sẽ giới thiệu Bard Advanced, phiên bản cho phép truy cập đầu tiên vào các mô hình với khả năng tân tiến nhất của Google, bắt đầu với Gemini Ultra.
Google cho biết Gemini Ultra đã vượt qua GPT-4, mô hình trí tuệ nhân tạo do OpenAI phát triển và hiện được sử dụng cho phần mềm ChatGPT. Cũng theo Google, Gemini Ultra có thể vượt trội con người trong nhiều lĩnh vực, như toán, vật lý, lịch sử, hóa học… Theo thử nghiệm của Google, Gemini Ultra đạt điểm 90% trong bài kiểm tra khả năng hiểu ngôn ngữ đa nhiệm lớn (MMLU - Massive Multitask Language Understanding).
Ngoài ra, phiên bản mạnh nhất này của Gemini cũng vượt 30 trong số 32 tiêu chuẩn trong nghiên cứu và phát triển mô hình ngôn ngữ lớn, gồm cả các tác vụ đa phương thức trải rộng trên các lĩnh vực khác nhau đòi hỏi suy luận có chủ ý.
Ông Sundar Pichai - CEO Google khẳng định hãng đang thực hiện bước tiếp theo trên hành trình với Gemini. Nó sẽ mang đến những làn sóng đổi mới và tiến bộ kinh tế mới đồng thời thúc đẩy kiến thức, học tập, sáng tạo và năng suất ở quy mô mà chúng ta chưa từng thấy trước đây.
Gemini là mô hình AI đa phương thức do bộ phận Google DeepMind nghiên cứu và phát triển, được đề cập lần đầu hồi tháng 5 tại sự kiện Google I/O 2023.