2024年7月26日
Gemini là dòng mô hình AI thế hệ mới mà Google đã hứa hẹn từ lâu. Dòng mô hình này được phát triển bởi các phòng nghiên cứu AI của Google, bao gồm DeepMind và Google Research. Gemini có bốn …
Credit: Google Gemini
Gemini là gì?
Gemini là dòng mô hình AI thế hệ mới mà Google đã hứa hẹn từ lâu. Dòng mô hình này được phát triển bởi các phòng nghiên cứu AI của Google, bao gồm DeepMind và Google Research. Gemini có bốn phiên bản chính, mỗi phiên bản được thiết kế để phục vụ các nhu cầu khác nhau:
Gemini Ultra: Đây là mô hình mạnh mẽ nhất của Gemini, được thiết kế để xử lý các tác vụ phức tạp và yêu cầu hiệu suất cao nhất.
Gemini Pro: Đây là phiên bản nhẹ hơn của Ultra, cung cấp hiệu suất tốt nhưng với yêu cầu tài nguyên thấp hơn, phù hợp cho các ứng dụng cần sự linh hoạt.
Gemini Flash: Đây là phiên bản nhanh hơn của Pro, được tối ưu hóa để xử lý tác vụ với tốc độ cao mà vẫn duy trì hiệu suất tốt.
Gemini Nano: Phiên bản này gồm hai mô hình nhỏ, Nano-1 và Nano-2, được thiết kế để chạy offline trên các thiết bị di động, đảm bảo tính di động và tiện lợi.
Một trong những điểm nổi bật của các mô hình Gemini là khả năng xử lý đa phương tiện. Điều này có nghĩa là chúng không chỉ làm việc với văn bản mà còn có thể phân tích và tạo ra âm thanh, hình ảnh và video. Google đã huấn luyện các mô hình này trên một lượng lớn dữ liệu công khai, độc quyền và có giấy phép bao gồm âm thanh, hình ảnh, video, mã nguồn và văn bản ở nhiều ngôn ngữ khác nhau.
Điều này làm cho Gemini khác biệt so với các mô hình trước đó như LaMDA của Google. LaMDA chỉ được huấn luyện trên dữ liệu văn bản, vì vậy chỉ có thể hiểu và tạo ra văn bản (như bài luận, bản nháp email), nhưng không thể làm việc với các dạng dữ liệu khác. Trong khi đó, Gemini có khả năng xử lý nhiều dạng dữ liệu khác nhau, mang lại sự linh hoạt và tiềm năng ứng dụng rộng rãi hơn.
Tuy nhiên, cần lưu ý rằng có một số tranh cãi về đạo đức và tính hợp pháp của việc huấn luyện mô hình AI trên dữ liệu công khai mà không có sự đồng ý của chủ sở hữu dữ liệu. Google có chính sách bảo vệ một số khách hàng Google Cloud khỏi các vụ kiện liên quan đến vấn đề này, nhưng chính sách này cũng có những giới hạn. Vì vậy, hãy cẩn trọng nếu bạn dự định sử dụng Gemini cho mục đích thương mại.
Credit: Google
Gemini Advanced có thể làm những gì gì?
Lập kế hoạch chuyến đi trong Google Search: Gemini tạo ra các hành trình du lịch tùy chỉnh dựa trên các yêu cầu của bạn. Nó xem xét các yếu tố như thời gian bay (từ email trong hộp thư Gmail của bạn), sở thích ăn uống và thông tin về các địa điểm du lịch (từ dữ liệu Google Search và Maps), cũng như khoảng cách giữa các địa điểm này. Hành trình sẽ được cập nhật tự động để phản ánh bất kỳ thay đổi nào.
Viết email & tóm tắt chuỗi tin nhắn trong Gmail: Gemini có mặt trong bảng bên, có thể viết email và tóm tắt các chuỗi tin nhắn. Bạn có thể dễ dàng tạo ra các email chuyên nghiệp hoặc tóm tắt các cuộc trao đổi dài dòng để nhanh chóng nắm bắt nội dung chính.
Viết & hoàn thiện nội dung trong Google Docs: Gemini giúp bạn viết và hoàn thiện nội dung, cũng như brainstorm ra các ý tưởng mới. Bảng bên tương tự như trong Gmail cung cấp các gợi ý và công cụ để cải thiện văn bản của bạn.
Tạo slides & hình ảnh tuỳ chỉnh trong Google Slides: Gemini có khả năng tạo ra các slide và hình ảnh tùy chỉnh. Điều này giúp bạn tiết kiệm thời gian khi tạo bài thuyết trình và đảm bảo rằng các slide của bạn trông chuyên nghiệp và hấp dẫn.
Theo dõi & tổ chức dữ liệu trong Google Sheets: Gemini theo dõi và tổ chức dữ liệu, tạo ra các bảng và công thức. Nó giúp bạn quản lý dữ liệu hiệu quả hơn và dễ dàng thực hiện các phân tích số liệu phức tạp.
Tóm tắt tệp & cung cấp thông tin trongGoogle Drive: Gemini có thể tóm tắt các tệp và cung cấp thông tin nhanh về một dự án. Điều này rất hữu ích khi bạn cần nắm bắt nhanh nội dung của các tài liệu hoặc báo cáo mà không cần đọc chi tiết từng trang.
Dịch phụ đề trong Google Meet: Gemini dịch phụ đề sang nhiều ngôn ngữ khác nhau. Điều này giúp các cuộc họp trở nên dễ hiểu hơn và phục vụ cho một nhóm người dùng đa ngôn ngữ.
Credit: Google
Gemini có tốt hơn GPT-4 của OpenAI không?
Google đã nhiều lần tự hào về sự vượt trội của Gemini trên các tiêu chuẩn đánh giá, khẳng định rằng Gemini Ultra vượt qua các kết quả tiên tiến hiện tại trên “30 trong số 32 tiêu chuẩn học thuật phổ biến được sử dụng trong nghiên cứu và phát triển mô hình ngôn ngữ”. Tuy nhiên, bỏ qua câu hỏi liệu các tiêu chuẩn đánh giá có thực sự chỉ ra một mô hình tốt hơn hay không, các điểm số mà Google chỉ ra dường như chỉ tốt hơn một chút so với các mô hình GPT-4 của OpenAI.
Credit: Google
Gemini có xuất hiện trên iPhone không?
Có thể! Apple và Google được cho là đang đàm phán để sử dụng Gemini cho một số tính năng sẽ được bao gồm trong bản cập nhật iOS sắp tới vào cuối năm nay. Không có gì chắc chắn, vì Apple cũng được cho là đang đàm phán với OpenAI và đang phát triển khả năng AI tạo sinh của riêng mình.
Sau bài phát biểu chính tại WWDC 2024, SVP Craig Federighi của Apple đã xác nhận kế hoạch làm việc với các mô hình bên thứ ba bổ sung bao gồm Gemini, nhưng không tiết lộ chi tiết thêm.
Credit: Google, Techcrunch