Google Gemini đã chính thức hỗ trợ tải lên file âm thanh MP3, WAV và nhiều định dạng khác, giúp bạn dễ dàng phân tích, ghi chú và xử lý nội dung.
Google vừa âm thầm cập nhật một trong những tính năng được mong chờ nhất trên Gemini: hỗ trợ tải lên file âm thanh. Trước đây, Gemini đã có thể xử lý hình ảnh, PDF và thậm chí cả video, nhưng âm thanh lại là mảnh ghép còn thiếu. Giờ đây, người dùng đã có thể tải lên các định dạng phổ biến như MP3, WAV chỉ với vài thao tác đơn giản.
Nâng cấp ngay thiết bị để sử dụng Gemini Live mượt mà nhất:
Người dùng miễn phí có thể tải tối đa 10 file cùng lúc, với tổng thời lượng không vượt quá 10 phút. Trong khi đó, người dùng gói trả phí Gemini Advanced hoặc Gemini Ultra được mở rộng giới hạn lên tới 3 giờ âm thanh – đủ cho các nhu cầu chuyên sâu như xử lý podcast hay ghi chú cuộc họp dài.
![Google Gemini giờ đã nghe được file âm thanh cực kỳ hữu ích]()
Có giới hạn tùy gói tài khoản
Tuy nhiên, việc upload các file âm thanh là có giới hạn, số lượt tải tùy thuộc vào tài khoản người dùng, như sau:
-
Người dùng miễn phí: tải tối đa 10 file/lần, nhưng tổng thời lượng chỉ 10 phút.
-
Người dùng trả phí (Gemini Advanced, AI Pro, AI Ultra): được nâng cấp giới hạn lên đến 3 giờ âm thanh mỗi lần tải.
So với video (chỉ 5 phút cho bản miễn phí), âm thanh được ưu tiên hơn nhiều. Điều này cực kỳ hữu ích cho việc chuyển giọng nói thành văn bản, phân tích nội dung họp, hay xử lý các đoạn podcast ngắn.
Ứng dụng thực tế cho người dùng
Việc hỗ trợ âm thanh không chỉ là bổ sung kỹ thuật, mà còn mở ra nhiều tình huống sử dụng hữu ích:
-
Sinh viên có thể ghi lại bài giảng và nhờ Gemini tóm tắt nội dung, rút ra ý chính để học nhanh hơn.
-
Nhân viên văn phòng dễ dàng chuyển file họp trực tuyến thành bản ghi chú súc tích, tiết kiệm thời gian viết biên bản.
-
Người sáng tạo nội dung có thể phân tích đoạn podcast, tìm ý tưởng cắt ghép hoặc tạo dàn ý cho video mới.
-
Người dùng cá nhân chỉ cần ghi âm nhanh một ý tưởng, sau đó nhờ Gemini diễn đạt lại thành văn bản mạch lạc để lưu trữ hoặc chia sẻ.
![Google Gemini giờ đã nghe được file âm thanh cực kỳ hữu ích]()
Vì sao tính năng này quan trọng?
Trước đây, Gemini đã có thể tóm tắt video YouTube hoặc xử lý clip ngắn, nhưng việc ghi âm giọng nói trực tiếp rồi đưa vào AI lại không khả thi. Giờ đây, khoảng trống này đã được lấp đầy, giúp Gemini bắt kịp các đối thủ như ChatGPT vốn đã hỗ trợ âm thanh từ lâu. Với giới hạn 10 phút cho bản miễn phí và 3 giờ cho gói trả phí, đây là mức dung lượng hợp lý cho cả nhu cầu cơ bản lẫn nâng cao.
Tuy 10 phút có thể hơi ít cho bản miễn phí, rõ ràng Google muốn tính năng này trở thành lý do để người dùng nâng cấp. Nhưng nhìn chung, đây vẫn là một bước tiến lớn giúp Gemini mạnh mẽ và thực tế hơn cho học tập, công việc và sáng tạo.