Zalo là một trong những ứng dụng nhắn tin và gọi điện phổ biến nhất tại Việt Nam, được nhiều gia đình, cơ quan, trường học và cộng đồng sử dụng hằng ngày để trao đổi công việc, trò chuyện với người thân hay cập nhật thông tin. Mới đây, ứng dụng này vừa chính thức công bố cập nhật mới, tiếp tục đẩy mạnh tích hợp trí tuệ nhân tạo AI và nâng cấp trải nghiệm người dùng bằng các giải pháp công nghệ mang tính nhân văn sâu sắc. Nổi bật nhất trong đợt nâng cấp này là sự xuất hiện của tính năng chuyển đổi giọng nói thành văn bản trực tiếp trong các cuộc hội thoại trực quan.
| Tóm tắt những cập nhật mới về AI của Zalo: |
- Phụ đề cuộc gọi thông minh: Phụ đề cuộc gọi video sử dụng AI để tự động chuyển chuyển đổi lời nói thành chữ theo thời gian thực.
- Trợ năng đọc dữ liệu chuyên sâu: Hỗ trợ người dùng đọc to toàn bộ nội dung tin nhắn chat, thông báo danh tính người gửi, thời gian gửi cụ thể và mô tả chi tiết các tệp hình ảnh, nhãn dán.
- Điều hướng màn hình thông minh: Ứng dụng hỗ trợ nhận diện chính xác vị trí các nút chức năng qua cử chỉ di chuyển ngón tay và đưa ra hướng dẫn bằng giọng nói trực quan.
- Tối ưu hóa soạn thảo văn bản: Tự động đọc to từng ký tự khi người dùng tương tác với bàn phím ảo, giúp hạn chế tối đa việc nhập sai nội dung tin nhắn cho người khiếm thị.
- Kích hoạt dễ dàng trên đa nền tảng: Đồng bộ hóa các tính năng trợ năng này thông qua các công cụ hệ thống TalkBack trên Android hoặc VoiceOver trên điện thoại iPhone (iOS).
|
Zalo chính thức tích hợp AI tạo phụ đề cuộc gọi video
Bước đi chiến lược mới nhất của Zalo trong việc làm chủ công nghệ và ứng dụng vào thực tế chính là việc cho ra mắt tính năng phụ đề cuộc gọi video hoàn toàn mới. Đây là giải pháp đột phá sử dụng trí tuệ nhân tạo AI để nhận diện và chuyển lời nói thành chữ theo thời gian thực ngay trên màn hình hiển thị của thiết bị, giúp người dùng có thể vừa nghe, vừa đọc nội dung cuộc trò chuyện trong lúc gọi.
![Zalo chính thức tích hợp AI tạo phụ đề cuộc gọi video]()
Lợi ích thực tế và cách thức vận hành của tính năng này mang lại giá trị rất lớn cho người dùng trong cuộc sống số hằng ngày:
- Khắc phục rào cản môi trường: Hữu ích trong các tình huống người dùng khó nghe rõ đầu dây bên kia nói gì, ví dụ như khi tại nhà ga, công trường, ngoài đường… hoặc khi tín hiệu kết nối mạng internet không ổn định.
- Hỗ trợ y tế và đời sống: Dành cho người dùng lớn tuổi hoặc những người gặp khó khăn về thính lực, giúp họ không bị bỏ lỡ bất kỳ thông tin quan trọng nào từ con cháu, người thân.
Cách thức kích hoạt tính năng này trên Zalo vô cùng nhanh chóng. Để sử dụng tính năng này trực tiếp, người dùng tiến hành ngay trong giao diện cuộc gọi video đang diễn ra, rồi nhấn vào biểu tượng dấu ba chấm hiển thị trên màn hình và chọn bật mục Phụ đề.
Zalo nâng cấp trợ năng cho người khiếm thị và người cao tuổi
Bên cạnh giải pháp phụ đề thông minh dựa trên AI, Zalo cũng đã ra mắt gói tính năng nâng cấp hệ thống trợ năng vô cùng hữu ích cho người lớn tuổi, người gặp khó khăn về thính lực và đặc biệt là hỗ trợ toàn diện cho nhóm người khiếm thị. Bản cập nhật này thể hiện sự quan tâm sâu sắc của đội ngũ phát triển ứng dụng trong việc bình đẳng hóa công nghệ, giúp mọi đối tượng đều có thể kết nối không giới hạn với bạn bè, xã hội.
AI hỗ trợ đọc tin nhắn và mô tả hình ảnh
Trụ cột đầu tiên tập trung giải quyết bài toán tiếp nhận thông tin dạng đa phương tiện trong các cửa sổ trò chuyện, giúp người khiếm thị không bị cô lập trước các nội dung hình ảnh vốn là xu hướng giao tiếp hiện nay. Khi tính năng đọc nội dung tin nhắn và hình ảnh được kích hoạt, hệ thống sẽ tự động chuyển đổi toàn bộ dữ liệu trên màn hình thành dạng âm thanh
Cơ chế này hoạt động cực kỳ chi tiết thông qua các thuật toán thông minh sau:
- Đọc nội dung chat: Tự động quét và đọc to rõ ràng toàn bộ nội dung ký tự của tin nhắn văn bản được gửi đến trong đoạn hội thoại.
- Thông báo người gửi, thời gian gửi: Phát âm thanh thông báo chính xác danh tính của người gửi, giờ gửi tin nhắn cụ thể, cũng như thông báo về sự xuất hiện của các file đính kèm.
- Mô tả sticker và hình ảnh: Trí tuệ nhân tạo AI sẽ tiến hành phân tích bối cảnh và đưa ra lời mô tả chi tiết bằng ngôn ngữ nói về các hình ảnh, cũng như các nhãn dán được gửi trong đoạn chat, giúp người dùng hình dung trọn vẹn thông điệp.
![AI của Zalo hỗ trợ đọc tin nhắn và mô tả hình ảnh]()
Hỗ trợ điều hướng và thao tác bằng giọng nói
Đối với người có thị lực kém hoặc người mù, việc tìm chính xác các nút bấm chức năng (như nút gửi, nút ghi âm, nút gọi điện) trên một màn hình phẳng cảm ứng của smartphone là một thách thức cực kỳ lớn. Nhằm giải quyết triệt để khó khăn này, Zalo đã tích hợp sâu giải pháp nhận biết vị trí các nút chức năng, giúp các thao tác điều hướng trở nên dễ dàng và chuẩn xác hơn bao giờ hết. Hệ thống điều hướng thông minh bằng giọng nói bao gồm các cơ chế tương tác sau:
- Nhận diện vị trí nút chức năng: Bằng cách di chuyển nhẹ nhàng ngón tay của mình trên bề mặt màn hình cảm ứng, người dùng sẽ được hệ thống phát âm thanh hướng dẫn trực tiếp về các nút bấm, các cảnh báo hoặc thông báo tương ứng mà ngón tay đang chạm vào.
- Hướng dẫn thao tác trên màn hình: AI đưa ra các chỉ dẫn phản hồi bằng giọng nói theo thời gian thực, giúp người dùng khiếm thị dễ dàng nhận biết mình đang ở đâu và cần thực hiện hành động vuốt chạm như thế nào để đạt được mục đích mong muốn.
- Tăng khả năng tiếp cận ứng dụng: Nâng cấp khả năng tiếp cận ứng dụng, giúp người cao tuổi có bàn tay run hay người mù hoàn toàn làm chủ được các tính năng cốt lõi của Zalo mà không cần đến sự trợ giúp từ người bên ngoài.
![AI của Zalo hỗ trợ điều hướng và thao tác bằng giọng nói]()
Hỗ trợ nhập văn bản chính xác hơn
Trụ cột công nghệ thứ ba tập trung vào quá trình phản hồi thông tin, cụ thể là việc hỗ trợ soạn thảo nội dung tin nhắn một cách chính xác. Khi mở bàn phím ảo để soạn tin nhắn, người dùng khiếm thị thường rất dễ bấm nhầm các phím ký tự nằm sát nhau, dẫn đến việc thông điệp truyền đi bị sai lệch ngữ nghĩa hoặc gây hiểu lầm.
Giải pháp tối ưu hóa quy trình nhập văn bản của Zalo được vận hành như sau:
- Đọc từng ký tự khi soạn tin nhắn: Ngay khi bàn phím được mở ra, tính năng trợ năng sẽ tự động theo dõi chuyển động ngón tay của người dùng và đọc to từng chữ cái, chữ số hoặc ký hiệu ngay khi ngón tay vừa chạm vào phím đó trước khi người dùng nhấn thả để chọn.
- Hạn chế nhập sai nội dung: Việc nghe thấy âm thanh phát ra của từng ký tự giúp người dùng ngay lập tức nhận biết mình có bấm đúng chữ mình cần hay không, từ đó hạn chế tối đa việc nhập sai nội dung thông tin.
- Phù hợp với người khiếm thị: Tiện ích này cực kỳ phù hợp với người khiếm thị, giúp họ tự tin tự mình soạn thảo những đoạn văn bản dài một cách độc lập. Bên cạnh đó, người dùng cũng có thể kết hợp sử dụng linh hoạt các tính năng sẵn có của Zalo như "Đọc tin nhắn" và "Chuyển giọng nói thành văn bản" để giảm tải tối đa việc sử dụng tay, tối ưu hóa sự tiện lợi khi kết nối với bạn bè.
![Zalo hỗ trợ nhập văn bản chính xác hơn]()
Cách bật Tính Năng Trợ Năng trên Android Và iPhone
Để có thể trải nghiệm toàn bộ hệ thống trợ năng thông minh, đọc nội dung và hỗ trợ điều hướng vừa nêu trên ứng dụng Zalo, người dùng cần kích hoạt trình đọc màn hình tiêu chuẩn tương ứng được tích hợp sẵn trong nhân hệ điều hành của điện thoại di động.
Với hệ điều hành iOS (áp dụng cho các dòng điện thoại iPhone của Apple):
- Bước 1: Mở Cài đặt trên giao diện điện thoại iPhone.
- Bước 2: Tìm kiếm và nhấn chọn vào mục Trợ năng.
- Bước 3: Chọn VoiceOver và gạt thanh ngang sang trạng thái kích hoạt.
![Cách bật Tính Năng Trợ Năng trên iPhone]()
Với hệ điều hành Android (chạy trên các dòng máy như Samsung, Xiaomi, OPPO):
- Bước 1: Truy cập vào mục Cài đặt trên màn hình chính của điện thoại.
- Bước 2: Di chuyển xuống phía dưới và tìm đến mục Trợ năng.
- Bước 3: Chọn mục TalkBack và gạt công tắc sang chế độ Bật.
![Cách bật Tính Năng Trợ Năng trên Android]()
Việc ứng dụng Zalo chính thức ra mắt tính năng AI tạo phụ đề cuộc gọi video theo thời gian thực, đi kèm bộ giải pháp trợ năng đọc tin nhắn, mô tả hình ảnh và hướng dẫn điều hướng bằng giọng nói là một bước tiến công nghệ mang ý nghĩa xã hội cực kỳ to lớn. Giờ đây, các em nhỏ, người cao tuổi hay những người khiếm khuyết một phần cơ thể đều có thể tự tin trò chuyện trực quan, chia sẻ yêu thương với gia đình thông qua những dòng phụ đề tự động và những chỉ dẫn âm thanh thông minh.
Zalo