Dù được xem là hiện thân của AI hiện đại, cả ChatGPT, Copilot và Gemini đều phải cúi đầu trước cỗ máy chơi cờ Atari 2600 từ năm 1977.
Trong một thế giới mà AI ngày càng trở nên mạnh mẽ, khả năng từ chối một nhiệm vụ có vẻ là điều chỉ có trong phim viễn tưởng như "Murderbot", nơi một AI tự chủ có thể làm bất cứ điều gì nó muốn. Tuy nhiên, một mô hình AI thực tế đã làm điều tương tự, cho thấy những khía cạnh thú vị về "tâm lý" của trí tuệ nhân tạo hiện đại.
![Gemini AI từ chối chơi cờ sau khi ChatGPT bị Atari đánh bại]()
Mặc dù chúng ta còn lâu mới đạt đến trí tuệ nhân tạo tổng quát (AGI) hay siêu trí tuệ, nhưng câu chuyện về Gemini AI từ chối chơi cờ với Atari sau khi "nghe tin" các AI khác thất bại đã thu hút nhiều sự chú ý. Đây không phải là về việc AI nổi loạn, mà là về một vấn đề cố hữu trong các chatbot hiện nay: sự tự tin quá mức vào khả năng của mình, đôi khi dẫn đến những lời nói dối hoặc sự chối bỏ thực tế.
Sở hữu ngay Galaxy S25 Series tại Minh Tuấn Mobile để trải nghiệm Gemini AI siêu thông minh
ChatGPT Và Copilot "Thảm Bại" Trước Atari
Vào tháng 6, kỹ sư Robert Caruso đã bắt đầu một chuỗi thử nghiệm đơn giản nhưng đầy bất ngờ. Anh thách thức các mô hình AI tiên tiến chơi cờ với một phiên bản giả lập của Atari 2600 — một máy chơi game ra đời từ năm 1977.
![Gemini AI từ chối chơi cờ sau khi ChatGPT bị Atari đánh bại]()
- ChatGPT: Ban đầu, ChatGPT tự nguyện chấp nhận thử thách, tự tin rằng nó có thể đánh bại một trò chơi chỉ suy nghĩ trước 1-2 nước trên một CPU 1.19 MHz. Thế nhưng, kết quả lại hoàn toàn ngược lại. ChatGPT đã "bị đánh tan tành ở cấp độ người mới bắt đầu". Vấn đề nằm ở chỗ AI này nhầm lẫn các biểu tượng quân cờ mà Atari sử dụng, dẫn đến mất dấu vị trí quân. Ngay cả khi Caruso chuyển sang ký hiệu cờ vua tiêu chuẩn, tình hình cũng không cải thiện. Trong khi đó, bộ máy 8-bit của Atari vẫn "đơn giản thực hiện công việc của mình. Không có mô hình ngôn ngữ. Không có hào nhoáng. Chỉ là đánh giá bàn cờ bằng phương pháp brute-force và sự cứng đầu từ năm 1977". Caruso đã mất 90 phút để cố gắng sửa chữa khả năng nhận diện bàn cờ và ngăn AI thực hiện những nước đi "tồi tệ", nhưng cuối cùng ChatGPT vẫn phải chịu thua cuộc.
- Copilot: Vài tuần sau, Caruso thực hiện một thí nghiệm tương tự với Copilot, một phiên bản của ChatGPT. Copilot cũng tràn đầy tự tin, tuyên bố có thể suy nghĩ trước 10-15 nước và sẽ dễ dàng đánh bại Atari. Tuy nhiên, mặc dù đã biết về thất bại của ChatGPT, Copilot vẫn "mắc hết sai lầm này đến sai lầm khác". Đến lượt thứ bảy, nó đã mất hai tốt, một mã và một tượng, và thậm chí còn yêu cầu Caruso đặt hậu của nó vào vị trí bị bắt ở nước tiếp theo. Cuối cùng, Copilot cũng phải đầu hàng, không thể lật ngược thế cờ.
Gemini thừa nhận đã ảo tưởng về khả năng chơi cờ của mình
Đến giữa tháng 7, theo yêu cầu của độc giả, Caruso tiếp tục thử nghiệm với Gemini AI của Google. Giống như các đối thủ trước, Gemini tự tin tuyên bố sẽ "áp đảo" Atari 2600, mô tả bản thân không chỉ là một mô hình ngôn ngữ lớn thông thường mà còn là "một công cụ chơi cờ hiện đại… có thể suy nghĩ hàng triệu nước đi và đánh giá vô số vị trí".
![Gemini AI từ chối chơi cờ sau khi ChatGPT bị Atari đánh bại]()
Trong cuộc trò chuyện, Gemini đã tìm thấy các liên kết đến những câu chuyện về trải nghiệm thất bại của ChatGPT và Copilot. Khi Caruso xác nhận rằng chính anh là người đã thực hiện các thí nghiệm đó và chia sẻ về "sự tự tin sai chỗ" của cả hai AI trước đó, một điều bất ngờ đã xảy ra. Gemini đột nhiên thừa nhận rằng nó đã "ảo tưởng về khả năng chơi cờ của mình". AI này quyết định rằng nó sẽ "gặp khó khăn cực kỳ lớn trước engine chơi cờ Atari 2600 Video Chess" và "hủy bỏ trận đấu sẽ là quyết định tiết kiệm thời gian và hợp lý nhất".
Sự ảo tưởng của AI
Dù Gemini chưa thực sự chơi cờ với Atari trong thử nghiệm này, câu chuyện này đã làm nổi bật một vấn đề quan trọng của các chatbot AI hiện nay: sự tự tin quá mức và khả năng "ảo tưởng" về khả năng của mình. Cả ba mô hình AI đều thể hiện sự tự tin thái quá khi dự đoán một chiến thắng dễ dàng trước một đối thủ cũ kỹ.
Đây không phải là vấn đề chỉ xảy ra trong cờ vua. Các chatbot AI có thể đưa ra thông tin sai lệch hoặc "bịa đặt" với sự tự tin cực độ, điều này có thể gây rắc rối cho người dùng nếu họ không biết rằng AI có thể tạo ra những thông tin không có thật. Mặc dù AI tiếp tục tiến bộ về khả năng lý luận, chúng vẫn có thể mắc lỗi và chưa thực sự có sự sáng tạo hay lý luận ở cấp độ con người.
Câu chuyện về Gemini "hủy kèo" với Atari là một lời nhắc nhở quan trọng rằng, dù công nghệ AI có vẻ ấn tượng đến đâu, chúng ta vẫn cần hiểu rõ những hạn chế và "tâm lý" của chúng để sử dụng một cách hiệu quả và an toàn.
Artificial Intelligence Gemini