Google ra mắt Gemini 2.5 Pro, mô hình AI tiên tiến phá vỡ kỷ lục trong bài kiểm tra HLE, dẫn đầu bảng xếp hạng LMArena và vượt trội về tư duy.
Google vừa giới thiệu một mô hình AI mang tính đột phá có tên Gemini 2.5 Pro, đạt được 18,8% trong kỳ thi cuối cùng của nhân loại (HLE) mà không sử dụng tìm kiếm web hay bất kỳ công cụ nào khác. HLE là một chuẩn đánh giá nghiêm ngặt, được thiết kế bởi các chuyên gia hàng đầu và các học giả xuất sắc trên thế giới nhằm kiểm tra kiến thức chuyên sâu về nhiều lĩnh vực khác nhau. Trước đó, mô hình o3-mini-high của OpenAI đã đạt 14% trên cùng một chuẩn đánh giá mà không sử dụng công cụ hỗ trợ.
![AI Gemini 2.5 Pro vừa ra mắt đã phá vỡ kỷ lục]()
Gemini 2.5 Pro là một mô hình tư duy, nghĩa là một mô hình suy luận, được xây dựng trên nền tảng một mô hình ngôn ngữ lớn (LLM) với sự hỗ trợ của học tăng cường và phương pháp nhắc tư duy chuỗi (chain-of-thought prompting). Trước Gemini 2.5 Pro, Google đã ra mắt một mô hình nhỏ hơn có tên Gemini 2.0 Flash Thinking.
Google tuyên bố rằng mô hình Gemini 2.5 Pro có thể “phân tích thông tin, rút ra kết luận logic, kết hợp ngữ cảnh và sắc thái, đồng thời đưa ra quyết định có cơ sở.”
Gemini 2.5 Pro đã được thử nghiệm trên LMArena dưới mật danh “nebula”. Hiện tại, mô hình này đã giành vị trí dẫn đầu trên bảng xếp hạng LMArena với số điểm cao nhất là 1.443, vượt qua cả Grok 3 và GPT-4.5. Theo Google, Gemini 2.5 Pro thể hiện hiệu suất vượt trội trong các lĩnh vực lập trình, toán học và khoa học.
![AI Gemini 2.5 Pro vừa ra mắt đã phá vỡ kỷ lục]()
Trong bài kiểm tra GPQA Diamond, Gemini 2.5 Pro đạt 84%; trong kỳ thi AIME 2025, mô hình đạt 86,7%. Ngay cả trong chuẩn đánh giá SWE-bench, nơi kiểm tra khả năng giải quyết các vấn đề phần mềm thực tế, Gemini 2.5 Pro cũng đạt 63,8%, chỉ xếp sau Claude 3.7 Sonnet Extended Thinking với 70,3%.
Cách sử dụng Gemini 2.5 Pro
Google khẳng định rằng Gemini 2.5 Pro có khả năng lập trình nâng cao và suy luận sâu. Hiện tại, mô hình này đang được triển khai cho người dùng Gemini Advanced. Những ai muốn thử nghiệm Gemini 2.5 Pro miễn phí có thể truy cập Google AI Studio và chọn mô hình “Gemini 2.5 Pro Experimental 03-25” từ menu thả xuống.