Claude 4 chính thức ra mắt: Đánh bại cả Codex của OpenAI

Anthropic ra mắt với hai mô hình AI Claude 4 vượt trội, thiết lập chuẩn mực mới về hiệu suất lập trình và tư duy suy luận sâu.

Anthropic vừa chính thức giới thiệu hai mô hình AI thế hệ mới thuộc dòng Claude 4 — Claude Opus 4 và Claude Sonnet 4. Công ty khẳng định Claude Opus 4 là "mô hình lập trình xuất sắc nhất thế giới", được tối ưu hóa cho các quy trình làm việc dài hạn và ứng dụng tác nhân. Trong khi đó, Claude Sonnet 4 mang đến những cải tiến đáng kể về khả năng lập trình và tư duy logic so với phiên bản tiền nhiệm Claude Sonnet 3.7.

Trên bảng xếp hạng SWE-bench được công nhận rộng rãi — tiêu chuẩn đánh giá hiệu suất trong các tác vụ kỹ thuật phần mềm thực tế, Claude Opus 4 đạt điểm ấn tượng 72,5%. Con số này vượt qua nhẹ mô hình lập trình hàng đầu của OpenAI là Codex-1 với 72,1%. Điều đặc biệt ấn tượng hơn nữa là khi sử dụng khả năng tính toán song song tại thời điểm kiểm tra — tương tự chế độ Deep Think của Gemini 2.5 Pro — Opus 4 đã đạt mức đột phá 79,4%.

Claude 4 chính thức ra mắt

Thú vị là Claude Sonnet 4, dù được định vị là mô hình nhỏ gọn hơn, lại thể hiện hiệu suất vượt trội với 72,7% trên SWE-bench chuẩn và 80,2% khi áp dụng tính toán song song. Điều này cho thấy Sonnet 4 thậm chí còn vượt qua người anh em Opus 4 trong một số khía cạnh lập trình.

Theo Anthropic, Claude Sonnet 4 được thiết kế để "cân bằng tối ưu giữa hiệu suất và hiệu quả, phù hợp cho mọi ứng dụng từ nội bộ đến bên ngoài". Mô hình này tích hợp khả năng điều hướng nâng cao, giúp người dùng kiểm soát tốt hơn quá trình triển khai. Mặc dù chưa thể sánh kịp Opus 4 trong hầu hết lĩnh vực, Sonnet 4 mang đến sự kết hợp lý tưởng giữa năng lực mạnh mẽ và tính ứng dụng thực tiễn.

Cả hai mô hình đều sử dụng kiến trúc "tư duy lai" độc đáo, cho phép chúng vừa phản hồi tức thì vừa có khả năng tư duy mở rộng để phân tích chuyên sâu khi cần thiết. Claude Opus 4 đặc biệt xuất sắc trong các nhiệm vụ phức tạp, quy trình làm việc kéo dài và ứng dụng tác nhân, trong khi Claude Sonnet 4 tập trung vào việc kết hợp hiệu suất lập trình mạnh mẽ với độ hiệu quả cao.

Claude 4 chính thức ra mắt

Một tính năng đáng chú ý khác của Claude Opus 4 là khả năng duy trì thông tin quan trọng trong tệp bộ nhớ khi được cấp quyền truy cập tệp cục bộ. Anthropic đã minh họa điều này qua ví dụ Claude Opus 4 chơi Pokémon, trong đó mô hình tự tạo ra tệp hướng dẫn di chuyển để cải thiện chiến thuật game của mình.

Về mặt bảo mật, đây là lần đầu tiên Anthropic kích hoạt Mức An Toàn AI 3 (ASL-3) cho Claude Opus 4, tuân thủ nghiêm ngặt Chính sách Mở rộng Có Trách nhiệm (RSP) của công ty. Hệ thống được trang bị các Bộ phân loại Hiến pháp và nhiều lớp bảo vệ khác nhằm ngăn chặn các kỹ thuật vượt rào bảo mật.

Dòng mô hình Claude 4 hiện đã được triển khai cho toàn bộ người dùng trả phí qua các gói Pro, Max, Team và Enterprise. Đặc biệt, Claude Sonnet 4 cũng được cung cấp miễn phí cho người dùng thông thường, tuy nhiên phiên bản này sẽ không bao gồm tính năng tư duy mở rộng.

Xem thêm