OpenAI ra mắt GPT-5.6 Sol Terra và Luna mạnh hơn GPT-5.5

Vừa qua, OpenAI chính thức công bố những thông tin đầu tiên về thế hệ mô hình tiếp theo của mình. Sự xuất hiện của dòng sản phẩm mới không chỉ thay đổi cách định nghĩa về tốc độ xử lý mà còn thiết lập một tiêu chuẩn hoàn toàn mới về tư duy logic của máy móc. Dưới đây là tổng hợp những cải tiến, thông số kỹ thuật cũng như lộ trình phát hành của dòng AI đang thu hút sự chú ý lớn từ cộng đồng công nghệ toàn cầu này.

Tóm tắt chung:

Hệ thống phiên bản đa dạng: GPT-5.6 được OpenAI thiết kế theo một hệ thống đặt tên mới, phân chia thành ba cấp độ năng lực bền vững bao gồm bản cao cấp Sol, bản cân bằng Terra và bản tối ưu chi phí Luna.
Bước nhảy vọt về hiệu năng: Thế hệ AI mới này mang đến những cải tiến mang tính đột phá về khả năng xử lý các tác vụ phức tạp nhờ cơ chế suy luận chuyên sâu và mô hình phối hợp đa đại lý.
Lĩnh vực chuyên biệt vượt trội: Mô hình ghi nhận các cột mốc kỷ lục mới về năng lực lập trình, nghiên cứu sinh học định lượng cũng như hỗ trợ đắc lực cho công việc an ninh mạng của các chuyên gia phòng thủ.
Lá chắn bảo mật kiên cố: OpenAI trang bị cho GPT-5.6 hệ thống phòng thủ đa lớp nghiêm ngặt, kết hợp huấn luyện từ chối chuyên sâu và quy trình kiểm thử tự động quy mô lớn trước khi phát hành rộng rãi.

GPT-5.6 là gì?

Mô hình GPT-5.6 là thế hệ trí tuệ nhân tạo mới nhất được phát triển bởi OpenAI, đánh dấu sự thay đổi căn bản trong cấu trúc dán nhãn sản phẩm của hãng. Trong hệ thống phân loại mới này, con số "5.6" đại diện cho thế hệ phát triển chung của toàn bộ mô hình, trong khi các danh xưng đi kèm sẽ chỉ định các phân cấp năng lực cốt lõi riêng biệt.

Cách tiếp cận này giúp các lập trình viên và doanh nghiệp dễ dàng đưa ra quyết định lựa chọn công cụ tối ưu nhất dựa trên ba tiêu chí cốt lõi: mức độ thông minh, tốc độ phản hồi và chi phí vận hành.

GPT-5.6 là gì?

Dòng sản phẩm GPT-5.6 được ra mắt bao gồm ba phiên bản chính thức với các định hướng thị trường rất rõ ràng:

Sol: Phiên bản cao cấp nhất (flagship), đại diện cho đỉnh cao công nghệ và năng lực xử lý mạnh mẽ nhất của OpenAI tính đến thời điểm hiện tại.
Terra: Phiên bản cân bằng hoàn hảo, được tối ưu hóa cho các công việc văn phòng và xử lý tác vụ hằng ngày với mức chi phí hợp lý.
Luna: Phiên bản có tốc độ phản hồi nhanh nhất và sở hữu mức giá dễ tiếp cận nhất trong cả ba mô hình.

GPT-5.6 có gì mới?

Sự ra đời của thế hệ GPT-5.6 mang theo kỳ vọng giải quyết những bài toán hóc búa mang tính chuỗi và đòi hỏi tư duy logic cao, điều mà các thế hệ AI trước đó thường gặp nhiều hạn chế.

Hiệu năng cao hơn GPT-5.5

Điểm nhấn đầu tiên nằm ở sự tối ưu hóa chi phí và hiệu năng đồng thời giữa các phân khúc. Cụ thể, phiên bản tầm trung GPT-5.6 Terra chứng minh được năng lực cạnh tranh sòng phẳng, tương đương với sức mạnh của phiên bản tiền nhiệm GPT-5.5.

Đáng chú ý, dù giữ nguyên được chất lượng xử lý tương đương, chi phí vận hành thực tế của bản Terra lại tiết kiệm gấp 2 lần so với hệ thống cũ. Trong khi đó, biến thể giá rẻ Luna vẫn mang lại các năng lực xử lý ổn định ở ngưỡng chi phí thấp nhất mà OpenAI từng cung cấp.

Thêm chế độ Maximum Reasoning

Nhằm đẩy lùi các giới hạn về khả năng suy luận logic, OpenAI lần đầu tiên giới thiệu tính năng nỗ lực suy luận tối đa mang tên Maximum Reasoning trên dòng GPT-5.6. Khi kích hoạt chế độ này, phiên bản cao cấp Sol sẽ được cung cấp nhiều thời gian hơn để phân tích sâu, bóc tách các khía cạnh phức tạp của vấn đề trước khi đưa ra câu trả lời cuối cùng.

Cơ chế này giúp giảm thiểu đáng kể hiện tượng "ảo tưởng" của AI và nâng cao độ chính xác đối với các câu hỏi mang tính học thuật cao.

Ultra Mode hoạt động như nhiều AI phối hợp

Một trong những bước tiến công nghệ mang tính bản lề của dòng sản phẩm này là việc tích hợp chế độ siêu cấp Ultra Mode. Tính năng này cho phép vượt qua giới hạn xử lý thông thường của một đại lý trí tuệ nhân tạo đơn lẻ.

Bằng cách tận dụng hệ thống các trợ lý phụ, Ultra Mode thiết lập một mạng lưới phối hợp hành động nhịp nhàng nhằm đẩy nhanh tiến độ và giải quyết triệt để các luồng công việc có độ phức tạp cao.

GPT-5.6 cải thiện mạnh về lập trình, sinh học và an ninh mạng

Năng lực thực tế của dòng GPT-5.6, đặc biệt là phiên bản Sol, được chứng minh rõ nét nhất thông qua các bài kiểm tra thực tế trong ba lĩnh vực đòi hỏi chuyên môn kỹ thuật cao, gồm công nghệ phần mềm, nghiên cứu y sinh học và an toàn thông tin.

Hiệu năng lập trình dẫn đầu trên TerminalBench 2.1

Trong các quy trình làm việc liên quan đến lập trình và phát triển phần mềm, GPT-5.6 Sol đã thiết lập một tiêu chuẩn mới về trạng thái công nghệ tối tân trên bài kiểm tra TerminalBench 2.1. Đây là hệ thống đánh giá chuyên sâu mô phỏng các luồng công việc thực tế trên giao diện dòng lệnh, đòi hỏi các mô hình AI phải có khả năng lập kế hoạch dài hạn, lặp đi lặp lại để sửa lỗi và phối hợp nhuần nhuyễn giữa nhiều công cụ khác nhau.

Kết quả ghi nhận điểm số cụ thể như sau:

GPT-5.6 Sol Ultra: Đạt mức điểm kỷ lục 91.9%.
GPT-5.6 Sol: Đạt 88.8%.

Mô hình đứng ở vị trí tiếp theo là Claude Mythos 5 đạt 84.3%, trong khi bản GPT-5.6 Terra đạt 82.5% và GPT-5.5 dừng lại ở mức 88.0%. Bản giá rẻ GPT-5.6 Luna cũng ghi nhận kết quả khả quan với 84.3%.

GPT-5.6 cải thiện mạnh về lập trình, sinh học và an ninh mạng

Khả năng xử lý nghiên cứu sinh học tốt hơn

Đối với các luồng công việc thuộc lĩnh vực sinh học, mô hình GPT-5.6 Sol thể hiện những bước tiến dài mang tính toàn diện. Trên bài kiểm tra GeneBench v1 chuyên đánh giá các phân tích sinh học định lượng và bản đồ gen quy mô dài hạn, mô hình Sol không chỉ đạt được kết quả đầu ra chính xác và mạnh mẽ hơn đáng kể so với thế hệ GPT-5.5 cũ mà còn tối ưu hóa tài nguyên vượt trội khi tiêu tốn ít số lượng token đầu ra hơn.

GPT-5.6 cải thiện mạnh về lập trình, sinh học và an ninh mạng

Nâng cấp đáng kể khả năng hỗ trợ an ninh mạng

Về khía cạnh an toàn thông tin, GPT-5.6 Sol hiện là mô hình có năng lực mạnh mẽ nhất của OpenAI trong việc dịch chuyển ranh giới giữa hiệu năng thực tế và hiệu suất chi phí đối với các tác vụ bảo mật dài hạn. Các tác vụ này bao gồm từ việc nghiên cứu lỗ hổng bảo mật cho đến khai thác thử nghiệm.

Trên bài test ExploitBench, GPT-5.6 Sol cho thấy năng lực cạnh tranh tương đương với mô hình Mythos Preview nhưng chỉ tiêu tốn vỏn vẹn khoảng 1/3 lượng token đầu ra. Trong khi đó trên hệ thống ExploitGym, cả ba phiên bản Sol, Terra và Luna đều chứng minh sự tiến bộ vượt bậc về năng lực không gian mạng tỷ lệ thuận với mức tăng thời gian suy luận của hệ thống.

GPT-5.6 cải thiện mạnh về lập trình, sinh học và an ninh mạng

OpenAI tăng cường hệ thống bảo mật cho GPT-5.6

Khi năng lực tư duy logic của trí tuệ nhân tạo ngày càng tiến gần hơn tới các giới hạn nguy hiểm, việc thiết lập một hệ thống kiểm soát hành vi và ngăn chặn rủi ro là yêu cầu bắt buộc được đặt lên hàng đầu. OpenAI đã áp dụng một triết lý thiết kế bảo mật nghiêm ngặt cho thế hệ mô hình này nhằm đảm bảo lợi ích tối đa cho các chuyên gia phòng thủ.

Hệ thống bảo vệ mạnh nhất từ trước đến nay

Phiên bản hàng đầu GPT-5.6 Sol chính thức được phát hành đi kèm với ngăn xếp an toàn kiên cố và mạnh mẽ nhất từ trước đến nay của OpenAI. Nhà phát triển đã gia cố nghiêm ngặt các rào cản bảo vệ đối với nhóm hoạt động có mức độ rủi ro cao, các yêu cầu nhạy cảm liên quan đến không gian mạng và các hành vi cố tình lạm dụng hệ thống lặp đi lặp lại.

AI được huấn luyện để từ chối yêu cầu nguy hiểm

Hệ thống cốt lõi của GPT-5.6 được trải qua quy trình huấn luyện chuyên sâu để chủ động đưa ra phản hồi từ chối đối với bất kỳ hành vi hỗ trợ mạng phi pháp nào bị cấm. Cơ chế tự vệ này hoạt động hiệu quả ngay cả khi người dùng cố tình áp dụng các kỹ thuật ngụy trang ý định tinh vi hoặc cố gắng bẻ khóa mô hình bằng các câu lệnh mồi phức tạp.

Các biện pháp bảo vệ cấp độ mô hình này tạo thành ranh giới phòng thủ đầu tiên, định hình rõ ràng những gì AI được phép và không được phép trợ giúp.

Cơ chế giám sát nhiều lớp

Nhận thức được rằng không có một giải pháp bảo vệ đơn lẻ nào có thể ngăn chặn triệt để các hành vi lạm dụng có chủ đích hoặc mang tính thích ứng cao, OpenAI đã triển khai một ngăn xếp bảo vệ đa lớp trên toàn bộ dòng sản phẩm preview của GPT-5.6. Cấu trúc này bao gồm:

Bộ phân loại lạm dụng thời gian thực: Quét liên tục các nội dung đầu ra thuộc mảng không gian mạng và sinh học ngay khi chúng vừa được tạo ra. Đối với các trường hợp có mức độ rủi ro cao hơn, nếu phát hiện dấu hiệu vi phạm tiềm ẩn, quá trình tạo văn bản có thể bị tạm dừng để một mô hình suy luận lớn hơn vào cuộc, đánh giá lại toàn bộ ngữ cảnh đoạn hội thoại. Nếu nội dung được xác định là không hợp lệ, nó sẽ bị giữ lại trước khi kịp tiếp cận người dùng.
Đánh giá cấp độ tài khoản: Các hoạt động bị gắn cờ đỏ có thể kích hoạt quy trình xem xét tài khoản tổng thể dựa trên các dấu hiệu rủi ro và điều khoản dịch vụ. Việc nhìn rộng hơn ngoài phạm vi một cuộc hội thoại đơn lẻ giúp hệ thống phân biệt được hành vi phá hoại bền bỉ của kẻ xấu với các công việc nghiên cứu bảo mật lưỡng dụng hoàn toàn hợp pháp.

GPT-5.6 chưa vượt ngưỡng Cyber Critical

Một thông tin quan trọng được công bố dựa trên Khung Chuẩn bị của OpenAI là mô hình GPT-5.6 Sol hoàn toàn chưa vượt qua ngưỡng nguy hiểm về an ninh mạng. Trong các bài kiểm tra liên quan đến môi trường mã nguồn của hai trình duyệt Chromium và Firefox, mô hình này mới chỉ dừng lại ở việc nhận diện các lỗi bảo mật và các nguyên mẫu khai thác cơ bản. Thực tế kiểm nghiệm cho thấy AI không thể tự chủ tạo ra một chuỗi khai thác đầy đủ chức năng vận hành dưới các điều kiện thử nghiệm tiêu chuẩn.

GPT-5.6 chưa vượt ngưỡng Cyber Critical

OpenAI sử dụng hơn 700.000 giờ GPU để kiểm thử GPT-5.6

Để đảm bảo các lớp hàng rào bảo vệ luôn giữ được tính hiệu quả cao khi những kẻ tấn công liên tục thay đổi chiến thuật, OpenAI đã đầu tư một nguồn lực tính toán khổng lồ vào quy trình kiểm thử an toàn hệ thống. Cụ thể, hãng đã dành ra hơn 700.000 giờ GPU quy đổi tương đương dòng chip A100 chỉ để phục vụ cho công tác thử nghiệm xâm nhập tự động.

Quy trình tự động hóa này tập trung chủ yếu vào việc tìm kiếm các lỗ hổng bẻ khóa phổ quát, tức là những phương thức tấn công nguy hiểm có khả năng hoạt động xuyên suốt trên nhiều bối cảnh câu lệnh khác nhau thay vì chỉ một cài đặt hẹp. Việc áp dụng trí tuệ nhân tạo của chính hãng để tự tìm điểm yếu giúp OpenAI khám phá được nhiều mô hình tấn công hơn so với các phương pháp thủ công của con người, từ đó rút ngắn con đường sửa chữa lỗ hổng.

Song song với hệ thống tự động, OpenAI vẫn duy trì sự hợp tác chặt chẽ với bên thứ ba để thực hiện các chiến dịch thử nghiệm xâm nhập do các chuyên gia bảo mật là con người trực tiếp vận hành. Đội ngũ chuyên gia này sẽ bổ khuyết cho máy móc bằng cách thử nghiệm các kịch bản lạm dụng sáng tạo mà hệ thống tự động chưa thể lường trước được.

Khi nào GPT-5.6 được phát hành?

Về lộ trình ra mắt, OpenAI hiện đang bắt đầu triển khai chương trình xem trước giới hạn đối với dòng mô hình GPT-5.6. Ở giai đoạn ban đầu này, các mô hình sẽ chỉ được tiếp cận trước bởi một nhóm nhỏ các đối tác và tổ chức đáng tin cậy đã được phê duyệt thông qua lộ trình phối hợp chặt chẽ với chính phủ Hoa Kỳ.

Tuy nhiên, người dùng đại chúng sẽ không phải chờ đợi quá lâu. OpenAI đã lên kế hoạch chính thức để đưa toàn bộ ba phiên bản GPT-5.6 Sol, Terra và Luna phổ biến rộng rãi đến với người dùng dịch vụ ChatGPT, hệ thống Codex và cổng kết nối API trong vài tuần tới.

Đặc biệt, đối với các doanh nghiệp yêu cầu tốc độ xử lý dữ liệu ở quy mô siêu lớn, OpenAI cũng công bố kế hoạch triển khai phiên bản GPT-5.6 Sol trên nền tảng cơ sở hạ tầng của Cerebras vào tháng 7. Sự kết hợp này hứa hẹn mang lại tốc độ xử lý chưa từng có trong lịch sử AI, đạt hiệu suất lên tới 750 token trên mỗi giây.

Giá API GPT-5.6 Sol, Terra và Luna

Để tạo điều kiện cho các nhà phát triển dễ dàng cân đối ngân sách cho các dự án thương mại của mình, OpenAI đã đưa ra một bảng biểu giá chi tiết dựa trên đơn vị tính cho mỗi 1 triệu token xử lý đầu vào và đầu ra:

Phiên bản Mô hình	Chi phí Đầu vào	Chi phí Đầu ra
GPT-5.6 Sol	5 USD	30 USD
GPT-5.6 Terra	2,5 USD	15 USD
GPT-5.6 Luna	1 USD	6 USD

Bên cạnh biểu giá cơ bản, dòng mô hình GPT-5.6 còn giới thiệu một cơ chế bộ đệm câu lệnh mới dễ dự đoán hơn rất nhiều, có tên là Prompt Cache. Hệ thống mới bổ sung tính năng hỗ trợ thiết lập các điểm ngắt bộ đệm rõ ràng cùng thời gian tồn tại tối thiểu của bộ nhớ đệm là 30 phút.

Giá API GPT-5.6 Sol, Terra và Luna

Quy định tính phí đối với tính năng bộ đệm này được cấu trúc như sau: các lượt ghi vào bộ đệm sẽ được tính hóa đơn bằng 1.25 lần so với tỷ lệ đầu vào không có bộ đệm thông thường của mô hình. Trong khi đó, các lượt đọc dữ liệu có sẵn từ bộ đệm sẽ tiếp tục được áp dụng chính sách giảm giá sâu lên đến 90% so với giá token đầu vào tiêu chuẩn.

Xem thêm