OpenAI vừa ra mắt GPT-OSS, mô hình AI mở miễn phí cho phép bạn chạy ChatGPT cực mạnh ngay trên máy tính mà không cần Internet.
Kể từ khi phát hành GPT-2 vào năm 2019, OpenAI đã giữ kín các mô hình ngôn ngữ của mình. Tuy nhiên, hãng đã gây bất ngờ lớn khi ra mắt hai mô hình AI có trọng số mở (open-weight) là GPT-OSS-120B và GPT-OSS-20B. Đây là một bước ngoặt đáng chú ý, cho phép cộng đồng nhà phát triển và người dùng cá nhân có thể tải xuống, chạy cục bộ và tùy chỉnh các mô hình AI mạnh mẽ.
![Hướng dẫn chi tiết cách cài đặt và sử dụng GPT-OSS]()
OpenAI khẳng định rằng các mô hình mới này mang lại hiệu suất tiên tiến nhất trong lĩnh vực mã nguồn mở, vượt trội hơn các mô hình cùng kích thước khác. Cả hai đều sử dụng kiến trúc Mixture of Experts (MoE), giúp tăng tốc độ xử lý và hiệu quả bộ nhớ. Cụ thể, GPT-OSS-120B hoạt động với 5.1 tỷ tham số và GPT-OSS-20B hoạt động với 3.6 tỷ tham số.
Trong bài đăng trên blog, OpenAI chia sẻ rằng các mô hình này được huấn luyện bằng cách kết hợp giữa học tăng cường (reinforcement learning) và các kỹ thuật từ các mô hình nội bộ tiên tiến nhất của OpenAI, bao gồm o3 và các hệ thống đột phá khác.
So sánh hiệu năng và khả năng của GPT-OSS
Vậy, các mô hình GPT-OSS mạnh mẽ đến mức nào? Dưới đây là bảng so sánh hiệu năng của GPT-OSS với các mô hình độc quyền khác trong một số bài kiểm tra tiêu chuẩn.
Tiêu chuẩn kiểm tra | GPT-OSS-120B | GPT-3.5 (03) | GPT-4 Mini (04 Mini) |
Codeforce (lập trình) | 2622 | ~2700 | ~2630 |
GPQA (câu hỏi khó) | Tương đương GPT-3.5 | ✓ | ✓ |
HealthBench (y tế) | Vượt trội hơn 04 Mini | ✓ | ❌ |
Competition Math (toán học) | Vượt trội hơn GPT-3.5 | ✓ | Hơi kém hơn |
Humanities Last Exam | Ngang bằng 04 Mini | ✓ | ✓ |
Ngoài ra, các mô hình mới của OpenAI còn hỗ trợ độ dài ngữ cảnh lên đến 128k token, cho phép xử lý các văn bản dài hơn và phức tạp hơn. Chúng chủ yếu được huấn luyện trên bộ dữ liệu tiếng Anh và có thế mạnh đặc biệt trong các lĩnh vực STEM, lập trình và kiến thức tổng quát.
Một điểm đáng chú ý khác là cả hai mô hình này đều hỗ trợ quy trình tác vụ tự động (agentic workflows), bao gồm khả năng sử dụng công cụ như tìm kiếm web và thực thi mã Python. Điều này có nghĩa là bạn có thể sử dụng các mô hình này để hoàn thành nhiều tác vụ phức tạp trên máy tính của mình mà không cần kết nối internet.
Cách cài đặt và sử dụng GPT-OSS
Bạn có thể dễ dàng tải xuống và sử dụng GPT-OSS từ Hugging Face. Việc chạy các mô hình này cục bộ cũng đơn giản hơn bạn nghĩ.
-
Yêu cầu phần cứng:
-
GPT-OSS-120B cần một GPU đơn với 80GB VRAM.
-
GPT-OSS-20B dễ tiếp cận hơn, có thể chạy trên laptop và điện thoại thông minh chỉ với 16GB RAM.
-
Cài đặt trên máy tính:
-
Sử dụng LM Studio: Bạn có thể tải xuống LM Studio từ trang web https://lmstudio.ai/, sau đó tìm và tải mô hình GPT-OSS-20B (hoặc 120B nếu phần cứng đủ mạnh) tại ĐÂY.
-
Sử dụng Ollama: Nếu muốn một cách nhanh chóng, bạn có thể cài đặt Ollama và chạy lệnh ollama run gpt-oss:20b
để bắt đầu.
Xem thêm: Hướng dẫn chi tiết cách sử dụng mô hình AI cục bộ trên PC và Mac
![Hướng dẫn chi tiết cách cài đặt và sử dụng GPT-OSS]()
GPT-OSS không chỉ là một mô hình AI mạnh mẽ mà còn là biểu tượng cho sự thay đổi trong chiến lược của OpenAI, hướng tới một hệ sinh thái AI cởi mở hơn. Việc này mở ra nhiều cơ hội mới cho các nhà phát triển và người dùng, cho phép họ tận dụng sức mạnh của AI một cách an toàn và linh hoạt hơn.
Tham khảo ngay các dòng laptop cấu hình xịn, giá tốt để chạy mô hình AI tại Minh Tuấn Mobile