Báo cáo từ Cisco chỉ ra chatbot DeepSeek thất bại hoàn toàn trong việc ngăn chặn nội dung độc hại, gây lo ngại về an toàn AI.
DeepSeek, một trong những mô hình AI đang nổi lên từ Trung Quốc, đang gặp phải những thách thức nghiêm trọng về khả năng bảo mật. Theo báo cáo mới nhất từ Cisco, chatbot AI DeepSeek R1 đã thể hiện những điểm yếu đáng quan ngại trong việc xử lý các nội dung có hại.
Trong cuộc kiểm tra sử dụng 50 câu lệnh từ bộ dữ liệu HarmBench, DeepSeek R1 đã thể hiện tỷ lệ thất bại đáng báo động - 100% trong việc ngăn chặn các nội dung độc hại. Điều này bao gồm nhiều loại tấn công khác nhau, từ tội phạm mạng đến thông tin sai lệch và các hoạt động phi pháp.
Công ty bảo mật Adversa AI cũng đưa ra những kết luận tương tự, củng cố thêm những lo ngại về khả năng bảo mật của mô hình này.
Một trong những lý do chính được các chuyên gia từ Cisco chỉ ra là khoản đầu tư phát triển khá khiêm tốn của DeepSeek - chỉ khoảng 6 triệu USD. Con số này tương đối nhỏ khi so sánh với các đối thủ cạnh tranh như OpenAI, nơi có thể chi đến 500 triệu USD cho việc phát triển GPT-5.
Điều đáng chú ý là mặc dù DeepSeek thể hiện sự yếu kém trong việc ngăn chặn nội dung độc hại, mô hình này lại có những hạn chế rất nghiêm ngặt đối với các chủ đề nhạy cảm, đặc biệt là những vấn đề chính trị liên quan đến Trung Quốc. Khi được hỏi về những chủ đề này, DeepSeek thường tránh né và chuyển hướng sang các vấn đề khác.
Mặc dù tồn tại những hạn chế về mặt an toàn và kiểm duyệt, DeepSeek vẫn ghi nhận sự tăng trưởng ấn tượng về số lượng người dùng. Theo số liệu từ Similarweb, lượng truy cập hàng ngày của nền tảng này đã tăng từ 300.000 lên đến 6 triệu trong một khoảng thời gian ngắn sau khi ra mắt.
Đáng chú ý là các công ty công nghệ hàng đầu của Mỹ như Microsoft và Perplexity đang tích cực tích hợp DeepSeek vào hệ thống của họ, tận dụng tính chất mã nguồn mở của mô hình này.
Những phát hiện này đặt ra câu hỏi quan trọng về sự cân bằng giữa tốc độ phát triển và đảm bảo an toàn trong lĩnh vực AI. Mặc dù DeepSeek đang thu hút được sự quan tâm đáng kể, những vấn đề về bảo mật cần được giải quyết để đảm bảo an toàn cho người dùng trong tương lai.