Nghiên cứu cho thấy DeepSeek R1 dễ bị khai thác, có nguy cơ mất an toàn cho người dùng

03/02/2025 - 23:34

(Bankviet.com) DeepSeek R1 không thể chặn bất kỳ lời nhắc độc hại nào, theo nghiên cứu từ Cisco. AI này dễ bị khai thác và có nguy cơ mất an toàn cho người dùng.

DeepSeek R1 dễ bị khai thác – 100% lời nhắc độc hại vượt qua kiểm duyệt

DeepSeek – công ty AI của Trung Quốc đang đối mặt với những lo ngại nghiêm trọng về bảo mật sau khi nghiên cứu của Cisco và Adversa AI cho thấy mô hình DeepSeek R1 không thể ngăn chặn bất kỳ lời nhắc gây hại nào.

Nghiên cứu cho thấy DeepSeek R1 dễ bị khai thác, có nguy cơ mất an toàn cho người dùng

Deepseek đang nổi lên thời gian gần đây

Ngày 20/1, DeepSeek R1 chính thức ra mắt, nhưng chỉ sau một thời gian ngắn, mô hình này đã bị phát hiện không có khả năng chống lại các lời nhắc độc hại.

Nhóm nghiên cứu của Cisco đã thử nghiệm DeepSeek R1 bằng 50 lời nhắc độc hại ngẫu nhiên từ HarmBench – một tập dữ liệu chuyên kiểm tra khả năng bảo mật của AI. Các lời nhắc này bao gồm tội phạm mạng, thông tin sai lệch, hoạt động bất hợp pháp và nhiều nội dung nguy hiểm khác.

Kết quả DeepSeek R1 bị khai thác 100%, tức không có bất kỳ cơ chế bảo vệ nào hoạt động hiệu quả. Cisco nhận định: "Điều này trái ngược với các mô hình AI hàng đầu khác, vốn có khả năng chống chịu ít nhất một phần các cuộc tấn công."

Cùng quan điểm, nghiên cứu từ Adversa AI cũng chỉ ra rằng DeepSeek R1 dễ bị tấn công bằng nhiều kỹ thuật bẻ khóa, từ thủ thuật đơn giản đến những lời nhắc phức tạp được tạo ra bởi AI.

Lý do DeepSeek dễ bị khai thác

Các chuyên gia bảo mật cho rằng chi phí phát triển thấp là nguyên nhân chính khiến DeepSeek không có đủ cơ chế bảo vệ vững chắc.

Theo phân tích, DeepSeek chỉ sử dụng khoảng 6 triệu USD để phát triển các mô hình AI như V3 miễn phí và R1 mới nhất. Tuy nhiên, nghiên cứu của SemiAnalysis – công ty chuyên phân tích thị trường AI và bán dẫn – cho thấy con số thực sự có thể lên tới hơn một tỷ USD.

DJ Sampath, Phó chủ tịch phần mềm AI của Cisco, nhận định: "100% cuộc tấn công thành công cho thấy sự đánh đổi. Đúng là có thể rẻ hơn khi xây dựng thứ gì đó ở đây, nhưng khoản đầu tư có lẽ chưa được sử dụng để tính đến vấn đề an toàn và bảo mật."

Điều này có nghĩa là DeepSeek có thể đã tập trung quá nhiều vào tốc độ phát triển và giảm chi phí, thay vì đầu tư vào bảo mật.

DeepSeek để lộ dữ liệu – Nguy cơ rò rỉ thông tin người dùng

Không chỉ gặp vấn đề với lời nhắc độc hại, DeepSeek còn bị phát hiện để lộ dữ liệu người dùng.

Tuần trước, công ty an ninh mạng Wiz (Mỹ) cảnh báo rằng DeepSeek đã để lộ hơn một triệu dòng dữ liệu không có biện pháp bảo mật, bao gồm: Khóa phần mềm kỹ thuật số; Nhật ký trò chuyện ghi lại yêu cầu của người dùng gửi đến AI miễn phí.

Điều này có thể gây rủi ro lớn về quyền riêng tư, khi dữ liệu của người dùng bị rò rỉ mà không có cơ chế bảo vệ chặt chẽ.

Sau khi được cảnh báo, DeepSeek đã nhanh chóng triển khai các biện pháp bảo mật, nhưng không đưa ra bất kỳ bình luận chính thức nào về vụ việc này.

So sánh DeepSeek với các mô hình AI hàng đầu

Theo Cisco, DeepSeek R1 không phải mô hình AI duy nhất gặp vấn đề về kiểm duyệt nội dung. Một số AI khác cũng có tỷ lệ bị khai thác cao:

Llama 3.1 405B (Meta): 96% lời nhắc độc hại vượt qua kiểm duyệt.

GPT-4o (OpenAI): 86% lời nhắc độc hại được chấp nhận.

Claude 3.5 Sonet (Anthropic): 36% lời nhắc độc hại được chấp nhận.

O1-preview (OpenAI): 26% lời nhắc độc hại được chấp nhận.

Tuy nhiên, DeepSeek R1 vẫn đứng đầu danh sách với tỷ lệ 100%, tức hoàn toàn không có bất kỳ cơ chế kiểm soát hiệu quả nào.

DeepSeek được thành lập vào tháng 5/2023 bởi Liang Wenfeng, có trụ sở tại Hàng Châu, Trung Quốc. Công ty này được quỹ đầu tư High-Flyer sở hữu và tài trợ.

Mặc dù có tham vọng phát triển mạnh mẽ trong lĩnh vực AI, DeepSeek hiện không có kế hoạch huy động vốn, mà tập trung vào xây dựng công nghệ nền tảng.

Tỷ phú trẻ Joshua Kushner: Người mở đường cho sự thành công của OpenAI

Sam Altman, CEO OpenAI từng nhận định về nhà sáng lập công ty đầu tư mạo hiểm Thrive Capital – tỷ phú Joshua Kushner rằng: ...

Chat GPT cán mốc 300 triệu người dùng hàng tuần

Chat GPT hiện có hơn 300 triệu người dùng hoạt động hàng tuần, theo CEO Sam Altman. Với tham vọng đạt một tỷ người dùng ...

Mâu thuẫn giữa Sam Altman và Elon Musk: Từ OpenAI đến cuộc chiến ChatGPT

Sam Altman gọi Elon Musk là 'kẻ bắt nạt' và làm rõ mâu thuẫn liên quan đến OpenAI và ChatGPT trong cuộc chiến dẫn đầu ...

Ngọc Nhi

Theo: Kinh Tế Chứng Khoán

Nghiên cứu cho thấy DeepSeek R1 dễ bị khai thác, có nguy cơ mất an toàn cho người dùng

DeepSeek R1 dễ bị khai thác – 100% lời nhắc độc hại vượt qua kiểm duyệt

Lý do DeepSeek dễ bị khai thác

DeepSeek để lộ dữ liệu – Nguy cơ rò rỉ thông tin người dùng

So sánh DeepSeek với các mô hình AI hàng đầu

Bài liên quan

Giá Pi Network hôm nay 21/7: Thận trọng trước ngưỡng “bung sóng”

Cập nhật giá cà phê hôm nay 21/7: Tăng mạnh nhất nhiều tuần gần đây

Giá Pi Network hôm nay 20/7: “Nín thở” sau đợt unlock khổng lồ

Cập nhật giá cà phê hôm nay 20/7: Tăng mạnh, áp sát ngưỡng kỷ lục

Mẫu xe máy xăng "hot" bất ngờ giảm giá sâu trước tin cấm xe?

VINALOGIC SWING CUP 2025: 152 golfer hội tụ kỷ niệm 5 năm thành lập VINALOGIC

Cập nhật giá cà phê hôm nay 18/7: Hồi phục, cà phê Đắk Lắk tăng mạnh nhất

Giá Pi Network hôm nay 18/7: “Trượt nhẹ” sau Mainnet, cộng đồng vẫn kiên định chờ thời

<h1 class="sc-longform-header-title block-sc-title arx-block-state">Mẫu xe máy điện VinFast đang được dân công sở "săn lùng": Nhẹ, sang, đi 112km chỉ 3.000 đồng/lần sạc đầy

Giá tiêu hôm nay 17/7: Mất đà tăng, gia Lai về mốc thấp nhất trong các tỉnh trồng lớn<br>

Chứng khoán BIDV (BSC) báo lãi hơn 227 tỷ nửa đầu năm, cổ phiếu duy trì sức hấp dẫn

Dự báo giá cà phê ngày 19/7: Liệu có "hồi sinh" sau chuỗi ngày giảm sâu?

Khẩn trương tập trung triển khai tổ chức Triển lãm thành tựu Đất nước nhân dịp kỷ niệm 80 năm Ngày Quốc khánh

Giá heo hơi hôm nay 18/7: Cả ba miền chuyển đỏ, miền Trung – Tây Nguyên lập đáy

Dự báo giá cà phê ngày 17/7: Liệu có vững đà tăng?

Giá lúa gạo hôm nay 17/7: CL 555 tăng nhẹ, giá cám giảm, thị trường xuất khẩu Thái Lan gặp khó

TP. Hồ Chí Minh sau sáp nhập, khu vực nào sẽ hút dòng vốn đầu tư?