Vỏ quýt dày có móng tay nhọn: DetectGPT

Minh họa: pexels-tara-winstead

Với nhiều người, ChatGPT của OpenAI có thể giúp nhiều việc. Từ nay, người người nhà nhà đều có thể trở thành “nhà văn”, “nhà thơ”, “nhà báo”, “nhà khoa học”…

Cũng vì lý do đó nên một câu hỏi liền được đặt ra: Liệu một văn bản là do con người hay chatbot AI (Artificial Intelligence) viết? Đã có những người chỉ trích, phàn nàn rằng phần mềm này sẽ bị lạm dụng để gian lận trong các bài thi ở trường học hoặc đại học. Theo một nghiên cứu, AI thậm chí có thể đánh lừa các chuyên gia khoa học. Vì lý do này, nhiều trường đại học danh tiếng trên thế giới như Paris Science Po thậm chí cấm sử dụng ChatGPT. Trong tương lai, muốn gian lận trong trường học hay ở đại học không còn là việc dễ dàng. Với DetectGPT, người ta có thể phơi bày nguồn gốc thật sự các văn bản từ AI với độ chính xác lên tới 95%.

Các nhà nghiên cứu tại Đại học Stanford đã phát triển một phương pháp mới để có thể nhận dạng ngay các văn bản do AI tạo ra, chẳng hạn từ ChatGPT. DetectGPT thậm chí không cần phải được huấn luyện để phân tích văn bản, vì điều đó sẽ yêu cầu một lượng dữ liệu khổng lồ. Các nhà khoa học cho rằng đằng sau chức năng của ChatGPT và những thứ tương tự, có một mô hình có thể phân biệt rõ ràng về mặt toán học với cách viết văn bản của con người.

Ý tưởng làm nên DetectGPT được thử nghiệm dựa trên các mô hình nguồn mở (Open-Source-Model) phổ biến, bao gồm cả những mô hình có sẵn thông qua API của OpenAI (Application Programming Interface – “Giao diện lập trình ứng dụng”). Đây là một tập hợp các quy tắc, giao thức và công cụ cho phép các ứng dụng khác nhau tương tác với nhau. API cung cấp cách truyền dữ liệu và thông tin giữa các ứng dụng khác nhau, cho phép chúng tương tác và làm việc với nhau một cách hiệu quả.

API được sử dụng rộng rãi trong phát triển phần mềm và ứng dụng, đặc biệt trong các ứng dụng web, để kết nối các hệ thống khác nhau và chia sẻ dữ liệu và chức năng. Vì vậy, DetectGTP chỉ cần sử dụng LLM (Large Language Model) để phát hiện đầu ra của chính nó. Về cơ bản, nó hỏi một LLM rằng, nó “thích” một mẫu văn bản đến mức nào.

Vấn đề ở đây không phải là xác định mô hình ngôn ngữ có sở thích nào, mà là nhận ra liệu văn bản có đến từ LLM tương ứng hay không. Nếu mô hình LLM thích nó rất nhiều, rất có thể đó là từ mô hình. Nếu LLM không thích nó, thì nó không được viết bởi mô hình này. Và theo các nhà nhiên cứu, phương pháp này hoạt động tốt hơn nhiều so với đoán ngẫu nhiên.

Trong thử nghiệm, các nhà nghiên cứu tại Đại học Stanford đã đánh giá mức độ các LLM khác nhau được công khai truy cập, những văn bản do con người viết cũng như văn bản của chính họ, bao gồm những bài báo giả mạo và bài luận học thuật. Nó cũng được đánh giá xem LLM phản ứng như thế nào trung bình với 100 yếu tố gây nhiễu trong văn bản của LLM hoặc văn bản được tạo bởi con người. Dựa trên phương pháp này, các nhà nghiên cứu có thể phân biệt khá tốt nguồn các văn bản.

Share:

Ý kiến độc giả
Quảng Cáo

Có thể bạn chưa đọc

Quảng Cáo
Quảng Cáo
Quảng Cáo
Quảng Cáo
Quảng Cáo
Quảng Cáo
Share trang này:
Facebook
Twitter
Telegram
WhatsApp
LinkedIn
Email
Kênh Saigon Nhỏ: