Nghiên cứu về AI được viết bằng AI và phản biện bởi AI

Tranh cãi đã nổ ra sau khi 21% các bài phản biện cho một hội nghị quốc tế về AI bị phát hiện được viết hoàn toàn bởi AI

Các nhà nghiên cứu nên làm gì nếu họ nghi ngờ bài báo của mình bị phản biện bằng AI? Gần đây, nhiều nhà nghiên cứu chia sẻ trên mạng xã hội rằng một số bài phản biện của Hội thảo ICLR 2026 (một hội thảo lớn về học máy) có dấu hiệu do AI tạo ra. Họ thấy có các trích dẫn bịa đặt, phản hồi quá dài dòng và mơ hồ.

Graham Neubig, một nhà nghiên cứu AI tại Đại học Carnegie Mellon, cũng nhận được các bài phản biện giống như vậy. Ông nói rằng phản biện rất dài, nhiều gạch đầu dòng và yêu cầu những phân tích không giống tiêu chuẩn của lĩnh vực AI.

Để kiểm tra xem phản biện có phải do AI viết hay không, ông Neubig đã đăng lên X (Twitter) và treo thưởng cho ai có thể phân tích tất cả các bản thảo và phần phản biện được gửi đến hội thảo. Max Spero, giám đốc Pangram Labs – một công ty chuyên phát hiện văn bản do AI tạo, đã nhận lời.

Pangram đã quét 19.490 bài nghiên cứu và 75.800 bài phản biện của ICLR 2026. Kết quả cho thấy:

  • 21% bài phản biện hoàn toàn do AI tạo ra
  • Hơn 50% có dấu hiệu sử dụng AI

Trước đây mọi người chỉ nghi ngờ, nhưng đây là lần đầu có bằng chứng rõ ràng.

Ban tổ chức hội nghị cho biết họ sẽ dùng công cụ tự động để kiểm tra xem các tác giả hoặc phản biện có vi phạm quy định về sử dụng AI hay không. Đây là lần đầu ICLR phải xử lý vấn đề ở quy mô lớn như vậy. Họ hy vọng sau quy trình này, việc đánh giá bài báo sẽ đáng tin cậy hơn.

AI bị phản biện bởi AI

Pangram dùng công cụ của họ để kiểm tra có bao nhiêu bản thảo và phản biện được “chắp bút” bởi AI. Kết quả cho thấy có 15.899 bài phản biện tại ICLR được viết hoàn toàn bằng AI. Ngoài ra, họ cũng phát hiện nhiều bài nộp cho hội thảo có dùng AI:

  • 199 bài (1%): hoàn toàn do AI viết
  • 61%: chủ yếu do con người viết
  • 9%: hơn một nửa nội dung là do AI tạo

Pangram mô tả chi tiết mô hình này trong một bản thảo tiền xuất bản mà họ cũng đã nộp đến ICLR 2026. Bản thảo này nhận được 4 phản biện – và chính công cụ của họ cho thấy 1 phản biện là hoàn toàn do AI viết, 1 phản biện khác được AI chỉnh sửa một phần.

Nhiều nhà nghiên cứu cảm thấy kết quả này đúng với nghi ngờ ban đầu của họ. Desmond Elliott, nhà khoa học máy tính tại Đại học Copenhagen, nói rằng một trong ba phản biện ông nhận được “không hiểu đúng bài báo”. Nghiên cứu sinh của ông nghi ngờ đây là phản biện do AI viết, vì nó trích dẫn nhầm số liệu và dùng các câu văn kỳ lạ.

Khi Pangram công bố kết quả, Elliott lập tức kiểm tra nghi vấn của mình. Và quả không sai, phản biện mà nhóm nghiên cứu của ông đang nghi ngờ được kết luận là do AI viết 100%. Không chỉ vậy, phản biện này thậm chí còn cho điểm thấp nhất, khiến bản thảo của ông bị xoay như chong chóng trong vòng lặp phản biện.

Hệ quả

Hội nghị ICLR 2026 cho phép dùng AI để chỉnh sửa câu chữ, viết code thí nghiệm hoặc phân tích kết quả nhưng bắt buộc phải khai báo quy trình sử dụng. Họ cấm dùng AI để làm lộ bản thảo hoặc tạo nội dung sai. Bây giờ, ban tổ chức sẽ dùng kết quả phân tích của Pangram và các công cụ khác để kiểm tra xem bài nộp hoặc bài phản biện có vi phạm quy định không và sẽ phạt những người vi phạm.

Người phụ trách phản biện sẽ có trách nhiệm đánh dấu cả những phản biện chất lượng kém, không chỉ phản biện do AI viết. Tuy nhiên, họ nói rõ rằng họ sẽ không chỉ dựa vào công cụ tự động, vì những công cụ này đôi khi vẫn mắc lỗi.

Một số tác giả đã rút bài khỏi ICLR vì nghi ngờ bài của mình đang bị AI phản biện. Nhiều người khác thì bối rối không biết cách phản hồi. Elliott nói: “Tôi quen với việc thỉnh thoảng nhận phải phản biện kém chất lượng.” Nhưng phản biện do AI viết thì thường “rất dài”, trong đó có đoạn cần trả lời nhưng cũng nhiều đoạn vô lý.

Tình trạng này cho thấy áp lực rất lớn lên giới phản biện, nhất là khi lĩnh vực AI phát triển quá nhanh. Neubig nói: “AI và học máy đang gây ra khủng hoảng cho quy trình phản biện vì số lượng bài tăng quá mạnh trong 5 năm qua.”

Hariharan cho biết: mỗi phản biện của ICLR phải đọc 5 bài trong 2 tuần, quá tải hơn nhiều so với trước. Cộng đồng đang thảo luận cách xử lý vì “ai cũng đang phải làm nhiều hơn rất nhiều so với trước đây”.

Dịch từ Nature

--- Bài viết này có hữu ích không? ---

Nhấn sao để đánh giá!

Đánh giá trung bình 0 / 5. Số đánh giá: 0

Chưa có đánh giá.

Có thể bạn quan tâm