Hallucinated References (Trích dẫn ảo)

Hallucinated reference là một trích dẫn hoặc tài liệu tham khảo do trí tuệ nhân tạo tạo ra, trông giống hệt một công trình học thuật có thật nhưng thực tế không tồn tại. Tên tác giả, tiêu đề bài báo, tên tạp chí, năm xuất bản, thậm chí mã số DOI đều có thể được dựng lên rất gọn gàng, đúng định dạng và hoàn toàn bịa. Trong tiếng Việt, thuật ngữ này thường được gọi là “trích dẫn ảo”.

Điều khiến nó nguy hiểm không phải sự cẩu thả, mà là sự chỉn chu. Một trích dẫn ảo không trông giống lỗi. Nó trông giống một nguồn đáng tin, cho tới khi có người thử tra cứu và không tìm thấy gì.

Ảo ở đây nghĩa là gì

Từ “hallucination” (ảo giác) trong lĩnh vực AI chỉ những lúc một mô hình ngôn ngữ lớn (LLM) như ChatGPT, Gemini hay Claude đưa ra thông tin nghe rất hợp lý nhưng sai hoặc không có thật. Trích dẫn ảo là một dạng cụ thể của hiện tượng đó, và cũng là dạng dễ phát hiện nhất, vì chỉ cần kiểm tra là biết nguồn có tồn tại hay không.

Cần phân biệt trích dẫn ảo với lỗi trích dẫn thông thường. Một bài báo có thật nhưng bị ghi sai số trang, sai năm, hay sai tên một đồng tác giả thì đó là lỗi trích dẫn. Còn trích dẫn ảo là khi bản thân công trình ấy chưa từng được viết ra. Trên thực tế, AI mắc cả hai loại lỗi, và đôi khi trộn lẫn chúng: lấy một tác giả có thật ghép với một tiêu đề không có thật, hoặc đặt một bài báo có thật vào một tạp chí mà nó chưa từng đăng.

Vì sao AI lại bịa ra nguồn

Để hiểu vì sao chuyện này xảy ra, cần biết một mô hình ngôn ngữ thật sự làm gì khi bạn yêu cầu nó “cho vài nguồn tham khảo”.

LLM không tra cứu một cơ sở dữ liệu thư mục như Google Scholar hay PubMed. Nó dự đoán từ tiếp theo. Mỗi câu nó viết ra là kết quả của việc ước lượng chuỗi ký tự nào có khả năng xuất hiện cao nhất, dựa trên khối văn bản khổng lồ nó đã học. Khi bạn hỏi một trích dẫn, mô hình biết rất rõ một trích dẫn học thuật trông như thế nào: một dãy tên, một tiêu đề trong ngoặc kép, tên tạp chí in nghiêng, rồi số tập và số trang. Nó tái tạo lại đúng cái khuôn đó. Khuôn thì đúng, còn ruột thì không nhất thiết có thật.

Vấn đề nặng hơn ở những chủ đề hẹp, mới, hoặc ít tài liệu. Khi trong dữ liệu huấn luyện gần như không có gì để dựa vào, mô hình không dừng lại và nói “tôi không biết”. Nó vẫn lấp đầy chỗ trống bằng thứ trông hợp lý. Có một quy luật khá rõ ở đây: bài báo càng được trích dẫn nhiều, AI càng nhớ chính xác; còn những bài ít được nhắc tới thì gần như chắc chắn bị dựng lại sai.

Chuyện này phổ biến đến mức nào

Phổ biến hơn nhiều so với cảm nhận của hầu hết người dùng.

Bằng chứng rõ ràng nhất đến từ nghiên cứu của William Walters và Esther Wilder, đăng trên tạp chí Scientific Reports năm 2023. Hai tác giả yêu cầu ChatGPT viết các bài tổng quan tài liệu ngắn cho 42 chủ đề, rồi đối chiếu toàn bộ 636 trích dẫn thu được. Với ChatGPT-3.5, 55% trích dẫn là bịa đặt. Với ChatGPT-4, con số giảm còn 18%. Đáng chú ý là ngay cả trong số những trích dẫn trỏ tới bài báo có thật, 43% ở bản GPT-3.5 và 24% ở bản GPT-4 vẫn chứa lỗi đáng kể.

GPT-4 tốt hơn hẳn GPT-3.5, nhưng 18% vẫn nghĩa là cứ khoảng sáu nguồn thì có một nguồn không có thật. Và bức tranh không tự khá lên theo thời gian. Một cuộc kiểm toán quy mô lớn năm 2026 do M.Z. Naser tại Đại học Clemson thực hiện đã yêu cầu 10 mô hình ngôn ngữ thương mại tạo trích dẫn trên bốn lĩnh vực học thuật, rồi đối chiếu 69.557 trích dẫn với ba cơ sở dữ liệu CrossRef, OpenAlex và Semantic Scholar. Tỷ lệ bịa đặt dao động từ 11,4% đến 56,8% tùy mô hình, lĩnh vực và cách đặt câu hỏi. Một phát hiện thú vị: không mô hình nào tự ý chèn trích dẫn khi không được yêu cầu, nghĩa là hành vi này do lời nhắc kích hoạt chứ không phải bản tính cố hữu của mô hình.

Trích dẫn ảo cũng đã lọt vào cả những nơi đáng lẽ phải chặt chẽ nhất. Năm 2025, giới nghiên cứu phát hiện hàng loạt trích dẫn bịa trong các bài đã được nhận tại NeurIPS, một trong những hội nghị AI uy tín nhất, và trong các bài đang phản biện ở ICLR. Một công ty tư vấn lớn ở Úc cũng từng phải hoàn lại một phần phí cho bản báo cáo nộp chính phủ vì trong đó có nguồn không tồn tại.

Một vụ việc có thật: Mata kiện Avianca

Ví dụ nổi tiếng nhất không nằm trong giới học thuật mà ở tòa án. Năm 2023, trong vụ Mata kiện hãng hàng không Avianca tại Tòa án Liên bang khu vực Nam New York, một luật sư đã dùng ChatGPT để soạn bản tranh tụng. ChatGPT đưa ra sáu bản án làm căn cứ pháp lý, kèm tên vụ kiện, trích dẫn nội bộ và lập luận nghe rất thuyết phục. Cả sáu đều không tồn tại.

Luật sư bên bị không tìm được bản án nào. Tòa cũng không. Khi được yêu cầu nộp bản sao, phía nguyên đơn lại nộp tiếp những đoạn trích cũng do ChatGPT bịa ra. Thẩm phán P. Kevin Castel cuối cùng phạt mỗi luật sư và công ty luật 5.000 USD. Một chi tiết đáng suy ngẫm: luật sư Steven Schwartz khai trước tòa rằng ông tin ChatGPT “không thể nào tự bịa ra các vụ án”. Ông đã nhầm, và cái nhầm đó được ghi lại trong một bản án dài 46 trang mà nhiều đoàn luật sư bang sau này dùng làm bài học cảnh báo.

Điểm mấu chốt: tòa không phạt vì luật sư dùng AI. Tòa phạt vì họ không kiểm tra, và vì khi bị phát hiện họ vẫn cố bảo vệ những nguồn giả.

Vì sao người làm nội dung và marketing cần để tâm

Nhiều người có thể nghĩ đây là chuyện của nhà nghiên cứu và luật sư. Không hẳn. Bất kỳ ai dùng AI để viết đều có thể vướng phải, và dân làm nội dung thì dùng AI gần như mỗi ngày.

Một bài blog tuyến SEO viện dẫn “một nghiên cứu của Đại học Harvard” không có thật. Một báo cáo ngành trích số liệu kèm nguồn không tồn tại. Một whitepaper gửi khách hàng dẫn một bài trên Forbes chưa từng được đăng. Slide gọi vốn xây lập luận trên thống kê bịa. Mỗi tình huống bắt đầu giống nhau: AI viết ra thứ trông chuyên nghiệp, người dùng tin, không ai tra lại, rồi nội dung được xuất bản.

Hậu quả thì không ảo chút nào. Với một thương hiệu, một nguồn giả bị độc giả phát hiện sẽ làm sứt mẻ uy tín của cả bài viết, đôi khi cả website. Với SEO, nội dung sai sự thật đi ngược nguyên tắc E-E-A-T mà Google dùng để đánh giá độ tin cậy của trang. Với quan hệ khách hàng, một con số bịa trong bản đề xuất có thể khiến cả tài liệu mất giá trị, và mất luôn niềm tin.

Cách phát hiện và phòng tránh

Tin tốt là trích dẫn ảo thuộc loại lỗi dễ bắt nhất, miễn là người đọc dành thời gian ra để kiểm tra.

Tra ngược mọi nguồn. Nếu AI đưa một bài báo, hãy chép chính xác tiêu đề vào Google Scholar, CrossRef hoặc cơ sở dữ liệu phù hợp. Không ra kết quả thì gần như chắc chắn bài đó không tồn tại.

Kiểm tra DOI. Một mã DOI thật sẽ dẫn tới đúng bài khi gắn sau địa chỉ doi.org. AI rất hay bịa ra dãy DOI đúng định dạng nhưng dẫn tới trang lỗi.

Đừng tin đường link. AI cũng bịa cả URL. Một liên kết mở ra trang 404, hoặc mở ra một bài khác hẳn nội dung được trích, là dấu hiệu khá chắc chắn.

Hỏi lại cùng một câu nhiều lần. Nếu nguồn là thật, mô hình thường trả lời nhất quán. Nếu là bịa, nó hay đổi tên tác giả hoặc năm giữa các lần hỏi. Nghiên cứu của Naser còn cho thấy khi từ ba mô hình trở lên cùng trích một công trình, độ chính xác lên tới 95,6%.

Ưu tiên công cụ có truy xuất thật. Các công cụ gắn trực tiếp với cơ sở dữ liệu học thuật, như Elicit, Consensus hay SciSpace, hoặc các chế độ tìm kiếm web, ít bịa nguồn hơn hẳn so với một LLM chỉ dựa vào trí nhớ. Kỹ thuật phía sau gọi là retrieval-augmented generation (RAG): mô hình lấy dữ liệu thật từ bên ngoài rồi mới viết. Nó giảm rủi ro chứ không xóa bỏ hoàn toàn.

Coi AI là trợ lý nháp, không phải nguồn. Quy tắc gọn nhất: dùng AI để phác ý và gọt câu chữ, nhưng mọi sự thật, con số và trích dẫn đều phải do con người xác minh trước khi xuất bản.

Tài liệu tham khảo

  1. Walters, W. H., & Wilder, E. I. (2023). Fabrication and errors in the bibliographic citations generated by ChatGPT. Scientific Reports, 13, 14045.
  2. Naser, M. Z. (2026). How LLMs Cite and Why It Matters: A Cross-Model Audit of Reference Fabrication in AI-Assisted Academic Writing and Methods to Detect Phantom Citations. arXiv:2603.03299.
  3. Mata v. Avianca, Inc., 678 F. Supp. 3d 443 (S.D.N.Y. 2023).

--- Bài viết này có hữu ích không? ---

Nhấn sao để đánh giá!

Đánh giá trung bình 0 / 5. Số đánh giá: 0

Chưa có đánh giá.

Có thể bạn quan tâm