Vụ vi phạm bản quyền lớn nhất trong lịch sử: hàng ngàn đầu sách của Úc bị sử dụng một cách trái phép để huấn luyện các mô hình AI

Hàng ngàn đầu sách từ các tác giả nổi tiếng ở Úc dường như đã bị “đánh cắp” trong một vụ việc mà Richard Flanagan, một tác giả từng nhận giải thưởng Booker, gọi là vụ “đánh cắp bản quyền lớn nhất trong lịch sử”.

Những tác phẩm này đã bị lấy cắp bởi bộ dữ liệu Book3 từ Mỹ và được sử dụng để huấn luyện các AI tạo sinh cho các tập đoàn công nghệ lớn như Meta và Bloomberg.

Flanagan, tác giả của 10 tác phẩm, bao gồm quyển tiểu thuyết đã thắng nhiều giải thưởng quốc tế lớn Đường hẹp lên miền Bắc thẳm, đã bày tỏ cú sốc của mình khi phát hiện về bộ dữ liệu Book3 một vài ngày trước. Ông chia sẻ: “Tôi cảm thấy như linh hồn của mình bị cắt thành từng mảnh và bất lực khi ngăn chặn nó. Đây là một vụ đánh cắp bản quyền lớn nhất trong lịch sử.”

Hiệp hội các Nhà xuất bản Úc (APA – Australian Publishers Association) đã xác nhận rằng có dấu hiệu vi phạm bản quyền cho khoảng 18000 đầu sách nhiều thể loại có mã số định danh của Úc (ISBNs – International Standard Book Numbers). Tuy nhiên, Hiệp hội chưa thể xác định chính xác rằng khoảng bao nhiêu trong sách số đó là phiên bản xuất bản ở Úc của các tác phẩm do các tác giả quốc tế sáng tác.

Người phát ngôn của APA cho biết: “Chúng tôi vẫn đang xử lý [bộ dữ liệu] để làm rõ quy mô ảnh hưởng đến các tác giả Úc. Đây là một vấn đề pháp lý và đạo đức nghiêm trọng đối với ngành công nghiệp xuất bản và cộng đồng tác giả quốc tế.”

Một công cụ tìm kiếm được đăng tải bởi Hiệp hội Tác giả Mỹ (US Authors Guild) đã cho thấy các tác phẩm của Peter Carey, Helen Garner, Kate Grenville, Anna Funder, Christos Tsiolkas, Thomas Keneally, cũng như Flanagan, và hàng loạt các tác giả nổi tiếng từ Úc khác, đã được bao gồm trong một bộ dữ liệu “lậu” chứa 180000 đầu sách.

Trong khoảng thời gian ngắn sau phát hiện trên, Hiệp hội Tác giả Úc (ASA – Australian Society of Authors) công bố một văn bản chính thức, cho rằng họ đã “sửng sốt” khi biết rằng các tác phẩm của các tác giả Úc bị sử dụng để huấn luyện các mô hình AI mà không có sự cho phép.

Chủ tịch ASA cho, Olivia Lanchester, mô tả bộ dữ liệu Book3 như một đạo tặc ở quy mô nền công nghiệp. Bà nhận định: “Việc các tác giả cảm thấy bị xúc phạm là hoàn toàn đúng, khi công nghệ này phụ thuộc vào các đầu sách, tạp chí, luận văn viết bởi các tác giả, nhưng chưa có sự đồng ý hay bồi thường thỏa đáng.”

Bà cũng cho rằng nền công nghiệp xuất bản của Úc, mặc dù không phản đối các công nghệ mới nổi như AI, nhưng lại lo ngại sâu sắc về sự thiếu minh bạch rõ ràng trong quá trình phát triển và kiếm tiền từ AI của các công ty công nghệ toàn cầu.

Bà bổ sung: “Việc nhắm mắt làm ngơ trước các quyền hợp pháp của chủ sở hữu có nguy cơ làm cho các công việc sáng tạo biến mất, vốn hiện tại đã gặp rất nhiều khó khăn. Việc làm giàu của một số công ty hùng mạnh phải trả giá bằng cái giá của hàng nghìn nhà sáng tạo khác. Đây không phải là cách một thị trường công bằng hoạt động.”

Josephine Johnston, giám đốc điều hành của Cơ quan Bản quyền Úc (Australia’s Copyright Agency), đã mô tả sự phát triển của Books3 là “cú hích miễn phí của các tập đoàn công nghệ lớn” gây tổn hại nghiêm trọng đến đời sống văn hóa và sáng tạo của Úc. Được biết, luật bản quyền của Úc bảo vệ người sáng tạo nội dung khỏi việc thu thập dữ liệu hàng loạt.

Trong bối cảnh trên, vụ kiện ở Hoa Kỳ chống lại OpenAI, người sáng tạo ChatGPT về việc sử dụng bộ dữ liệu sách bị cáo buộc vi phạm bản quyền, Books1 và Books2 (có vẻ như không liên kết với Books3) đã bắt đầu.

Dịch từ The Guardian

--- Bài viết này có hữu ích không? ---

Nhấn sao để đánh giá!

Đánh giá trung bình 5 / 5. Số đánh giá: 1

Chưa có đánh giá.

Có thể bạn quan tâm

Tin Hot

Tin đang nổi

Theo dõi

Tin ảnh