
Điều thú vị nhất về bất kỳ công nghệ nào là cách nó ảnh hưởng đến con người: thay đổi tần suất mà chúng ta cộng tác với nhau, thúc đẩy khám phá và giao tiếp, hoặc làm ta xao nhãng và tồi tệ đi. Điều này đã được thấy vào những năm 1990. Khi internet trở nên phổ biến hơn, các nhà nghiên cứu bắt đầu thử nghiệm các công cụ viết có khả năng cộng tác, cho phép họ làm việc trên một tài liệu duy nhất cùng lúc bất kể vị trí vật lý, như dự án Collaboratories. Các nền tảng này cho phép nhiều tác giả cùng viết, chú thích và thảo luận theo thời gian thực, tổ chức hợp lý quy trình nghiên cứu và thúc đẩy sự hợp tác quốc tế mà chỉ vài năm trước đó là điều không thể tưởng tượng được.
Hầu hết mọi người, dù không phải tất cả, đều đồng ý rằng internet đã mang lại lợi ích cho nghiên cứu và công việc của các nhà nghiên cứu. Nhưng chúng ta có thể chắc chắn về vai trò của các công nghệ mới ngày nay, và gần đây nhất là AI tạo sinh không? Các bên liên quan đến một nghiên cứu – như các nhà nghiên cứu, các hiệp hội và các nhà xuất bản – đều nên cân nhắc đến một tương lai được AI hỗ trợ và vai trò của họ trong đó.
Nhà xuất bản Đại học Oxford (Oxford University Press – OUP) đã thực hiện một khảo sát nhằm tìm hiểu xem liệu điều gì được các nhà nghiên cứu coi là quan trọng khi quyết định sử dụng AI tạo sinh – điều gì khiến họ hứng thú hoặc lo ngại, cách họ sử dụng, hình dung của họ về việc sử dụng các công cụ AI và niềm tin của họ vào vai trò của các nhà xuất bản (cùng với các bên liên quan khác trong tổ chức) trong việc hỗ trợ và bảo vệ nghiên cứu đã được xuất bản. Kết quả chỉ ra hơn ba phần tư nhà nghiên cứu tham gia vào khảo sát sử dụng một số công cụ AI trong nghiên cứu hiện tại, phổ biến nhất là dịch máy và chatbot. AI thường được sử dụng để khám phá các nghiên cứu hiện có, cũng như chỉnh sửa và tóm tắt nghiên cứu của họ. Một nửa các nhà nghiên cứu báo cáo tổ chức mà họ làm việc không có chính sách AI, một phần tư khác không hay biết về những chính sách này. Nhìn chung, mức độ tin tưởng vào các công ty AI rất thấp, đa phần các nhà nghiên cứu không cho rằng các công ty AI sẽ không sử dụng dữ liệu của họ khi chưa được cho phép, hay có khả năng đáp ứng các yêu cầu về quyền riêng tư và bảo mật dữ liệu. Cũng có những lo ngại về tác động của AI đối với sở hữu trí tuệ và nghiên cứu học thuật nói chung, với 25% nhà nghiên cứu tin rằng AI làm giảm nhu cầu tư duy phản biện. Một điều đáng chú ý là nhiều nhà nghiên cứu đang tìm kiếm sự hướng dẫn từ các tổ chức, hiệp hội học thuật và nhà xuất bản về cách sử dụng AI hiệu quả nhất.
Là nhà xuất bản nghiên cứu phi lợi nhuận lớn nhất, OUP bắt đầu xác định các nguyên tắc hoạt động giữa nhà xuất bản và các công ty tạo ra các Mô hình ngôn ngữ lớn (Large language model – LLM). Những cân nhắc quan trọng bao gồm: tôn trọng quyền sở hữu trí tuệ, hiểu được vai trò quan trọng của công nghệ trong việc hỗ trợ giảng dạy và nghiên cứu, đảm bảo thù lao và các hình thức ghi nhận phù hợp cho tác giả, cũng như thiết lập các kênh phản hồi rõ ràng với nhà phát triển để xử lý lỗi hoặc sự cố.
Các nhà xuất bản như OUP có vị thế đặc biệt để bảo vệ nhà nghiên cứu và công trình nghiên cứu của họ trước sự phát triển của LLM. Về phía các nhà cung cấp AI tạo sinh và LLM, họ mong muốn có được dữ liệu học thuật chất lượng, không thiên kiến để huấn luyện mô hình; và những nhà cung cấp có trách nhiệm hiểu rằng việc xin phép sử dụng và trả phí là cách thức bền vững nhất để có thể xây dựng các mô hình vượt qua đối thủ của mình. Các LLM không được và không nên được xây dựng với mục đích thay thế nhà nghiên cứu, tuy nhiên, chúng nên được hưởng lợi từ việc sử dụng các tài liệu học thuật chất lượng bên cạnh kho dữ liệu khổng lồ trên web công cộng. Vì một số nhà xuất bản cũng sẽ sử dụng AI để nâng cao chất lượng sản phẩm, dịch vụ của mình, các LLM cần phải càng trung lập và không thiên kiến càng tốt.
Khi tham gia vào các cuộc thảo luận với nhà cung cấp LLM, một số nguyên tắc quan trọng được OUP dựa vào để định hướng nhằm bảo vệ các tác giả nghiên cứu khỏi nguy cơ đạo văn dưới mọi hình thức. Ví dụ, các mô hình cần đảm bảo không tái sử dụng nguyên văn hoặc trích dẫn nào liên quan đến việc hiển thị nội dung (tức là không hiển thị văn bản gốc); nội dung không bị sử dụng để tạo ra nội dung tương tự, bao gồm cả việc dịch ngược (reverse engineering); và không có dịch vụ hay sản phẩm nào được tạo ra chỉ nhằm mục đích sản xuất công trình học thuật gốc.
Đây là một thách thức khó khăn, đặc biệt là khi rất nhiều nội dung học thuật đã bị người dùng đưa vào các LLM thông qua việc sử dụng các công cụ AI hội thoại. Nhưng các nhà xuất bản như OUP có khả năng đương đầu với điều này nhờ vị thế của mình và tạo ra sự khác biệt khi các công cụ này tiếp tục phát triển. Bằng cách tiếp cận như vậy, các nhà xuất bản có thể đảm bảo để nhà nghiên cứu có thể bắt đầu hoặc tiếp tục khai thác những gì tốt nhất mà AI mang lại nhằm cải thiện chất lượng công trình nghiên cứu của mình.
Dịch từ OUPblog
--- Bài viết này có hữu ích không? ---
Nhấn sao để đánh giá!
Đánh giá trung bình 0 / 5. Số đánh giá: 0
Chưa có đánh giá.