Google Scholar vẫn chưa “hỏng”, nhưng có một số giải pháp thay thế

Với nhiều người, Google Scholar đã trở thành một phần quan trọng phục vụ nghiên cứu của họ. Tuy nhiên, những tiết lộ về khả năng thao túng chỉ số và đưa vào các bài báo do AI tạo ra đã khiến một số người hoài nghi về độ tin cậy của công cụ này. Thay vì bị coi là “hỏng”, những vấn đề này phản ánh hạn chế chung của bất kỳ công cụ tìm kiếm học thuật nào; tuy nhiên, vẫn có những giải pháp thay thế Google Scholar.

Ảnh: Selected Projects via Behance | CC BY-NC-ND 4.0

Đối với câu hỏi liệu Google Scholar có bị “hỏng” không, câu trả lời hiển nhiên là “Còn tùy”: tùy vào mục đích sử dụng, cách sử dụng và các giải pháp thay thế khả dụng.

Google Scholar có nhiều ưu điểm hơn các cơ sở dữ liệu học thuật truyền thống như Scopus và Web of Science: miễn phí sử dụng, không yêu cầu đăng nhập để tìm kiếm và có phạm vi bao phủ toàn diện hơn – bao gồm cả các nguồn không phải tạp chí như sách và luận án. Những điểm này đặc biệt quan trọng đối với các học giả không được hỗ trợ bởi tổ chức (unaffiliated), khi họ không có quyền truy cập vào các nguồn tài nguyên của một tổ chức nhất định, và với những học giả trong lĩnh vực nhân văn.

Google Scholar được sử dụng cho nhiều loại tìm kiếm thông tin học thuật khác nhau: tìm toàn văn của một bài viết, khám phá về một chủ đề rộng, tìm kiếm các tài liệu đã trích dẫn hay số liệu trích dẫn để chứng minh tác động nghiên cứu nào đó, và tìm kiếm thông tin cho tổng quan hệ thống. Mỗi mục đích đều có các tiêu chí khác nhau để xác định tính phù hợp và hiệu quả.

Tuy nhiên, Google Scholar cũng có nhiều nhược điểm. Trong khi hầu hết các cơ sở dữ liệu học thuật khác đều có tiêu chí lập chỉ mục, thường ở cấp độ tạp chí, Google Scholar lại dựa vào việc thu thập dữ liệu web. Các xuất bản phẩm bị loại bỏ ở các cơ sở dữ liệu khác do kém chất lượng hoặc lo ngại về tính liêm chính vẫn có khả năng được đưa vào Google Scholar. Ngay cả khi có bằng chứng rõ ràng về việc thao túng trích dẫn, các bài báo vẫn không bị xóa, như trường hợp của Larry the Cat và H-Index ấn tượng của ông. Khi các sản phẩm do AI tạo ra ngày càng gia tăng, Google Scholar càng dễ bị ngập trong các nghiên cứu giả mạo.

Một điểm khác biệt quan trọng so với hầu hết các cơ sở dữ liệu học thuật là Google Scholar, giống như Google, xếp hạng kết quả với thuật toán không đủ minh bạch. Việc xếp hạng có thể dựa trên sự kết hợp của số lượng trích dẫn, số lần các từ được tìm kiếm xuất hiện trong tiêu đề và toàn văn, cũng như được xếp theo ngày tháng, với các nghiên cứu gần nhất xuất hiện ở vị trí cao hơn. Nhiều người dùng Google Scholar chỉ xem một vài trang đầu tiên của kết quả, vì hiệu suất tìm kiếm thường giảm dần khi sang những trang sau. Điều này có thể làm trầm trọng thêm hiệu ứng Matthew, khi các công trình được trích dẫn nhiều có khả năng càng tích lũy được nhiều trích dẫn trong tương lai hơn, cũng như tồn tại sự thiên vị đối với các xuất bản phẩm tiếng Anh.

Thuật toán xếp hạng có thể cho ra kết quả không mong muốn, chẳng hạn như một công trình có vai trò nền tảng trong lĩnh vực nào đó biến mất khỏi trang đầu tiên, hay một luận văn xuất hiện ở vị trí cao bất ngờ. Các tìm kiếm trên Google Scholar không được tái tạo một cách nhất quán – khiến nhiều người suy giảm lòng tin vào kết quả tìm kiếm và nghĩ rằng Google Scholar đã “hỏng”. Tuy nhiên, không có phiên bản hoàn hảo nào của thuật toán có thể đưa ra kết quả “tốt nhất” cho mọi tìm kiếm, vì định nghĩa “tốt nhất” thay đổi tùy theo mục đích và lĩnh vực. Ví dụ, việc tìm ra các công bố mới nhất trong y học quan trọng hơn rất nhiều so với trong lĩnh vực nhân văn.

Một cách giảm thiểu vấn đề của Google Search là sử dụng phần mềm Publish or Perish thay vì tìm kiếm trực tiếp. Phần mềm này cho phép lưu chính xác các thuật ngữ tìm kiếm, giúp việc tìm kiếm vào những ngày sau đó có thể lặp lại tương tự lần đầu. Phần mềm cũng có các tùy chọn để sắp xếp thay cho thứ hạng mặc định của Google, bao gồm số lượng trích dẫn và ngày.

Bên cạnh đó, một số người phản đối sự thiếu minh bạch trong dữ liệu được Google Scholar sử dụng và trình bày. Trong bối cảnh ngày càng nhiều trường đại học và nhà tài trợ càng ủng hộ khoa học mở, tính minh bạch trở thành một yêu cầu quan trọng. Tuyên bố Barcelona (Barcelona Declaration) gần đây đã áp dụng các nguyên tắc công khai thông tin về nghiên cứu, những người tham gia cam kết làm việc với các dịch vụ, hệ thống hỗ trợ và tạo điều kiện cho thông tin về nghiên cứu mở. Google Scholar không được đánh giá là đã đáp ứng được tiêu chí này, bởi các quy trình lựa chọn và xếp hạng các kết quả nghiên cứu vẫn chưa rõ ràng. Các hệ thống “khoa học đóng” độc quyền do các công ty kiếm lợi nhuận lớn điều hành, như Elsevier hay Clarivate, rõ ràng cũng không đáp ứng được tiêu chí này.

Một điểm khác trong Tuyên bố Barcelona là “tính bền vững của cơ sở hạ tầng” – mối quan ngại chính về Google Scholar. Chúng ra không rõ mô hình tài trợ dài hạn cho Google Scholar là gì và liệu nó có được duy trì trong tương lai hay không. Như vậy, sẽ là khôn ngoan hơn nếu chúng ta tìm hiểu về những phương án khác thay cho Google Scholar.

Có nhiều lựa chọn thay thế cho Google Scholar hoạt động trên tinh thần khoa học mở và miễn phí sử dụng. Ba nền tảng nổi bật trong số đó là The Lens, MatildaOpenAlex.

Đối với riêng OpenAlex, một nghiên cứu đã khám phá ra rằng cơ sở dữ liệu này có phạm vi bao phủ tương đương với Web of Science và Scopus. Thậm chí, tìm kiếm hạn chế trên OpenAlex của một nhà nghiên cứu cho thấy lượng xuất bản phẩm được lập chỉ mục trong lĩnh vực khoa học xã hội và nhân văn nhiều hơn đáng kể so với hai cơ sở dữ liệu trên. Mã nguồn của công cụ này hoàn toàn mở, dữ liệu có thể tái sử dụng, hệ thống có tài liệu hướng dẫn đầy đủ và nhóm hỗ trợ của OpenAlex trả lời nhanh chóng với các phản hồi. So với Google Scholar, OpenAlex có lợi thế đáng kể ở độ minh bạch và khả năng tương tác với cộng đồng học thuật. Tuy vậy, OpenAlex vẫn còn tương đối mới và dữ liệu chưa được hoàn hảo, chẳng hạn như quy trình xác định danh tính các tác giả có tên giống nhau còn gặp khó khăn, đặc biệt là khi những nhà nghiên cứu này có xuất bản phẩm trong nhiều lĩnh vực.

Tất cả những điều này có ý nghĩa gì trong tương lai? Đối với các nhà nghiên cứu, việc cần thiết là suy ngẫm về quá trình tìm kiếm hiện tại, cân nhắc liệu Google Scholar có còn là lựa chọn tốt nhất cho mục đích của họ hay không, xét đến những cảnh báo ở trên và lưu ý đến những hạn chế, thiên vị ​​của các hệ thống khác hiện có. Đối với các thủ thư học thuật, các thủ thư được khuyến khích khám phá các hệ thống thông tin liên quan đến nghiên cứu mở, hỗ trợ phát triển khả năng nhận thức thông tin có phê phán (Critical Information Literacy) ở người dùng thư viện, kết hợp vào giảng dạy về các công cụ tìm kiếm, về cách thức tạo ra, chi phí dành cho các hệ thống tìm kiếm, truy cập thông tin, cũng như cách thức này định hình kết quả tìm kiếm thông tin.

Dịch từ LSE

--- Bài viết này có hữu ích không? ---

Nhấn sao để đánh giá!

Đánh giá trung bình 0 / 5. Số đánh giá: 0

Chưa có đánh giá.

Có thể bạn quan tâm