Lập chỉ mục Tạp chí: Các tiêu chuẩn cốt lõi và tầm quan trọng của chúng

Lập chỉ mục trực tuyến của các tạp chí đóng vai trò thiết yếu trong việc tìm kiếm và truy cập chúng. Việc được đưa vào các chỉ mục nhất định cũng liên quan chặt chẽ đến đánh giá chất lượng. Các nhà tài trợ nghiên cứu thường yêu cầu bên nhận quỹ của họ xuất bản trên các tạp chế được liệt kê trong các chỉ mục cụ thể. Trong bài viết này, Danielle Padula giải thích tầm quan trọng của việc lập chỉ mục tạp chí chất lượng cao và cách các tạp chí áp dụng các tiêu chuẩn cốt lõi có thể gia tăng phạm vi tiếp cận và tác động của các ấn phẩm của họ.

Một bài nghiên cứu được xuất bản nhưng không nằm trong bất kỳ cơ sở dữ liệu học thuật nào liệu có thể tạo ra tác động gì không? Không giống như câu hỏi hóc búa: “Nếu một cái cây đổ trong rừng và không ai ở đó để nghe, liệu nó có tạo ra âm thanh không?” – thì câu hỏi về bài nghiên cứu có một câu trả lời khá chắc chắn. Bỏ qua những tác động vô hình, thì gần như chắc chắn rằng nếu không được đưa vào các chỉ mục học thuật, tác động của bài nghiên cứu sẽ bị giảm đi đáng kể.

Việc lập chỉ mục đóng vai trò then chốt trong việc tạo nên uy tín, phạm vi tiếp cận và sức ảnh hưởng của các bài báo khoa học. Theo các báo cáo gần đây, các chỉ mục học thuật như Google Scholar, PubMed, MathSciNet và  Directory of Open Access Journals đóng vai trò là điểm khởi đầu cho hoạt động nghiên cứu của phần lớn các học giả. Bên cạnh đó, nhiều học giả ưu tiên trích dẫn và xuất bản bài báo trên các tạp chí được lập chỉ mục uy tín, bởi vì việc được lập chỉ mục là thước đo chất lượng của tạp chí.

Mọi nhà xuất bản đều nên ưu tiên lập chỉ mục cho các ấn phẩm của mình. Điều này giúp gia tăng phạm vi tiếp cận của các bài báo và phục vụ tốt hơn cho nhu cầu của các nhà nghiên cứu. Để đạt được tác động chỉ mục rộng rãi nhất, các nhà xuất bản tạp chí cần đáp ứng cả các tiêu chuẩn xuất bản cơ bản và các tiêu chuẩn kỹ thuật lập chỉ mục cao nhất.

Tiêu chuẩn lập chỉ mục cơ bản

Tất cả các chỉ mục học thuật đều yêu cầu các tạp chí tuân theo một số tiêu chuẩn xuất bản cốt lõi. Để đáp ứng các yêu cầu lập chỉ mục cơ bản, các tạp chí cần có:

  • Mã số báo chí chuẩn quốc tế (ISSN)
  • Mã định danh đối tượng kỹ thuật số (DOI)
  • Lịch xuất bản đã thiết lập
  • Chính sách bản quyền rõ ràng
  • Siêu dữ liệu cơ bản ở cấp độ bài báo

Ngoài ra, các chỉ mục sẽ có các yêu cầu đưa vào danh sách khác nhau như:

  • Lĩnh vực xuất bản: Nhiều chỉ mục chỉ chấp nhận các tạp chí xuất bản trong các lĩnh vực chuyên môn cụ thể. Ví dụ, MEDLINE và PubMed Central chỉ lập chỉ mục cho các tạp chí về y sinh học và khoa học đời sống.
  • Ban biên tập và chính sách: Thông thường, các chỉ mục yêu cầu họ và tên đầy đủ cùng đơn vị công tác của ban biên tập tạp chí, cũng như thông tin về chính sách biên tập, chẳng hạn như chính sách bình duyệt đồng cấp được công khai và tuyên bố đạo đức xuất bản.
  • Mức độ chuyên nghiệp hóa xuất bản: Một số chỉ mục đánh giá mức độ chuyên nghiệp hóa xuất bản, bao gồm tính dễ đọc của bài báo và chất lượng sản xuất.
  • Chính sách lưu trữ: Một số chỉ mục yêu cầu các tạp chí chứng minh rằng các bài báo của họ đang được lưu trữ bởi một dịch vụ lưu trữ kỹ thuật số dài hạn.
Ảnh: Drawers via Behance | CC BY-NC 4.0

Bạn có thể tìm thấy phân tích chi tiết về các tiêu chuẩn xuất bản cho các chỉ mục học thuật trong sách điện tử của Scholastica The Small Publisher’s Guide to Digitally Driven OA Journal Development. Các tiêu chuẩn xuất bản đảm bảo tính đồng nhất và uy tín của các chỉ mục. Do đó, các chỉ mục có tiêu chuẩn cao hơn thường được các học giả tin tưởng hơn, giúp nâng cao uy tín và phạm vi tiếp cận của các tạp chí được đưa vào danh sách.

Ví dụ về một số chỉ mục tổng hợp hàng đầu:

  • Academic Search (EBSCO):
  • Directory of Open Access Journals (DOAJ)
  • JSTOR
  • SciELO
  • Web of Science

Đạt tiềm năng lập chỉ mục tối đa: Tại sao các tiêu chuẩn kỹ thuật là then chốt

Khi các tạp chí đáp ứng được các tiêu chuẩn xuất bản cốt lõi, chẳng hạn như những tiêu chuẩn đã nêu ở trên, chúng sẽ đủ điều kiện để được đưa vào các chỉ mục phù hợp. Tuy nhiên, để tận dụng tối đa lợi ích của việc lập chỉ mục, các tạp chí cũng phải đáp ứng các tiêu chuẩn kỹ thuật cao nhất.

Hai mô hình chính về cách các chỉ mục thu thập và xử lý thông tin:

  • Công cụ thu thập thông tin web (Web crawlers):

Một số chỉ mục, chẳng hạn như Google Scholar, lập chỉ mục các bài báo trên tạp chí theo cách riêng của họ thông qua các công cụ thu thập thông tin web (web crawlers). Đây là các chương trình internet tự động “thu thập” thông tin từ các trang web. Để công cụ thu thập dễ dàng xác định nội dung mới, các nhà xuất bản phải áp dụng siêu dữ liệu cho các bài báo và duy trì cấu trúc trang web tuân theo các yêu cầu của chỉ mục.

  • Nộp siêu dữ liệu/nội dung:

Nhiều chỉ mục không sử dụng công cụ thu thập thông tin web mà thay vào đó yêu cầu thông tin được gửi cho họ ở các định dạng có thể đọc được bằng máy. Trong trường hợp này, các tệp siêu dữ liệu có thể đọc được bằng máy (thường là XML) phải được gửi vào chỉ mục để chỉ mục có thể xử lý thông tin bài báo và biết nội dung trả về trong kết quả tìm kiếm.

Mặc dù công cụ thu thập thông tin web của các chỉ mục tự động thực hiện hầu hết công việc, các nhà xuất bản vẫn cần thực hiện một số bước để đảm bảo các bài báo có thể được thu thập. Ví dụ, đối với một công cụ tìm kiếm học thuật như Google Scholar, các bước kỹ thuật bao gồm:

  •  Kiểm tra các tệp HTML và PDF để đảm bảo văn bản có thể tìm kiếm được
  •  Thiết lập cấu hình trang web của tạp chí để xuất dữ liệu thư mục học thuật trong các thẻ meta HTML
  • Đảm bảo trang web của tạp chí có thể được thu thập bởi các robot

Điều quan trọng cần lưu ý là hầu hết các chỉ mục học thuật không sử dụng công cụ thu thập thông tin web (web crawlers). Thay vào đó, họ yêu cầu các tạp chí nộp siêu dữ liệu, được định dạng theo cấu trúc cụ thể cho phép máy tính dễ dàng hiểu và xử lý. Mặc dù một số chỉ mục cung cấp biểu mẫu để nhập thủ công siêu dữ liệu, việc gửi trực tiếp các tệp siêu dữ liệu có thể đọc được bằng máy vào các chỉ mục được coi là tiêu chuẩn kỹ thuật cao nhất và mang lại kết quả tốt nhất. Bằng cách gửi trực tiếp các tệp này, các nhà xuất bản có thể đảm bảo tính chính xác và nhất quán của thông tin bài báo được lập chỉ mục. Ngoài ra, phương pháp này còn tiết kiệm thời gian và công sức so với việc nhập thủ công từng bài báo.

Các tệp siêu dữ liệu có thể đọc được bằng máy sẽ phong phú hơn, đồng nhất hơn và ít có sai sót hơn so với siêu dữ liệu được nhập thủ công. Chúng cũng có tiềm năng khai thác dữ liệu (hoặc tiềm năng khai thác văn bản và dữ liệu nếu chúng là các tệp toàn văn bản). Các bài viết cho phép khai thác văn bản và dữ liệu có thể được xử lý bằng các tập lệnh trực tuyến và công cụ học máy để phân tích thông tin bài viết cho các mục đích như phân tích ngôn ngữ hoặc trích dẫn. Ví dụ: Scite, một nhà cung cấp phần mềm mới, đang sử dụng máy học để quét các trích dẫn bài viết nhằm kiểm tra xem các bài viết có được hỗ trợ hay mâu thuẫn hay không.

Các tệp siêu dữ liệu có thể đọc được bằng máy sẽ phong phú hơn, đồng nhất hơn và ít có sai sót hơn so với siêu dữ liệu được nhập thủ công. Chúng cũng có tiềm năng khai thác dữ liệu (hoặc tiềm năng khai thác văn bản và dữ liệu nếu chúng là các tệp toàn văn bản). Các bài viết cho phép khai thác văn bản và dữ liệu có thể được xử lý bằng các tập lệnh trực tuyến và công cụ học máy để phân tích thông tin bài viết cho các mục đích như phân tích ngôn ngữ hoặc trích dẫn. Ví dụ: Scite, một nhà cung cấp phần mềm mới, đang sử dụng máy học để quét các trích dẫn bài viết nhằm kiểm tra xem các bài viết có được hỗ trợ hay mâu thuẫn hay không.

Tệp siêu dữ liệu có thể đọc được bằng máy phong phú hơn, thống nhất hơn và ít lỗi hơn so với siêu dữ liệu nhập thủ công. Chúng cũng có tiềm năng khai thác dữ liệu (hoặc khai thác dữ liệu văn bản và dữ liệu nếu là tệp toàn văn). Các bài báo cho phép khai thác dữ liệu văn bản và dữ liệu có thể được xử lý bởi các chương trình trực tuyến và công cụ học máy để phân tích thông tin bài báo cho các mục đích như phân tích ngôn ngữ hoặc phân tích trích dẫn. Ví dụ, Scite, một nhà cung cấp phần mềm mới, đang sử dụng học máy (machine learning) để quét các trích dẫn bài báo nhằm kiểm tra xem các bài báo có được hỗ trợ hay bác bỏ lẫn nhau không.

Tiêu chuẩn lập chỉ mục kỹ thuật cho các tạp chí học thuật là XML (extensible markup language – ngôn ngữ đánh dấu mở rộng), theo định dạng JATS (Journal Article Tag Suite – Bộ thẻ bài báo). Trong khi XML là một ngôn ngữ, JATS là một loại cú pháp. Đây là cách định dạng cụ thể các tệp XML do Tổ chức Tiêu chuẩn Thông tin Quốc gia (NISO) phát triển. JATS được nhiều chỉ mục học thuật ưa thích hoặc yêu cầu, bao gồm tất cả các chỉ mục và công cụ tìm kiếm của Thư viện Y học Quốc gia (ví dụ: PubMed, PubMed Central và MEDLINE). Ngoài ra, cOAlition S cũng khuyến nghị mạnh mẽ định dạng bài báo theo JATS XML trong hướng dẫn thực hiện Kế hoạch S cập nhật của họ.

Mặc dù việc tạo ra các tệp XML theo định dạng JATS có tính kỹ thuật cao, các phần mềm có thể tự động hóa phần lớn quá trình này. Phần mềm cũng có thể được sử dụng để tạo các tệp XML toàn văn, giúp tránh các bước thủ công như tự thêm và kiểm tra dữ liệu bản quyền hoặc siêu dữ liệu trích dẫn, tiết kiệm thời gian và chi phí.

Các tạp chí ít nhất nên tạo các tệp XML phần mở đầu (front-matter) cho tất cả bài báo, chứa các siêu dữ liệu cơ bản như tiêu đề bài báo, nhà xuất bản và DOI. Tuy nhiên, như đã lưu ý, các tệp XML JATS toàn văn tốt hơn cho việc khai thác dữ liệu văn bản và dữ liệu. Chúng cũng là yêu cầu của một số chỉ mục như PubMed Central. Tệp XML JATS toàn văn bao gồm tất cả siêu dữ liệu đã đề cập cùng với toàn bộ nội dung bài báo.

Gieo gì gặt nấy

Việc đưa các bài báo khoa học vào các chỉ mục liên quan có thể cải thiện đáng kể uy tín và phạm vi tiếp cận của chúng, mang lại tiềm năng tác động lớn hơn cho các tạp chí và các học giả xuất bản trên các tạp chí đó. Được đưa vào các chỉ mục hàng đầu là một dấu hiệu về chất lượng tạp chí đối với các học giả và tổ chức của họ, đồng thời các chỉ mục cũng là một trong những kênh chính mà các học giả sử dụng để tìm kiếm bài báo, đóng vai trò như những công cụ tìm kiếm mạnh mẽ. Tuy nhiên, những lợi ích tiềm năng của các chỉ mục phụ thuộc vào chất lượng của siêu dữ liệu có thể đọc được bằng máy và các tệp bài báo mà các tạp chí đưa vào đó. Để các nhà xuất bản và tác giả tạp chí có được tác động lớn nhất từ việc lập chỉ mục, điều then chốt là các tạp chí phải thực hiện các bước để đáp ứng cả tiêu chuẩn xuất bản và tiêu chuẩn kỹ thuật cao nhất.

--- Bài viết này có hữu ích không? ---

Nhấn sao để đánh giá!

Đánh giá trung bình 5 / 5. Số đánh giá: 1

Chưa có đánh giá.

Có thể bạn quan tâm

Tin Hot

Tin đang nổi

Theo dõi

Tin ảnh