
Phong trào khoa học mở (open science) hướng đến việc làm cho nghiên cứu trở nên minh bạch và dễ tiếp cận hơn. Một trong những yêu cầu quan trọng là các nhà nghiên cứu phải chia sẻ dữ liệu đã được ẩn danh với cộng đồng học thuật để kiểm tra, phân tích lại hoặc tái sử dụng. Trong lĩnh vực tâm lý học, các thực hành khoa học mở thường tập trung vào dữ liệu định lượng, nhưng nhu cầu chia sẻ dữ liệu định tính ngày càng gia tăng.
Tuy nhiên, việc ẩn danh dữ liệu kể chuyện (narrative data) gặp nhiều thách thức hơn so với dữ liệu định lượng, đặc biệt khi nghiên cứu liên quan đến các nhóm yếu thế, thiểu số hoặc người từng trải qua chấn thương. Nếu thông tin nhạy cảm bị tái nhận dạng, người tham gia có thể đối mặt với rủi ro nghiêm trọng. Hiện nay, vẫn còn thiếu hướng dẫn cụ thể về cách ẩn danh dữ liệu định tính.
Để giải quyết khoảng trống này, Campbell và cộng sự đã phát triển một khung phương pháp luận gồm ba giai đoạn để xử lý dữ liệu kể chuyện nhạy cảm:
- Giai đoạn 1: Tham vấn các bên liên quan để hiểu rõ nguy cơ tái nhận dạng và mối quan tâm về chia sẻ dữ liệu.
- Giai đoạn 2: Xây dựng quy trình lặp để nhận diện thông tin có thể định danh và áp dụng các chiến lược xử lý phù hợp thông qua thảo luận nhóm.
- Giai đoạn 3: Đánh giá tính hợp lệ của quá trình ẩn danh, đảm bảo dữ liệu sau xử lý bảo vệ được quyền riêng tư của người tham gia.
Nghiên cứu áp dụng khung này trên 32 cuộc phỏng vấn với những người sống sót sau tấn công tình dục, sử dụng kỹ thuật làm mờ (blurring) và xóa bỏ (redaction) để bảo vệ thông tin như tên, ngày tháng, địa điểm, tiền sử chấn thương, trải nghiệm tìm kiếm hỗ trợ và tương tác giữa các cá nhân.
Bối cảnh và Mục tiêu
Phong trào khoa học mở khuyến khích tính minh bạch trong nghiên cứu, bao gồm việc chia sẻ dữ liệu để:
- Kiểm chứng tính tái lập (reproducibility): Đảm bảo kết quả nghiên cứu có thể được lặp lại từ cùng dữ liệu.
- Đánh giá tính nhân rộng (replicability): Xác định liệu kết quả có thể tái hiện với dữ liệu mới.
- Tái sử dụng dữ liệu: Khuyến khích khám phá các câu hỏi nghiên cứu mới.
Tuy nhiên, phần lớn thảo luận về chia sẻ dữ liệu tập trung vào dữ liệu định lượng. Nghiên cứu định tính, với bản chất quan hệ và chủ quan, đặt ra những thách thức riêng về mặt đạo đức và phương pháp luận.
Thách thức trong Nghiên cứu Định tính
- Khác biệt nhận thức luận: Nghiên cứu định tính không đặt nặng tính khách quan mà tập trung vào trải nghiệm cá nhân, khiến việc chia sẻ dữ liệu đòi hỏi cân nhắc kỹ lưỡng.
- Rủi ro đạo đức: Người tham gia có thể không muốn thông tin nhạy cảm được chia sẻ rộng rãi, đặc biệt khi nghiên cứu liên quan đến chấn thương hoặc bạo lực.
- Khó khăn phương pháp: Dữ liệu định tính chứa nhiều thông tin có thể định danh trực tiếp (tên, địa chỉ) hoặc gián tiếp (chi tiết độc đáo về cuộc sống cá nhân).
Khung Phương pháp Ẩn danh Dữ liệu
Giai đoạn 1: Nhận diện Thông tin Nhạy cảm
- Tham vấn các nguồn như quy định HIPAA, hướng dẫn IRB, và tài liệu khoa học mở.
- Xem xét hồ sơ công khai (ví dụ: bản án tòa án) để đối chiếu thông tin.
- Đặt ba câu hỏi then chốt:
- Ai khác biết thông tin này?
- Họ biết bằng cách nào?
- Thông tin này có trong hồ sơ nào khác?
Giai đoạn 2: Xử lý Dữ liệu
- Làm mờ (Blurring): Thay thế chi tiết cụ thể bằng thông tin tổng quát hơn, ví dụ:
- Tuổi “22” → “[18–25 tuổi]”.
- “Bệnh tiểu đường” → “[Tình trạng sức khỏe thể chất]”.
- Xóa bỏ (Redaction): Loại bỏ hoàn toàn thông tin không thể làm mờ, đánh dấu bằng dấu ngoặc vuông, ví dụ: “[Chi tiết bạo lực đã xóa]”.
Giai đoạn 3: Đánh giá Tính Hợp lệ
- Độ tin cậy (Credibility): Kiểm tra với các chuyên gia và tổ chức hỗ trợ nạn nhân.
- Tính nhất quán (Dependability): Ghi chép quy trình xử lý để đảm bảo minh bạch.
- Khả năng áp dụng (Transferability): Cung cấp hướng dẫn chi tiết để các nghiên cứu khác có thể áp dụng.
Ví dụ Minh họa
- Tên: Thay thế tên bằng mối quan hệ, ví dụ: “[Thành viên gia đình]”.
- Ngày tháng: Chuyển đổi thành khoảng thời gian, ví dụ: “năm 2008” → “[2000–2010]”.
- Địa điểm: Xóa tên thành phố hoặc địa chỉ cụ thể để tránh tái nhận dạng.
- Chi tiết vụ tấn công: Tóm tắt thông tin chính thay vì để nguyên bản, ví dụ: “[Bị tấn công bởi nhiều người, một người là bạn]”.
Kết luận
Nghiên cứu này cung cấp một khung phương pháp chi tiết để ẩn danh dữ liệu định tính nhạy cảm, cân bằng giữa tính minh bạch và bảo vệ quyền riêng tư. Các nhà nghiên cứu cần linh hoạt áp dụng tùy theo ngữ cảnh, đồng thời chú trọng hỗ trợ tâm lý cho nhóm nghiên cứu khi làm việc với nội dung chấn thương.
Bài báo đã được cấp phép Creative Commons (CC BY-NC 4.0), cho phép sử dụng phi thương mại với điều kiện ghi công tác giả.
Chi tiết nghiên cứu: Campbell, R., Javorka, M., Engleton, J., Fishwick, K., Gregory, K., & Goodman-Williams, R. (2023). Open-Science Guidance for Qualitative Research: An Empirically Validated Approach for De-Identifying Sensitive Narrative Data. Advances in Methods and Practices in Psychological Science, 6(4). https://doi.org/10.1177/25152459231205832
--- Bài viết này có hữu ích không? ---
Nhấn sao để đánh giá!
Đánh giá trung bình 0 / 5. Số đánh giá: 0
Chưa có đánh giá.