Quy trình nghiên cứu, Phần 6: Bias không phải vấn đề kỹ thuật, mà là vấn đề tư duy

Bias trong nghiên cứu thường được giới thiệu như một phiền toái kỹ thuật. Thứ cần được "hiệu chỉnh," "kiểm soát," hoặc thừa nhận ngắn gọn trong phần hạn chế. Trên thực tế, bias xâm nhập sớm hơn nhiều, rất lâu trước khi bất kỳ mô hình thống kê nào được chọn.

Bias bắt đầu ngay khi chúng ta quyết định:

ai được tính là đối tượng nghiên cứu
nguồn dữ liệu nào được chấp nhận
gì được ghi chép nhất quán, và gì thì không
giải thích nào cảm thấy đủ hợp lý để xem xét

Khi phân tích bắt đầu, hầu hết thiệt hại, nếu có, đã xảy ra rồi.

Tại sao bias sống sót qua ý tốt

Hầu hết nhà nghiên cứu không bất cẩn. Họ tuân thủ protocol, áp dụng tiêu chí chọn mẫu, và trích dẫn định nghĩa chuẩn về bias. Nhưng nghiên cứu bị bias vẫn tồn tại. Lý do là bias không chủ yếu là thất bại kỹ thuật. Nó là thất bại tưởng tượng.

Bias phát triển khi nhà nghiên cứu không tưởng tượng được thực tế khác biệt thế nào so với cấu trúc sạch sẽ mà nghiên cứu giả định. Bệnh nhân không đến ngẫu nhiên. Hồ sơ không thiếu ngẫu nhiên. Đo lường không được thực hiện trong điều kiện đồng nhất.

Chúng ta biết điều này về lý thuyết. Nhưng biết nó một cách trừu tượng rất khác với xây dựng nó vào quy trình.

Một bias mình không thấy: mô hình chuyển tuyến

Trong nghiên cứu hình ảnh ARM, ban đầu mình giả định rằng bệnh nhân đến trung tâm tuyến cuối của mình đại diện cho phổ đầy đủ của dị tật hậu môn trực tràng.

Không phải vậy.

Bệnh viện tuyến dưới xử lý ca đơn giản tại chỗ và chuyển ca phức tạp, dị tật cao, giải phẫu không rõ, lên tuyến trên. Trước khi mình tuyển một bệnh nhân nào, bộ dữ liệu đã giàu ca khó rồi.

Hệ quả:

Yếu tố dự đoán trên hình ảnh gần như chỉ được test trên giải phẫu phức tạp
Độ nhạy có vẻ cao giả tạo
Khả năng tổng quát hóa bị giới hạn ở cơ sở tuyến cuối

Mình chỉ nhận ra điều này khi một reviewer hỏi: "Tại sao 80% ca của bạn là dị tật cao trong khi nghiên cứu dân số cho thấy phân bố gần 50-50?"

Bias không nằm trong phép đo hay phân tích. Nó nằm trong cấu trúc luồng bệnh nhân, rất lâu trước khi thu thập dữ liệu bắt đầu.

Bias xâm nhập qua cấu trúc, không phải qua sai lầm

Bias thường được liên kết với sai sót, nhập liệu cẩu thả, đo lường bất cẩn, phân tích lỗi.

Thường hơn, nó mang tính cấu trúc. Nó đến từ:

hệ thống chuyển tuyến định hình ai xuất hiện trong bộ dữ liệu
quy trình lâm sàng quyết định dữ liệu nào được thu thập
thông lệ bệnh viện ảnh hưởng ghi chép

Những lực lượng này hoạt động ngay cả khi mọi người liên quan đều có năng lực và thiện chí.

Đây là lý do bias không thể được "sửa" hoàn toàn ở hạ nguồn. Nó phải được lường trước ở thượng nguồn.

Bias ghi chép: khi dữ liệu thiếu có ý nghĩa

Một bias khác mình đánh giá thấp là ghi chép.

Biến chứng được ghi chép tỉ mỉ, nhiều ghi chú, xét nghiệm, lượt tái khám. Phục hồi bình thường, ngược lại, được tóm tắt trong một dòng: "Phục hồi thuận lợi. Xuất viện ngày hậu phẫu thứ 3."

Khi mình phân tích kết quả:

Biến chứng được mô tả phong phú
Phục hồi suôn sẻ được ghi chép sơ sài

Dữ liệu thiếu không ngẫu nhiên. Nó mang thông tin.

Điều này khiến các mối liên quan liên quan đến biến chứng dễ phát hiện hơn, trong khi kết cục không biến chứng có vẻ đơn giản và đồng nhất một cách lừa dối.

Lại nữa, không ai mắc sai lầm. Bias xuất hiện từ thứ bác sĩ lâm sàng tự nhiên chú ý đến, và ghi chép lại.

Thấy bias sớm thay đổi những gì bạn có thể claim

Nhà nghiên cứu suy nghĩ nghiêm túc về bias từ sớm có xu hướng đưa ra quyết định thiết kế khác. Họ hỏi:

Ai không bao giờ xuất hiện trong bộ dữ liệu này?
Ai bị đại diện quá mức, và tại sao?
Thông tin nào có nhiều khả năng bị thiếu, và từ ai?

Những câu hỏi này không loại bỏ bias. Nhưng chúng làm rõ claim nào vẫn bảo vệ được.

Với nghiên cứu của mình, điều này nghĩa là chấp nhận kết luận hẹp hơn: Không phải: "Siêu âm dự đoán chính xác độ phức tạp phẫu thuật trong tất cả ca ARM." Mà: "Siêu âm tương quan với phương pháp phẫu thuật ở quần thể chuyển tuyến tuyến cuối với dị tật trung bình đến phức tạp."

Claim thứ hai ít tham vọng hơn, nhưng trung thực.

Biết khi nào không nên hiệu chỉnh

Khi bias được nhận ra, thường có áp lực sửa nó bằng thống kê. Hiệu chỉnh có thể giúp ích. Phân tích độ nhạy có thể giúp ích. Nhưng chúng không thể biến bộ dữ liệu có giới hạn cơ bản thành thứ nó không phải.

Có lúc mình cân nhắc nhiều hiệu chỉnh thống kê cho bias chuyển tuyến. Thầy hướng dẫn chặn lại: "Em đang cố dùng thống kê để tạo ra bộ dữ liệu em ước mình có." Thầy đúng.

Thay vì hiệu chỉnh quá mức, mình tập trung vào:

Mô tả rõ ràng quy trình chọn mẫu
Giới hạn claim cho quần thể thực sự được nghiên cứu
Thảo luận hàm ý cho khả năng tổng quát hóa
Đề xuất thiết kế tốt hơn cho nghiên cứu tương lai

Reviewer phản hồi tích cực, không phải vì bias biến mất, mà vì nó được thừa nhận mà không quá tay.

Dùng AI để bộc lộ giả định ẩn

Đôi khi mình dùng AI không phải để phân tích dữ liệu, mà để thách thức giả định về nó. Một prompt đơn giản:

Nghiên cứu của tôi xem xét [chủ đề] sử dụng [nguồn dữ liệu].
Bệnh nhân được tuyển từ [cơ sở].

Những bias hệ thống nào có thể ảnh hưởng đến ai xuất hiện trong bộ dữ liệu?
Tôi có thể đang bỏ sót ai?
Mô hình ghi chép nào có thể làm méo mó các mối liên quan?

AI không thay thế kiến thức chuyên môn hay phán đoán. Nó giúp bộc lộ điểm mù mà bạn có thể không thấy khi quá gần công việc.

Cách đơn giản để lường trước bias

Trước khi thu thập dữ liệu, giờ mình vẽ hành trình bệnh nhân:

Bệnh nhân vào hệ thống bằng cách nào?
Điều gì quyết định dữ liệu nào được thu thập?
Điều gì ảnh hưởng chất lượng và tính đầy đủ của dữ liệu?
Ai bị mất dấu theo dõi, và tại sao?

Rồi mình hỏi: Với những ràng buộc này, mình vẫn có thể claim gì một cách trung thực?

Tiếp theo là gì

Ngay cả khi thiết kế, đo lường, và bias được xử lý cẩn thận, một giai đoạn cuối cùng vẫn còn. Diễn giải.

Đây là nơi công việc cẩn thận có thể bị hủy hoại bởi vài câu, nơi kết quả đúng về mặt kỹ thuật biến thành kết luận gây hiểu lầm.

Đó là nơi chúng ta chuyển sang tiếp theo.

Nếu bạn đang soạn bản thảo, bạn có thể thấy Checklist: Idea to Submission của mình hữu ích.