Tuyến Trần, MD
AI cho nghiên cứu

Claude vs ChatGPT cho bác sĩ làm nghiên cứu

5 task cụ thể: literature search, draft Discussion, methodology critique, table extraction, response letter. Claude thắng ở reasoning, ChatGPT thắng ở speed.

Claude tốt hơn ChatGPT cho nghiên cứu — câu trả lời ngắn này đúng nhưng quá rộng. Sau một thời gian dùng cả hai cho các paper chẩn đoán hình ảnh trong phẫu thuật nhi, mình thấy mỗi tool thắng ở task khác nhau. Bài này test cùng 5 task trên cả hai tool, với output minh họa.

Caveat: mình dùng Claude Sonnet 4.5 + Claude Max plan, ChatGPT GPT-4o + Plus plan. Free tier kết quả khác.

Task 1: Literature search short-list

Prompt: "Tôi cần short-list 10 paper về diagnostic accuracy của một kỹ thuật chẩn đoán hình ảnh trong khoảng 2020-2026. Yêu cầu: peer-reviewed, sample n≥30, có sensitivity/specificity report."

Claude: trả về 10 paper với title, journal, year, DOI, 1 dòng tóm tắt mỗi paper. Phần lớn verify được trên PubMed (mình check sau). Vài paper hallucinated — author kết hợp năm sai.

ChatGPT: trả về 12 paper, structured table. Tỷ lệ hallucinate cao hơn Claude rõ rệt.

Winner: Claude — nhưng vẫn phải verify mỗi citation against PubMed/DOI. AI suggest reference đều có rủi ro hallucinate.

Task 2: Draft Discussion (đoạn 300 từ)

Prompt: "Đây là kết quả nghiên cứu của mình (paste các số liệu chính). So sánh với 3 paper short-list, viết đoạn Discussion 300 từ."

Claude: Structure: agreement với paper A, disagreement với paper B (explain bằng population difference). Mention limitation single-center. Reasoning chain rõ ràng.

ChatGPT: Liệt kê 3 paper với "consistent with prior studies" generic. Không explain disagreement. Methodology limitation generic.

Winner: Claude — Claude bám claim cụ thể, ChatGPT viết hay nhưng nông.

Task 3: Methodology critique

Prompt: "Reviewer khắt khe sẽ challenge methodology paper này điểm nào? Liệt kê 5 điểm cụ thể."

Claude: 5 điểm chi tiết — selection bias (single-center), index test interpretation có blind hay không, reference standard timing gap, subgroup size chưa đủ power, statistical inflation từ multiple comparison.

ChatGPT: 5 điểm generic — sample size, generalizability, blinding, follow-up duration, conflict of interest. Đa số không dính methodology cụ thể của paper.

Winner: Claude rõ ràng — Claude đọc context paper, ChatGPT trả lời theo template chung.

Task 4: Extract data table từ paper khác

Prompt: Upload một PDF paper, prompt "Extract Table 2 thành CSV format".

Claude: Extract đúng structure, value chính xác so với paper.

ChatGPT: Miss một row, lệch một value.

Winner: Claude — extraction precision quan trọng cho meta-analysis. Khi extract hàng trăm paper × nhiều field, một tỷ lệ error nhỏ cũng thành hàng chục sai số. Không chấp nhận được.

Task 5: Response letter to reviewer

Prompt: "Reviewer nói validation chưa convincing vì single-center. Viết response letter politely mà confident, 200 từ."

Claude: Tone formal-academic, structure: ack concern → counter argument 1 → counter 2 → commitment to multi-center prospective.

ChatGPT: Tone hơi defensive, structure tương tự nhưng dùng cụm cliché kiểu "We respectfully submit".

Tie. Tôi thường merge hai output, lấy structure Claude + 1-2 phrase ChatGPT.

Tổng kết — chọn nào cho task nào

Task Winner Lý do
Literature search Claude Hallucinate ít hơn
Draft Discussion Claude Reasoning bám claim
Methodology critique Claude Đọc context paper
Data extraction từ PDF Claude Precision cao
Response letter Tie Cả 2 OK với edit
Image/table parsing ChatGPT Vision tốt hơn (chưa test trong batch này)
Speed (≤30s response) ChatGPT Nhanh hơn ~2x

Tôi dùng Claude làm primary cho phần lớn task nghiên cứu. ChatGPT khi cần image OCR (table chụp từ paper cũ) hoặc speed cho task đơn giản.

Workflow tổng

5 task này nằm trong workflow AI 5 step cho nghiên cứu của mình. Pillar: Workflow AI cho bác sĩ làm nghiên cứu — từ đọc paper đến viết Discussion.

5 prompt structured cho draft Discussion: 5 prompt Claude mình dùng hằng ngày khi đọc paper.

Khoá AI nghiên cứu

Module 2 khoá AI cho nghiên cứu trên tuyentranmd.com cover so sánh Claude/ChatGPT/Gemini/local model cho 12 task nghiên cứu cụ thể. Plus prompt template + decision tree pick tool theo task.