Một nghiên cứu mang tính bước ngoặt vừa được công bố trên tạp chí danh tiếng Science đã làm rúng động giới y khoa: Các mô hình ngôn ngữ lớn (LLM) của trí tuệ nhân tạo đang thể hiện khả năng chẩn đoán bệnh đáng kinh ngạc, thậm chí vượt qua cả các bác sĩ thực thụ trong một số tình huống cấp cứu y tế thực tế.
Nghiên cứu này được thực hiện bởi nhóm chuyên gia gồm các bác sĩ và nhà khoa học máy tính đến từ Trường Y Harvard và Trung tâm Y tế Beth Israel Deaconess.
Cuộc đối đầu giữa AI và Bác sĩ con người
Các nhà nghiên cứu đã tiến hành một loạt thí nghiệm để đánh giá hiệu suất của các mô hình AI từ OpenAI so với các bác sĩ y khoa. Cụ thể, họ tập trung vào hồ sơ của 76 bệnh nhân đã nhập viện tại phòng cấp cứu Beth Israel.
Họ so sánh các chẩn đoán do hai bác sĩ nội trú đưa ra với kết quả từ các mô hình o1 và 4o của OpenAI. Để đảm bảo tính khách quan, các chẩn đoán này được đánh giá mù (blind assessment) bởi hai bác sĩ cấp cao khác – những người hoàn toàn không biết kết quả nào là của máy móc, kết quả nào là của con người.
Kết quả đầy bất ngờ: AI chiếm ưu thế
Báo cáo nghiên cứu chỉ ra rằng: "Tại mỗi điểm chạm chẩn đoán, mô hình o1 đều hoạt động tốt hơn hoặc ngang bằng với hai bác sĩ điều trị và mô hình 4o".
Sự chênh lệch này đặc biệt rõ rệt ở khâu phân loại cấp cứu ban đầu (triage) – thời điểm mà thông tin về bệnh nhân ít ỏi nhất nhưng lại đòi hỏi quyết định nhanh chóng và chính xác nhất.
Đáng chú ý, dữ liệu đầu vào cho AI hoàn toàn là dữ liệu thô, không hề qua xử lý trước. AI được cung cấp chính xác những thông tin có sẵn trong hồ sơ bệnh án điện tử tại thời điểm đó. Với lượng thông tin này:
- Mô hình o1 đưa ra chẩn đoán chính xác hoặc rất sát với thực tế trong 67% trường hợp.
- Bác sĩ thứ nhất đạt tỷ lệ 55%.
- Bác sĩ thứ hai đạt tỷ lệ 50%.
Sự phát triển và ứng dụng mạnh mẽ của công nghệ AI không chỉ đang tái định hình lại ngành y tế. Thực tế, các tổ chức và cơ quan chính phủ lớn trên toàn cầu cũng đang chạy đua vũ trang công nghệ, điển hình như việc Lầu Năm Góc ký hợp đồng AI với Nvidia, Microsoft và AWS nhằm xây dựng hạ tầng thông minh quy mô lớn.
Những tranh cãi và góc nhìn thực tế: AI đã sẵn sàng thay thế con người?
Dù kết quả vô cùng ấn tượng, ông Arjun Manrai, trưởng phòng thí nghiệm AI tại Trường Y Harvard, khẳng định: Nghiên cứu này không đồng nghĩa với việc AI đã sẵn sàng đưa ra các quyết định sinh tử tại phòng cấp cứu. Nó chỉ nhấn mạnh nhu cầu cấp thiết phải có các thử nghiệm lâm sàng thực tế để đánh giá công nghệ này.
Hơn nữa, các chuyên gia cũng chỉ ra những hạn chế cố hữu:
- Giới hạn về dữ liệu: AI hiện tại chỉ hoạt động tốt với dữ liệu văn bản. Khả năng lập luận dựa trên hình ảnh (như ảnh chụp X-quang, MRI) hay tín hiệu phi văn bản vẫn còn rất hạn chế.
- Vấn đề trách nhiệm: Bác sĩ Adam Rodman cảnh báo rằng hiện chưa có "khung pháp lý và trách nhiệm giải trình" nào cho các chẩn đoán bằng AI. Bệnh nhân luôn cần sự thấu cảm và hướng dẫn từ con người trong những thời khắc sinh tử.
- Góc nhìn chuyên môn: Bác sĩ cấp cứu Kristen Panthagani lên tiếng chỉ trích cách thiết lập nghiên cứu. Cô cho rằng việc so sánh AI với bác sĩ nội khoa trong bối cảnh phòng cấp cứu là khập khiễng. "Mục tiêu chính của một bác sĩ cấp cứu khi lần đầu gặp bệnh nhân không phải là đoán ra ngay căn bệnh cuối cùng, mà là xác định xem bệnh nhân có đang mắc phải tình trạng đe dọa tính mạng hay không", cô nhấn mạnh.
Cơ hội nào cho y tế Việt Nam?
Tại Việt Nam, với tình trạng quá tải thường xuyên tại các phòng khám và khu vực cấp cứu ở các bệnh viện tuyến đầu (như Bạch Mai, Chợ Rẫy), việc ứng dụng AI như một "trợ lý y khoa" (Copilot) để rà soát hồ sơ, đưa ra các gợi ý chẩn đoán sơ bộ là một tiềm năng cực kỳ lớn. AI sẽ không thay thế bác sĩ Việt Nam, nhưng "bác sĩ biết sử dụng AI sẽ thay thế bác sĩ không biết sử dụng AI". Điều quan trọng lúc này là cần xây dựng cơ sở dữ liệu y tế điện tử đồng bộ và hành lang pháp lý vững chắc trước khi áp dụng trí tuệ nhân tạo vào thực tiễn.