Nghiên cứu của Harvard Phát hiện OpenAI o1 Vượt Trên Mức Cơ sở của Bác sĩ

(AsiaGameHub) – Đội nghiên cứu tại Harvard Medical School và Beth Israel Deaconess Medical Center đã thử nghiệm các mô hình của OpenAI so sánh với bác sĩ trong việc chẩn đoán bệnh, sử dụng các trường hợp khám phẫu thuật cấp cứu và các nhiệm vụ y tế khác.

Thông tin có ích

Mô hình OpenAI o1 đã cho ra kết luận chính xác hoặc gần như chính xác trong 67% trường hợp triage ban đầu tại phòng cấp cứu.
Hai bác sĩ khoa chuyên khoa đạt kết quả là 55% và 50% trên cùng bài kiểm tra triage.
Nhà nghiên cứu cho rằng bệnh viện vẫn cần thử nghiệm trong các điều kiện chăm sóc thật trước khi áp dụng AI cho các bệnh nhân nguy hiểm cao.

Nhà nghiên cứu cho rằng việc sử dụng AI tại phòng cấp cứu vẫn cần kiểm nghiệm

Kết quả mạnh mẽ nhất được ghi nhận ở những phút giây mà bác sĩ thường có ít thông tin nhất. Trong quá trình triage ban đầu tại phòng cấp cứu, OpenAI o1 đã cho ra kết luận chính xác hoặc gần như chính xác trong 67% trường hợp. Một bác sĩ khoa chuyên khoa đạt 55%, trong khi người kia chỉ đạt 50%.

Nhà nghiên cứu không định hướng kết quả này là một dấu hiệu cho phép AI điều hành các phòng cấp cứu. Thay vào đó, bài báo cáo trong tạp chí Science gọi là “cần thiết để có nhanh chóng nghiên cứu tiềm năng để đánh giá những công nghệ này trong thực tế”.

Lời cảnh báo này có ý nghĩa lớn vì thí nghiệm chỉ diễn ra bằng các hồ sơ dựa trên văn bản. Đội nghiên cứu đã chú ý rằng “các nghiên cứu hiện có cho thấy các mô hình cơ bản hiện tại còn hạn chế trong việc suy luận về các thông tin không phải là văn bản”. Nói một cách đơn giản hơn, các biểu đồ, hình ảnh y tế, hình ảnh vật lý và phán đoán tại giường bệnh vẫn là những vấn đề khó hơn cho các công cụ AI chẩn đoán.

Thí nghiệm sử dụng dữ liệu 76 bệnh nhân từ khoa cấp cứu của Beth Israel. Mô hình OpenAI o1 và 4o đã nhận được cùng những thông tin về hồ sơ y tế điện tử tại mỗi điểm chẩn đoán. Bác sĩ Harvard Medical School đã cho biết rằng các nhà nghiên cứu không “tiền xử lý dữ liệu chút nào”, vì vậy mô hình chẳng hề nhận được bản tóm tắt được làm sạch hay các hướng dẫn bổ sung nào.

Hai bác sĩ khoa chuyên khoa khác sau đó đã đánh giá các kết luận mà không biết kết quả nào được đưa ra bởi bác sĩ và kết quả nào là do AI.

Bài nghiên cứu nói:

“Tại mỗi điểm chẩn đoán, mô hình o1 hoạt động không kém hoặc tương đương hơn hai bác sĩ khoa và mô hình 4o,”

Thêm vào đó, sự khác biệt trông rõ rệt hơn ở điểm chẩn đoán đầu tiên (triage ban đầu tại phòng cấp cứu), nơi có ít thông tin nhất về bệnh nhân và cần ra quyết định đúng đắn nhất trong thời gian quyết định:

“đặc biệt rõ rệt ở điểm chẩn đoán đầu tiên (triage ban đầu tại phòng cấp cứu), nơi có ít thông tin nhất về bệnh nhân và cần ra quyết định đúng đắn nhất trong thời gian quyết định.”

Arjun Manrai, người đứng đầu một phòng thí nghiệm AI tại Harvard Medical School và đã giúp dẫn dắt nghiên cứu này, cho biết:

“Chúng tôi đã thử nghiệm mô hình AI trên hầu hết các tiêu chí đánh giá, và nó đã vượt xa cả các mô hình trước đó và các bậc thang của bác sĩ trong nghiên cứu này,”

Tuy nhiên, nguyên tắc trách nhiệm vẫn là vấn đề khó. Adam Rodman, một bác sĩ tại Beth Israel và một trong các tác giả chính của bài nghiên cứu, đã bình luận với Guardian rằng hiện tại vẫn “không có khung chính thống nào cho việc trách nhiệm” trong việc chẩn đoán bằng AI. Anh cũng nói rằng bệnh nhân vẫn “muốn những người con người điều hành quyết định sinh tử hoặc quyết định điều trị khó khăn.”

Bài viết này được cung cấp bởi một nhà cung cấp nội dung bên thứ ba. AsiaGameHub (https://asiagamehub.com/) không đưa ra bất kỳ ضمان أو cam kết nào liên quan đến nội dung.

Danh mục: Tin tức mới nhất, Cập nhật chung

AsiaGameHub cung cấp dịch vụ phân phối iGaming mục tiêu cho các công ty và tổ chức, kết nối với hơn 3.000 cơ quan truyền thông cao cấp tại châu Á và hơn 80.000 người ảnh hưởng chuyên ngành. Đây là cầu nối tối ưu cho việc phân phối nội dung iGaming, casino và eSports trên toàn khu vực ASEAN.