MIT đã tạo ra các công nhân AI duplicate để thực hiện hàng ngàn tác vụ khác nhau. Kết luận? Hầu hết thời gian AI vẫn chỉ là ‘của nhỏ nhất’

(SeaPRwire) – Tỷ lệ ngày càng tăng của nhân viên văn phòng Mỹ đã thử nghiệm trí tuệ nhân tạo (AI) trong công việc hàng ngày của họ có lẽ đã có vài khoảnh khắc nghi ngờ về sự ổn định công việc lâu dài của mình.

Nhưng bất chấp mọi cải tiến của AI trong những năm gần đây, công nghệ này vẫn chỉ có thể đạt được những tiêu chuẩn thấp trong các nhiệm vụ cụ thể tại nơi làm việc, theo dữ liệu gần đây được MIT công bố. Ngay cả khi đó, nó vẫn có thể mắc phải một số sai lầm lớn.

Những người lao động lo lắng rằng họ có thể sớm bị AI thay thế có lẽ sẽ cảm thấy yên tâm bởi nghiên cứu mới từ MIT, nghiên cứu này mô tả câu chuyện về sự thay thế công việc do AI dẫn dắt không giống như một bộ phim hành động tốc độ nhanh, mà giống một bài phân tích sâu sắc, chậm rãi hơn.

AI đang dần cải thiện khả năng hoàn thành nhiều nhiệm vụ khác nhau trong nhiều ngành nghề, theo một nghiên cứu về kết quả sơ bộ được công bố vào thứ Năm. Nhưng trong hầu hết các trường hợp, hiệu suất của các mô hình hiện có tương tự như một thực tập sinh chán nản—chỉ đạt được các tiêu chuẩn tối thiểu nhưng nhìn chung gặp khó khăn trong việc tạo ra sản phẩm chất lượng nếu không có bàn tay con người để tinh chỉnh kết quả đầu ra của nó.

Vượt qua ngưỡng

Các nhà nghiên cứu MIT đã sử dụng 41 LLM khác nhau—bao gồm các phiên bản của Claude, Gemini và ChatGPT—để phân tích hiệu suất trên hơn 11.000 nhiệm vụ chủ yếu dựa trên văn bản cho các vai trò công việc khác nhau do Bộ Lao động liệt kê. Kết quả đầu ra của chúng sau đó được chấm điểm bởi những người có kinh nghiệm thực tế trong các lĩnh vực đó. Mục tiêu là xem một nhân viên thay thế bằng AI có thể tạo ra kết quả đầu ra mà người quản lý chấp nhận được mà không cần chỉnh sửa của con người thường xuyên như thế nào, và sau đó đánh giá chất lượng của nó.

Các nhà nghiên cứu phát hiện ra rằng AI đã trở nên đáng tin cậy hơn trong những năm qua đối với nhiều loại công việc, nhưng vẫn còn thiếu sót khi các yêu cầu hoặc tiêu chuẩn được nâng cao. Nghiên cứu của MIT đã sử dụng thang điểm từ 1–9 để đánh giá hiệu suất của AI, trong đó điểm 7 được định nghĩa là “đủ tối thiểu”, nghĩa là công việc hữu ích như hiện tại và không cần chỉnh sửa. Tính đến cuối năm 2025, các mô hình AI đạt điểm 7 trong khoảng 65% nhiệm vụ.

Quan trọng nhất đối với các công ty đang cân nhắc thay thế một phần lực lượng lao động của họ bằng AI, dữ liệu của MIT cho thấy AI gặp khó khăn trong việc thực hiện các nhiệm vụ phức tạp hơn. Bất kể mô hình AI có bao nhiêu thời gian để hoàn thành một nhiệm vụ, xác suất thành công khi được đánh giá theo điểm chất lượng 9 hoặc “vượt trội” không bao giờ vượt quá 50%. Nói cách khác, khi một công việc đòi hỏi nhiều bước, sự sáng tạo hoặc độ chính xác, các phương án thay thế bằng AI có nhiều khả năng thất bại hơn là thành công.

Nghiên cứu này khớp với một số khía cạnh trong câu chuyện áp dụng AI hiện tại của các tập đoàn Mỹ. Các công ty sử dụng AI có xu hướng tự động hóa các nhiệm vụ và vai trò thông thường từng dành cho các vị trí nhập môn, trong khi một số kỹ năng chuyên môn cao, đặc biệt là kỹ năng số, thực sự gắn liền với mức lương cao hơn.

Điều đó đã được phản ánh trong dữ liệu của MIT, trong đó tỷ lệ thành công trung bình thấp hơn đối với các vai trò có kỹ năng trong các công việc pháp lý và IT, trong khi các mô hình AI nhìn chung dễ dàng hơn trong việc xử lý các nhiệm vụ dựa trên văn bản liên quan đến các ngành xây dựng và bảo trì.

Các công ty đã thử nghiệm tự động hóa hoàn toàn một số phần công việc của họ đã gặp phải những khó khăn ban đầu. Năm ngoái, Deloitte đã sản xuất hai báo cáo cho các khách hàng chính phủ ở Úc và Canada, cả hai đều bị phát hiện chứa đầy những thông tin bịa đặt. Các phương tiện truyền thông bao gồm CNET và Sports Illustrated cũng đã bị phát hiện sử dụng AI để tạo ra các câu chuyện không chính xác dưới bút danh giả. Các luật sư cũng đã dựa vào AI để chuẩn bị hồ sơ của họ, với một công ty luật công khai xin lỗi vào năm ngoái sau khi có thông tin rằng các trích dẫn giả do AI tạo ra đã góp phần vào một vụ nộp đơn xin phá sản trong một trong các vụ án của họ.

Bằng chứng giai thoại và dữ liệu của MIT cho thấy AI vẫn cần sự can thiệp của con người để tối đa hóa lợi ích của nó, mặc dù công nghệ này vẫn đang phát triển nhanh chóng. Các nhà nghiên cứu MIT ước tính tỷ lệ thành công của AI trong các nhiệm vụ được phân tích đã tăng tới 11 điểm phần trăm mỗi năm do các mô hình có năng lực hơn.

Đến năm 2029, các tác giả ước tính hầu hết các mô hình AI sẽ có thể hoàn thành từ 80% đến 95% các nhiệm vụ dựa trên văn bản ở mức đủ tối thiểu.

Liệu AI có bao giờ có thể mở rộng quy mô để đạt được hiệu suất xuất sắc hoặc thậm chí hoàn hảo hay không vẫn chưa được biết.

“Tự động hóa trên diện rộng, đặc biệt là trong các lĩnh vực có dung sai lỗi thấp, có thể vẫn còn một khoảng cách xa,” các nhà nghiên cứu viết.

AI có thể thực hiện công việc tối thiểu liên quan đến soạn thảo, gửi email và tính toán số liệu, nhưng nó vẫn chưa đạt đến lĩnh vực hiệu suất vượt trội, nơi con người vẫn có thể nổi bật.

Bài viết được cung cấp bởi nhà cung cấp nội dung bên thứ ba. SeaPRwire (https://www.seaprwire.com/) không đưa ra bảo đảm hoặc tuyên bố liên quan đến điều đó.

Lĩnh vực: Tin nổi bật, Tin tức hàng ngày

SeaPRwire cung cấp phát hành thông cáo báo chí thời gian thực cho các công ty và tổ chức, tiếp cận hơn 6.500 cửa hàng truyền thông, 86.000 biên tập viên và nhà báo, và 3,5 triệu máy tính để bàn chuyên nghiệp tại 90 quốc gia. SeaPRwire hỗ trợ phân phối thông cáo báo chí bằng tiếng Anh, tiếng Hàn, tiếng Nhật, tiếng Ả Rập, tiếng Trung Giản thể, tiếng Trung Truyền thống, tiếng Việt, tiếng Thái, tiếng Indonesia, tiếng Mã Lai, tiếng Đức, tiếng Nga, tiếng Pháp, tiếng Tây Ban Nha, tiếng Bồ Đào Nha và các ngôn ngữ khác.