Tại Sao AI Của Google Không Biết Đánh Vần? Giải Mã LLM

Có bao nhiêu chữ 'P' trong từ 'Google'? Theo AI của Google, câu trả lời là... 2.

Nghe có vẻ vô lý, nhưng đó là sự thật. Tính năng AI Overview của Google không chỉ đếm sai chữ cái mà còn tự tin khẳng định có 'đúng 1 chữ r trong từ poop', hoặc từ 'journalism' có 2 chữ 'd' (và đánh vần nó thành j-o-u-r-n-a-d-i-s-m). Dù nhận diện được có 1 chữ 'P' trong họ của cựu Tổng thống Mỹ Trump, nhưng AI lại đánh vần là t-r-p-u-m.

Lỗi ngớ ngẩn từ một 'Bộ não siêu việt'

Bạn không cần phải là một nhà tiên tri để dự đoán rằng cuộc đại tu Search tích hợp AI của Google sẽ gặp nhiều trắc trở. Chúng ta đã từng chứng kiến điều này. Lần đầu tiên Google thêm AI Overviews vào công cụ tìm kiếm, tính năng này đã trích dẫn các bài viết châm biếm từ The Onion và Reddit, khuyên người dùng... ăn đá và bôi keo lên bánh pizza.

Lần này, khi Google nhân đôi nỗ lực để biến AI tạo sinh thành trung tâm của sản phẩm chủ lực đã 29 năm tuổi, việc nó vấp ngã không có gì đáng ngạc nhiên. 'Đếm chữ cái trong một từ là một thách thức đã được biết đến đối với các mô hình ngôn ngữ lớn (LLM), và chúng tôi đang nỗ lực khắc phục vấn đề cụ thể này,' đại diện Google chia sẻ với TechCrunch.

Tại sao Mô hình Ngôn ngữ Lớn (LLM) lại 'mù' chính tả?

Những lỗi chính tả cơ bản này có vẻ rất quen thuộc. Trong cộng đồng công nghệ, đã có một trò đùa kéo dài nhiều năm nay: Mỗi khi một công ty ra mắt mô hình AI mới, hãy hỏi nó có bao nhiêu chữ 'r' trong từ 'strawberry' (dâu tây). Những mô hình AI này - có khả năng lập trình một ứng dụng trong vài giây, hay giải quyết các bài toán làm khó các nhà toán học trong nhiều thập kỷ - lại chỉ giỏi đánh vần ngang... một học sinh mẫu giáo.

Đáng chú ý, điều này đặc biệt phổ biến với người dùng Việt Nam. Khi yêu cầu AI đếm số lượng chữ cái hoặc dấu câu trong các từ tiếng Việt phức tạp như 'nghiêng', 'nguệch ngoạc', AI thường bị nhầm lẫn giữa ký tự (character) và dấu (diacritics), đưa ra những đáp án khiến chúng ta 'dở khóc dở cười'.

Sự cố AI của Google không chỉ dừng lại ở những lỗi chính tả ngớ ngẩn. Gần đây, khi tìm kiếm từ 'disregard' (bỏ qua), AI lại hiển thị định nghĩa là: 'Đã hiểu. Hãy cho tôi biết khi bạn có câu lệnh hoặc câu hỏi mới!'.

Những lỗi này tồn tại dai dẳng vì chúng rất khó bị loại bỏ hoàn toàn. Các nhà nghiên cứu giải thích rằng, AI không nhìn nhận câu văn như những đơn vị ngôn ngữ cấu tạo từ các từ và chữ cái riêng lẻ giống con người.

Lỗ hổng Tokenizer: Khi AI đọc số thay vì đọc chữ

Phần lớn các LLM được xây dựng trên kiến trúc Transformer, chúng phá vỡ văn bản thành các 'token' (có thể là toàn bộ từ, âm tiết, hoặc chữ cái, tùy thuộc vào mô hình). Thay vì 'đọc' như con người, AI chuyển đổi văn bản thành các biểu diễn kỹ thuật số (dạng số hóa) của chính nó, sau đó bối cảnh hóa chúng để đưa ra phản hồi logic.

Matthew Guzdial, nhà nghiên cứu AI và trợ lý giáo sư tại Đại học Alberta, cho biết: 'LLM dựa trên kiến trúc transformer không thực sự đọc văn bản. Khi bạn nhập một câu lệnh, nó sẽ được dịch thành một mã hóa (encoding). Khi nó thấy từ 'the', nó có một mã hóa đại diện cho ý nghĩa của 'the', nhưng nó hoàn toàn không biết về sự tồn tại của các chữ cái riêng lẻ T, H, E.'

Kiến trúc dựa trên token cung cấp sức mạnh cho AI Overview của Google nhưng bản thân nó cũng mang tính hạn chế cố hữu. Việc đánh giá sự tiến bộ của Google qua những lỗi này khiến nhiều người tự hỏi liệu chiến lược của họ có đang đi đúng hướng. Để hiểu sâu hơn về bức tranh toàn cảnh, bạn có thể tham khảo bài phân tích về hệ sinh thái AI Agent của Google: Tương lai hay bước lùi để xem cách Google đang định hình lại công nghệ cốt lõi của mình.

Bài học rút ra: Đừng tin tưởng AI một cách mù quáng

'Rất khó để xác định chính xác một 'từ' nên là gì đối với một mô hình ngôn ngữ. Ngay cả khi các chuyên gia con người thống nhất được một bộ từ vựng token hoàn hảo, các mô hình có lẽ vẫn thấy hữu ích khi 'chia nhỏ' mọi thứ hơn nữa,' Sheridan Feucht, nghiên cứu sinh tiến sĩ tại Đại học Northeastern giải thích. 'Sẽ không có khái niệm về một tokenizer hoàn hảo do tính chất mơ hồ này.'

Đây không hẳn là vấn đề cấp bách trong tâm trí các nhà nghiên cứu, vì tiện ích thực sự của LLM không nằm ở khả năng đánh vần. Tuy nhiên, những thất bại hiển nhiên này là hồi chuông nhắc nhở chúng ta: AI không hoàn hảo. Dù đôi khi AI có vẻ như một thế lực toàn tri vượt xa sự hiểu biết của con người, chúng ta tuyệt đối không thể nhắm mắt tin tưởng vào kết quả đầu ra của AI mà không có sự kiểm chứng chéo (double-check).

Tại Sao AI Của Google Không Biết Đánh Vần? Sự Thật Về Lỗi LLM

Lỗi ngớ ngẩn từ một 'Bộ não siêu việt'

Tại sao Mô hình Ngôn ngữ Lớn (LLM) lại 'mù' chính tả?

Lỗ hổng Tokenizer: Khi AI đọc số thay vì đọc chữ

Bài học rút ra: Đừng tin tưởng AI một cách mù quáng

Đừng bỏ lỡ tin AI mới nhất

Tại Sao AI Của Google Không Biết Đánh Vần? Sự Thật Về Lỗi LLM

Lỗi ngớ ngẩn từ một 'Bộ não siêu việt'

Tại sao Mô hình Ngôn ngữ Lớn (LLM) lại 'mù' chính tả?

Lỗ hổng Tokenizer: Khi AI đọc số thay vì đọc chữ

Bài học rút ra: Đừng tin tưởng AI một cách mù quáng

Đừng bỏ lỡ tin AI mới nhất

Kết nối trên mạng xã hội