Gần đây, những gã khổng lồ trong ngành trí tuệ nhân tạo (AI) như OpenAI và Anthropic đang ráo riết ngăn chặn các bên thứ ba sử dụng chatbot và API công khai của họ để huấn luyện mô hình mới. Quá trình này được giới chuyên môn gọi là kỹ thuật "chưng cất" (distillation).
Trong một thời gian dài, giới công nghệ thường nhắm mũi dùi vào các công ty Trung Quốc, cáo buộc họ sử dụng phương pháp chưng cất để tạo ra các mô hình AI mã nguồn mở (open-weight models) có khả năng gần tương đương các sản phẩm của Mỹ nhưng với chi phí cực kỳ rẻ. Tuy nhiên, nhiều kỹ sư công nghệ vẫn luôn rỉ tai nhau rằng: Chính các phòng thí nghiệm Mỹ cũng đang âm thầm dùng "chiêu" này với nhau để tránh bị bỏ lại phía sau.
Lời thú nhận gây sốc của Elon Musk tại tòa án
Giờ đây, những lời đồn đoán đã được xác thực, ít nhất là trong một trường hợp cụ thể. Hôm thứ Năm vừa qua, tại một tòa án liên bang ở California, tỷ phú Elon Musk đã nhận được câu hỏi trực diện: Liệu xAI có sử dụng kỹ thuật chưng cất trên các mô hình của OpenAI để huấn luyện AI Grok hay không?
Musk không hề vòng vo mà khẳng định đây là "hoạt động chung" giữa các công ty AI. Khi được bồi thẩm đoàn hỏi ép rằng điều đó có nghĩa là "Có" đúng không, vị tỷ phú đáp lời ngắn gọn: "Một phần là vậy."
Đáng chú ý, lời thú nhận này diễn ra ngay trong bối cảnh Musk đang khởi kiện OpenAI, CEO Sam Altman và Greg Brockman. Musk cáo buộc họ đã vi phạm sứ mệnh phi lợi nhuận ban đầu của OpenAI bằng cách chuyển đổi thực thể này sang cấu trúc kinh doanh vì lợi nhuận.
Sự trớ trêu của các ông lớn AI và mối đe dọa mang tên "Distillation"
Lời thừa nhận của Musk mang sức nặng rất lớn, bởi kỹ thuật chưng cất (distillation) đang trực tiếp đe dọa các ông lớn AI. Nó phá vỡ lợi thế độc tôn mà họ đã phải bỏ ra hàng tỷ USD để xây dựng cơ sở hạ tầng tính toán (compute infrastructure). Bằng cách chưng cất, các nhà phát triển phần mềm khác có thể tạo ra những mô hình AI thông minh gần bằng bản gốc nhưng với chi phí rẻ hơn rất nhiều.
Sự bành trướng thương mại của OpenAI ngày càng bành trướng mạnh mẽ, thể hiện qua các thỏa thuận hợp tác tỷ đô (chẳng hạn như việc Amazon cung cấp sản phẩm OpenAI trên AWS đang tạo ra một hệ sinh thái khép kín). Điều này càng khiến các startup sinh sau đẻ muộn như xAI buộc phải tìm cách "đi tắt đón đầu".
Có một sự mỉa mai không hề nhẹ ở đây: Các phòng thí nghiệm AI hàng đầu luôn bị cáo buộc bóp méo và vi phạm luật bản quyền để thu thập dữ liệu khổng lồ đào tạo mô hình của họ. Thế nhưng, họ lại lớn tiếng phản đối khi người khác dùng dữ liệu từ chính chatbot của họ để học hỏi.
Cục diện cuộc đua AI hiện tại qua góc nhìn của Musk
Việc xAI – công ty thành lập năm 2023, tức là đi sau OpenAI nhiều năm – cố gắng học hỏi từ người dẫn đầu lĩnh vực là điều hoàn toàn dễ hiểu. Tính hợp pháp của "distillation" vẫn chưa được làm rõ, nhưng nó chắc chắn vi phạm các điều khoản dịch vụ (Terms of Service) mà các công ty đặt ra cho người dùng.
Để chống lại làn sóng này, OpenAI, Anthropic và Google được cho là đã khởi xướng một sáng kiến thông qua Frontier Model Forum nhằm chia sẻ cách thức ngăn chặn các nỗ lực chưng cất dữ liệu, đặc biệt là từ Trung Quốc. Các nỗ lực này bao gồm việc truy vấn hệ thống liên tục để bẻ khóa cấu trúc mô hình gốc.
Trong phần sau của phiên tòa, khi được hỏi về tuyên bố hồi mùa hè năm ngoái rằng "xAI sẽ sớm vượt xa bất kỳ công ty nào ngoài Google", Elon Musk đã đưa ra một bảng xếp hạng các nhà cung cấp AI hàng đầu thế giới theo quan điểm cá nhân:
- Vị trí số 1: Anthropic
- Vị trí số 2: OpenAI
- Vị trí số 3: Google
- Vị trí số 4: Các mô hình mã nguồn mở của Trung Quốc
Musk cũng khiêm tốn (hoặc thực tế) khi miêu tả xAI hiện tại chỉ là một công ty nhỏ với vài trăm nhân viên, vẫn đang trên con đường nỗ lực thu hẹp khoảng cách với những người khổng lồ.