Kể từ ngày 1/6/2026, GitHub Copilot sẽ chính thức thay đổi mô hình kinh doanh, chuyển từ việc thu phí thuê bao trọn gói (flat rate) sang tính phí dựa trên số lượng token thực tế mà người dùng tiêu thụ. Đây là một bước ngoặt lớn, đòi hỏi các lập trình viên và doanh nghiệp phải thay đổi thói quen sử dụng công cụ AI này.
1. Tạm Biệt Mô Hình "Trọn Gói", Chào Đón "Dùng Bao Nhiêu Trả Bấy Nhiêu"
Trước đây, mô hình cũ của GitHub Copilot khá đơn giản và có phần "dễ dãi". Tùy thuộc vào gói đăng ký, người dùng được cấp một số lượng "Premium Requests" (Yêu cầu cao cấp) cố định. Điểm bất cập là một tác vụ code phức tạp tốn hàng giờ xử lý cũng chỉ tiêu tốn 1 request, y hệt như việc bạn đặt một câu hỏi đơn giản. Điều này tạo ra sự chênh lệch lớn trong việc sử dụng tài nguyên.
Tuy nhiên, sự thay đổi sắp tới sẽ đưa GitHub Copilot về chung "vành đai" với mô hình tính phí API của các mô hình ngôn ngữ lớn (LLM) hiện nay. Hầu hết các yêu cầu sẽ được đo lường dựa trên số lượng token được đưa vào (input) và xuất ra (output) từ LLM cốt lõi của Copilot.
2. Token Là Gì Và Cách Tính Phí AI Credit Ra Sao?
Để dễ hình dung, trong thế giới AI, một token tương đương với khoảng 3/4 của một từ. Tuy nhiên, trong ngôn ngữ lập trình, nếu Copilot phân tích một đoạn code (để tối ưu hóa hoặc tìm lỗi) dài 10.000 "từ" (bao gồm các biểu thức, câu lệnh, tên biến, hàm...), thì chỉ một lần truy vấn duy nhất đã tiêu tốn khoảng 12.000 đến 13.000 token.
Cả văn bản bạn nhập vào (Prompt) và kết quả AI trả về (Output) đều được tính vào tổng lượng token tiêu thụ.
Mức giá của các gói thuê bao hiện tại vẫn được giữ nguyên, nhưng thay vì cấp số lượt truy vấn, người dùng sẽ nhận được "AI Credits" (Tín dụng AI). Ví dụ, một tài khoản Copilot Pro cơ bản (giá 10 USD/tháng) sẽ nhận được 1.000 credit. Theo GitHub, hiện tại 1 AI Credit có giá trị tương đương 1 cent (0,01 USD).
Số lượng token mà mỗi credit mua được sẽ dao động tùy thuộc vào mô hình AI được sử dụng, tỷ lệ input/output, kích thước bộ nhớ đệm (context cache) và tính năng cụ thể. Những truy vấn đơn giản sẽ ít tốn kém, nhưng nếu bạn yêu cầu AI quét toàn bộ một dự án code khổng lồ bằng các mô hình tiên tiến nhất, tài khoản AI Credit của bạn sẽ cạn kiệt rất nhanh.
3. Không Phải Mọi Thứ Đều Bị Tính Phí
Tin vui cho cộng đồng dev là GitHub vẫn giữ lại một số đặc quyền miễn phí để bù đắp cho sự thay đổi này. Các tính năng như Code completions (Gợi ý hoàn thành code tự động - tương tự tính năng đoán chữ trên điện thoại) và Next Edit suggestions (Gợi ý chỉnh sửa tiếp theo) sẽ tiếp tục được cung cấp hoàn toàn miễn phí mà không trừ vào AI Credit.
4. Xu Hướng Chung Của Ngành Công Nghiệp AI
Quyết định của GitHub (thuộc sở hữu của Microsoft) không phải là cá biệt. Các ông lớn như Anthropic và OpenAI cũng đã chuyển khách hàng doanh nghiệp của họ sang hình thức thanh toán theo token. Trước đây, Microsoft nhờ có hệ sinh thái phần mềm và điện toán đám mây sinh lời khủng nên đã "trợ giá" rất nhiều cho Copilot. Nhưng khi quy mô phình to, việc tối ưu hóa bài toán kinh tế là bắt buộc.
Khi các hệ thống AI tự trị (AI Agent) ngày càng phát triển, hạ tầng thanh toán cũng phải nâng cấp theo để đáp ứng các giao dịch vi mô (micro-transactions) theo token này. Gần đây, việc Stripe ra mắt ví điện tử Link cho AI tự động thanh toán chính là một minh chứng rõ ràng cho thấy nền kinh tế API đang đòi hỏi các AI Agent phải có khả năng tự hạch toán và chi trả chi phí vận hành của chính mình.
5. Bài Học Lớn Cho Các Doanh Nghiệp Phát Triển Phần Mềm
Việc tính phí per-token sẽ buộc các lập trình viên phải từ bỏ thói quen "thử và sai" vô tội vạ. Họ sẽ phải học cách viết Prompt tối ưu hơn, ngắn gọn và đi thẳng vào vấn đề.
Đối với các doanh nghiệp, sự chuyển dịch này mang lại bài toán lớn về quản trị rủi ro chi phí. Điển hình như Uber, Giám đốc Công nghệ (CTO) của họ tiết lộ rằng công ty đã tiêu sạch ngân sách AI dự kiến cho năm 2026 ngay từ thời điểm hiện tại, một phần vì 11% lượng code cập nhật của Uber hiện đang do các AI Agent (chủ yếu là Claude của Anthropic) đảm nhận.
Lời khuyên: Dù sử dụng AI trong bộ phận IT hay tự động hóa doanh nghiệp, các nhà quản lý cần phải đo lường kỹ lưỡng. Hiệu suất công việc mà AI mang lại bắt buộc phải sinh lời đủ lớn để bù đắp lại những hóa đơn token ngày càng tăng từ các nhà cung cấp nền tảng.