Phỏng vấn với Alexandr Wang
Founder and CEO @ Scale.ai
bởi 20VC with Harry Stebbings • 2024-06-12

Trong một cuộc trò chuyện hấp dẫn và thẳng thắn với Harry Stebbings trên 20VC, Alexandr Wang, CEO của Scale AI, đã bóc tách các lớp về bức tranh AI hiện tại, thách thức những quan niệm thông thường và làm nổi bật nút thắt cổ chai thực sự đối với hiệu suất mô hình thế hệ tiếp theo. Trong khi thế giới đang ám ảnh về sức mạnh tính toán (compute), Wang lập luận rằng cuộc đua thực sự—và yếu tố khác biệt tiềm năng—không nằm ở phần cứng (silicon), mà ở dữ liệu.
Bức Tường Dữ Liệu: Tại Sao Sức Mạnh Tính Toán Không Còn Đủ Nữa
Cuộc phỏng vấn đi thẳng vào một câu hỏi đầy tính gợi mở: liệu chúng ta có đang chứng kiến hiệu suất mô hình AI giảm dần, nơi nhiều sức mạnh tính toán hơn không còn đảm bảo kết quả tốt hơn? Câu trả lời của Wang là một tiếng "có" dứt khoát. Ông chỉ ra rằng, bất chấp sự tăng vọt theo cấp số nhân trong chi tiêu GPU của Nvidia kể từ cuối năm 2022 (từ 5 tỷ USD lên hơn 20 tỷ USD mỗi quý), chúng ta vẫn chưa thấy một mô hình cơ bản "tốt hơn một cách đáng kinh ngạc" so với GPT-4, vốn có trước bước ngoặt lớn về sức mạnh tính toán này.
Wang giải thích rằng sự tiến bộ của AI dựa trên ba trụ cột: sức mạnh tính toán (compute), thuật toán (algorithms) và dữ liệu (data). Trong khi sức mạnh tính toán đã tăng trưởng đáng kể, hai yếu tố còn lại chưa theo kịp. Quan trọng hơn, ông tin rằng ngành công nghiệp đã chạm vào một "bức tường dữ liệu". "Dữ liệu dễ dàng"—mọi thứ có sẵn trên internet công khai, được thu thập từ các công cụ tìm kiếm hoặc torrent—phần lớn đã được tiêu thụ. Các mô hình này hiện "cực kỳ giỏi trong việc mô phỏng internet", nhưng điều đó là không đủ cho các tác vụ phức tạp và khả năng suy luận cần thiết cho AGI thực sự hoặc các tác nhân AI hiệu quả.
Những hiểu biết chính:
- Sự tiến bộ của AI phụ thuộc vào việc sức mạnh tính toán (compute), dữ liệu và thuật toán cùng phát triển đồng bộ.
- Các khoản đầu tư khổng lồ vào sức mạnh tính toán sau GPT-4 đã không mang lại những bước nhảy vọt tương xứng về hiệu suất mô hình cơ bản.
- Ngành công nghiệp phần lớn đã cạn kiệt "dữ liệu dễ dàng" (dữ liệu internet), dẫn đến sự chững lại về hiệu suất.
Khai Phá Tiên Phong: Nuôi Dưỡng Sự Phong Phú Dữ Liệu
Để vượt qua bức tường dữ liệu này, Wang đã giới thiệu khái niệm "dữ liệu Tiên phong" (Frontier data). Ông nhấn mạnh rằng phần lớn quá trình suy luận và giải quyết vấn đề phức tạp thúc đẩy nền kinh tế ngày nay – như quy trình suy luận của một nhà phân tích gian lận – không được ghi lại trực tuyến. Điều này có nghĩa là các mô hình được đào tạo chỉ bằng dữ liệu internet sẽ thiếu khả năng học hỏi từ trí tuệ con người sâu sắc hơn này.
Vậy, làm thế nào để chúng ta thu thập loại dữ liệu Tiên phong khó nắm bắt này? Wang đã phác thảo hai con đường chính. Thứ nhất, có một kho dữ liệu độc quyền khổng lồ bị khóa bên trong các doanh nghiệp. Ông dẫn chứng 150 petabyte dữ liệu nội bộ của JPMorgan, làm lu mờ bộ dữ liệu internet chưa đến một petabyte của GPT-4. Tuy nhiên, dữ liệu này có tính bảo mật cao và sẽ yêu cầu các doanh nghiệp khai thác và tinh chỉnh nó cho các hệ thống AI của riêng họ, có thể là tại chỗ (on-prem) hoặc với các đảm bảo chặt chẽ chống lại việc sử dụng bên ngoài. Thứ hai, và quan trọng hơn đối với những đột phá tổng quát, là "sản xuất dữ liệu mới" (forward data production). Điều này không chỉ là thu thập dữ liệu hiện có mà là tạo ra dữ liệu mới, có độ phức tạp cao. Điều này liên quan đến một "quy trình kết hợp con người-tổng hợp" (human-synthetic hybrid process) nơi AI tạo ra dữ liệu, và các chuyên gia con người đóng vai trò "người giám sát an toàn" (safety drivers), hướng dẫn AI, sửa lỗi và cung cấp đầu vào quan trọng khi các mô hình gặp khó khăn. Wang coi những "người huấn luyện AI" hoặc "người đóng góp" này đang nắm giữ một số công việc có đòn bẩy cao nhất cho tác động xã hội. Ông lưu ý: "Là một chuyên gia con người, bạn có khả năng tạo ra tác động rộng lớn đến xã hội bằng cách tạo ra dữ liệu để giúp cải thiện các mô hình này."
Những thay đổi chính:
- Việc chuyển đổi từ "dữ liệu dễ dàng" có sẵn sang "dữ liệu Tiên phong" là cần thiết cho AI tiên tiến.
- Dữ liệu Tiên phong bao gồm các chuỗi suy luận phức tạp, việc sử dụng công cụ và hành vi mang tính tác nhân không có trên internet công khai.
- Sự phong phú về dữ liệu sẽ đạt được thông qua việc khai thác dữ liệu độc quyền của doanh nghiệp và chủ động tạo ra dữ liệu mới, chất lượng cao.
- Các vai trò mới của con người sẽ xuất hiện để hướng dẫn và sửa lỗi các hệ thống AI trong việc tạo dữ liệu tổng hợp, tương tự như những người lái xe an toàn của phương tiện tự hành.
Cuộc Đua Dữ Liệu Địa Chính Trị: Một Cuộc Chiến Tranh Lạnh Mới?
Cuộc trò chuyện chuyển sang các hàm ý địa chính trị sâu sắc của AI, một chủ đề mà Wang tin rằng chưa được thảo luận nhiều. Ông thẳng thắn tuyên bố: "Về bản chất, công nghệ AI này có tiềm năng trở thành một trong những tài sản quân sự vĩ đại nhất mà nhân loại từng thấy, thậm chí có thể còn là một tài sản quân sự lớn hơn cả vũ khí hạt nhân." Ông vẽ ra một kịch bản đáng sợ, nơi một chế độ toàn trị với AGI có thể chinh phục một quốc gia không có nó.
Wang bày tỏ mối quan ngại đáng kể về sự tiến bộ nhanh chóng của AI của Trung Quốc. Trong khi hai năm trước họ có thể "không hề gần" với khả năng của GPT-4, thì một mô hình Trung Quốc gần đây, Yi-Large từ 0101, hiện được xếp hạng trong số những mô hình tốt nhất thế giới, chỉ sau GPT-4o, Gemini và Claude 3 Opus. Ông quy điều này cho khả năng đặc biệt của ĐCSTQ trong việc thực hiện "hành động tập trung rất quyết liệt và chính sách công nghiệp tập trung để thúc đẩy các ngành công nghiệp quan trọng." Mô hình này, đã thấy ở năng lượng mặt trời và xe điện (EVs), cho thấy Trung Quốc có "một cơ hội rõ ràng để bứt phá và vượt lên trước chúng ta." Với điều này, Wang tin rằng có một "sự phân đôi phải xuất hiện": các hệ thống AI tiên tiến, thực sự mạnh mẽ nên được giữ kín vì lý do quân sự và địa chính trị, trong khi các mô hình mở, kém tiên tiến hơn có thể tiếp tục thúc đẩy giá trị kinh tế.
Những bài học chính:
- AI, đặc biệt là AGI, có thể là tài sản quân sự mạnh mẽ nhất của nhân loại, với những hậu quả địa chính trị sâu sắc.
- Chính sách công nghiệp tập trung của Trung Quốc cho phép AI tiến bộ nhanh chóng, nhanh chóng thu hẹp khoảng cách với năng lực của phương Tây.
- Một sự phân biệt chiến lược giữa các hệ thống AI mở và đóng là rất quan trọng: các mô hình tiên tiến có thể cần được đóng vì lý do an ninh, trong khi các mô hình ít mạnh mẽ hơn có thể vẫn mở để mang lại lợi ích kinh tế rộng lớn.
Định Nghĩa Lại Cạnh Tranh: Dữ Liệu Là Lợi Thế Vượt Trội Cuối Cùng
Trong thế giới cạnh tranh khốc liệt của các mô hình nền tảng (foundation models), Wang tin chắc rằng dữ liệu sẽ là yếu tố khác biệt cuối cùng. Ông phác thảo rằng thuật toán cuối cùng có thể được giải mã ngược (reverse-engineered) hoặc trở thành kiến thức chung, và sức mạnh tính toán (compute) có thể đơn giản được mua. Ông khẳng định: "Dữ liệu là một trong số ít lĩnh vực mà bạn thực sự có thể tạo ra một lợi thế cạnh tranh bền vững lâu dài." Ông dẫn chứng các quan hệ đối tác của Open AI với Financial Times và Axel Springer là những dấu hiệu sớm của sự thay đổi này.
Wang mạnh dạn dự đoán một tương lai nơi các nhà lãnh đạo AI sẽ không khoe khoang về số lượng GPU của họ, mà là "họ có quyền truy cập vào dữ liệu nào và những quyền đặc biệt của họ đối với các nguồn dữ liệu khác nhau là gì." Sự nhấn mạnh vào dữ liệu độc quyền, độc đáo này sẽ thúc đẩy sự khác biệt hóa thị trường. Hơn nữa, ông dự đoán một sự thay đổi đáng kể trong phần mềm, chuyển từ SaaS "vườn tường" (walled garden) sang các ứng dụng được tùy chỉnh cao, được xây dựng có mục đích cho doanh nghiệp, gợi nhớ đến cách tiếp cận ban đầu của Palantir. Điều này sẽ được thúc đẩy bởi AI làm giảm đáng kể chi phí tạo phần mềm, dẫn đến một kỷ nguyên mới của các giải pháp phần mềm cá nhân hóa. Do đó, mô hình định giá theo ghế (per-seat) đã tồn tại lâu dài có khả năng sẽ nhường chỗ cho định giá dựa trên mức tiêu thụ (consumption-based pricing), phản ánh công việc được thực hiện bởi cả nhân viên con người và tác nhân AI.
Những hiểu biết chính:
- Dữ liệu đang nổi lên như lợi thế cạnh tranh chính và bền vững nhất trong cuộc đua mô hình nền tảng.
- Cạnh tranh trong tương lai sẽ xoay quanh quyền truy cập dữ liệu độc quyền, quyền sở hữu và khả năng sản xuất các bộ dữ liệu độc đáo.
- Việc thương mại hóa việc tạo phần mềm sẽ dẫn đến các ứng dụng được thiết kế riêng, tùy chỉnh cho doanh nghiệp, vượt ra ngoài SaaS chung chung.
- Các mô hình định giá phần mềm sẽ phát triển từ định giá theo ghế sang định giá dựa trên mức tiêu thụ, phù hợp với giá trị được cung cấp bởi cả con người và tác nhân AI.
Điều Hướng Sự Ồn Ào: Các Kênh Trực Tiếp và Niềm Tin
Chuyển sang chủ đề xây dựng công ty, Wang chia sẻ cách tiếp cận khác thường của mình đối với quan hệ công chúng (PR): "PR tốt nhất là không có PR." Ông lập luận rằng truyền thông truyền thống, thường bị thúc đẩy bởi lượt nhấp, có xu hướng cường điệu hóa và bóp méo câu chuyện, xây dựng và phá hủy các công ty để thu hút sự tương tác. Ông tiết lộ một trải nghiệm cá nhân đáng ngạc nhiên: "Tôi đã nhận được sự đối xử công bằng hơn khi điều trần trước Quốc hội so với những gì tôi nhận được từ các cơ quan truyền thông khác nhau trong những năm qua."
Quan điểm này đã khiến Scale AI ưu tiên các kênh trực tiếp, như podcast và blog của công ty, nơi họ có thể truyền tải thông điệp của mình một cách chân thực và không bị thay đổi. Việc làm chủ câu chuyện của họ đảm bảo rằng câu chuyện của họ là "thuần khiết" và không bị biến chất, thúc đẩy sự tin tưởng và rõ ràng với khán giả của họ.
Các thực hành chính:
- Áp dụng chiến lược "không PR" hoặc tương tác tối thiểu với truyền thông truyền thống để tránh sự cường điệu và bóp méo câu chuyện.
- Ưu tiên các kênh giao tiếp trực tiếp (podcast, nội dung của công ty) để có thông điệp chân thực và không bị thay đổi.
- Các nhà sáng lập và công ty phải chủ động làm chủ và quản lý câu chuyện của mình trong một bối cảnh thông tin ngày càng ồn ào.
"Về bản chất, công nghệ AI này có tiềm năng trở thành một trong những tài sản quân sự vĩ đại nhất mà nhân loại từng thấy, thậm chí có thể còn là một tài sản quân sự lớn hơn cả vũ khí hạt nhân." - Alexandr Wang


