Phỏng vấn với Jensen Huang

founder & CEO of NVIDIA

bởi Bg2 Pod2025-09-25

Jensen Huang

Trong một cuộc thảo luận đầy lôi cuốn, Jensen Huang, vị CEO có tầm nhìn xa của Nvidia, đã mang đến cái nhìn hiếm hoi về tương lai của điện toán, AI và thậm chí cả kinh tế toàn cầu. Trong cuộc trò chuyện với Bill Gurley và Brad Gerstner từ Bg2 Pod, Huang đã lý giải một cách vô cùng rõ ràng về việc một khía cạnh bị bỏ qua của trí tuệ nhân tạo đang sẵn sàng định hình lại các ngành công nghiệp và khơi nguồn tăng trưởng chưa từng có, đồng thời thách thức những quan điểm truyền thống của Wall Street.

Bùng Nổ Billionx: Định Nghĩa Lại Các Yêu Cầu Tính Toán Của AI

Một năm trước, Jensen Huang đã mạnh dạn dự đoán rằng suy luận AI sẽ không chỉ tăng 100 lần hay 1000 lần, mà là con số khổng lồ một tỷ lần (one billionx). Nhìn lại dự đoán này, ông thừa nhận, "Tôi đã đánh giá thấp. Tôi xin chính thức thừa nhận điều đó." Sự tự tin của ông chỉ tăng vọt, được thúc đẩy bởi sự phát triển nhanh chóng của AI. Cái mà trước đây từng được coi là một luật mở rộng "tiền đào tạo" (pre-training) duy nhất giờ đây đã phân tách thành ba lực lượng riêng biệt, phát triển theo cấp số nhân: tiền đào tạo, hậu đào tạo (post-training, nơi AI "thực hành" các kỹ năng), và quan trọng nhất là suy luận "tư duy" (thinking inference).

Suy luận "tư duy" này chính là yếu tố thay đổi cuộc chơi. Không giống như mô hình suy luận một lần cũ, AI hiện đại giờ đây được thiết kế để "suy nghĩ trước khi trả lời", thực hiện nghiên cứu, kiểm tra sự thật cơ bản và lặp lại. Quá trình nhận thức phức tạp này đòi hỏi sức mạnh tính toán tăng theo cấp số nhân. Như Huang đã nói, "AI không còn chỉ là một mô hình ngôn ngữ nữa; AI là một hệ thống các mô hình ngôn ngữ và tất cả chúng đều chạy đồng thời, có thể sử dụng các công cụ... và tất cả đều là đa phương thức (multimodality)." Sự thay đổi sâu sắc này có nghĩa là nhu cầu tính toán của AI không chỉ lớn mà còn không thể thỏa mãn và mở rộng nhanh chóng, vượt xa những gì nhiều người hiện đang hình dung.

Những Điểm Chính:

  • Suy luận AI đang chứng kiến sự gia tăng tính toán gấp "một tỷ lần" nhờ sự xuất hiện của khả năng "tư duy" và chuỗi suy luận.
  • Bức tranh AI giờ đây được điều chỉnh bởi ba luật mở rộng riêng biệt: tiền đào tạo (pre-training), hậu đào tạo (post-training, AI thực hành), và suy luận phức tạp.
  • Các hệ thống đa tác nhân (multi-agent systems), AI đa phương thức (multimodal AI), và việc sử dụng công cụ rộng rãi làm tăng đáng kể yêu cầu tính toán, vượt ra ngoài các mô hình ngôn ngữ đơn giản.

OpenAI: Hyperscaler Nghìn Tỷ Đô La Tiếp Theo Và Nước Cờ Chiến Lược Của Nvidia

Trọng tâm trong tầm nhìn của Huang là mối quan hệ đối tác chiến lược giữa Nvidia với OpenAI, bao gồm cả việc đầu tư và hỗ trợ xây dựng cơ sở hạ tầng AI khổng lồ của riêng họ. Ông xem OpenAI không chỉ là một khách hàng, mà là "có khả năng trở thành công ty hyperscale đa nghìn tỷ đô la tiếp theo." Dự đoán táo bạo này củng cố quyết định của Nvidia trong việc đầu tư trước sự trỗi dậy như vũ bão được dự kiến của OpenAI, một cơ hội mà Huang gọi là "một trong những khoản đầu tư thông minh nhất mà chúng ta có thể tưởng tượng được".

Mối quan hệ đối tác này cũng báo hiệu một sự thay đổi đáng kể trong bức tranh AI. OpenAI, theo truyền thống vẫn tận dụng các hyperscaler như Microsoft Azure, giờ đây đang xây dựng "cơ sở hạ tầng AI tự xây dựng" của riêng mình – thực chất đang tự mình trở thành một hyperscaler. Điều này phản ánh các mối quan hệ trực tiếp mà Nvidia có với các gã khổng lồ như Meta và Google, nơi họ làm việc trực tiếp ở cấp độ chip, phần mềm và hệ thống. OpenAI đang đồng thời điều hướng "hai cấp số nhân": sự tăng trưởng theo cấp số nhân về mức độ sử dụng của khách hàng và sự tăng theo cấp số nhân về yêu cầu tính toán cho mỗi trường hợp sử dụng (do AI "tư duy"). Sự hỗ trợ đa chiều của Nvidia trên Azure, OCI, CoreWeave, và giờ đây là việc OpenAI tự xây dựng trực tiếp, được thiết kế để đáp ứng nhu cầu tổng hợp này, củng cố hơn nữa vai trò không thể thiếu của Nvidia.

Những Quyết Định Quan Trọng:

  • Khoản đầu tư của Nvidia vào OpenAI là một động thái chiến lược, đặt cược vào tiềm năng của OpenAI để trở thành một thực thể hyperscale đa nghìn tỷ đô la.
  • Việc hỗ trợ OpenAI tự xây dựng cơ sở hạ tầng AI thúc đẩy các mối quan hệ trực tiếp, toàn diện (full-stack), phản ánh sự hợp tác của Nvidia với các gã khổng lồ công nghệ khác.
  • Mối quan hệ đối tác này giải quyết thách thức tổng hợp của việc khách hàng chấp nhận sử dụng tăng theo cấp số nhân và nhu cầu tính toán trên mỗi người dùng trong AI.

Hào Lũy Không Thể Công Phá: Đồng Thiết Kế Cực Đoan Và Tốc Độ Hàng Năm

Các nhà phân tích của Wall Street hiện đang dự báo tăng trưởng của Nvidia sẽ chững lại vào khoảng năm 2027-2030, một quan điểm mà Huang thấy không phù hợp với những thay đổi cơ bản. Ông đưa ra ba điểm chính: Thứ nhất, "điện toán đa năng đã kết thúc," và hàng nghìn tỷ đô la cơ sở hạ tầng điện toán của thế giới phải được làm mới bằng điện toán AI tăng tốc. Thứ hai, các khối lượng công việc hyperscale hiện có (tìm kiếm, công cụ đề xuất) đang nhanh chóng chuyển từ CPU sang GPU, một sự chuyển dịch trị giá "hàng trăm tỷ đô la". Cuối cùng, và sâu sắc nhất, AI sẽ bổ trợ trí tuệ con người, tác động đến 50-65% GDP toàn cầu.

Để đáp ứng "cấp số nhân của cấp số nhân" được thúc đẩy bởi việc tạo token và sử dụng của khách hàng, Nvidia đã áp dụng chu kỳ phát hành hàng năm đầy mạnh mẽ cho các kiến trúc của mình (Hopper, Blackwell, Rubin, Fineman). Khi Định luật Moore về hiệu suất phần lớn đã chấm dứt, lợi thế cạnh tranh của Nvidia đến từ "đồng thiết kế cực đoan" (extreme co-design). Đây không chỉ là về các chip nhanh hơn; đó là về việc tối ưu hóa mô hình, thuật toán, hệ thống và chip cùng lúc, đổi mới "vượt ra ngoài khuôn khổ". Như Huang giải thích, cách tiếp cận toàn diện này – bao gồm CPU, GPU, chip mạng, MVLink và Spectrum-X Ethernet – cho phép Nvidia đạt được mức tăng hiệu suất gấp 30 lần giữa các thế hệ (như từ Hopper lên Blackwell) mà không một tiến bộ silicon thông thường nào có thể mang lại. Sự đổi mới mang tính hệ thống này, kết hợp với quy mô đầu tư khổng lồ cần thiết từ cả Nvidia và khách hàng, tạo ra một hào lũy đáng gờm mà "khó hơn bao giờ hết" để các đối thủ sao chép.

Những Thực Tiễn Quan Trọng:

  • Nvidia duy trì chu kỳ phát hành hàng năm đầy mạnh mẽ cho các kiến trúc của mình để theo kịp sự gia tăng theo cấp số nhân về việc tạo token và sử dụng AI.
  • "Đồng thiết kế cực đoan" (Extreme co-design) bao gồm việc tối ưu hóa đồng thời trên toàn bộ hệ sinh thái nhà máy AI: mô hình, thuật toán, hệ thống, chip, mạng và phần mềm.
  • Công ty đã vượt ra khỏi việc đổi mới chip riêng lẻ để xây dựng các hệ thống AI tích hợp, toàn diện (full-stack) mang lại những cải thiện hiệu suất chưa từng có.
  • Quy mô triển khai của khách hàng (ví dụ: một gigawatt yêu cầu 500.000 GPU) và năng lực chuỗi cung ứng của Nvidia tạo ra một rào cản lớn cho các đối thủ muốn gia nhập thị trường.

Bổ Trợ Con Người: Sự Thay Đổi Kinh Tế Nghìn Tỷ Đô La

Huang cho rằng tác động thực sự dài hạn của AI nằm ở khả năng bổ trợ trí tuệ con người. Lấy một phép so sánh, ông cho rằng cũng giống như động cơ đã thay thế lao động chân tay, "những siêu máy tính AI này, những nhà máy AI mà tôi đang nói đến, chúng sẽ tạo ra các token để bổ trợ trí tuệ con người." Với việc trí tuệ con người chiếm có khả năng tới 50 nghìn tỷ đô la GDP toàn cầu, ngay cả một sự bổ trợ khiêm tốn – như một AI trị giá 10.000 đô la khiến một nhân viên có mức lương 100.000 đô la năng suất gấp đôi – cũng tạo ra một thị trường mới khổng lồ.

Ông tin rằng sự bổ trợ này có thể thêm "10 nghìn tỷ" vào GDP toàn cầu, đòi hỏi "5 nghìn tỷ" chi phí đầu tư hàng năm vào cơ sở hạ tầng AI. Đây không phải là một "khoảng trống" hay "sự dư thừa"; đó là một sự thay đổi cơ bản. Ông bác bỏ những lo ngại về nguồn cung vượt cầu, khẳng định rằng, "cho đến khi chúng ta chuyển đổi hoàn toàn tất cả điện toán đa năng sang điện toán tăng tốc và AI... khả năng [dư thừa] là cực kỳ thấp." Các tín hiệu nhu cầu từ khách hàng luôn đánh giá thấp nhu cầu thực tế, khiến Nvidia luôn ở trong trạng thái "phải vội vã chạy theo." "Thời kỳ Phục hưng" này đối với ngành năng lượng và toàn bộ hệ sinh thái cơ sở hạ tầng biểu thị sự tăng tốc GDP toàn cầu, được thúc đẩy bởi hàng tỷ "đồng nghiệp" AI mới.

Những Điểm Chính:

  • Tác động kinh tế chính của AI sẽ là bổ trợ trí tuệ con người, dẫn đến sự tăng tốc tăng trưởng GDP toàn cầu.
  • Sự chuyển đổi từ điện toán đa năng sang điện toán tăng tốc/AI, kết hợp với việc di chuyển các khối lượng công việc hyperscale hiện có sang AI, đảm bảo nhu cầu liên tục.
  • Chuỗi cung ứng của Nvidia được thúc đẩy bởi nhu cầu, luôn phản ứng với các dự báo của khách hàng vốn thường xuyên đánh giá thấp nhu cầu tính toán thực tế.

"Điều hối tiếc duy nhất của tôi là họ đã mời chúng tôi đầu tư từ sớm... và chúng tôi đã quá nghèo, bạn biết đấy, chúng tôi đã quá nghèo nên không đầu tư đủ, bạn biết đấy, và lẽ ra tôi nên dốc hết tiền của mình cho họ." - Jensen Huang