Интервью с Alexandr Wang
Founder and CEO @ Scale.ai
от 20VC with Harry Stebbings • 2024-06-12

В увлекательной и откровенной беседе с Гарри Стеббингсом на 20VC Александр Ванг, CEO Scale AI, пролил свет на текущую ситуацию в области ИИ, бросая вызов общепринятым представлениям и выделяя истинное узкое место в производительности моделей нового поколения. В то время как мир одержим вычислительными мощностями, Ванг утверждает, что настоящая гонка — и потенциальное конкурентное преимущество — заключается не в кремнии, а в данных.
Стена данных: почему вычислительных мощностей уже недостаточно
Интервью сразу перешло к провокационному вопросу: наблюдаем ли мы убывающую отдачу в производительности моделей ИИ, когда большее количество вычислительных мощностей больше не гарантирует лучших результатов? Ответ Ванга был громким "да". Он отметил, что, несмотря на экспоненциальный рост расходов на Nvidia GPU с конца 2022 года (с 5 миллиардов долларов до более чем 20 миллиардов долларов в квартал), мы не видели "кардинально лучшей" базовой модели, чем GPT-4, которая предшествует этому массивному скачку в вычислительных мощностях.
Ванг объяснил, что прогресс ИИ основывается на трех столпах: вычислительные мощности, алгоритмы и данные. В то время как вычислительные мощности значительно масштабировались, два других не успевали за ними. Что крайне важно, он считает, что индустрия столкнулась со "стеной данных". "Легкодоступные данные" — все, что легко доступно в открытом интернете, собранное с общих веб-обходов или торрентов — были в значительной степени исчерпаны. Эти модели теперь "исключительно хорошо эмулируют интернет", но этого недостаточно для сложных задач и рассуждений, необходимых для истинного AGI или эффективных ИИ-агентов.
Ключевые выводы:
- Прогресс ИИ зависит от одновременного развития вычислительных мощностей, данных и алгоритмов.
- Масштабные инвестиции в вычислительные мощности после GPT-4 не привели к соразмерным скачкам в производительности базовых моделей.
- Индустрия в значительной степени исчерпала "легкодоступные данные" (интернет-данные), что привело к плато в производительности.
Освоение нового рубежа: создание изобилия данных
Чтобы преодолеть эту стену данных, Ванг представил концепцию "данных передового рубежа" (Frontier data). Он подчеркнул, что большая часть сложного рассуждения и решения проблем, которые движут современной экономикой – например, дедуктивный процесс аналитика по борьбе с мошенничеством – не фиксируются онлайн. Это означает, что модели, обученные исключительно на интернет-данных, не способны учиться на основе этого более глубокого человеческого интеллекта.
Итак, как же получить эти неуловимые данные "передового рубежа"? Ванг выделил два основных пути. Во-первых, существует колоссальный объем проприетарных данных, хранящихся внутри предприятий. Он привел в пример 150 петабайт внутренних данных JPMorgan, что затмевает интернет-набор данных GPT-4 объемом менее одного петабайта. Однако эти данные очень конфиденциальны и потребуют от предприятий их добычи и совершенствования для собственных систем ИИ, вероятно, локально или с твердыми гарантиями против внешнего использования. Во-вторых, и что более важно для обобщенных прорывов, это "упреждающее производство данных". Речь идет не просто о сборе существующих данных, а о создании новых, высокосложных данных. Это включает "гибридный человеко-синтетический процесс", в котором ИИ генерирует данные, а эксперты-люди выступают в роли "водителей безопасности", направляя ИИ, исправляя ошибки и предоставляя критически важные входные данные, когда модели заходят в тупик. Ванг считает, что эти "тренеры ИИ" или "участники" занимают одни из самых влиятельных позиций с точки зрения общественного воздействия. "Как эксперт-человек, – отметил он, – вы способны оказать общенациональное влияние, производя данные для улучшения этих моделей".
Ключевые изменения:
- Переход от легкодоступных "легких данных" к данным "передового рубежа" имеет решающее значение для развития ИИ.
- Данные "передового рубежа" включают сложные цепочки рассуждений, использование инструментов и агентное поведение, не встречающиеся в открытом интернете.
- Изобилие данных будет достигнуто за счет добычи проприетарных корпоративных данных и активного производства новых, высококачественных данных.
- Появятся новые человеческие роли для направления и корректировки систем ИИ при генерации синтетических данных, подобно водителям безопасности автономных транспортных средств.
Геополитическая гонка за данные: новая холодная война?
Разговор перешел к глубоким геополитическим последствиям ИИ — теме, которая, по мнению Ванга, недостаточно обсуждается. Он четко обозначил: "По своей сути, эта технология ИИ может стать одним из величайших военных активов, которые когда-либо видело человечество, потенциально даже большим военным активом, чем ядерное оружие". Он нарисовал пугающий сценарий, когда тоталитарный режим с AGI мог бы завоевать нацию без него.
Ванг выразил серьезную обеспокоенность по поводу быстрого прогресса Китая в области ИИ. Если два года назад они "даже близко не подходили" к возможностям GPT-4, то недавняя китайская модель Yi-Large от 0101 теперь входит в число лучших в мире, сразу за GPT-4o, Gemini и Claude 3 Opus. Он объяснил это исключительной способностью КПК реализовывать "очень агрессивные централизованные действия и централизованную промышленную политику для продвижения критически важных отраслей". Эта модель, наблюдаемая в солнечной энергетике и электромобилях, предполагает, что у Китая есть "явный шанс обогнать нас и вырваться вперед". Учитывая это, Ванг считает, что должна возникнуть "дихотомия": передовые, действительно мощные системы ИИ должны оставаться закрытыми по военным и геополитическим причинам, в то время как менее продвинутые, открытые модели могут продолжать приносить экономическую ценность.
Ключевые выводы:
- ИИ, в особенности AGI, может стать самым мощным военным активом человечества, имеющим глубокие геополитические последствия.
- Централизованная промышленная политика Китая обеспечивает быстрый прогресс в области ИИ, быстро сокращая отставание от западных возможностей.
- Стратегическое различие между открытыми и закрытыми системами ИИ критически важно: передовые модели, возможно, должны быть закрыты по соображениям безопасности, в то время как менее мощные могут оставаться открытыми для широкой экономической выгоды.
Переосмысление конкуренции: данные как главный защитный барьер
В жестоко конкурентном мире фундаментальных моделей Ванг твердо убежден, что данные станут ключевым отличием. Он отметил, что алгоритмы в конечном итоге могут быть реверс-инжинирингованы или стать общеизвестными, а вычислительные мощности можно просто приобрести. "Данные — это одна из немногих областей, — утверждал он, — где вы действительно можете создать долгосрочное устойчивое конкурентное преимущество". Он привел в пример партнерство OpenAI с Financial Times и Axel Springer как ранние индикаторы этого сдвига.
Ванг смело предсказал будущее, где лидеры ИИ не будут хвастаться количеством своих GPU, а тем, "к каким данным они имеют доступ и каковы их уникальные права на различные источники данных". Этот акцент на уникальных, проприетарных данных будет стимулировать рыночную дифференциацию. Более того, он ожидает значительного сдвига в программном обеспечении, отходя от SaaS-моделей "закрытых экосистем" к высококастомизированным, специализированным приложениям для предприятий, напоминающим ранний подход Palantir. Это будет стимулировано ИИ, значительно снижающим затраты на создание программного обеспечения, что приведет к новой эре персонализированных программных решений. Как следствие, давняя модель ценообразования "за место" (per-seat), вероятно, уступит место ценообразованию на основе потребления, отражая работу, выполненную как сотрудниками-людьми, так и ИИ-агентами.
Ключевые выводы:
- Данные становятся основным и наиболее устойчивым конкурентным преимуществом в гонке фундаментальных моделей.
- Будущая конкуренция будет вращаться вокруг доступа к проприетарным данным, владения ими и способности производить уникальные наборы данных.
- Коммодификация создания программного обеспечения приведет к появлению индивидуальных, настраиваемых приложений для предприятий, выходящих за рамки общего SaaS.
- Модели ценообразования программного обеспечения будут развиваться от "за место" (per-seat) до ценообразования на основе потребления, согласуясь с ценностью, предоставляемой как людьми, так и ИИ-агентами.
Ориентирование в информационном шуме: прямые каналы и доверие
Переходя к теме построения компании, Ванг поделился своим нетрадиционным подходом к связям с общественностью: "лучший PR – это отсутствие PR". Он утверждал, что традиционные СМИ, часто гонящиеся за кликами, склонны сенсационно преувеличивать и искажать информацию, возвышая и низвергая компании ради вовлеченности. Он рассказал об удивительном личном опыте: "Я получил более справедливое отношение, выступая перед Конгрессом, чем от различных средств массовой информации за эти годы".
Эта точка зрения заставила Scale AI отдать приоритет прямым каналам, таким как подкасты и блоги компании, где они могут передавать свое сообщение аутентично и без искажений. Это владение своим нарративом гарантирует, что их история "чиста" и незапятнана, способствуя доверию и ясности в отношениях с их аудиторией.
Ключевые практики:
- Придерживаться стратегии "отсутствия PR" или минимального взаимодействия с традиционными СМИ, чтобы избежать сенсационности и искажения нарратива.
- Отдавать приоритет прямым каналам связи (подкасты, контент компании) для аутентичного и неизменного обмена сообщениями.
- Основатели и компании должны активно владеть и управлять своим нарративом в условиях все более зашумленного информационного ландшафта.
"По своей сути эта технология ИИ может стать одним из величайших военных активов, которые когда-либо видело человечество, потенциально даже большим военным активом, чем ядерное оружие." - Александр Ванг


