Entrevista com Alexandr Wang
Founder and CEO @ Scale.ai
por 20VC with Harry Stebbings • 2024-06-12

Em uma conversa cativante e franca com Harry Stebbings no 20VC, Alexandr Wang, CEO da Scale AI, dissecou as camadas do cenário atual da IA, desafiando a sabedoria convencional e destacando o verdadeiro gargalo no desempenho dos modelos de próxima geração. Enquanto o mundo se obceca com o poder de processamento, Wang argumenta que a verdadeira corrida – e o potencial diferencial – não está no silício, mas nos dados.
A Barreira dos Dados: Por Que o Poder de Processamento Não É Mais Suficiente
A entrevista mergulhou direto em uma pergunta provocadora: estamos vendo retornos decrescentes no desempenho dos modelos de IA, onde mais poder de processamento não garante mais resultados melhores? A resposta de Wang foi um "sim" retumbante. Ele apontou que, apesar de um aumento exponencial nos gastos com GPUs da Nvidia desde o final de 2022 (de US$ 5 bilhões para mais de US$ 20 bilhões por trimestre), não vimos um modelo base "assombrosamente melhor" do que o GPT-4, que antecede este ponto de inflexão massivo no poder de processamento.
Wang explicou que o progresso da IA assenta em três pilares: poder de processamento, algoritmos e dados. Enquanto o poder de processamento escalou dramaticamente, os outros dois não acompanharam o ritmo. Crucialmente, ele acredita que a indústria atingiu uma "barreira de dados". Os "dados fáceis" – tudo o que está prontamente disponível na internet aberta, raspado de rastreadores comuns ou torrents – foi em grande parte consumido. Esses modelos agora são "excepcionalmente bons em emular a internet", mas isso não é suficiente para as tarefas complexas e o raciocínio exigidos para uma verdadeira AGI ou agentes de IA eficazes.
Principais Insights:
- O progresso da IA depende do poder de processamento, dos dados e dos algoritmos avançando em conjunto.
- Investimentos massivos em poder de processamento pós-GPT-4 não produziram saltos proporcionais no desempenho do modelo base.
- A indústria esgotou em grande parte os "dados fáceis" (dados da internet), levando a um platô de desempenho.
Forjando a Fronteira: Cultivando a Abundância de Dados
Para superar esta barreira de dados, Wang introduziu o conceito de "dados de Fronteira". Ele destacou que grande parte do raciocínio complexo e da resolução de problemas que impulsionam a economia atual – como o processo dedutivo de um analista de fraude – não é documentado online. Isso significa que os modelos treinados exclusivamente com dados da internet carecem da capacidade de aprender com esta inteligência humana mais profunda.
Então, como capturamos esses dados de Fronteira esquivos? Wang delineou duas vias principais. Primeiro, há um tesouro colossal de dados proprietários trancados dentro das empresas. Ele citou os 150 petabytes de dados internos do JPMorgan, eclipsando o conjunto de dados da internet do GPT-4, que é inferior a um petabyte. Esses dados, no entanto, são altamente sensíveis e exigiriam que as empresas os minerem e refinem para seus próprios sistemas de IA, provavelmente on-premise ou com fortes garantias contra uso externo. Em segundo lugar, e mais criticamente para avanços generalizados, está a "produção avançada de dados". Isso não é apenas sobre coletar dados existentes, mas criar dados novos e altamente complexos. Isso envolve um "processo híbrido humano-sintético" onde a IA gera dados, e especialistas humanos atuam como "condutores de segurança", guiando a IA, corrigindo erros e fornecendo informações cruciais quando os modelos travam. Wang vê esses "treinadores de IA" ou "contribuidores" como ocupando alguns dos cargos de maior alavancagem para o impacto social. "Como um especialista humano", ele observou, "você tem a capacidade de ter um impacto em toda a sociedade, produzindo dados para ajudar a melhorar esses modelos."
Principais Mudanças:
- A transição de "dados fáceis" prontamente disponíveis para "dados de Fronteira" é essencial para a IA avançada.
- Dados de Fronteira abrangem cadeias de raciocínio complexas, uso de ferramentas e comportamento de agente não encontrados na internet aberta.
- A abundância de dados será alcançada através da mineração de dados proprietários de empresas e da produção ativa de novos dados de alta qualidade.
- Novos papéis humanos surgirão para guiar e corrigir sistemas de IA na geração de dados sintéticos, semelhantes aos condutores de segurança de veículos autônomos.
A Corrida Geopolítica por Dados: Uma Nova Guerra Fria?
A conversa tomou um rumo em direção às profundas implicações geopolíticas da IA, um tópico que Wang acredita ser pouco discutido. Ele afirmou categoricamente: "Em sua essência, esta tecnologia de IA tem o potencial de ser um dos maiores ativos militares que a Humanidade já viu, potencialmente até mais um ativo militar do que as armas nucleares." Ele pintou um cenário arrepiante onde um regime totalitário com AGI poderia conquistar uma nação sem ela.
Wang expressou preocupação significativa com o rápido progresso da IA da China. Embora há dois anos eles pudessem estar "nem perto" das capacidades do GPT-4, um modelo chinês recente, Yi-Large da 0101, está agora classificado entre os melhores do mundo, logo atrás do GPT-4o, Gemini e Claude 3 Opus. Ele atribuiu isso à excepcional capacidade do PCC de implementar "ações centralizadas muito agressivas e uma política industrial centralizada para impulsionar indústrias críticas". Este padrão, visto em energia solar e veículos elétricos, sugere que a China tem "uma chance clara de avançar e nos ultrapassar". Diante disso, Wang acredita que há uma "dicotomia que deve surgir": sistemas de IA de ponta e verdadeiramente poderosos devem ser mantidos fechados por razões militares e geopolíticas, enquanto modelos abertos menos avançados podem continuar a gerar valor econômico.
Principais Aprendizados:
- A IA, particularmente a AGI, pode ser o ativo militar mais potente da humanidade, com profundas consequências geopolíticas.
- A política industrial centralizada da China permite um rápido avanço da IA, fechando rapidamente a lacuna com as capacidades ocidentais.
- Uma distinção estratégica entre sistemas de IA abertos e fechados é crítica: modelos de ponta podem precisar ser fechados por segurança, enquanto os menos poderosos podem permanecer abertos para um amplo benefício econômico.
Redefinindo a Competição: Dados Como o Fosso Defensivo Final
No mundo ferozmente competitivo dos modelos de base, Wang acredita firmemente que os dados serão o diferencial definitivo. Ele delineou que algoritmos podem eventualmente ser submetidos à engenharia reversa ou se tornar conhecimento comum, e o poder de processamento pode simplesmente ser comprado. "Dados são uma das poucas áreas", ele afirmou, "onde você pode realmente produzir uma vantagem competitiva sustentável de longo prazo." Ele citou as parcerias da OpenAI com o Financial Times e a Axel Springer como indicadores iniciais dessa mudança.
Wang previu ousadamente um futuro onde os líderes de IA não se gabarão de sua contagem de GPUs, mas "a quais dados eles têm acesso e quais são seus direitos exclusivos a diferentes fontes de dados". Essa ênfase em dados únicos e proprietários impulsionará a diferenciação de mercado. Além disso, ele antecipa uma mudança significativa no software, afastando-se de SaaS de "jardim murado" para aplicativos altamente personalizados e desenvolvidos sob medida para empresas, lembrando a abordagem inicial da Palantir. Isso será impulsionado pela IA que reduz drasticamente os custos de criação de software, levando a uma nova era de soluções de software personalizadas. Consequentemente, o modelo de precificação de longa data por licença (per-seat) provavelmente dará lugar à precificação baseada no consumo, refletindo o trabalho realizado tanto por funcionários humanos quanto por agentes de IA.
Principais Insights:
- Dados estão emergindo como a principal e mais duradoura vantagem competitiva na corrida dos modelos de base.
- A futura competição girará em torno do acesso a dados proprietários, propriedade e a capacidade de produzir conjuntos de dados únicos.
- A comoditização da criação de software levará a aplicações personalizadas e sob medida para empresas, indo além do SaaS genérico.
- Os modelos de precificação de software evoluirão de por licença para baseados no consumo, alinhando-se com o valor entregue tanto por humanos quanto por agentes de IA.
Navegando o Ruído: Canais Diretos e Confiança
Mudando de assunto para a construção de empresas, Wang compartilhou sua abordagem não convencional às relações públicas: "a melhor RP é nenhuma RP". Ele argumentou que a mídia tradicional, frequentemente impulsionada por cliques, tende a sensacionalizar e distorcer narrativas, construindo e derrubando empresas por engajamento. Ele revelou uma surpreendente experiência pessoal: "Recebi um tratamento mais justo testemunhando perante o Congresso do que de várias mídias ao longo dos anos."
Essa perspectiva levou a Scale AI a priorizar canais diretos, como podcasts e blogs da empresa, onde podem transmitir sua mensagem de forma autêntica e sem alteração. Essa propriedade de sua narrativa garante que sua história seja "a mais pura" e incontaminada, promovendo confiança e clareza com seu público.
Principais Práticas:
- Adotar uma estratégia de "nenhuma RP" ou engajamento mínimo com a mídia tradicional para evitar sensacionalismo e distorção narrativa.
- Priorizar canais de comunicação diretos (podcasts, conteúdo da empresa) para mensagens autênticas e inalteradas.
- Fundadores e empresas devem ativamente possuir e gerenciar sua narrativa em um cenário de informações cada vez mais ruidoso.
"Em sua essência, esta tecnologia de IA tem o potencial de ser um dos maiores ativos militares que a Humanidade já viu, potencialmente até mais um ativo militar do que as armas nucleares." - Alexandr Wang


