பேட்டி Alexandr Wang
Founder and CEO @ Scale.ai
மூலம் 20VC with Harry Stebbings • 2024-06-12

ஹாரி ஸ்டெப்பிங்ஸுடன் 20VC-யில் ஒரு கவர்ச்சிகரமான மற்றும் வெளிப்படையான உரையாடலில், Scale AI-யின் CEO ஆன அலெக்சாண்டர் வாங், தற்போதைய AI உலகின் பல அடுக்குகளைப் பிரித்துப் பார்த்தார், வழக்கமான நம்பிக்கைகளை சவால் செய்தார் மற்றும் அடுத்த தலைமுறை மாதிரிச் செயல்திறனுக்கான உண்மையான முட்டுக்கட்டையை வெளிச்சம் போட்டுக் காட்டினார். உலகம் compute-ஐ மட்டுமே கருதும் வேளையில், உண்மையான போட்டி — மற்றும் சாத்தியமான வேறுபடுத்தும் காரணி — சிலிக்கனில் இல்லை, தரவில்தான் உள்ளது என்று வாங் வாதிடுகிறார்.
தரவுச் சுவர்: compute ஏன் இனி போதுமானதல்ல?
நேர்காணல் நேரடியாக ஒரு தூண்டும் கேள்வியுடன் தொடங்கியது: AI மாதிரி செயல்திறனில் குறைந்து வரும் பலன்களை நாம் காண்கிறோமா, அதாவது அதிக compute இனி சிறந்த முடிவுகளுக்கு உத்தரவாதம் அளிப்பதில்லையா? வாங் ஒரு அழுத்தமான "ஆம்" என்று பதிலளித்தார். 2022 இன் பிற்பகுதியிலிருந்து Nvidia GPU செலவினங்களில் (காலாண்டுக்கு $5 பில்லியனில் இருந்து $20 பில்லியனுக்கும் மேல்) அபரிமிதமான அதிகரிப்பு இருந்தபோதிலும், இந்த பெரிய compute வளர்ச்சிக்கு முந்தைய GPT-4 ஐ விட "பிரமிக்க வைக்கும் சிறந்த" அடிப்படை மாதிரியை நாம் காணவில்லை என்று அவர் சுட்டிக்காட்டினார்.
AI முன்னேற்றம் மூன்று தூண்களின் மீது நிற்கிறது என்று வாங் விளக்கினார்: compute, அல்காரிதம்கள் மற்றும் தரவு. compute வியத்தகு அளவில் வளர்ந்தாலும், மற்ற இரண்டும் வேகத்திற்கு ஈடுகொடுக்கவில்லை. முக்கியமாக, இந்தத் துறை ஒரு "தரவுச் சுவரை" அடைந்துள்ளது என்று அவர் நம்புகிறார். "எளிதான தரவு" – திறந்த இணையத்தில் எளிதாகக் கிடைக்கும் அனைத்தும், பொதுவான க்ரால்கள் அல்லது டாரன்ட்களில் இருந்து சேகரிக்கப்பட்டவை – பெரும்பாலும் பயன்படுத்தப்பட்டுவிட்டன. இந்த மாதிரிகள் இப்போது "இணையத்தைப் பின்பற்றுவதில் மிகச்சிறந்தவை", ஆனால் உண்மையான AGI அல்லது பயனுள்ள AI ஏஜென்ட்களுக்குத் தேவையான சிக்கலான பணிகள் மற்றும் பகுத்தறிதலுக்கு இது போதாது.
முக்கிய நுண்ணறிவுகள்:
- AI முன்னேற்றம் compute, தரவு மற்றும் அல்காரிதம்கள் ஒரே நேரத்தில் முன்னேறுவதை சார்ந்துள்ளது.
- GPT-4-க்கு பிந்தைய compute-இல் செய்யப்பட்ட பெரிய முதலீடுகள், அடிப்படை மாதிரி செயல்திறனில் ஒப்பிடக்கூடிய முன்னேற்றங்களை அளிக்கவில்லை.
- இந்தத் துறை "எளிதான தரவுகளை" (இணையத் தரவு) பெரும்பாலும் பயன்படுத்திவிட்டது, இது செயல்திறனில் ஒரு தேக்கநிலைக்கு வழிவகுக்கிறது.
புதிய எல்லையை உருவாக்குதல்: தரவு செழிப்பை வளர்த்தல்
இந்த தரவுச் சுவரைத் தாண்ட, வாங் "ஃபிரன்டியர் தரவு" என்ற கருத்தை அறிமுகப்படுத்தினார். இன்றைய பொருளாதாரத்திற்கு சக்தியளிக்கும் சிக்கலான பகுத்தறிதல் மற்றும் சிக்கல் தீர்க்கும் திறன்களில் பெரும்பாலானவை – ஒரு மோசடி பகுப்பாய்வாளரின் ஊகிக்கக்கூடிய செயல்முறை போன்றது – இணையத்தில் எழுதப்படுவதில்லை என்று அவர் வலியுறுத்தினார். இதன் பொருள் இணையத் தரவில் மட்டுமே பயிற்சி பெற்ற மாதிரிகள் இந்த ஆழமான மனித நுண்ணறிவில் இருந்து கற்றுக்கொள்ளும் திறனைக் கொண்டிருக்கவில்லை.
அப்படியானால், இந்த பிடிபடாத ஃபிரன்டியர் தரவை நாம் எப்படிப் பெறுவது? வாங் இரண்டு முக்கிய வழிகளை கோடிட்டுக் காட்டினார். முதலாவதாக, நிறுவனங்களுக்குள் பூட்டப்பட்டிருக்கும் தனியுரிமத் தரவுகளின் பெரும் புதையல் உள்ளது. GPT-4-ன் ஒரு பெட்டாபைட்டுக்கும் குறைவான இணையத் தரவுத் தொகுப்பைப் புறக்கணிக்கும் JPMorgan-ன் 150 பெட்டாபைட் உள் தரவுகளை அவர் மேற்கோள் காட்டினார். இந்தத் தரவு, இருப்பினும், மிகவும் உணர்திறன் வாய்ந்தது மற்றும் நிறுவனங்கள் தங்கள் சொந்த AI அமைப்புகளுக்காக அதைத் தோண்டி எடுத்து செம்மைப்படுத்த வேண்டும், அநேகமாக on-prem அல்லது வெளிப்பயன்பாட்டிற்கு எதிரான வலுவான உத்தரவாதங்களுடன். இரண்டாவதாக, மற்றும் பொதுவான முன்னேற்றங்களுக்கு மிகவும் முக்கியமானது, "முன்னோக்கிய தரவு உருவாக்கம்" ஆகும். இது இருக்கும் தரவைச் சேகரிப்பது மட்டுமல்ல, புதிய, மிகவும் சிக்கலான தரவை உருவாக்குவதையும் உள்ளடக்கியது. இதில் ஒரு "மனித-செயற்கை கலப்பின செயல்முறை" (human-synthetic hybrid process) அடங்கும், அங்கு AI தரவை உருவாக்குகிறது, மேலும் மனித வல்லுநர்கள் "பாதுகாப்பு ஓட்டுநர்கள்" (safety drivers) போல செயல்பட்டு, AI-க்கு வழிகாட்டுகிறார்கள், பிழைகளைத் திருத்துகிறார்கள், மற்றும் மாதிரிகள் தடுமாறும் போது முக்கியமான உள்ளீடுகளை வழங்குகிறார்கள். இந்த "AI பயிற்சியாளர்கள்" (AI trainers) அல்லது "பங்களிப்பாளர்கள்" (contributors) சமூக தாக்கத்திற்கான மிக உயர்ந்த செல்வாக்கு மிக்க வேலைகளில் சிலவற்றை வகிக்கிறார்கள் என்று வாங் கருதுகிறார். "ஒரு மனித வல்லுநராக," அவர் குறிப்பிட்டார், "இந்த மாதிரிகளை மேம்படுத்த உதவும் தரவுகளை உருவாக்குவதன் மூலம் சமூக அளவில் தாக்கத்தை ஏற்படுத்த உங்களுக்குத் திறன் உள்ளது."
முக்கிய மாற்றங்கள்:
- எளிதாகக் கிடைக்கும் "எளிதான தரவிலிருந்து" "ஃபிரன்டியர் தரவு" க்கு மாறுவது மேம்பட்ட AI-க்கு அவசியம்.
- ஃபிரன்டியர் தரவு சிக்கலான பகுத்தறிவு சங்கிலிகள், கருவிப் பயன்பாடு மற்றும் திறந்த இணையத்தில் காணப்படாத முகவர் நடத்தைகளை உள்ளடக்கியது.
- தனியுரிம நிறுவனத் தரவுகளைக் கண்டுபிடிப்பதன் மூலமும், புதிய, உயர்தரத் தரவுகளைச் செயல்படுத்துவதன் மூலமும் தரவு செழிப்பு அடையப்படும்.
- தன்னாட்சி வாகனப் பாதுகாப்பு ஓட்டுநர்களைப் போல, செயற்கை தரவுகளை உருவாக்குவதில் AI அமைப்புகளுக்கு வழிகாட்டவும், சரிசெய்யவும் புதிய மனிதப் பாத்திரங்கள் உருவாகும்.
புவிசார் அரசியல் தரவுப் போட்டி: ஒரு புதிய பனிப்போர்?
இந்த உரையாடல் AI-யின் ஆழமான புவிசார் அரசியல் தாக்கங்களை நோக்கித் திரும்பியது, இது குறைவாக விவாதிக்கப்படும் ஒரு தலைப்பு என்று வாங் நம்புகிறார். அவர் வெளிப்படையாகக் கூறினார், "அதன் மையத்தில், இந்த AI தொழில்நுட்பம் மனிதகுலம் இதுவரை கண்டிராத மிகச்சிறந்த இராணுவச் சொத்துக்களில் ஒன்றாக இருக்கக்கூடிய சாத்தியக்கூறுகளைக் கொண்டுள்ளது, அணு ஆயுதங்களை விடவும் ஒரு இராணுவச் சொத்தாக இருக்கலாம்." AGI கொண்ட ஒரு சர்வாதிகார ஆட்சி அது இல்லாத ஒரு நாட்டை வெல்ல முடியும் என்ற ஒரு திகிலூட்டும் காட்சியையும் அவர் விளக்கினார்.
சீனாவின் விரைவான AI முன்னேற்றம் குறித்து வாங் குறிப்பிடத்தக்க கவலையை வெளிப்படுத்தினார். இரண்டு ஆண்டுகளுக்கு முன்பு அவர்கள் GPT-4 இன் திறன்களுக்கு "அருகில் கூட இல்லை" என்றாலும், 0101 இலிருந்து Yi-Large என்ற சமீபத்திய சீன மாதிரி, இப்போது GPT-4o, Gemini மற்றும் Claude 3 Opus க்குப் பின்னால், உலகின் சிறந்தவற்றுள் ஒன்றாக தரவரிசைப்படுத்தப்பட்டுள்ளது. முக்கியமான தொழில்களை முன்னேற்ற "மிகவும் ஆக்ரோஷமான மையப்படுத்தப்பட்ட நடவடிக்கை மற்றும் மையப்படுத்தப்பட்ட தொழில்துறை கொள்கையை" செயல்படுத்த CCP இன் அசாதாரண திறனே இதற்குக் காரணம் என்று அவர் கூறினார். சூரிய ஆற்றல் மற்றும் EVs-இல் காணப்பட்ட இந்த முறை, சீனா "நமக்கு முன்னால் விரைந்து ஓடி வெற்றிபெற ஒரு தெளிவான வாய்ப்பு உள்ளது" என்று காட்டுகிறது. இதை கருத்தில் கொண்டு, "ஒரு பிளவு உருவாக வேண்டும்" என்று வாங் நம்புகிறார்: அதிநவீன, உண்மையிலேயே சக்திவாய்ந்த AI அமைப்புகள் இராணுவ மற்றும் புவிசார் அரசியல் காரணங்களுக்காக மூடப்பட்டிருக்க வேண்டும், அதேசமயம் குறைவான மேம்பட்ட, திறந்த மாதிரிகள் பொருளாதார மதிப்பைத் தொடர்ந்து செலுத்த முடியும்.
முக்கிய படிப்பினைகள்:
- AI, குறிப்பாக AGI, மனிதகுலத்தின் மிகவும் சக்திவாய்ந்த இராணுவச் சொத்தாக இருக்கலாம், இது ஆழமான புவிசார் அரசியல் விளைவுகளைக் கொண்டது.
- சீனாவின் மையப்படுத்தப்பட்ட தொழில்துறை கொள்கை விரைவான AI முன்னேற்றத்தை செயல்படுத்துகிறது, மேற்கத்திய திறன்களுடன் உள்ள இடைவெளியை விரைவாக குறைக்கிறது.
- திறந்த மற்றும் மூடிய AI அமைப்புகளுக்கு இடையே ஒரு மூலோபாய வேறுபாடு முக்கியமானது: பாதுகாப்பு காரணங்களுக்காக அதிநவீன மாதிரிகள் மூடப்பட வேண்டும், அதேசமயம் குறைவான சக்திவாய்ந்த மாதிரிகள் பரந்த பொருளாதார நன்மைக்காக திறந்திருக்கலாம்.
போட்டியை மறுவரையறை செய்தல்: தரவுவே இறுதிப் பாதுகாப்பு அரண்
அடித்தள மாதிரிகளின் மிகவும் போட்டி நிறைந்த உலகில், தரவுவே இறுதி வேறுபடுத்தும் காரணியாக இருக்கும் என்று வாங் உறுதியாக நம்புகிறார். அல்காரிதம்கள் இறுதியில் தலைகீழாக மாற்றப்படலாம் அல்லது பொதுவான அறிவாக மாறலாம், மற்றும் compute-ஐ எளிதாக வாங்க முடியும் என்று அவர் கோடிட்டுக் காட்டினார். "தரவுவே ஒரு சில துறைகளில் ஒன்றாகும்," என்று அவர் வலியுறுத்தினார், "அங்கு நீங்கள் உண்மையில் ஒரு நீண்ட கால நீடித்த போட்டி நன்மையை உருவாக்க முடியும்." Open AI-ன் Financial Times மற்றும் Axel Springer உடனான கூட்டாண்மைகளை இந்த மாற்றத்தின் ஆரம்ப குறிகாட்டிகளாக அவர் மேற்கோள் காட்டினார்.
AI தலைவர்கள் தங்கள் GPU எண்ணிக்கையைப் பற்றிப் பெருமை பேச மாட்டார்கள், ஆனால் "எந்தத் தரவை அவர்கள் அணுகுகிறார்கள் மற்றும் வெவ்வேறு தரவு மூலங்களுக்கான அவர்களின் தனித்துவமான உரிமைகள் என்ன" என்று ஒரு எதிர்காலத்தை வாங் தைரியமாக கணித்தார். தனித்துவமான, தனியுரிமத் தரவுகளுக்கு இந்த முக்கியத்துவம் சந்தை வேறுபாட்டை ஏற்படுத்தும். மேலும், Palantir-ன் ஆரம்பகால அணுகுமுறையை நினைவூட்டும் வகையில், "மதிலிடப்பட்ட தோட்டம்" (walled garden) SaaS-இல் இருந்து நிறுவனங்களுக்கான மிகவும் தனிப்பயனாக்கப்பட்ட, குறிப்பிட்ட நோக்கத்திற்காக உருவாக்கப்பட்ட பயன்பாடுகளுக்கு மாறுவதன் மூலம் மென்பொருளில் குறிப்பிடத்தக்க மாற்றத்தை அவர் எதிர்பார்க்கிறார். AI மென்பொருள் உருவாக்கும் செலவுகளை வியத்தகு முறையில் குறைப்பதன் மூலம் இது உந்தப்படும், இது தனிப்பயனாக்கப்பட்ட மென்பொருள் தீர்வுகளின் புதிய சகாப்தத்திற்கு வழிவகுக்கும். இதன் விளைவாக, நீண்டகாலமாக இருக்கும் ஒரு-இடத்திற்கு (per-seat) விலை நிர்ணய முறை நுகர்வு அடிப்படையிலான (consumption-based) விலைக்கு வழிவகுக்கும், இது மனித ஊழியர்கள் மற்றும் AI ஏஜென்ட்கள் இருவராலும் செய்யப்படும் வேலையை பிரதிபலிக்கிறது.
முக்கிய நுண்ணறிவுகள்:
- அடித்தள மாதிரிப் போட்டியில் தரவு முதன்மையான மற்றும் மிகவும் நீடித்த போட்டி நன்மையாக உருவாகி வருகிறது.
- எதிர்காலப் போட்டி தனியுரிமத் தரவு அணுகல், உரிமை மற்றும் தனித்துவமான தரவுத்தொகுப்புகளை உருவாக்கும் திறனைச் சுற்றியே இருக்கும்.
- மென்பொருள் உருவாக்கத்தின் வணிகமயமாக்கல், பொதுவான SaaS-க்கு அப்பால், நிறுவனங்களுக்கான தனிப்பயனாக்கப்பட்ட பயன்பாடுகளுக்கு வழிவகுக்கும்.
- மென்பொருள் விலை நிர்ணய மாதிரிகள் ஒரு-இடத்திலிருந்து நுகர்வு அடிப்படையிலானதாக மாறும், இது மனிதர்கள் மற்றும் AI ஏஜென்ட்களால் வழங்கப்படும் மதிப்புடன் ஒத்துப்போகும்.
சத்தமான உலகத்தில் வழிநடத்துதல்: நேரடி சேனல்கள் மற்றும் நம்பிக்கை
நிறுவனத்தை உருவாக்குவது குறித்து மாறிப் பேசும்போது, வாங் மக்கள் தொடர்புகளுக்கான அவரது வழக்கத்திற்கு மாறான அணுகுமுறையைப் பகிர்ந்து கொண்டார்: "சிறந்த PR என்பது PR இல்லாததுதான்." பெரும்பாலும் கிளிக்குகளால் உந்தப்படும் பாரம்பரிய ஊடகங்கள், செய்திகளை பரபரப்பாக்கி திரித்து வெளியிடுகின்றன என்றும், ஈடுபாட்டிற்காக நிறுவனங்களை உயர்த்திப் பேசுவதும், இழிவாகப் பேசுவதும் உண்டு என்றும் அவர் வாதிட்டார். அவர் ஒரு ஆச்சரியமான தனிப்பட்ட அனுபவத்தை வெளிப்படுத்தினார்: "பல ஆண்டுகளாக பல்வேறு ஊடக நிறுவனங்களிடமிருந்து கிடைத்ததை விட, காங்கிரஸில் சாட்சியமளித்தபோது எனக்கு அதிக நியாயமான சிகிச்சை கிடைத்தது."
இந்த கண்ணோட்டம் Scale AI-யை பாட்காஸ்ட்கள் மற்றும் நிறுவன வலைப்பதிவுகள் போன்ற நேரடி சேனல்களுக்கு முன்னுரிமை அளிக்க வழிவகுத்தது, அங்கு அவர்கள் தங்கள் செய்தியை உண்மையாக, எந்த மாற்றமும் இல்லாமல் கடத்த முடியும். அவர்களின் கதைக்கான இந்த உரிமை அவர்களின் கதை "தூய்மையானது" மற்றும் கலப்படம் இல்லாதது என்பதை உறுதி செய்கிறது, இது அவர்களின் பார்வையாளர்களிடம் நம்பிக்கை மற்றும் தெளிவை வளர்க்கிறது.
முக்கிய நடைமுறைகள்:
- பரபரப்பைத் தவிர்ப்பதற்கும், கதையின் திரிபுகளைத் தவிர்ப்பதற்கும் "PR இல்லை" அல்லது பாரம்பரிய ஊடகங்களுடன் குறைந்தபட்ச ஈடுபாடு என்ற உத்தியைக் கடைப்பிடிக்கவும்.
- உண்மையான மற்றும் மாற்றப்படாத செய்தி பரிமாற்றத்திற்கு நேரடி தொடர்பு சேனல்களுக்கு (பாட்காஸ்ட்கள், நிறுவன உள்ளடக்கம்) முன்னுரிமை அளிக்கவும்.
- நிறுவனர் மற்றும் நிறுவனங்கள் பெருகிவரும் சத்தமான தகவல் உலகில் தங்கள் கதையைச் சுறுசுறுப்பாக சொந்தமாக்கிக் கொண்டு நிர்வகிக்க வேண்டும்.
"அதன் மையத்தில், இந்த AI தொழில்நுட்பம் மனிதகுலம் இதுவரை கண்டிராத மிகச்சிறந்த இராணுவச் சொத்துக்களில் ஒன்றாக இருக்கக்கூடிய சாத்தியக்கூறுகளைக் கொண்டுள்ளது, அணு ஆயுதங்களை விடவும் ஒரு இராணுவச் சொத்தாக இருக்கலாம்." - அலெக்சாண்டர் வாங்


