Mahojiano na Alexandr Wang
Founder and CEO @ Scale.ai
na 20VC with Harry Stebbings • 2024-06-12

Katika mazungumzo ya kuvutia na waziwazi na Harry Stebbings kwenye 20VC, Alexandr Wang, Mkurugenzi Mtendaji wa Scale AI, alifafanua kwa undani hali halisi ya AI kwa sasa, akipinga fikra za kawaida na kuangazia kikwazo halisi cha utendaji wa mifumo ya kizazi kijacho. Wakati ulimwengu unajali sana kuhusu uwezo wa uchakataji (compute), Wang anasema kwamba shindano halisi—na kigezo cha utofautishaji—haitegemei silicon, bali data.
Ukuta wa Data: Kwa Nini Uwezo wa Uchakataji Hautoshi Tena
Mahojiano yalianza moja kwa moja na swali la kutia shaka: Je, tunaona matokeo yanayopungua katika utendaji wa mifumo ya AI, ambapo uwezo zaidi wa uchakataji hauhakikishi tena matokeo bora? Jibu la Wang lilikuwa "ndiyo" kubwa na thabiti. Alieleza kuwa licha ya ongezeko kubwa la matumizi ya GPU za Nvidia tangu mwishoni mwa 2022 (kutoka dola bilioni 5 hadi zaidi ya dola bilioni 20 kwa robo), hatujaona mfumo wa msingi "bora kwa kiasi cha kushangaza" kuliko GPT-4, ambao ulitangulia mabadiliko haya makubwa ya uwezo wa uchakataji.
Wang alieleza kuwa maendeleo ya AI yanategemea nguzo tatu: uwezo wa uchakataji, algorithms, na data. Wakati uwezo wa uchakataji umeongezeka kwa kasi kubwa, hizo zingine mbili hazijaendana na kasi hiyo. Muhimu zaidi, anaamini sekta hiyo imefika kwenye "ukuta wa data." "Data rahisi"—kila kitu kinachopatikana kwa urahisi kwenye intaneti huria, kilichokusanywa kutoka vyanzo vya kawaida vya intaneti au torrents—kimetumika kwa kiasi kikubwa. Mifumo hii sasa ni "bora sana katika kuiga intaneti," lakini hiyo haitoshi kwa kazi ngumu na hoja zinazohitajika kwa AGI halisi au mawakala bora wa AI.
Muhtasari Muhimu:
- Maendeleo ya AI yanategemea uwezo wa uchakataji, data, na algorithms kuendelea kwa pamoja.
- Uwekezaji mkubwa katika uwezo wa uchakataji baada ya GPT-4 haujatoa maendeleo yanayolingana katika utendaji wa mifumo ya msingi.
- Sekta kwa kiasi kikubwa imemaliza "data rahisi" (data ya intaneti), na hivyo kusababisha kudorora kwa utendaji.
Kufungua Mipaka: Kukuza Utele wa Data
Ili kushinda ukuta huu wa data, Wang alianzisha dhana ya "Data ya Mipaka." Alionyesha kuwa sehemu kubwa ya hoja ngumu na utatuzi wa matatizo unaochochea uchumi wa leo – kama mchakato wa uchunguzi wa mchambuzi wa udanganyifu – haiandikwi mtandaoni. Hii inamaanisha mifumo iliyefunzwa pekee kwenye data ya intaneti hukosa uwezo wa kujifunza kutoka kwa akili hii ya kina ya binadamu.
Kwa hivyo, tunakamataka vipi data hii ya Mipaka isiyopatikana kwa urahisi? Wang alielezea njia mbili kuu. Kwanza, kuna hazina kubwa ya data ya umiliki binafsi iliyofungwa ndani ya makampuni. Alitaja data ya ndani ya JPMorgan ya petabyte 150, ikiifanya seti ya data ya intaneti ya GPT-4 isiyozidi petabyte moja kuonekana ndogo. Data hii, hata hivyo, ni nyeti sana na ingehitaji makampuni kuchimba na kuisafisha kwa mifumo yao wenyewe ya AI, pengine ndani ya kampuni (on-prem) au kwa dhamana kali dhidi ya matumizi ya nje. Pili, na muhimu zaidi kwa mafanikio ya jumla, ni "uzalishaji wa data ya mbele." Hili si tu kuhusu kukusanya data iliyopo bali kuunda data mpya, yenye utata mkubwa. Hili linahusisha "mchakato mseto wa binadamu na usanifu" ambapo AI huzalisha data, na wataalamu wa kibinadamu hufanya kazi kama "madereva wa usalama," wakiiongoza AI, wakirekebisha makosa, na kutoa mchango muhimu wakati mifumo inapokwama. Wang anawaona "wakufunzi wa AI" hawa au "wachangiaji" kama wenye baadhi ya kazi zenye ushawishi mkubwa zaidi kwa athari ya kijamii. "Kama mtaalamu wa kibinadamu," alibainisha, "una uwezo wa kuwa na athari ya kijamii nzima kwa kuzalisha data ili kusaidia kuboresha mifumo hii."
Mabadiliko Muhimu:
- Mpito kutoka "data rahisi" inayopatikana kwa urahisi hadi "Data ya Mipaka" ni muhimu kwa AI ya hali ya juu.
- Data ya Mipaka inajumuisha minyororo changamano ya hoja, matumizi ya zana, na tabia ya uwakala ambayo haipatikani kwenye intaneti huria.
- Utele wa data utapatikana kupitia uchimbaji wa data ya umiliki wa makampuni na uzalishaji hai wa data mpya, yenye ubora wa juu.
- Majukumu mapya ya kibinadamu yataibuka kuongoza na kurekebisha mifumo ya AI katika kuzalisha data usanifu, kama vile madereva wa usalama wa magari yanayojiendesha.
Mbio za Data za Kijiografia na Kisiasa: Vita Baridi Mpya?
Mazungumzo yaliangazia athari kubwa za kijiografia na kisiasa za AI, mada ambayo Wang anaamini haijajadiliwa vya kutosha. Alieleza waziwazi, "Katika msingi wake teknolojia hii ya AI ina uwezo wa kuwa mojawapo ya mali muhimu zaidi za kijeshi ambazo Binadamu amewahi kuona, pengine hata mali muhimu zaidi ya kijeshi kuliko silaha za nyuklia." Alielezea hali ya kutisha ambapo utawala wa kiimla wenye AGI unaweza kushinda taifa lisilo na AGI.
Wang alionyesha wasiwasi mkubwa juu ya maendeleo ya haraka ya AI nchini China. Ingawa miaka miwili iliyopita wangeweza kuwa "mbali sana" na uwezo wa GPT-4, mfumo wa hivi karibuni wa Kichina, Yi-Large kutoka 0101, sasa umeorodheshwa kati ya bora zaidi duniani, nyuma kidogo ya GPT-4o, Gemini, na Claude 3 Opus. Alihusisha hili na uwezo wa kipekee wa CCP kutekeleza "hatua za kati zilizodhubutu sana na sera ya viwanda ya kati kuendeleza viwanda muhimu." Mfumo huu, ulioonekana katika nishati ya jua na magari ya umeme (EVs), unaonyesha China ina "fursa wazi ya kusonga mbele na kutuacha nyuma." Kwa kuzingatia hili, Wang anaamini kuna "mgawanyiko wa lazima" uibuke: mifumo ya AI ya kisasa, yenye nguvu kweli, inapaswa kuwekwa siri kwa sababu za kijeshi na kijiografia na kisiasa, wakati mifumo isiyo na maendeleo sana, huria inaweza kuendelea kuleta thamani ya kiuchumi.
Mafunzo Muhimu:
- AI, hasa AGI, inaweza kuwa mali muhimu zaidi ya kijeshi ya ubinadamu, ikiwa na matokeo makubwa ya kijiografia na kisiasa.
- Sera ya viwanda ya kati ya China inawezesha maendeleo ya haraka ya AI, ikifunga haraka pengo na uwezo wa Magharibi.
- Tofauti ya kimkakati kati ya mifumo huria na iliyofungwa ya AI ni muhimu: mifumo ya kisasa inaweza kuhitaji kufungwa kwa usalama, wakati ile isiyo na nguvu sana inaweza kubaki huria kwa manufaa mapana ya kiuchumi.
Kufafanua Upya Ushindani: Data kama Ngome Kuu
Katika ulimwengu wenye ushindani mkali wa mifumo ya msingi, Wang anaamini kabisa data itakuwa kigezo kikuu cha utofautishaji. Alielezea kuwa algorithms zinaweza hatimaye kuchanganuliwa (reverse-engineered) au kuwa ujuzi wa kawaida, na uwezo wa uchakataji unaweza kununuliwa tu. "Data ni mojawapo ya maeneo machache," alisisitiza, "ambapo unaweza kuzalisha faida endelevu ya ushindani wa muda mrefu." Alitaja ushirikiano wa Open AI na Financial Times na Axel Springer kama viashiria vya mwanzo vya mabadiliko haya.
Wang alitabiri kwa ujasiri mustakabali ambapo viongozi wa AI hawatajigamba kuhusu idadi ya GPU zao, bali "data wanayopata na haki zao za kipekee za vyanzo tofauti vya data." Msisitizo huu juu ya data ya kipekee, ya umiliki binafsi utaendesha utofautishaji wa soko. Zaidi ya hayo, anatarajia mabadiliko makubwa katika programu, kuondoka kutoka kwa SaaS ya "bustani iliyozingirwa" (walled garden) hadi programu zilizobinafsishwa sana, zilizoundwa mahsusi kwa makampuni, ikifanana na mbinu ya awali ya Palantir. Hili litachochewa na AI kupunguza sana gharama za uundaji wa programu, na kusababisha enzi mpya ya suluhisho za programu zilizobinafsishwa. Kwa hivyo, mfumo wa bei wa muda mrefu wa kila kiti (per-seat) huenda ukapisha bei inayotegemea matumizi (consumption-based), ikionyesha kazi iliyofanywa na wafanyakazi wa kibinadamu na mawakala wa AI.
Muhtasari Muhimu:
- Data inajitokeza kama faida ya msingi na imara zaidi ya ushindani katika mbio za mifumo ya msingi.
- Ushindani wa baadaye utahusu upatikanaji wa data ya umiliki, umiliki, na uwezo wa kuzalisha seti za data za kipekee.
- Urasimishaji wa uundaji wa programu utasababisha programu maalum, zilizobinafsishwa kwa makampuni, zikizidi SaaS za jumla.
- Mifumo ya bei ya programu itabadilika kutoka kila kiti (per-seat) hadi inayotegemea matumizi (consumption-based), ikilingana na thamani inayotolewa na binadamu na mawakala wa AI.
Kushughulikia Kelele: Njia za Moja kwa Moja na Imani
Akihamia kwenye ujenzi wa kampuni, Wang alishiriki mbinu yake isiyo ya kawaida ya mahusiano ya umma (PR): "PR bora ni kutokuwa na PR." Alisema kuwa vyombo vya habari vya jadi, mara nyingi vikichochewa na "clicks", huelekea kukuza na kupotosha hadithi, vikikuza na kuvishusha kampuni kwa ajili ya ushiriki. Alifichua uzoefu wa kibinafsi wa kushangaza: "Nimepokea matibabu ya haki zaidi nikitoa ushahidi mbele ya Congress kuliko kutoka kwa vyombo mbalimbali vya habari kwa miaka mingi."
Mtazamo huu umesababisha Scale AI kuweka kipaumbele kwenye njia za moja kwa moja, kama vile podcasts na blogu za kampuni, ambapo wanaweza kusambaza ujumbe wao kwa uhalisi na bila mabadiliko. Umiliki huu wa hadithi zao unahakikisha hadithi yao ni "safi zaidi" na haijachafuliwa, na hivyo kukuza imani na uwazi na hadhira yao.
Mbinu Muhimu:
- Kubali mkakati wa "kutokuwa na PR" au ushirikiano mdogo na vyombo vya habari vya jadi ili kuepuka kukuza na kupotosha hadithi.
- Weka kipaumbele kwenye njia za mawasiliano za moja kwa moja (podcasts, maudhui ya kampuni) kwa ujumbe halisi na usiobadilishwa.
- Waanzilishi na kampuni lazima wamiliki na kusimamia kikamilifu hadithi zao katika mazingira ya habari yenye kelele zinazoongezeka.
"Katika msingi wake teknolojia hii ya AI ina uwezo wa kuwa mojawapo ya mali muhimu zaidi za kijeshi ambazo Binadamu amewahi kuona, pengine hata mali muhimu zaidi ya kijeshi kuliko silaha za nyuklia." - Alexandr Wang


