مقابلة مع Alexandr Wang

Founder and CEO @ Scale.ai

بواسطة 20VC with Harry Stebbings2024-06-12

Alexandr Wang

في حوار آسر وصريح مع هاري ستيبينغز في برنامج 20VC، كشف ألكسندر وانغ، الرئيس التنفيذي لشركة Scale AI، الستار عن خبايا المشهد الحالي للذكاء الاصطناعي، متحديًا الحكمة التقليدية ومسلطًا الضوء على العقبة الحقيقية أمام أداء نماذج الجيل القادم. وبينما يهتم العالم بقوة المعالجة (compute)، يرى وانغ أن السباق الحقيقي – والميزة التنافسية المحتملة – لا يكمن في الرقائق الإلكترونية (silicon)، بل في البيانات.

جدار البيانات: لماذا لم تعد قوة المعالجة كافية؟

تعمق الحوار مباشرة في سؤال استفزازي: هل نشهد تراجعًا في عائد الأداء لنماذج الذكاء الاصطناعي، حيث لم تعد قوة المعالجة الإضافية تضمن نتائج أفضل؟ جاءت إجابة وانغ مدوية: "نعم". وأشار إلى أنه على الرغم من الزيادة الهائلة في الإنفاق على وحدات معالجة الرسوميات (GPU) من Nvidia منذ أواخر عام 2022 (من 5 مليارات دولار إلى أكثر من 20 مليار دولار ربع سنويًا)، إلا أننا لم نشهد نموذجًا أساسيًا "أفضل بشكل مذهل" من GPT-4، الذي يسبق نقطة التحول الهائلة هذه في قوة المعالجة.

أوضح وانغ أن تقدم الذكاء الاصطناعي يستند إلى ثلاثة أعمدة: قوة المعالجة، والخوارزميات، والبيانات. وبينما توسعت قوة المعالجة بشكل كبير، لم يواكب الآخران وتيرتها. الأهم من ذلك، يعتقد أن الصناعة قد اصطدمت بـ "جدار البيانات". تم استهلاك "البيانات السهلة" إلى حد كبير – كل ما هو متاح بسهولة على الإنترنت المفتوح، والمُقتبس من عمليات الزحف الشائعة أو التورنت. هذه النماذج أصبحت الآن "جيدة بشكل استثنائي في محاكاة الإنترنت"، لكن ذلك لا يكفي للمهام المعقدة والاستدلال المطلوب للذكاء الاصطناعي العام (AGI) الحقيقي أو وكلاء الذكاء الاصطناعي الفعالين.

رؤى رئيسية:

  • يعتمد تقدم الذكاء الاصطناعي على قوة المعالجة والبيانات والخوارزميات التي تتقدم جنبًا إلى جنب.
  • الاستثمارات الضخمة في قوة المعالجة بعد GPT-4 لم تسفر عن قفزات متناسبة في أداء النماذج الأساسية.
  • استنفدت الصناعة إلى حد كبير "البيانات السهلة" (بيانات الإنترنت)، مما أدى إلى ثبات في الأداء.

رسم الحدود: تنمية وفرة البيانات

للتغلب على جدار البيانات هذا، قدم وانغ مفهوم "بيانات الحدود" (Frontier data). وأبرز أن الكثير من الاستدلال المعقد وحل المشكلات الذي يحرك اقتصاد اليوم – مثل العملية الاستنتاجية لمحلل الاحتيال – لا يُسجل على الإنترنت. وهذا يعني أن النماذج التي تدربت فقط على بيانات الإنترنت تفتقر إلى القدرة على التعلم من هذا الذكاء البشري الأعمق.

إذًا، كيف نلتقط بيانات الحدود هذه التي يصعب الوصول إليها؟ حدد وانغ مسارين رئيسيين. أولاً، هناك كنز هائل من البيانات الاحتكارية المحصورة داخل الشركات. واستشهد بـ 150 بيتابايت من البيانات الداخلية لشركة JPMorgan، والتي تفوق بكثير مجموعة بيانات الإنترنت لـ GPT-4 التي تقل عن بيتابايت واحد. ومع ذلك، هذه البيانات حساسة للغاية وستتطلب من الشركات استخراجها وصقلها لأنظمة الذكاء الاصطناعي الخاصة بها، على الأرجح داخل المؤسسة (on-prem) أو بضمانات قوية ضد الاستخدام الخارجي. ثانيًا، والأكثر أهمية لتحقيق إنجازات معممة، هو "إنتاج البيانات المستقبلي" (forward data production). الأمر لا يتعلق فقط بجمع البيانات الموجودة بل بإنشاء بيانات جديدة ومعقدة للغاية. يتضمن ذلك "عملية هجينة بشرية اصطناعية" حيث يقوم الذكاء الاصطناعي بتوليد البيانات، ويعمل الخبراء البشريون بمثابة "سائقي الأمان"، يوجهون الذكاء الاصطناعي، ويصححون الأخطاء، ويقدمون مدخلات حاسمة عندما تتعثر النماذج. يرى وانغ أن "مدربي الذكاء الاصطناعي" أو "المساهمين" هؤلاء يشغلون بعضًا من أكثر الوظائف تأثيرًا على المجتمع. وعلق قائلاً: "بصفتك خبيرًا بشريًا، لديك القدرة على إحداث تأثير على مستوى المجتمع من خلال إنتاج البيانات للمساعدة في تحسين هذه النماذج".

تغييرات رئيسية:

  • الانتقال من "البيانات السهلة" المتاحة بسهولة إلى "بيانات الحدود" ضروري للذكاء الاصطناعي المتقدم.
  • تشتمل بيانات الحدود على سلاسل استدلال معقدة، واستخدام الأدوات، والسلوك الفاعل الذي لا يوجد على الإنترنت المفتوح.
  • سيتم تحقيق وفرة البيانات من خلال استخراج بيانات الشركات الاحتكارية وإنتاج بيانات جديدة وعالية الجودة بشكل فعال.
  • ستظهر أدوار بشرية جديدة لتوجيه وتصحيح أنظمة الذكاء الاصطناعي في توليد البيانات الاصطناعية، على غرار سائقي الأمان للمركبات ذاتية القيادة.

سباق البيانات الجيوسياسي: حرب باردة جديدة؟

تحول الحوار نحو التداعيات الجيوسياسية العميقة للذكاء الاصطناعي، وهو موضوع يعتقد وانغ أنه لا يُناقش بالقدر الكافي. صرح بوضوح: "في جوهرها، تتمتع تقنية الذكاء الاصطناعي هذه بالقدرة على أن تكون واحدة من أعظم الأصول العسكرية التي عرفتها البشرية على الإطلاق، وربما تكون أصلًا عسكريًا أقوى من الأسلحة النووية". ورسم سيناريو مرعبًا حيث يمكن لنظام شمولي يمتلك ذكاء اصطناعي عام (AGI) أن يغزو أمة لا تملكه.

عبر وانغ عن قلق كبير بشأن التقدم السريع للصين في مجال الذكاء الاصطناعي. وبينما ربما كانوا قبل عامين "بعيدين كل البعد" عن قدرات GPT-4، فإن نموذجًا صينيًا حديثًا، هو Yi-Large من 0101، يُصنف الآن ضمن الأفضل عالميًا، مباشرة بعد GPT-4o و Gemini و Claude 3 Opus. وعزا ذلك إلى قدرة الحزب الشيوعي الصيني (CCP) الاستثنائية على تنفيذ "إجراءات مركزية عدوانية للغاية وسياسة صناعية مركزية لدفع الصناعات الحيوية إلى الأمام". وهذا النمط، الذي شوهد في الطاقة الشمسية والمركبات الكهربائية (EVs)، يشير إلى أن الصين لديها "فرصة واضحة للتقدم والتفوق علينا". بالنظر إلى ذلك، يعتقد وانغ أن هناك "انقسامًا يجب أن يظهر": يجب إبقاء أنظمة الذكاء الاصطناعي المتطورة والقوية حقًا مغلقة لأسباب عسكرية وجيوسياسية، بينما يمكن للنماذج الأقل تقدمًا والمفتوحة أن تستمر في تحقيق قيمة اقتصادية.

تعلمات رئيسية:

  • يمكن أن يكون الذكاء الاصطناعي، وخاصة الذكاء الاصطناعي العام (AGI)، أقوى الأصول العسكرية للبشرية، مع عواقب جيوسياسية عميقة.
  • تمكّن السياسة الصناعية المركزية للصين من تقدم الذكاء الاصطناعي السريع، مما يقلص الفجوة بسرعة مع القدرات الغربية.
  • التمييز الاستراتيجي بين أنظمة الذكاء الاصطناعي المفتوحة والمغلقة أمر بالغ الأهمية: قد تحتاج النماذج المتطورة إلى أن تكون مغلقة لأسباب أمنية، بينما يمكن أن تظل النماذج الأقل قوة مفتوحة لتحقيق فائدة اقتصادية واسعة.

إعادة تعريف المنافسة: البيانات كالميزة التنافسية الأسمى

في عالم النماذج الأساسية الشديد التنافسية، يؤمن وانغ بشدة أن البيانات ستكون العامل المميز الأسمى. وأوضح أن الخوارزميات يمكن في النهاية فك شفرتها (reverse-engineered) أو أن تصبح معرفة عامة، ويمكن ببساطة شراء قوة المعالجة. وأكد: "البيانات هي أحد المجالات القليلة التي يمكنك فيها بالفعل تحقيق ميزة تنافسية مستدامة على المدى الطويل". واستشهد بشراكات Open AI مع Financial Times و Axel Springer كمؤشرات مبكرة لهذا التحول.

توقع وانغ بجرأة مستقبلًا لن يتفاخر فيه قادة الذكاء الاصطناعي بعدد وحدات معالجة الرسوميات (GPU) لديهم، بل "بأي بيانات لديهم حق الوصول إليها وما هي حقوقهم الفريدة لمصادر البيانات المختلفة". هذا التركيز على البيانات الفريدة والخاصة سيقود إلى التمايز في السوق. علاوة على ذلك، يتوقع تحولًا كبيرًا في البرمجيات، مبتعدًا عن برمجيات الخدمة (SaaS) "ذات الحدائق المسورة" (walled garden) نحو تطبيقات مخصصة للغاية ومبنية لغرض معين للشركات، تذكرنا بالنهج المبكر لشركة Palantir. سيغذي هذا الانخفاض الهائل في تكاليف إنشاء البرمجيات بفضل الذكاء الاصطناعي، مما يؤدي إلى عصر جديد من حلول البرمجيات المخصصة. وبناءً عليه، من المرجح أن يفسح نموذج التسعير "لكل مقعد" (per-seat) الذي طال أمده المجال للتسعير القائم على الاستهلاك، مما يعكس العمل الذي يقوم به كل من الموظفين البشريين ووكلاء الذكاء الاصطناعي.

رؤى رئيسية:

  • تظهر البيانات كميزة تنافسية أساسية وأكثر دوامًا في سباق النماذج الأساسية.
  • ستدور المنافسة المستقبلية حول الوصول إلى البيانات الاحتكارية، وملكيتها، والقدرة على إنتاج مجموعات بيانات فريدة.
  • سيؤدي تحول إنشاء البرمجيات إلى سلعة إلى تطبيقات مخصصة ومصممة خصيصًا للشركات، متجاوزة برمجيات الخدمة (SaaS) العامة.
  • ستتطور نماذج تسعير البرمجيات من التسعير "لكل مقعد" إلى التسعير القائم على الاستهلاك، بما يتماشى مع القيمة المقدمة من قبل البشر ووكلاء الذكاء الاصطناعي على حد سواء.

التعامل مع الضجيج: القنوات المباشرة والثقة

بالانتقال إلى بناء الشركات، شارك وانغ منهجه غير التقليدي في العلاقات العامة: "أفضل علاقات عامة هي لا علاقات عامة". جادل بأن وسائل الإعلام التقليدية، التي غالبًا ما تحركها النقرات، تميل إلى إثارة القصص وتشويه الروايات، لترفع من شأن الشركات ثم تهدمها من أجل التفاعل. وكشف عن تجربة شخصية مفاجئة: "لقد حظيت بمعاملة أكثر إنصافًا عند الإدلاء بشهادتي أمام الكونغرس مما حظيت به من مختلف وسائل الإعلام على مر السنين".

أدت هذه النظرة إلى أن تولي شركة Scale AI الأولوية للقنوات المباشرة، مثل المدونات الصوتية (podcasts) ومدونات الشركة، حيث يمكنهم نقل رسالتهم بشكل أصيل ودون تغيير. تضمن هذه الملكية لسردهم أن تكون قصتهم "أنقى" وغير مشوهة، مما يعزز الثقة والوضوح مع جمهورهم.

ممارسات رئيسية:

  • اعتماد استراتيجية "لا علاقات عامة" أو الحد الأدنى من التعامل مع وسائل الإعلام التقليدية لتجنب الإثارة وتشويه الروايات.
  • إعطاء الأولوية لقنوات الاتصال المباشرة (المدونات الصوتية، محتوى الشركة) للحصول على رسائل أصيلة وغير معدلة.
  • يجب على المؤسسين والشركات امتلاك وإدارة روايتهم بفعالية في مشهد معلومات يزداد ضجيجًا.

"في جوهرها، تتمتع تقنية الذكاء الاصطناعي هذه بالقدرة على أن تكون واحدة من أعظم الأصول العسكرية التي عرفتها البشرية على الإطلاق، وربما تكون أصلًا عسكريًا أقوى من الأسلحة النووية." - ألكسندر وانغ