مقابلة مع Geoffrey Hinton

Godfather of AI

بواسطة Sana2024-05-20

Geoffrey Hinton

جيوفري هينتون، الذي يُشاد به غالبًا بلقب "العراب للذكاء الاصطناعي"، جلس مؤخرًا لإجراء محادثة صريحة كشفت الستار عن طبقات رحلته الاستثنائية، والحقائق المدهشة التي اكتشفها، والأسئلة العميقة التي ما زالت تحفزه. من خيبات الأمل الهادئة في مساعيه الأكاديمية المبكرة إلى مختبرات كارنيجي ميلون الصاخبة والمهووسة بالمستقبل، يقدم هينتون نظرة شخصية عميقة ومحفزة فكريًا لتطور الذكاء الاصطناعي، تتخللها مزيجته المميزة من التواضع، والبصيرة الثاقبة، وجرعة صحية من الشك تجاه الحكمة المتوارثة.

المسار العرضي نحو الذكاء الاصطناعي: شكوك، خيبات أمل، وحدس عميق

كان مسار هينتون ليصبح باحثًا رائدًا في مجال الذكاء الاصطناعي بعيدًا عن المسار الخطي. بدأ مسعاه الأولي لفهم الذكاء في كامبريدج، حيث درس علم وظائف الأعضاء. ومع ذلك، سرعان ما وجد الأمر "مخيبًا للآمال للغاية" عندما كان كل ما تعلمه هو "كيف توصل الخلايا العصبية جهود الفعل، وهو أمر مثير للاهتمام جدًا ولكنه لا يخبرك كيف يعمل الدماغ". وقد أثبت التحول إلى الفلسفة لفهم العقل أنه محبط بنفس القدر. ولم يشعر بشرارة حقيقية إلا عندما وجد نفسه في إدنبرة، يغوص في مجال الذكاء الاصطناعي: "على الأقل كان بإمكانك محاكاة الأشياء لاختبار النظريات".

شكلت خيبة الأمل المبكرة هذه حدسًا أساسيًا لديه. قرأ لدونالد هيب عن قوة الاتصال في الشبكات العصبية ولجون فون نيومان عن كيفية معالجة الدماغ للمعلومات بشكل مختلف عن أجهزة الكمبيوتر التقليدية. تراجع هينتون غريزيًا عن النهج السائد للمنطق الرمزي في الذكاء. "بدا لي أنه يجب أن تكون هناك طريقة لتعلم الدماغ، ومن الواضح أنها ليست عن طريق برمجة كل أنواع الأشياء فيه ثم استخدام قواعد الاستدلال المنطقي التي بدت لي جنونية منذ البداية." وبدلاً من ذلك، تضيّق تركيزه على السؤال الأساسي: كيف تتعلم الأدمغة تعديل الروابط داخل شبكة عصبية لأداء مهام معقدة، وهي بساطة أنيقة ستدعم الكثير من أعماله اللاحقة.

الدروس المستفادة الرئيسية:

  • حفّزت خيبات الأمل الأكاديمية المبكرة تحولاً نحو المحاكاة والاختبار التجريبي في الذكاء الاصطناعي.
  • طور هينتون حدسًا مبكرًا وقويًا ضد المنطق الرمزي كنموذج أساسي لوظيفة الدماغ.
  • اهتمامه الأساسي يكمن في فهم كيف يمكن للعمليات العصبية البسيطة أن تؤدي إلى تعلم معقد.

إقامة الروابط: من آلات بولتزمان إلى "الطبقات المخفية"

كان الجو في جامعة كارنيجي ميلون في أواخر السبعينيات مفعمًا بالحيوية، على النقيض تمامًا من تجاربه السابقة في إنجلترا. يتذكر هينتون دخوله المختبر ليلة السبت في الساعة التاسعة مساءً ليجده "يعج بالناس... جميع الطلاب كانوا هناك، وكانوا جميعًا موجودين لأن ما كانوا يعملون عليه هو المستقبل". وقد عززت هذه الأرض الخصبة تعاونات حاسمة، أبرزها مع تيري سيجنوفسكي حول آلات بولتزمان (Boltzmann Machines) – وهي فترة يصفها هينتون بأنها "أكثر الأبحاث إثارة التي قمت بها على الإطلاق". ورغم أنه يعتقد الآن أن آلات بولتزمان "ليست الكيفية التي يعمل بها الدماغ"، إلا أن الأناقة النظرية لخوارزمية التعلم لا تزال مصدر فخر عميق.

تفاعل محوري آخر كان مع بيتر براون، إحصائي يعمل على التعرف على الكلام. قدم براون لهينتون نماذج ماركوف المخفية (HMMs)، وهو مفهوم قدم الإلهام اللغوي المثالي. كان هينتون يستخدم بالفعل شبكات متعددة الطبقات لم يكن لديه اسم واضح لها، وقرر أن "المخفية" (hidden) في نماذج ماركوف المخفية كانت "اسمًا رائعًا للمتغيرات التي لا تعرف ما تقوم به". وهكذا، وُلدت "الطبقات المخفية" المنتشرة في الشبكات العصبية. ينسب هينتون الفضل بتواضع لطلابه، متأملاً: "أعتقد أنني أتعلم منهم أكثر مما تعلموا مني". وقد تجلت هذه الاستعداد للتعلم ممن قام بتوجيههم بأوضح صورها مع طالب معين يدعى إيليا. اقتحم إيليا سوتسكيفر مكتب هينتون بـ "طرق عاجل" في أحد أيام الأحد، معلنًا أنه يفضل أن يكون في المختبر بدلاً من "قلي البطاطس في الصيف". وبعد أن أعطي ورقة بحثية عن الانتشار العكسي (backpropagation)، لم تكن ملاحظات إيليا الفورية والعميقة أنه لم يفهم قاعدة السلسلة، بل كانت: "أنا فقط لا أفهم لماذا لا تعطي الانحدار لمُحسِّن دالة معقول". هذه القفزة الفورية إلى مشكلة أعمق وأكثر جوهرية بشرت بالحدس الفطري الاستثنائي لسوتسكيفر حول الأشياء [الذي] كان دائمًا جيدًا جدًا".

الممارسات الأساسية:

  • كان احتضان البحث التعاوني، حتى عبر مسافات كبيرة، حاسمًا للاكتشافات العلمية.
  • أثبت التعلم من الطلاب ومنحهم الفضل في رؤاهم ومساهماتهم الفريدة أنه لا يقدر بثمن.
  • نبعت تسمية مفاهيم الذكاء الاصطناعي الأساسية غالبًا من الاحتياجات العملية والإلهام متعدد التخصصات.
  • يعد تقدير الحدس الفطري الخام للطالب، حتى عندما يتحدى الأفكار الراسخة، ضروريًا للتقدم.

القوة غير المتوقعة للنطاق: ما وراء التنبؤ بالكلمة التالية

كان هناك موضوع متكرر في مسيرة هينتون المهنية اللاحقة وهو التأثير العميق للنطاق. بينما اعتقد هينتون في البداية أن شعار إيليا سوتسكيفر – "فقط اجعلها أكبر وستعمل بشكل أفضل" – كان "نوعًا من التهرب" وأن "الأفكار الجديدة تساعد"، فقد أقر في النهاية بالقوة الهائلة للحوسبة والبيانات. "اتضح أنني كنت على صواب في الأساس، الأفكار الجديدة تساعد، أشياء مثل "المحولات" (Transformers) ساعدت كثيرًا، لكن الأمر كان يتعلق حقًا بحجم البيانات وحجم الحوسبة." يروي قصة ورقة بحثية عام 2011 لإيليا وجيمس مارتينز، التي استخدمت التنبؤ على مستوى الحرف في ويكيبيديا: "لم نصدق تمامًا أنه فهم أي شيء، لكن بدا وكأنه فهم."

يرفض هينتون بشدة فكرة أن توقع الكلمة التالية مهمة سطحية. يجادل بأن نماذج الذكاء الاصطناعي تطور فهمًا عميقًا بالضبط لأنها مضطرة للتنبؤ بالرمز التالي في سياق معقد. "لتوقع الرمز التالي، يجب أن تفهم ما قيل. لذا أعتقد أنك تجبرها على الفهم بجعلها تتنبأ بالرمز التالي، وأعتقد أنها تفهم بنفس الطريقة التي نفهم بها نحن." يوضح ذلك بتشبيه مقنع: سؤال GPT-4 لماذا تشبه كومة السماد قنبلة ذرية. بينما يواجه معظم البشر صعوبة، يحدد GPT-4 البنية المشتركة لـ "تفاعل متسلسل". هذه القدرة على رؤية أوجه التشابه بين مفاهيم تبدو متباينة، يعتقد هينتون، هي "من أين تستمد الإبداع". علاوة على ذلك، يسلط الضوء على أن هذه النماذج يمكن أن تتجاوز حتى بيانات تدريبها، تمامًا مثل الطالب الذكي الذي يميز الحقيقة عن مستشار معيب. يشير إلى تجربة حيث حققت شبكة عصبية تم تدريبها على بيانات خاطئة بنسبة 50% نسبة خطأ 5% فقط. "يمكنها أن تفعل أفضل بكثير من بيانات تدريبها ومعظم الناس لا يدركون ذلك."

التغييرات الرئيسية:

  • تحول عميق في المنظور بخصوص القوة الهائلة للبيانات ونطاق الحوسبة، حتى على حساب الخوارزميات الجديدة وحدها.
  • إعادة تقييم "توقع الرمز التالي" من مهمة سطحية إلى آلية تفرض فهمًا عميقًا.
  • التعرف على الإبداع الناشئ للنماذج الكبيرة من خلال قدرتها على تحديد أوجه التشابه غير الواضحة.
  • فهم أن الذكاء الاصطناعي يمكنه التعميم وتصحيح الأخطاء في بيانات تدريبه، متجاوزًا الأمثلة المقدمة من البشر.

هندسة الخلود: مستقبل الاستدلال، والتعددية الوسائطية، والحوسبة

تطلعاً إلى المستقبل، يتصور هينتون تقدم استدلال الذكاء الاصطناعي من خلال عملية شبيهة بالتعلم البشري: استخدام الاستدلال لتصحيح الحدس الأولي، تمامًا كما تقوم ألفاغو بتحسين وظيفة تقييمها من خلال عمليات محاكاة مونت كارلو. يقول: "أعتقد أن نماذج اللغة الكبيرة هذه يجب أن تبدأ في القيام بذلك... الحصول على المزيد من بيانات التدريب بدلاً من مجرد محاكاة ما فعله الناس". وسيعزز تكامل البيانات متعددة الأنماط — الصور والفيديو والصوت — هذا بشكل كبير، خاصة فيما يتعلق بالاستدلال المكاني. "إذا كانت تقوم بالرؤية وتمد يدها وتمسك بالأشياء، فستفهم الكائن بشكل أفضل بكثير."

إن فهم هينتون المتطور للغة نفسها أمر رائع أيضًا. فهو يرفض الرؤية الرمزية القديمة ونهج "متجه الفكر" القائم على المتجهات فقط. يفترض اعتقاده الحالي أن "تأخذ هذه الرموز وتحولها إلى تضمينات (embeddings)... هذه التضمينات الغنية جدًا ولكن التضمينات لا تزال مرتبطة بالرموز... هذا هو الفهم". يحافظ هذا المزيج على البنية السطحية للغة بينما يغمرها بمعنى عميق قائم على المتجهات. تتطرق المحادثة أيضًا إلى دفاعه المبكر عن وحدات معالجة الرسوميات (GPUs)، وهي قصة تتضمن ريك سزيليسكي، وأجهزة الألعاب، ومحاضرة في نيبس، ووحدة معالجة رسوميات مجانية متأخرة من جينسن هوانج. ومع ذلك، يقارن بعد ذلك هذا النجاح الرقمي بسعيه الفاشل للحوسبة التناظرية منخفضة الطاقة. وقد أدى ذلك إلى إدراك عميق: "يمكن للأنظمة الرقمية مشاركة الأوزان وهذا أكثر كفاءة بشكل لا يصدق... لذا فهي متفوقة علينا بكثير في القدرة على مشاركة المعرفة." هذا "الخلود" للأوزان الرقمية يسمح بتعلم جماعي غير مسبوق.

الرؤى الرئيسية:

  • ستتعمق قدرات الاستدلال في الذكاء الاصطناعي من خلال تحسين حدسها بشكل متكرر عبر التصحيح الذاتي، محاكية الكيفية التي يستخدم بها البشر الاستدلال للتحقق من الحدس.
  • التعلم متعدد الأنماط، خاصة الذي ينطوي على التفاعل المادي، حاسم لتطوير فهم مكاني وكائني قوي.
  • يكمن الفهم الحقيقي في الذكاء الاصطناعي (وربما الدماغ البشري) في التضمينات الغنية والسياقية للرموز، بدلاً من المنطق الرمزي البحت أو "متجهات الفكر" المعزولة.
  • تمتلك أنظمة الذكاء الاصطناعي الرقمية "خلودًا" متأصلًا وكفاءة لا مثيل لها في مشاركة المعرفة بفضل الأوزان القابلة للتبديل، وهي ميزة أساسية على الأدمغة البيولوجية.

العقل الفضولي: كشف ألغاز الدماغ وتوجيه البحث

حتى مع التقدم السريع للذكاء الاصطناعي، يعتقد هينتون أن هناك حدودًا كبرى لا تزال قائمة: دمج "الأوزان السريعة" – وهي تغييرات مؤقتة تعتمد على السياق في قوة التشابك العصبي التي يستخدمها الدماغ للذاكرة قصيرة المدى. "هذا أحد أكبر الأشياء التي علينا تعلمها." يمكن لهذه القدرة أن تفتح أشكالًا جديدة تمامًا من الذاكرة والمعالجة لم تشهدها نماذج الذكاء الاصطناعي بعد. كما أثر عمله بعمق على رؤيته للدماغ، موضحًا أن فكرة "شبكة عصبية عشوائية كبيرة" تتعلم أشياء معقدة من البيانات هي "خاطئة تمامًا" – وهو تحدٍ مباشر لنظريات مثل بنية اللغة الفطرية لتشومسكي.

يغامر هينتون بالدخول في عالم الوعي والمشاعر، مقدمًا منظورًا استفزازيًا. يقترح أن المشاعر يمكن فهمها على أنها "أفعال سنقوم بها لولا القيود". يروي قصة روبوت عام 1973 في إدنبرة، والذي كان محبطًا بسبب عدم قدرته على تجميع سيارة لعبة من كومة متناثرة، "ضرب بمقبضه بقوة فبعثرها، ثم تمكن من تجميعها". لاحظ هينتون: "إذا رأيت ذلك في شخص، لقلت إنه كان غاضبًا من الموقف لأنه لم يفهمه فدمره". بالنسبة لهينتون، كان هذا إظهارًا واضحًا لروبوت يعبر عن عاطفة. عندما يتعلق الأمر باختيار المشكلات، فإن طريقته بسيطة ومنعشة: "أبحث عن شيء يتفق عليه الجميع ولكنه يبدو لي خاطئًا". ثم يحاول "صنع عرض توضيحي صغير ببرنامج كمبيوتر صغير يوضح أنه لا يعمل بالطريقة التي قد تتوقعها". مجاله "المشكوك فيه" الحالي هو نقص الأوزان السريعة في الذكاء الاصطناعي. وفي النهاية، السؤال الذي استهلكه لثلاثة عقود ما زال قائماً: "هل يقوم الدماغ بالانتشار العكسي (back propagation)؟" إنها شهادة على فضوله الدائم، حتى وهو يقر بالمخاطر المحتملة للذكاء الاصطناعي إلى جانب خيره الهائل في مجالات مثل الرعاية الصحية. بالنسبة لهينتون، كان البحث عن الفهم دائمًا هو الدافع الأساسي.

الدروس المستفادة الرئيسية:

  • يعد دمج "الأوزان السريعة" للذاكرة المؤقتة والتعلم متعدد المقاييس الزمنية مجالًا حاسمًا وغير مطور للذكاء الاصطناعي.
  • نجاح الشبكات العصبية الكبيرة قد تحدى بشكل أساسي المعتقدات الراسخة حول البنى الفطرية في التعلم، خاصة بالنسبة للغة.
  • يمكن تصور المشاعر في الذكاء الاصطناعي على أنها أفعال مكبوتة، مما يوفر إطارًا ملموسًا لفهم "عواطف" الروبوت.
  • تتضمن استراتيجية هينتون البحثية تحديد الأفكار المقبولة على نطاق واسع والتي تبدو "خاطئة" بشكل غريزي، ثم دحضها بعروض توضيحية بسيطة.
  • يدور فضوله الأعمق والمستمر حول كيفية تنفيذ الدماغ للتعلم القائم على التدرج، وتحديداً الانتشار العكسي.

"أردت فقط أن أفهم كيف يمكن للدماغ أن يتعلم فعل الأشياء، هذا ما أريد معرفته. ولقد فشلت نوعًا ما، وكنتيجة جانبية لذلك الفشل، حصلنا على بعض الهندسة الرائعة، ولكن نعم، لقد كان فشلاً جيدًا جيدًا جيدًا للعالم." - جيوفري هينتون