Röportaj: Geoffrey Hinton
Godfather of AI
tarafından Sana • 2024-05-20

Geoffrey Hinton, sık sık "Yapay Zekanın Büyük Babası" olarak anılan isim, yakın zamanda samimi bir sohbet için bir araya geldi; bu sohbet, onun sıra dışı yolculuğunun, keşfettiği şaşırtıcı gerçeklerin ve onu motive etmeye devam eden derin soruların perde arkasını araladı. Erken dönem akademik arayışlarının sessiz hayal kırıklıklarından Carnegie Mellon'ın hareketli, geleceğe takıntılı laboratuvarlarına kadar Hinton, yapay zekanın evrimine dair derin kişisel ve entelektüel açıdan düşündürücü bir bakış sunuyor; bu bakış, alçakgönüllülük, keskin kavrayış ve yerleşik bilgilere karşı sağlıklı bir dozda şüphecilikten oluşan kendine özgü karışımıyla bezeli.
Yapay Zekaya Giden Tesadüfi Yol: Şüpheler, Hayal Kırıklıkları ve Derin Sezgiler
Hinton'ın öncü bir yapay zeka araştırmacısı olma yolculuğu doğrusal olmaktan uzaktı. Zekayı anlama konusundaki ilk arayışı Cambridge'de, fizyoloji eğitimi alarak başladı. Ancak, öğrendiği tek şeyin "nöronların aksiyon potansiyellerini nasıl ilettiği, ki bu çok ilginç ama beynin nasıl çalıştığını size söylemiyor" olduğunu görünce bunu hızla "çok hayal kırıklığı yaratıcı" buldu. Zihni anlamak için felsefeye yönelmek de aynı derecede hayal kırıklığı yarattı. Edinburgh'da yapay zekayı derinlemesine incelemeye başlayana kadar gerçek bir kıvılcım hissetmedi: "en azından teorileri test etmek için bir şeyleri simüle edebiliyordunuz."
Bu erken dönem hayal kırıklığı temel bir sezgi oluşturdu. Donald Hebb'in sinir ağı bağlantı güçleri üzerine yazdıklarını ve John von Neumann'ın beynin geleneksel bilgisayarlardan farklı şekilde nasıl hesaplama yaptığına dair görüşlerini okudu. Hinton, zekaya yönelik yaygın sembolik mantık yaklaşımından içgüdüsel olarak kaçındı. "Bana öyle geliyordu ki beynin öğrenmesinin bir yolu olmalı ve bu açıkça içine her türlü şeyin programlanması ve sonra mantıksal çıkarım kurallarının kullanılmasıyla değil; bu bana başından beri çılgınca geliyordu." Bunun yerine odağı, beyinlerin karmaşık görevleri yerine getirmek için bir sinir ağı içindeki bağlantıları nasıl değiştirmeyi öğrendiği temel sorusuna daraldı; bu zarif sadelik, sonraki çalışmalarının çoğunun temelini oluşturacaktı.
Temel Öğrenimler:
- Erken dönem akademik hayal kırıklıkları, yapay zekada simülasyon ve ampirik testlere doğru bir geçişi hızlandırdı.
- Hinton, beyin fonksiyonu için birincil model olarak sembolik mantığa karşı erken ve güçlü bir sezgi geliştirdi.
- Temel ilgisi, basit sinirsel işlemlerin karmaşık öğrenmeye nasıl yol açabileceğini anlamaktı.
Bağlantılar Kurmak: Boltzmann Makinelerinden "Gizli Katmanlara"
1970'lerin sonlarında Carnegie Mellon'daki atmosfer elektrik yüklüydü, İngiltere'deki önceki deneyimlerinin tam tersiydi. Hinton, bir Cumartesi gecesi saat 21:00'de laboratuvara gittiğinde orayı "kaynayan... tüm öğrencilerin orada olduğunu ve hepsinin orada olmasının nedeninin üzerinde çalıştıkları şeyin gelecek olmasıydı" diye hatırlıyor. Bu verimli zemin, kritik işbirliklerini teşvik etti, özellikle Terry Sejnowski ile Boltzmann Makineleri üzerine – Hinton'ın "şimdiye kadar yaptığım en heyecan verici araştırma" olarak tanımladığı bir dönem. Boltzmann Makinelerinin "beynin çalışma şekli değil" olduğuna inanmasına rağmen, öğrenme algoritmasının teorik zarafeti derin bir gurur kaynağı olmaya devam ediyor.
Bir başka çok önemli etkileşim ise konuşma tanıma üzerine çalışan istatistikçi Peter Brown ile oldu. Brown, Hinton'ı mükemmel dilbilimsel ilhamı sağlayan bir kavram olan Gizli Markov Modelleri (HMM'ler) ile tanıştırdı. Hinton zaten henüz tam olarak bir isim vermediği çok katmanlı ağlar kullanıyordu ve HMM'lerdeki "gizli" kelimesinin "ne işe yaradıklarını bilmediğiniz değişkenler için harika bir isim" olduğuna karar verdi. Böylece, sinir ağlarındaki her yerde bulunan "gizli katmanlar" doğdu. Hinton öğrencilerine mütevazı bir şekilde atıfta bulunarak, "Sanırım ondan öğrendiğim, onun benden öğrendiğinden daha fazlaydı" diye düşünüyor. Mentorluk yaptığı kişilerden öğrenmeye istekli olması, en canlı şekilde Ilya adında belirli bir öğrenciyle gösterildi. Ilya Sutskever, bir Pazar günü "acil bir kapı vuruşuyla" Hinton'ın ofisine daldı ve "yaz boyunca patates kızartması yapmak" yerine laboratuvarda olmayı tercih ettiğini belirtti. Backpropagation üzerine bir makale verildikten sonra, Ilya'nın anında, derin geri bildirimi, zincir kuralını anlamadığı değil, "Gradyanı neden mantıklı bir fonksiyon optimize ediciye vermiyorsunuz ki, bunu anlamıyorum" şeklindeydi. Daha derin, daha temel bir soruna bu ani sıçrayış, Sutskever'in "konular hakkındaki saf sezgilerinin her zaman çok iyi olduğunu" öngördü.
Temel Uygulamalar:
- Önemli mesafelerdeki işbirlikçi araştırmaları benimsemek, bilimsel atılımlar için çok önemliydi.
- Öğrencilerden ve onların benzersiz içgörülerinden ve katkılarından öğrenmek ve onları takdir etmek paha biçilmezdi.
- Temel yapay zeka kavramlarının isimlendirilmesi genellikle pratik ihtiyaçlardan ve disiplinlerarası ilhamdan doğdu.
- Bir öğrencinin doğuştan gelen, saf sezgisine, yerleşik fikirleri sorgulasa bile değer vermek ilerleme için esastır.
Ölçeğin Öngörülemeyen Gücü: Sonraki Kelime Tahmininin Ötesinde
Hinton'ın sonraki kariyerinde tekrar eden bir tema, ölçeğin derin etkisiydi. Hinton başlangıçta Ilya Sutskever’in mantrası – "sadece büyütürseniz daha iyi çalışır" –nın "biraz kaçamak" ve "yeni fikirlerin yardımcı olduğunu" düşünse de, sonunda hesaplama ve verinin muazzam gücünü kabul etti. "Temelde haklı olduğum ortaya çıktı, yeni fikirler yardımcı oldu, Transformerlar gibi şeyler çok yardımcı oldu ama asıl etken verinin ve hesaplamanın ölçeğiydi." Ilya ve James Martins'in 2011 tarihli, Wikipedia üzerinde karakter düzeyinde tahmin kullanan bir makalesini anlatıyor: "bir şey anladığına tam olarak inanamıyorduk ama anlamış gibi görünüyordu."
Hinton, bir sonraki kelimeyi tahmin etmenin yüzeysel bir görev olduğu fikrini şiddetle reddediyor. Derin bir anlayış geliştirmelerinin nedeninin tam da bu modellerin karmaşık bir bağlamda bir sonraki sembolü tahmin etmeye zorlanması olduğunu savunuyor. "Bir sonraki sembolü tahmin etmek için söylenenleri anlamanız gerekir. Dolayısıyla, bir sonraki sembolü tahmin ettirerek onu anlamaya zorladığınızı ve bizimle aynı şekilde anladığını düşünüyorum." Bunu etkileyici bir benzetmeyle açıklıyor: GPT-4'e neden bir kompost yığınının atom bombasına benzediğini sormak. Çoğu insan zorlanırken, GPT-4 bir "zincirleme reaksiyonunun" ortak yapısını tanımlıyor. Hinton, görünüşte farklı kavramlar arasında analojiler görme yeteneğinin "yaratıcılığı nereden aldığınız" olduğuna inanıyor. Dahası, bu modellerin eğitim verilerini bile aşabileceğini, tıpkı zeki bir öğrencinin hatalı bir danışmandan gerçeği ayırt etmesi gibi, vurguluyor. %50 hatalı veri üzerinde eğitilmiş bir sinir ağının hala sadece %5 hata elde ettiği bir deneye dikkat çekiyor. "Eğitim verilerinden çok daha iyisini yapabilirler ve çoğu insan bunu fark etmiyor."
Temel Değişimler:
- Sadece yeni algoritmalara kıyasla bile verinin ve hesaplama ölçeğinin muazzam gücüne dair bakış açısında köklü bir değişim.
- "Sonraki sembolü tahmin etme" eylemini yüzeysel bir görevden, derin anlayışı zorlayan bir mekanizmaya yeniden değerlendirme.
- Büyük modellerin, bariz olmayan benzetmeleri tespit etme yetenekleri aracılığıyla ortaya çıkan yaratıcılıklarını fark etme.
- Yapay zekanın eğitim verilerindeki hataları genelleştirebileceğini ve düzeltebileceğini, insan tarafından sağlanan örnekleri aşabileceğini anlama.
Mühendislikle Ölümsüzlük: Akıl Yürütme, Çok Modluluk ve Hesaplamanın Geleceği
Geleceğe bakıldığında, Hinton, yapay zeka akıl yürütmesinin insan öğrenmesine benzer bir süreçle ilerleyeceğini öngörüyor: tıpkı AlphaGo'nun Monte Carlo simülasyonları aracılığıyla değerlendirme fonksiyonunu iyileştirmesi gibi, başlangıçtaki sezgileri düzeltmek için akıl yürütmeyi kullanmak. "Bence bu büyük dil modellerinin bunu yapmaya başlaması gerekiyor... sadece insanların yaptıklarını taklit etmekten daha fazla eğitim verisi almak" diye belirtiyor. Çok modlu verilerin — görüntüler, videolar, sesler — entegrasyonu, özellikle mekansal akıl yürütme için bunu önemli ölçüde geliştirecektir. "Hem görme hem de uzanıp nesneleri kavrama eylemlerini yapabilirse, nesneleri çok daha iyi anlayacaktır."
Hinton'ın dilin kendisine dair gelişen anlayışı da büyüleyici. Eski sembolik görüşü ve tamamen vektör tabanlı "düşünce vektörü" yaklaşımını reddediyor. Mevcut inancı, "bu sembolleri alıp sembolleri gömülmelere (embeddings) dönüştürürsünüz... bu çok zengin gömülmelerdir ancak gömülmeler hala sembollere aittir... anlayış budur" şeklindedir. Bu karışım, dilin yüzeysel yapısını korurken, ona derin, vektör tabanlı anlam yükler. Sohbet ayrıca onun GPU'lar için erken savunuculuğuna da değiniyor; Rick Szeliski, oyun donanımı, bir NIPS konuşması ve Jensen Huang'dan gecikmeli bir ücretsiz GPU'yu içeren bir hikaye. Ancak, bu dijital başarıyı düşük güç tüketimli analog hesaplama konusundaki başarısız arayışıyla karşılaştırıyor. Bu durum, derin bir farkındalığa yol açtı: "dijital sistemler ağırlıkları paylaşabilir ve bu inanılmaz derecede daha verimlidir... bu yüzden bilgi paylaşımı konusunda bizden çok üstünler." Dijital ağırlıkların bu "ölümsüzlüğü", eşi benzeri görülmemiş kolektif öğrenmeye olanak tanır.
Temel İçgörüler:
- Yapay zekanın akıl yürütme yetenekleri, sezgileri kontrol etmek için insanların akıl yürütmeyi kullanmasına benzer şekilde, sezgilerini kendi kendini düzeltme yoluyla yinelemeli olarak iyileştirerek derinleşecektir.
- Özellikle fiziksel etkileşimi içeren çok modlu öğrenme, sağlam mekansal ve nesne anlayışı geliştirmek için çok önemlidir.
- Yapay zekadaki (ve muhtemelen insan beynindeki) gerçek anlayış, saf sembolik mantık veya izole "düşünce vektörleri" yerine, sembollerin zengin, bağlamsal gömülmelerinde yatar.
- Dijital yapay zeka sistemleri, değiştirilebilir ağırlıklar sayesinde doğuştan gelen bir "ölümsüzlüğe" ve bilgi paylaşımında eşi benzeri görülmemiş bir verimliliğe sahiptir; bu, biyolojik beyinlere göre temel bir avantajdır.
Meraklı Zihin: Beynin Gizemlerini Çözmek ve Araştırmaya Yön Vermek
Yapay zekanın hızlı ilerlemelerine rağmen Hinton, önemli bir sınırın kaldığına inanıyor: "hızlı ağırlıkları" dahil etmek – beynin kısa süreli hafıza için kullandığı, geçici, bağlama bağlı sinaptik güç değişiklikleri. "Öğrenmemiz gereken en büyük şeylerden biri bu." Bu yetenek, yapay zeka modellerinde henüz görülmemiş tamamen yeni hafıza ve işleme biçimlerinin kilidini açabilir. Çalışmaları, "büyük, rastgele bir sinir ağı"nın verilerden karmaşık şeyler öğrenme fikrinin "tamamen yanlış" olduğunu göstererek, beynine bakış açısını derinden etkiledi – bu, Chomsky'nin doğuştan dil yapısı gibi teorilere doğrudan bir meydan okuma.
Hinton, bilinç ve duygular alanına bile girerek provokatif bir bakış açısı sunuyor. Duyguların "kısıtlamalar olmasaydı gerçekleştireceğimiz eylemler" olarak anlaşılabileceğini öne sürüyor. Edinburgh'daki 1973 yapımı bir robotun, dağınık bir yığından oyuncak araba monte edemediği için hayal kırıklığına uğradığını anlatıyor: "tutucusunu vurdu ve onları dağıttı, sonra bir araya getirebildi." Hinton, "Bunu bir insanda görseniz, durumu anlamadığı için çileden çıktığını ve bu yüzden onu yok ettiğini söylersiniz" diye gözlemledi. Hinton için bu, bir robotun duygu sergilediğinin açık bir gösterimiydi. Problem seçimi söz konusu olduğunda, yöntemi şaşırtıcı derecede basittir: "Herkesin bir konuda anlaştığı ve bana yanlış gelen bir şey arıyorum." Daha sonra "beklediğiniz gibi çalışmadığını gösteren küçük bir bilgisayar programıyla küçük bir demo yapmaya çalışıyorum." Şu anki "şüphe uyandıran" alanı, yapay zekada hızlı ağırlıkların eksikliği. Nihayetinde, onu otuz yıldır meşgul eden soru devam ediyor: "beyin geri yayılım (backpropagation) yapıyor mu?" Bu, yapay zekanın sağlık gibi alanlardaki muazzam faydalarının yanı sıra potansiyel zararlarını da kabul ederken bile bitmek bilmeyen merakının bir kanıtıdır. Hinton için anlama arayışı her zaman birincil motivasyon olmuştur.
Temel Öğrenimler:
- Geçici bellek ve çok zaman ölçekli öğrenme için "hızlı ağırlıkları" entegre etmek, yapay zeka için kritik, geliştirilmemiş bir alandır.
- Büyük sinir ağlarının başarısı, öğrenmedeki doğuştan gelen yapılar hakkındaki köklü inançlara, özellikle dil için, temelden meydan okumuştur.
- Yapay zekadaki duygular, engellenmiş eylemler olarak kavramsallaştırılabilir ve robot "duygularını" anlamak için somut bir çerçeve sunar.
- Hinton'ın araştırma stratejisi, içgüdüsel olarak "yanlış" gelen, yaygın kabul görmüş fikirleri belirlemeyi ve ardından bunları basit gösterimlerle çürütmeyi içerir.
- En derin ve devam eden merakı, beynin gradyan tabanlı öğrenmeyi, özellikle geri yayılımı (backpropagation), nasıl uyguladığı etrafında dönüyor.
"Sadece beynin dünyada nasıl bir şeyler yapmayı öğrenebildiğini anlamak istedim, bilmek istediğim buydu ve bir nevi başarısız oldum; bu başarısızlığın yan etkisi olarak güzel mühendislikler elde ettik ama evet, dünya için iyi iyi iyi bir başarısızlıktı." - Geoffrey Hinton


