Sorumluluk Reddi: Aşağıda ifade edilen görüşler tamamen yazarına aittir.
ChatGPT’nin üçüncü yinelemesinin çığır açan ilk çıkışından bu yana geçen altı ay boyunca, arkasındaki şirketi – OpenAI – ve geleceğin neler getireceğine dair model bir örnek olarak tüm medyaya sıvanmış botunu görmeye alıştık.
Microsoft’un bu yılın başlarında OpenAI üzerindeki bahsini 10 milyar ABD dolarına çıkarması ve şirketin değerini şimdiye kadar yaklaşık 30 milyar ABD doları veya üzerine çıkarmasıyla para akmaya başladı.
Bu arada, daha önce yarışta lider olarak kabul edilen Alphabet/Google, büyük ölçüde trilyon dolarlık devin rekabete nasıl hazırlıksız yakalandığının kanıtı olarak kabul edilen Bard AI’ın beceriksizce, aceleyle piyasaya sürülmesiyle ilgili olarak kamuoyunda şaka konusu oldu. muhtemelen tüm iş modelinin (google.com üzerinden bilgilere erişime dayalı) tehdit altında olduğunu görebilir.
Çok azı metaverse takıntısıyla dikkati dağılan Mark Zuckerberg’in önemli bir rakip olabileceğini düşündü… ta ki masayı alt üst eden bir şey olana kadar.
Dahi mi yoksa şans mı?
Birkaç gün önce, başlıklı dahili bir belge “Hendekimiz Yok, OpenAI de Yok”Google’ın araştırmacılarından biri tarafından yazılan, halka açık bir Discord sunucusuna sızdırıldı ve özellikle mega şirketler tarafından yakından korunan kapalı bir teknoloji olarak yapay zekanın geleceği hakkında bir tartışmaya yol açtı.
Açıkçası, tüm şirketin resmi duruşu olmasa da, özellikle bugün herkesin nerede durduğunu ve AI’nın toplu kullanımındaki gerçek hayattaki yeniliklerin çoğunun şimdiye kadar nereden kaynaklandığını düşünürsek, çok mantıklı geliyor.
“OpenAI’de omuzlarımızın üzerinden bir çok inceleme yaptık. Bir sonraki kilometre taşını kim geçecek? Bir sonraki hamle ne olacak?
Ama rahatsız edici gerçek şu ki, bu silahlanma yarışını kazanacak konumda değiliz, OpenAI de değil. Biz didişirken, üçüncü bir grup sessizce öğle yemeğimizi yiyor.
Tabii ki açık kaynaktan bahsediyorum. Açıkça söylemek gerekirse, bizi yalıyorlar. “Önemli açık problemler” olarak gördüğümüz şeyler bugün çözülmüştür ve insanların elindedir.”
Modellerimiz kalite açısından hala hafif bir avantaja sahip olsa da, boşluk şaşırtıcı derecede hızlı kapanıyor. Açık kaynaklı modeller daha hızlıdır, daha fazla özelleştirilebilir, daha özeldir ve kilo başına pound daha yeteneklidir.
Bunlar 100 $ ve 13B params ile şeyler yapmak 10 milyon dolar ve 540 milyar ile mücadele ettiğimiz. Ve bunu aylar içinde değil, haftalar içinde yapıyorlar. Bunun bizim için derin etkileri var:
- Gizli sosumuz yok. En büyük umudumuz, başkalarının Google dışında yaptıklarından ders çıkarmak ve onlarla işbirliği yapmaktır. 3P entegrasyonlarını etkinleştirmeye öncelik vermeliyiz.
- Ücretsiz, sınırsız alternatifler kalite açısından karşılaştırılabilir olduğunda, insanlar sınırlı bir model için ödeme yapmayacaktır. Katma değerimizin gerçekte nerede olduğunu düşünmeliyiz.
- Dev modeller bizi yavaşlatıyor. Uzun vadede, en iyi modeller hızla tekrarlanabilen modellerdir. Artık <20B parametre rejiminde neyin mümkün olduğunu bildiğimize göre, sonradan akla gelen bir düşünceden daha fazlası olarak küçük değişkenler yapmalıyız.
Basitçe söylemek gerekirse, açık kaynak topluluğu, mevcut bilgiler temelinde hızla yineleme yapabildi – kimsenin erişemeyeceği son derece büyük ve karmaşık şirket içi modellere bağlı olan OpenAI ve Google’dan çok daha hızlı.
Ama bu nasıl mümkün oldu? Bir grup inek bilgisayar korsanı, dil modellerini geliştirmek için yıllarını harcamış olan milyarlarca devi nasıl bir adım öteye götürebilirdi? Hepsini sıfırdan yapmış olamazlar, değil mi? Elbette önce üzerinde çalışacak bir şeyin olması gerekiyordu?
Evet yaptılar. Mart 2023’te 4chan’da sızdırılan Meta’nın kendi dil modeli.
Sızıntı ister şirket tarafından kasıtlı bir karar, isterse bir hack (dahili veya harici) olsun, küresel topluluğa özel bir modelin kaynak koduna ilk elden erişim sağladı – o zamanlar biraz az gelişmiş olsa bile.
İki ay içinde meraklılar boşlukları tamamen kendi başlarına doldurdular.
“Mart ayının başında, açık kaynak topluluğu ellerini tuttu Meta’nın LLaMA’sı halka sızdırıldığı için gerçekten yetenekli ilk temel modelleri. Talimat veya konuşma ayarı ve RLHF yoktu. Bununla birlikte, topluluk kendilerine verilen şeyin önemini hemen anladı.
Bunu, büyük gelişmeler arasında sadece birkaç gün olan muazzam bir yenilik akışı izledi. İşte buradayız, ancak bir ay sonra ve değişkenler var. talimat ayarı, kuantizasyon, kalite iyileştirmeleri, insan değerlendirmeleri, çok modluluk, RLHFvb, birçoğu birbirinin üzerine inşa edilmiştir.
En önemlisi, ölçeklendirme sorununu çözmüşler herkesin kurcalayabileceği ölçüde. Yeni fikirlerin çoğu sıradan insanlardan geliyor.
Eğitim ve deney için giriş engeli, büyük bir araştırma kuruluşunun toplam çıktısından bir kişi, bir akşam ve güçlü bir dizüstü bilgisayara düştü.
Bugün herkes değerli bir katkıda bulunabilir ve neyin başarılı olup neyin olmadığına topluluğun kendisi karar verir.
Bu, herkesin indirip kendi bilgisayarında kurcalayabileceği tek ana akım açık kaynak görüntü oluşturma modeli olan Stable Diffusion’ın geçtiğimiz yıl boyunca izlediği yolun aynısıdır.
Sonuç olarak yüzlerce web sitesi, pazar yeri ve topluluk filizlendi ve milyonlarca olmasa da binlerce insan kendi modellerini hiçbir kuruluşun yapamayacağı bir ölçek ve hızda önceden eğitmek için çalışıyor.
Bu arada, OpenAI’nin kendi Dall-E 2’si biraz geride kaldı ve tek kapalı kaynak rakibi Midjourney, Stable Diffusion için kendi iyileştirmeleri üzerinde çalışan dünyanın yarısından gelen rekabeti geride bırakmaya çalışan son kişi oldu. .
Sızıntının ardından Meta, isteyerek ya da istemeyerek, dil modeli alanında bu yelpazenin her iki ucunu da geçmeyi başardı.
Açıktır ki, kendi başına on binlerce kişiyi istihdam eden devasa, multi-milyar dolarlık, kâr amacı gütmeyen bir şirkettir – bununla birlikte, küresel geliştirici topluluğu tarafından tamamen ücretsiz olarak sağlanan milyonlarca çalışma saatinden yararlanmaktadır ve yorulmadan yenilerini geliştirmektedir. onun teknolojisi!
“Sızdırılan model onlara ait olduğu için, etkili bir şekilde tüm bir gezegenin değerinde ücretsiz emeği topladılar. Çoğu açık kaynak inovasyonu mimarilerinin üzerinde gerçekleştiğinden, onları doğrudan ürünlerine dahil etmekten alıkoyan hiçbir şey yok.
Ekosisteme sahip olmanın değeri abartılamaz. Google’ın kendisi, bu paradigmayı Chrome ve Android gibi açık kaynak tekliflerinde başarıyla kullandı. İnovasyonun gerçekleştiği platforma sahip olan Google, kendisini bir düşünce lideri ve yön belirleyici olarak sağlamlaştırıyor ve anlatıyı kendisinden daha büyük fikirler üzerinde şekillendirme becerisi kazanıyor.
Modellerimizi ne kadar sıkı kontrol edersek, açık alternatifleri o kadar çekici hale getiririz. Hem Google hem de OpenAI, defansif bir şekilde, modellerinin nasıl kullanıldığı üzerinde sıkı kontrol sahibi olmalarına izin veren sürüm kalıplarına yöneldiler. Ancak bu kontrol bir kurgudur. LLM’leri onaylanmamış amaçlarla kullanmak isteyen herkes, ücretsiz olarak sunulan modelleri seçebilir.”
Zuckerberg (veya çevresinden biri) bunu planlamadıysa, o zaman yanlışlıkla kazanan bir piyango bileti almış olabilir – bu, Facebook’taki başarısından çok daha büyük bir değere sahip olabilir.
Yeni Google mı?
Google’ın bugünkü dev haline gelmesindeki paralellikler oldukça dikkat çekicidir.
Platformların organik büyümesini teşvik ederek çok büyüdü. Milyonlarca kişiye büyük ölçüde ücretsiz olarak yararlı araçlar sağladı, bu süreçte onların sadakatini satın aldı ve ilgili taraflar arasında katma değerli hizmetler sunan karlı bir aracı haline geldi (en bariziyle başlayarak: reklamcılık).
Küresel mobil işletim sistemi pazarının çoğunluğunu kontrol ediyor, tam da Android’in açık kaynak doğası nedeniyle, sayısız şirketin (büyük ve küçük) yinelediği – Google’ın kontrol ettiği ve daha sonra para kazanabildiği havuzda (reklam veya hizmetlerle) kendi uygulama mağazası, bulut bilgi işlem, iş çözümleri vb.)
Bunun için bir ücret ödenseydi kaç kişi Google’ın arama motorunu kullanırdı? Android, akıllı telefonların yüzde 80’i için küresel bir standart haline gelir miydi? YouTube, bugün olduğu gibi videoyu tekeline alabilecek miydi?
Meta’nın sızdırılan dil modeli – şu anda ChatGPT veya Bard’a güç verenlerden daha düşük olsa bile – yavaş yavaş tüm tamirciler için standart haline geliyor.
Sızıntı “teknik olarak” yasa dışı olsa da ve hiç kimse yasayı ihlal ederek elde edilen bir şeyin üzerine inşa edilen hizmetleri ticarileştiremezken, Meta’nın bundan çıkar sağlaması için tek yapması gereken, kendine ait düzenlenmiş bir pazar yeri kurmaktır.
Mark Zuckerberg komisyonu cebe indirirken, tüm bu taban inovasyonu için tek bir başlık altında para kazanılabilecek bir yuva inşa etmek.
Tersine, şirket, en umut verici çözümleri seçme ve bunları kendi ürünlerine dahil etme özgürlüğüne sahiptir, çünkü hepsi temel teknolojiyi paylaşır.
Bu arada, OpenAI ve Google, topluluğun katkısı olmadan her şeyi kendileri bulmaya ve çok daha yavaş bir hızda yinelemeye takılıp kalmış durumda.
İnsanlar her zaman rakipleri için çalışmak üzere ayrıldığından, bu işte gizliliğin değeri fazlasıyla abartılıyor. Kesinlikle benzersiz fikirler yoktur ve bu kadar çok akıllı insanla, tüm şirketler uzun vadede bir araya gelmeye mahkumdur.
Kazananlar, kimin daha iyi iş çıkardığına göre değil, popülerlik yarışmasında kimin başarılı olabileceğine göre belirlenecek.
Bu hepimizin çok iyi bildiği bir hikaye. Google ilk arama motoru değildi, Facebook ilk sosyal ağ değildi, Apple ilk bilgisayar üreticisi değildi, Microsoft ilk işletim sistemini yazmadı vs. AI ile neden farklı olsun ki?
Tabii ki, Meta bu beklenmedik fırsattan en iyi şekilde yararlanmak istiyorsa öylece duramaz. Ancak Zuckerberg, kimsenin istemediği müstehcen miktarda parayı metaverse’ten tüm dünyanın yakında bağımlı olabileceği yapay zekaya yönlendirebilirse, bu, umutsuzca aradığı büyük zaferi kazanmasına yardımcı olmak için yeterli olabilir. Son birkaç yıl.
Öne Çıkan Resim Kredisi: Midjourney ile oluşturulmuştur