Makine öğrenimi modeli dünyasında işaret edilecek çok fazla gürültü var, ancak bu demo gerçekten etkileyici – veya eğlenceli bir şekilde MRI tarayıcılarına tırmanmaya alışkınsanız korkutucu.
Yeni araştırma, Profesör tarafından ortak yazılan “İnsan beyni aktivitesinden gizli difüzyon modelleri ile yüksek çözünürlüklü görüntü rekonstrüksiyonu” başlıklı bir makalede sunulmaktadır. Shinji Nişimoto ve Yardımcı Doçent Yu Takagi Frontier Biosciences Enstitüsü’nün (FBS) de Osaka Üniversitesi. Boffinlerin yaptığı şey, fMRI beyin taramalarını beyine geçirmenin bir yolunu buldu. açık kaynak tarafından oluşturulan Kararlı Difüzyon gizli değişken modeli Milyar dolarlık startup unicorn Stability AI.
Sonuçlar en hafif deyimiyle şaşırtıcı. Bir fMRI beyin taramasının çıktısıyla sunulan – gözümüze rastgele gürültüye çok yakın görünen – araştırmacıların sınırlı yayılma modeli, kendi sözleriyle şunları yapabilir:
herhangi bir ek eğitime ve karmaşık derin öğrenme modellerinde ince ayara ihtiyaç duymadan yüksek çözünürlüklü görüntüleri yüksek doğrulukla basit bir şekilde yeniden oluşturun.
Ön baskı kağıdı, kurtarılmış beş resmi sergiliyor: papyonuyla tamamlanmış bir oyuncak ayı; ağaçlardan oluşan bir cadde; iniş yapan (veya muhtemelen kalkan) bir jet uçağı; yamaçlarda bir snowboardcu; ve sivrilen bir saat kulesi. Eşleşme düzeyi değişkendir ve bir buharlı lokomotifin altıncı görüntüsü daha az nettir, ancak doğal olarak yapmaya eğilimli olacaklarından şüphelendiğimiz gibi, araştırmacılar sonuçlarının en iyisini seçmiş olsalar bile, dikkate değer ölçüde iyidir.
Bilginler, modellerinin kaynak kodunun “yakında çıkacağını” söylüyorlar. Girdi verileri, taramaları Minnesota Üniversitesi’nin halka açık Doğal Sahneler Veri Kümesinde veya NSDve bildiride verilen örnek görseller bir kişiye aittir.
Stable Difüzyon’un kendisi, metinsel açıklamalar alarak ve bazen yalnızca bir avuç sözcükten çok gerçekçi görüntüler üreterek ünlü oldu – ve eğer bunlar yeterince dikkatli seçilirse, metin, modeli eğitmek için kullanılan orijinal görüntüleri çağrıştırabilir.
Dolayısıyla bu, tam olarak birinin zihnini okuyan bir bilgisayar olmasa da, örneğin bu yönde daha önceki bazı çabalardan çok daha iyi sonuçlar veriyor. 2021’de rapor ettiğimiz. Makaleyi doğru takip edersek, eğitim veri tabanındaki öğeleri dahil ederek kurtarılan görüntüleri iyileştirmek için Kararlı Difüzyon kullanıyorlar. Karşılaştırma için, yaklaşık 12 yıl önce, karşılaştırılabilir bir kağıt [PDF] Bayes istatistiklerini ve modellemeyi kullanmak, bazı tanınabilir görüntüler üretti, ancak önemli ölçüde daha düşük kalitede.
Geçmişte bildirdiğimiz gibi, fMRI araştırmasının iddiaları uzun süredir tartışmalıancak bu, makine öğrenimi ve sinir ağı algoritmalarının en yararlı olabileceği türden bir alandır: kolayca tanınabilir sonuçlar üretmek için çok zayıf sinyalleri bulmak, bunları devasa görüntü kitaplıklarıyla ilişkilendirmek ve eşleştirmek.
Fonksiyonel MRI, manyetik rezonans görüntülemenin veya nükleer manyetik rezonans görüntülemenin bir alt kümesidir, bilim adamları “n kelimesinin” insanları korkuttuğunu fark etmeden önce çağrıldığı şekliyle. İlgili tarayıcılar son derece büyüktür (ve bu akbaba, birden fazla tarayıcıda bulunduğunu kanıtlayabilir, son derece yüksek sesle) makineler. Hiç kimse sokağın karşısından kafanıza parabolik bir çanak tutup ne düşündüğünüzü okumaz. Ama önce bir sürü feragatname imzalarsanız, sonra başınız etrafında dönerken halka şeklindeki devasa bir mıknatısla bir saat boyunca yatarak geçirirseniz, evet, bu tür bir teknik hangi resme baktığınızı söyleyebilir .
İki profesörün bir sayfa çalışmaları hakkında ve okuyabilirsiniz soyut veya 11 sayfanın tamamı kağıt [PDF] bioRchiv ön baskı sunucusunda. Bulgularını bu yılki fuarda sunacaklar. CVPR Haziran ayında Vancouver’da. ®