Nisan, büyük dil modellerinin ayıydı. Birbiri ardına duyurular yapıldı; Yeni modellerin çoğu öncekilerden daha büyüktü ve birçoğunun önemli ölçüde daha fazla enerji verimli olduğu iddia ediliyordu. En büyüğü (bildiğimiz kadarıyla), 1.2 trilyon parametreye sahip Google’ın GLAM’ıdır – ancak eğitmek için GPT-3’ten önemli ölçüde daha az enerji gerektirir. Chinchilla, GPT-3’ün ¼ kadar parametresine sahiptir, ancak ondan daha iyi performans gösterdiğini iddia eder. Giderek daha büyük modellere olan yarışın nereye varacağı ya da bizi nereye götüreceği belli değil. PaLM modeli, sebep ve sonuç hakkında akıl yürütebildiğini iddia eder (diğer büyük modellerden daha verimli olmasının yanı sıra); Henüz düşünen makinelere sahip değiliz (ve hiçbir zaman da olmayabiliriz), ama daha da yaklaşıyoruz. Enerji verimliliğinin konuşmanın bir parçası haline geldiğini görmek de güzel.
yapay zeka
- Google, GLAM’ı 1,2 trilyon parametreli bir model (GPT-3’ün 7 katı) oluşturmuştur. GLAM eğitimi 456 megavat saat gerektiriyordu, ⅓ GPT-3’ün enerjisi. GLAM, girdiye bağlı olarak sinir ağının farklı alt kümelerinin kullanıldığı bir Uzmanlar Karışımı (MoE) modeli kullanır.
- Google, 3D taranmış ev eşyalarından oluşan bir veri seti yayınladı. Bu, sanal gerçeklik için AI üzerinde çalışan herkes için çok değerli olacaktır.
- FOMO (Daha Hızlı Nesneler, Daha Fazla Nesne), 200 KB’den daha az bellek gerektiren gerçek zamanlı nesne algılama için bir makine öğrenme modelidir. TinyML hareketinin bir parçası: küçük gömülü sistemler için makine öğrenimi.
- LAION (Büyük Ölçekli Yapay Zeka Açık Ağ), büyük modeller oluşturan ve bunları halka açık hale getiren, kar amacı gütmeyen, ücretsiz ve açık bir kuruluştur. OpenAI’nin olması gereken buydu. İlk model, DALL-E’ye benzer eğitim modelleri için bir dizi görüntü-metin çiftidir.
- NVidia, en son GPU yongalarının tasarımını otomatikleştirmek için AI kullanıyor.
- Kanalizasyon borularını denetlemek için AI kullanmak, “görünmeyen” bir AI uygulamasına bir örnektir. Altyapıya dayalıdır, önyargıları veya önemli etik sorunları bir araya getirme riski yoktur ve (eğer işe yararsa) insan yaşamının kalitesini iyileştirir.
- Büyük dil modelleri genellikle metne dayalıdır. Facebook konuşulan dilden bir dil modeli oluşturmaya çalışıyor ki bu çok daha zor bir problem.
- STEGO, görüntü verilerini otomatik olarak etiketlemek için yeni bir algoritmadır. Nesneler arasındaki ilişkileri anlamak için transformatörler kullanır ve insan girdisi olmadan nesneleri segmentlere ayırmasına ve etiketlemesine olanak tanır.
- Bir araştırmacı, bir fotoğrafa dayalı olarak ilk izlenimleri ve klişeleri tahmin etmek için bir model geliştirdi. Bu modelin, maksimum etki için sahte ince ayar yapmak için kolayca kullanılabileceğini ve “ilk izlenimlerin” aslında bir kişi hakkında hiçbir şey söylemediğini söylemeye özen gösteriyorlar.
- Maori halkı için dil modelleri oluşturan bir grup, yerli diller için yapay zekanın yapay zeka, veri ve veri hakları hakkında farklı düşünme biçimleri gerektirdiğini gösteriyor.
- A21, “hizmet olarak” geniş bir dil modeli sunan yeni bir şirkettir. Müşterilerin modellerinin özel versiyonlarını eğitmelerine izin veriyorlar ve insanları ve makineleri “düşünce ortakları” yaptıklarını iddia ediyorlar.
- Araştırmacılar, dil modelleri tarafından üretilen zehirli metni azaltmak için bir yöntem buldular. Toksik metin üretmek için eğitilmiş bir modelin, toksisiteyi tespit etmek ve reddetmek için eğitilmiş bir modele “karşı oynadığı” bir GAN (üretken düşmanlık ağı) gibi görünüyor.
- AI’nın daha kötü uygulamaları: şirketler, satış görüşmeleri sırasında ruh halinizi izlemek için AI kullanıyor. Bu şüpheli özellik yakında Zoom’a gelecek.
- Primer, Rusya ile Ukrayna arasındaki savaşta ele geçirilen iletişimleri kopyalamak, tercüme etmek ve analiz etmek için yapay zeka kullanan bir araç geliştirdi.
- Deep Mind, başka bir büyük dil modeli olan Chinchilla’nın, parametre sayısının kabaca ¼’üyle GPT-3 ve Gopher’dan daha iyi performans gösterdiğini iddia ediyor. Yaklaşık 4 kat daha fazla veri üzerinde eğitildi, ancak daha az parametre ile eğitmek ve ince ayar yapmak için daha az enerji gerektirir.
- Veri Güvenilirliği Mühendisliği (DRE), makine öğrenimi uygulamaları için daha yüksek kaliteli veriler sağlarken gerekli el emeğini azaltmak için bir çerçeve olarak SRE ve DevOps’tan fikirler alır. Veri merkezli AI ile yakından ilgilidir.
- OpenAI’nin DALL-E 2’si, doğal dil açıklamalarından görüntüler oluşturmak için sistemlerine (DALL-E) yeni bir bakış açısı getiriyor. Ayrıca, değişikliklerin doğal dil açıklamalarına dayalı olarak mevcut sanat eserlerini değiştirme yeteneğine de sahiptir. OpenAI, DALL-E 2’yi GPT-3’e benzer şartlarda halka açmayı planlıyor.
- Google’ın yeni Pathways Language Modeli (PaLM) daha verimlidir, nispeten enerji tasarruflu olmasının yanı sıra kavramları ve sebep sonuç ilişkisini anlayabilir. Aslında düşünüyor gibi görünen AI’ya doğru bir başka adım.
- SandboxAQ, kuantum sonrası bir dünya için gerekli teknolojileri oluşturmak için AI kullanan bir Alfabe girişimidir. Kuantum hesaplama yapmıyorlar, ancak kuantum sonrası kriptografi için protokoller gibi sorunları çözüyorlar.
- IBM, hem makine öğrenimi hem de biyoloji ve malzeme bilimi gibi alanlarda bilimsel araştırmalar için yeni fikirler üretmek üzere tasarlanmış üretken bir model olan Generative Toolkit for Scientific Discovery’yi (GT4SD) açık kaynaklı hale getirdi.
- Waymo (Alphabet’in sürücüsüz otomobil şirketi) artık San Francisco’da sürücüsüz hizmet sunuyor. San Francisco, Waymo’nun 2020’den beri sürücüsüz hizmet sunduğu Phoenix’ten daha zorlu bir ortamdır. Katılım, Güvenilir Test Kullanıcısı programlarının üyeleriyle sınırlıdır.
Web3
- Merkezi olmayan bir sosyal ağ olan Mastodon, Elon Musk’ın Twitter’ı devralmasından yararlanıyor gibi görünüyor.
- Web3 için itibar ve kimlik yönetimi önemli bir sorundur: Uygulamalara olması gerekenden daha fazla bilgi vermeden kimliği ve itibarı nasıl doğrularsınız? Ontology adlı bir girişim bunu çözdüğünü iddia ediyor.
- NFT’ler için bir sanal sanat müzesi hala yapım aşamasındadır, ancak var ve onu ziyaret edebilirsiniz. Muhtemelen VR’de daha iyi bir deneyim.
- 2022, kripto suçlar için 2021’den daha büyük bir yıl olacağa benziyor. Saldırılar giderek merkezi olmayan finans (DeFi) platformlarına odaklanıyor.
- Wikipedia’nın web3 versiyonu, Rusya’nın “yasaklanmış bilgileri” kaldırma taleplerinden kaçabilir mi? Yoksa ekonomik teşviklerle çarpıtılmış bir Wikipedia’ya mı yol açacak (geçmişteki blok zinciri tabanlı bir ansiklopedi oluşturmaya yönelik girişimler gibi)?
- Helyum Ağı, erişim noktası operatörlerine kripto para biriminde ödeme yapan LoRaWAN kullanan merkezi olmayan bir genel geniş alan ağıdır. Ağ, 700.000’den fazla etkin noktaya ve dünyanın büyük metropol alanlarının çoğunda kapsama alanına sahiptir.
Programlama
- Gerçekten başka bir kabuk betik diline ihtiyacımız var mı? Hush geliştiricileri yaptığımızı düşünüyor. Hush, Lua’yı temel alır ve kabuk komut dosyası oluşturmayı daha sağlam ve sürdürülebilir hale getirdiğini iddia eder.
- Web Montajı çığır açıyor; Burada, istemci tarafı medya düzenlemeden sunucusuz platformlar, akıllı veri ardışık düzenleri ve diğer sunucu tarafı altyapıları oluşturmaya kadar her şey için wasm kullanan girişimlerin bir listesi.
- QR kodları korkunç. Canlandırıldıklarında daha mı az korkunçlar? İşe yarayacak gibi görünmüyor, ancak standartta yerleşik olarak bulunan hata düzeltme ile oyun oynamak, animasyonlu QR kodlarının oluşturulmasına izin veriyor.
- Kendi kuantum bilgisayarınızı mı kuruyorsunuz (simülasyonda)? Qubit Game, oyuncuların tek bir qubit ile başlayarak bir kuantum bilgisayarı “oluşturmalarını” sağlar.
- Docker’ın kurucularından biri, geliştiricilerin DevOps işlem hatlarını yönetmelerine yardımcı olacak yeni bir ürün olan Dagger’ı geliştiriyor.
- Uygulamalar, araya giren bip sesleri ve gonglar yerine “ortam bildirimleri” (esinti, hafif bir dokunuş veya gölgelerde kayma gibi) kullanabilir mi? Google, donanım için kod, elektronik ve 3D modelleri içeren ortam bildirimleriyle ilgili altı deney olan Little Signals yayınladı.
- Lambda İşlev URL’leri, AWS’deki tek işlevli mikro hizmetler için bir API uç noktasının yapılandırmasını otomatikleştirir. Bir URL’yi sunucusuz bir işleve eşleme işlemini basitleştirirler.
- GitHub, bir çekme isteğinin sonuçlarını inceleyen ve yeni bağımlılıkların getirdiği güvenlik açıkları konusunda uyaran bir bağımlılık inceleme özelliği ekledi.
- Google, yazılım tedarik zincirinin bütünlüğünü sağlamak için bir çerçeve olarak Yazılım Eserleri için Tedarik Zinciri Düzeyleri (SLSA) önerdi. Meta veri oluşturmak için kullanılabilecek bir dizi güvenlik yönergesidir; yazılım bileşenlerinin kurcalanmadığından ve izlenebilir bir kaynağa sahip olduğundan emin olmak için meta veriler denetlenebilir ve izlenebilir.
- Harvard ve Linux Vakfı, en popüler binlerce açık kaynak kütüphanesini listeleyen ve kullanımlarını sıralamaya çalışan Census II’yi üretti.
Güvenlik
- REvil fidye yazılımı geri döndü (belki). Çok fazla spekülasyon olmasına rağmen, bunun ne anlama geldiği veya arkasında kimin olduğu henüz net değil. Yine de, iş ortakları arıyor gibi görünüyorlar.
- Saldırganlar, GitHub’ı tehlikeye atmak ve başta npm olmak üzere birçok kuruluştan veri indirmek için çalınan OAuth belirteçlerini kullandı.
- NSA, Enerji Bakanlığı ve diğer federal kurumlar, güç altyapısını devre dışı bırakmak için tasarlanmış “pipedream” adlı yeni bir kötü amaçlı yazılım araç seti keşfetti. Diğer kritik altyapı sistemlerine uyarlanabilir. Henüz kullanılmamış görünüyor.
- Sandworm olarak bilinen Rus devlet destekli bir grup, Ukrayna’nın elektrik şebekesini yıkma girişiminde başarısız oldu. Industroyer’ın (endüstriyel kontrol sistemlerine saldırmak için) ve Caddywiper’ın (saldırıdan sonra temizlemek için) yeni sürümlerini kullandılar.
- IP adreslerinin bir bulut sağlayıcısı tarafından yeniden kullanılması, daha önce kullanılan bir IP adresi atanan bir kuruluşun önceki muhatap için amaçlanan verileri aldığı “bulut işgaline” yol açabilir. Adres ataması son derece dinamik hale geldi; DNS bunun için tasarlanmamıştı.
- Pete Warden, kameraları ve mikrofonları olan (telefonlarla sınırlı olmayan) cihazların gizliliğini doğrulamanın yollarını tartışacak bir araştırmacılar koalisyonu kurmak istiyor.
- Ev cephesinde siber savaş: FBI, Rus botnet kötü amaçlı yazılımlarını kaldırmak için bazı ABD şirketlerindeki cihazlara uzaktan erişti. Kötü amaçlı yazılım, WatchGuard güvenlik duvarlarını ve Asus yönlendiricilerini hedefler. Cyclops Blink botnet, Rusya sponsorluğundaki Sandworm grubu tarafından geliştirildi.
- Kimlik doğrulamanın devre dışı bırakıldığı dizüstü bilgisayar sunucularında Jupyter Notebook’ları hedef alan fidye yazılımı saldırıları görüldü. Jupyter’ın kendisinde önemli bir güvenlik açığı yok gibi görünüyor; sadece kimlik doğrulamayı devre dışı bırakma!
- Güvenlik kameraları, video yayınlarında farklı bir gizlilik sürümü kullanarak sınırlı bir tür gizlilik sağlayabilir. Kullanıcılar görüntü hakkında sorular sorabilir, ancak kişileri tanımlayamaz. (Gizlilik özelliklerine sahip bir güvenlik kamerası isteyip istemediğiniz başka bir sorudur.)
Biyoloji ve Sinirbilim
- Bir beyin-bilgisayar arayüzü, tamamen “kilitlenmiş” bir ALS hastasının dış dünyayla iletişim kurmasına izin verdi. İletişim yavaştır, ancak basit evet/hayır isteklerinin ötesine geçer.
Donanım
- CAT taramaları sadece radyoloji için değildir. Lumafield, bulutlarında yapılan görüntü analizi ile küçük dükkan ve ofislerde kullanılabilecek, masa boyutunda bir CT tarama makinesi üretti.
- Boston Dynamics’in piyasada ikinci bir robotu var: Kamyonları boşaltmak ve konteynırları taşımak gibi görevleri gerçekleştirmek için tasarlanmış bir kutu taşıma robotu olan Stretch.
- Bir başlangıç, binlerce tek moleküllü biyosensörü seri üretilebilen bir silikon çip üzerine yerleştirme yeteneğine sahip olduğunu iddia ediyor. 2022 yılı sonuna kadar ticari bir ürüne sahip olmayı planlıyorlar.
Sanal evren
Daha hızlı öğrenin. Daha derin kaz. Daha uzağa bakın.