• Sat. Oct 1st, 2022

Sonbaharın GTC’si Nvidia’nın gerçekten kimin umurunda olduğunu gösteriyor • Kayıt

Byadmin

Sep 22, 2022

GKŞ Bu haftaki GPU Teknoloji Konferansı, Nvidia’nın son zamanlarda çip tasarımcısından pek görmediğimiz bir şey yaptığını gördü: bir tüketici ürününü yenilemek.

Giderek daha fazla kurumsal takıntılı teknoloji devi için GTC, oyuncular için GPU’lar ve AI, robotik, otonom araçlar ve her zaman vızıldayan metaverse gibi yeni ve gelişmekte olan pazarlardan yararlanmakla ilgili her şey hakkında giderek daha az hale geldi. Bu bağlamda metaverse ile, simülasyonlar, uygulamalar ve birbirinizle etkileşim kurabileceğiniz ve işbirliği yapabileceğiniz 3B sanal gerçeklik dünyalarını kastediyoruz.

Nvidia CEO’su Jensen Huang, imzalı deri ceketiyle sahneye çıktı – yoksa sanal güverte mi? emin değiliz – mühendislerinin Ada Lovelace mimarisi tarafından desteklenen üç RTX 40 serisi grafik kartını ortaya çıkarmak için.

Huang’ın yaklaşık bir saat 45 dakikalık açılış konuşmasını izleyen birçok kişi için, bu açıklama, bu sonbahar etkinliğindeki tek sağlam ve ilgili duyuru olabilir.

Özenle seçilmiş bir dizi kriter kullanan Huang, RTX 4090 ve 4080 grafik kartlarının öncekilere göre performans kazanımları hakkında övündü. Yonga tasarımcısı, RTX 4090’ın şirketin bu baharda piyasaya sürülen önceki amiral gemisi 3090 TI’ye kıyasla 2x-4x daha yüksek performans sunacağını söyledi.

Sonra bu yeni RTX birimlerinin fiyatı var. Kartlar, Nvidia’nın bugüne kadarki en pahalılarından bazıları. 12GB 4080 için 899 dolar ve 16GB versiyonu için 1.199 dolar olan kartlar, iki yıl önce piyasaya sürüldüğünde 3080’den 200-500 dolar daha pahalı. 4090’daki fiyat düşüşü o kadar şiddetli değil. 1.599 dolarla, 3090’ın 2020’de piyasaya sürüldüğü zamandan yaklaşık 100 dolar daha fazla.

Çarşamba günü düzenlediği basın toplantısında konuşan Huang, performans artışlarını ve özellik setinin yüksek fiyatı telafi etmekten fazlasını savunarak artışı savundu. Fiyat artışının daha yüksek üretim ve malzeme maliyetleriyle daha da haklı olduğunu iddia etti.

“12 inçlik bir gofret bugün düne göre çok daha pahalı ve biraz daha pahalı değil, bir ton daha pahalı” dedi ve “Ada Lovelace ile performansımız anıtsal olarak daha iyi” diye ekledi.

Ancak Huang’ın üzerinde iki dakikadan daha az ayrıntılandırma harcadığı yeni kartların ötesinde, işler her zamanki gibi işbaşına dönmüştü. İşte Nvidia’nın GTC’deki daha büyük duyurularının bir özeti.

Çift mimarili bir modele geri dön

RTX duyurusuna kadar yaklaşık 15 dakika, Nvidia’nın çip tasarımcısının bir kez daha çift mimarili bir modele döndüğünü gören yeni Ada Lovelace mimarisine harcandı.

Nvidia’nın daha önce duyurulan Hopper mimarisi, şirketin H100 gibi HPC ve AI odaklı işlemcilerine güç verirken, Ada Lovelace mimarisi Nvidia’nın grafik merkezli yongalarına güç sağlayacak.

Adını 19. yüzyıl matematikçisinden alan Ada Lovelace mimarisi, TSMC’nin 4N süreci üzerine kuruludur ve Nv’nin üçüncü nesil gerçek zamanlı Işın İzleme çekirdeklerini ve dördüncü nesil Tensör çekirdeklerini içerir.

Yani bir ayrım var: Hooper, esas olarak yüksek performanslı bilgi işlem ve büyük AI iş yüklerini hedefliyordu ve Lovelace, esas olarak bulut sunucusu GPU’larından oyun kartlarına kadar her şeyi hedefliyordu.

Bu, Nvidia’nın çift mimarili bir modeli ilk kez kullanması değil. İki nesil geriye giden Nvidia’nın V100 gibi veri merkezi yongaları Volta mimarisini kullandı. Bu arada, tüketici ve grafik odaklı yongaları, örneğin RTX 2000 serisi ve Quadro RTX ailesi, Turing mikro mimarisini kullandı.

Ada Lovelace, Nvidia’nın RTX 40 serisi parçalarına ek olarak, Nvidia’nın RTX 6000 serisi iş istasyonu kartlarına ve L40 veri merkezi GPU’larına da güç sağlayacak. Bununla birlikte, Huang, Hopper’ın aksine, yeni mimarinin bulut oyunlarının yükselişi ve meta veri deposu dahil olmak üzere yeni nesil grafik merkezli zorlukları ele almak için tasarlandığını söylüyor. Bunlar, bu gerçek zamanlı ortamları oluşturmak için bir yerde grafik yongalarına ihtiyaç duyacaklar – bulut oyunları, oyunun esas olarak bir arka uçta oluşturulduğu ve internet üzerinden bir dizüstü bilgisayar veya telefon gibi kullanıcının önündeki bir ekrana canlı olarak aktarıldığı yerdir. Bu, oyuncuları oyun donanımlarını satın almaktan ve yükseltmekten ve/veya onları her yere taşımaktan kurtarır.

“Çin’de bulut oyunları çok büyük olacak ve bunun nedeni, oyun geliştiricilerin artık nasıl hizmet edeceklerini bilmediği milyarlarca telefon olması,” dedi ve “Bunu çözmenin en iyi yolu bulut oyunlarıdır. Entegre grafiklere ulaşabilir, mobil cihazlardan ulaşabilirsiniz.”

Meta veri deposu ancak hizmet olarak

Ancak Ada Lovelace, bulut oyun uygulamalarıyla sınırlı değildir. Nvidia, mimariyi, müşterilerin Omniverse donanım ve yazılım yığınına buluttan erişmesine izin vereceğini söylediği ilk hizmet olarak yazılım teklifinin iş atı olarak konumlandırıyor.

Omniverse Cloud, isteğe bağlı olarak metaverse uygulamalarını buluttan çalıştırmak için gereken uzaktan bilgi işlem ve yazılım kaynaklarını sunar. Fikir, her işletmenin bu düzeyde bir simülasyon sağlamak için Nvidia’nın OVX SuperPod’larından birine milyonlarca dolar harcamak istememesi ve hatta bütçesinin olmamasıdır. Bunun yerine, metaversiyonlarını Omniverse Cloud’da oluşturabilirler.

Nvidia, şimdilik büyük lojistik, üretim ve diğer endüstriyel ortaklara kur yapıyor ve dijital ikizleri oluşturmalarına ve görselleştirmelerine yardımcı olacağına söz veriyor. Bu ikizler büyük ölçekli simülasyonlardır – her simülasyon, gerçek veriler ve modelleme kullanılarak gerçek dünya ile ikizlenir – ve sanal bir dünyada tasarımları, süreçleri ve sistemleri kullanıma sunulmadan önce test etmenin ve doğrulamanın bir yolu olarak sunulur. gerçek dünya.

Evet, hepsi daha süslü modelleme ve simülasyon, ancak yeni silikon, etkileşim, sanal gerçeklik ve faturalarla.

Omniverse Cloud, Nvidia’nın yönetilen bulut hizmetlerine ilk adımı olsa da, şirketinin diğer yazılım platformları için benzer bir modeli değerlendirdiğinin sinyalini veren Huang’a göre, bu son olmayacak.

Daha akıllı otomobiller, robotlar

Nvidia, yalnızca müşterilerin depolarının ve üretim tesislerinin dijital ikizlerine güç sağlamak istemiyor. Açılış konuşması sırasında Huang, otonom robotlardan otomobillere kadar her şeye güç sağlamak için tasarlanmış bir dizi donanımı da detaylandırdı.

Huang, Nvidia’nın günümüzde araçlarda kullanılan çok sayıda bilgisayar sisteminin yerini almak üzere tasarlanmış hepsi bir arada bilgi işlem platformu Drive Thor’dan bahsetti.

Teknoloji, Nvidia’nın Zeekr ve Xpeng 2025 araç serisine ve QCraft’ın otonom taksi hizmetine güç vereceğini söylediği Çin’de ilk çıkışını yapacak. Bu, elbette, ABD ihracat kısıtlamaları Nvidia’nın artık sağlayamayacağı noktaya kadar sıkılaştırmazsa – Huang’ın Çarşamba günü düzenlediği basın toplantısında küçümsediği bir olasılık.

Bu arada, Nvidia, insan işçilerin yanında koşuşturan robot kölelere güç sağlamak için IGX ve Orin Nano platformlarını sergiledi.

IGX, Nvidia’nın daha önce duyurulan Orin AGX Endüstriyel modüller üzerinde sistemini temel alır, ancak yüksek hızlı ağ iletişimi ekler. Nvidia’ya göre, kartın ilk kullanımlarından biri cerrahi robotlarda olacak. Bu arada, Nvidia’nın Jetson Orin Nano modülleri, daha az talepkar uygulamaların üstesinden gelmek için tasarlandı.

Kitleler için geniş dilli modeller

Önceki GTC’lerde olduğu gibi, yazılım açılış konuşmasında önemli bir yere sahipti. Bu sonbahar etkinliği için en büyük sürümlerden ikisi, Nvidia’nın NeMo ve BioNeMo adlı geniş dil modeli (LLM) hizmetleriydi.

Hizmetler, karmaşık veri kümelerinden içgörü toplamak isteyen yapay zeka araştırmacıları ve biyologlar için LLM’leri kullanmayı kolaylaştırmayı amaçlıyor. Hizmetler, müşterilerin mevcut verilerini minimum çabayla özelleştirilebilir temel modellere bağlamasına olanak tanır. Örneğin, BioNeMo’nun protein katlama araştırmalarını hızlandırmak için kullanılabileceği öne sürüldü.

Her ülkede, her bir şirket, her bir dili konuşan muhtemelen onlarca farklı beceriye sahiptir ve bu şirketler, büyük dil modelimizi performans sergilemek üzere uyarlayabilir.

Bununla birlikte, tıp alanının ötesine bakan Huang, LLM’lerin işletmelerin büyük çoğunluğu için geniş bir uygulanabilirliğe sahip olmasını beklemektedir. “Benim düşünceme göre, her ülkede, her bir şirketin, her bir dili konuşan, muhtemelen onlarca farklı beceriye sahip olması, şirketlerinin büyük dil modelimizi gerçekleştirmeye adapte edebileceği” dedi.

“Bu fırsatın ne kadar büyük olduğundan tam olarak emin değilim, ancak potansiyel olarak şimdiye kadarki en büyük yazılım fırsatlarından biri.”

Üretimde hazne

Son olarak Nvidia, uzun süredir beklenen Hopper H100 GPU’larının toplu üretime girdiğini ve önümüzdeki ay OEM sistem üreticilerine gönderilmeye başlayacağını söylediği Hopper H100 GPU’larının kullanılabilirliği hakkında bir güncelleme yaptı.

Nvidia’nın GTC bahar etkinliğinde duyurulan 700W GPU’lar, 8 bit kayan nokta hesaplama desteği sayesinde, giden A100’e kıyasla 6 kat daha yüksek AI performansı vaat etti. Bu arada Nvidia, HPC uygulamaları için çipin çift duyarlıklı FP64 hesaplamalarında 3 kat daha fazla performans sunacağını söylüyor.

Bununla birlikte, Nvidia’nın özel ara bağlantı teknolojileriyle tamamlanmış şirket içi DGX H100 sunucularına el koymak isteyenler, beklenenden tam bir çeyrek sonra, Q1 2023’te bir süre beklemek zorunda kalacaklar.

Nvidia, DGX sisteminin daha fazla karmaşıklığını suçlarken, muhtemel bir suçlu, Intel’in sistemlerde kullanılan ve ilk çeyreğin sonlarına kadar ertelendiği bildirilen Sapphire Rapids işlemcileridir. ®