Google, madalya kazananı olan Olympiad, Gemini 2.5 "düşün" ü kamuya açık bir şekilde yayınladı-ancak bir yakalama var ...

Google, madalya kazananı olan Olympiad, Gemini 2.5 “düşün” ü kamuya açık bir şekilde yayınladı-ancak bir yakalama var …

Posta kutunuzda daha akıllı bilgiler mi istiyorsunuz? Sadece AI, veri ve güvenlik liderleri için önemli olanı elde etmek için haftalık bültenlerimize kaydolun. Şimdi kaydolun

Google Resmi olarak Gemini 2.5 Deep Think’i başlattı, Modelinin daha derin bir akıl yürütme ve sorunların karmaşık bir çözümü için tasarlanacak yeni bir varyasyonu Geçen ay Uluslararası Matematik Olimpiyatı’nda (IMO) altın madalya kazandığı için haber yaptı – Bir model AI ilk kez şirkete ulaştı.

Fakat, Bu maalesef Olumsuz Altın Madalya’nın aynı kazanan modeli. Google ve Logan Kilpatrick blog yazısına göre, Google’ın çalışması için daha az güçlü bir “bronz” versiyonudur.

GİBİ Kilpatrick Social Network’te yayınladı X: “Bu, günlük kullanım için daha hızlı ve daha optimize edilmiş altın IMO modelimizin bir varyasyonu. Ayrıca, tam becerilerin değerini test etmek için bir dizi matematikçiye altın tam model veriyoruz.”

Şimdi Gemini mobil uygulaması aracılığıyla kullanılabilirBu bronz model, aboneler tarafından erişilebilir. Google’ın en pahalı bireysel planı, ultraBu, yeni aboneler için 3 aylık bir başlangıç promosyonu ile ayda 249,99 $ ‘a mal oldu.

Etki AI serisi San Francisco’ya Dönüyor – 5 Ağustos

Yapay zekanın bir sonraki aşaması burada – hazır mısınız? Otonom ajanların kurumsal çalışma akışlarını nasıl yeniden şekillendirdiğine, gerçek zamanlı olarak uçtan uca otomasyona kadar kurumsal çalışma akışlarını nasıl yeniden şekillendirdiğine özel bir bakış için Block Liderleri, GSK ve SAP’ye katılın.

Yerinizi şimdi koruyor – alan sınırlı: https://bit.ly/3guupf

Google ayrıca sürüm blogundaki yayın yayınında, “önümüzdeki haftalarda” Gemini Uygulamaları (Arılar) programlama arayüzü aracılığıyla “güvenilir test uzmanları” araçlarının entegrasyonu olmadan derinden düşünmeye ve entegrasyona yol açacağını belirtti.

Çünkü “Deep Düşünüyor” çok güçlü

İkizler 2.5 Deep Think, Sofistike Sorunlar aracılığıyla akıl yürütmeye yönelik yeni beceriler ekleyerek Büyük Dilbilimsel Modellerin (LLM) Gemini ailesine dayanmaktadır.

BT Daha fazla fikri aynı anda keşfetmek için “paralel düşünce” tekniklerini kullanır ve zaman içinde adım adım sorunları çözme yeteneğini güçlendirmek için takviye öğrenimini içerir.

Model Matematik varsayım testleri, bilimsel araştırma, algoritma tasarımı gibi kapsamlı bir çözümden yararlanan kullanım durumları için tasarlanmıştır. ve Kod ve Tasarım İyileştirme Kodu gibi yaratıcı yineleme etkinlikleri.

Michel Van Garrel gibi matematikçiler de dahil olmak üzere ilk testçiler, çözülmemiş problemleri araştırmak ve potansiyel testler oluşturmak için kullandı.

Pennsylvania Üniversitesi Wharton İşletme Fakültesi Profesörü Ethan Mollick kullanıcısı ve besleme uzmanı, Ayrıca x’de yayınlandı Yeni modellerin becerilerini test etmek için sık sık kullandığı bir istem alabildiğini – “P5J’de yapıştırabileceğim bir şey yaratıyor, uzak bir gelecekte bir uzay gemisinin kontrol panelini çağıran bir şey yaratmada beni şaşırttı” – ve 3D grafiğe dönüştü, bu da herhangi bir model bunu ilk kez yapıyor.

Derin düşünceyle ikizlere erken erişim vardı. Çok iyi bir model, birçok sorun için Gemini 2.5 Pro Standard’a kıyasla büyük kazançlar.
İşte her modelle denediğim yıldız kontrol panelini sormaya yönelik ilk deneme. Yanıt olarak 3D arayüz yapmak için ilk kez bir model gördüm. https://t.co/8iw2pn6xpu pic.twitter.com/blff2icop3
– Ethan Mollick (@emollick) 1 Ağustos 2025

Performans ve kullanım durumlarının referans parametreleri

Google, Derin Düşünce için Anahtar Uygulamanın Çeşitli Alanını Vurgular:

Matematik ve Bilim: Model, karmaşık testler için akıl yürütmeyi simüle edebilir, varsayımları keşfedebilir ve yoğun bir bilimsel literatürü yorumlayabilir
Algoritma kodlaması ve tasarım: Performans, zamansal karmaşıklık ve daha fazla aşamayı uzlaştıran görevlerde iyi gerçekleşir.
Yaratıcı Geliştirme: Voksel sanatının oluşturulması veya kullanıcı arayüzü gibi tasarım senaryolarında, Deep Think daha güçlü bir yinelemeli iyileştirme ve ayrıntılı bir gelişme gösterir

Ayrıca model LiveCodebench V6 gibi referans değerlendirmelerde Leude Performans (kodlama becerileri için) ve insanlığın son sınavı (Kapak Matematik, Bilim ve Akıl Yürütme).

BT Garip Gemini 2.5 Pro ve GPT-4 Openi ve Grok 4 gibi rakip modeller Bazı kategorilerde çift alan marjları ile (akıl yürütme ve bilgi, kod üretimi ve matematik imo 2025).

İkizler 2.5 Deep Think Vs. İkizler 2.5 Pro

Hem Deep Think hem de Gemini 2.5 Pro, Gemini 2.5 model ailesinin bir parçası olsa da, Google Pozisyonları Derin Düşünce Bir Daha yetenekli ve analitik nitelikli varyantÖzellikle karmaşık akıl yürütme ve sorunların çeşitli aşamalardaki çözümü söz konusu olduğunda.

Bu gelişme, kullanımından kaynaklanır Paralel düşünce VE Takviye öğrenme teknikleribu da modelin daha derin bir bilişsel çözünürlüğü simüle etmesini sağlar.

Resmi iletişiminde Google, derin düşünmeyi en iyi şekilde anlatıyor. Gölgeli talimatları yönetin, çoklu hipotezleri keşfedin ve daha rafine çıkışlar üretin. Bu, Deep Think’in 2.5 Pro’ya kıyasla daha fazla tutarlılık, yapısal sadakat ve bileşimsel çeşitlilik eklediği Arte Voxel üretiminde karşılaştırmalarla desteklenmektedir.

İyileştirmeler sadece görsel veya anekdot değildir. Google, Deep’in düşündüğünü bildiriyor Superforms Gemini 2.5 Birden fazla teknik kriterde profesyonel akıl yürütme, kod üretimi ve çapraz yeterlilik ile ilgili. Bununla birlikte, bu kazançlar reaktivite ve hızlı kabul konusunda uzlaşmalarla donatılmıştır.

İşte bir mola:

Kapasite / öznitelik	İkizler 2.5 Pro	İkizler 2.5 derin düşün
Çıkarım hızı	Daha hızlı, düşük gecikme	“Yavaş ve daha kapsamlı düşünce zamanı”
Akıl yürütmenin karmaşıklığı	Ilıman	Yüksek – Paralel Düşünce Kullanın
Hazır derinlik ve yaratıcılık	Kuyu	Daha ayrıntılı ve nüanslı
Referans performansı	Güçlü	Avant -Garde
Tonun içerik güvenliği ve tarafsızlığı	Eski modellerde gelişti	Daha fazla gelişti
Reddetme oranı (iyi huylu öneriler)	Alt	Daha yüksek
Uzunluk	Standart	Daha uzun yanıtları destekler
Voksel Sanat / Tasarım Sadakati	Temel sahnenin yapısı	Geliştirilmiş detaylar ve servet

Google bunu gözlemliyor Derin düşünmenin en yüksek reddi oranı Aktif bir anket alanıdır. Bu, 2.5 Pro’ya kıyasla belirsiz veya gayri resmi sorgunun yönetimindeki esnekliğini sınırlayabilir. Aksine, 2.5 Pro, öncelikler veren kullanıcılar için daha uygun olmaya devam ediyor. Hız ve reaktiviteÖzellikle daha hafif görevler ve genel amaçlar için.

Bu farklılaşma, kullanıcıların önceliklerine göre seçim yapmalarını sağlar: Hız ve akışkanlık için 2.5 ProVEYA Ceza ve yansıma ile derin düşünün.

Altın madalyanın kazanan modeli değil, sadece bir bronz

Temmuz ayında, Google Deepmind, daha gelişmiş bir versiyonun İkizler Deep Think Modeli 2025’te Altın Madalyasının Resmi Durumuna ulaştı – Lise öğrencileri için dünyanın en prestijli matematik yarışması.

Sistem Altı talepkar problemden beşini çözdü ve ruhtan altın seviyesinde puan alan ilk AI oldu.

Google DeepMind CEO’su Demis Hassabis, X’in başarısını duyurdu ve modelin doğal dil-senza’daki uçtan uca problemleri resmi programlama sözdiziminde çeviriye ihtiyaç duyması için çözdüğünü belirtti.

IMO kartı, modelin altın eşiğin çok üzerinde 42 puandan 35’ini attığını doğruladı. İkizler 2.5 derinliğinin çözümleri Gregor Dolinar Yarışması Başkanı tarafından tarif edildi Net, hassas ve birçok durumda, Takip etmek insan rakiplerinden daha kolay.

Bununla birlikte, kullanıcılara yayınlanan Gemini 2.5 derin düşünce aynı rekabet modeli değil, daha düşük ama görünüşte daha hızlı bir sürüm.

Derin Düşünme Şimdi Nasıl Erişilir

İkizler 2.5 derin düşünce Yalnızca Google Gemini’nin iOS ve Android için mobil uygulamasında şu anda Google AI’nın Ultra Planının kullanıcılarına kullanılabilirGoogle One abonelik aralığının bir kısmı, fiyatlar aşağıdaki gibi.

Promosyon Teklifi: 3 ay boyunca 124.99 $/ay, sonra tekme …
Standart Oran: 249,99 $/ay
Özellikler: 30 TB depolama alanı, Deep Think ve Veo 3 ile İkizler uygulamasına erişim ve aylık olarak akış, çırpma ve 12.500 kredi gibi araçlar

Aboneler, 2.5 Pro modelini seçmek ve “Deep Think” seçeneğini etkinleştirmek İkizler uygulamasında Deep Think’i etkinleştirebilir.

Günde sabit sayıda talimatı destekler ve kodun yürütülmesi ve Google arayışı gibi işlevsellik ile entegre edilir. Model ayrıca standart sürümlerden daha uzun ve daha ayrıntılı bir çıktı üretir.

Google planı, daha düşük seviyedeki, ayda 19,99 $ (ücretsiz deneme ile) fiyatla, derin düşünmeye erişim veya Ücretsiz İkizler hizmetini içermez.

Çünkü şirket teknik karar vericileri için önemlidir

İkizler 2.5 derin düşünce, araştırmanın büyük bir kilometre taşının pratik uygulamasını temsil eder.

BT Şirketlerin ve kuruluşların Olimpiyat madalyalarının matematik modelinden yararlanmasına ve personeline katılmasına izin verir, Yalnızca tek bir kullanıcı hesabı aracılığıyla bile.

Tüm IMO-dereceli modelini alan araştırmacılar için, matematikte işbirlikçi yardımın geleceğine bir göz atıyor. Ultra aboneler için Deep Think, şimdi avucunun içinde çalışan bağlamın en yetenekli ve bilinçli yapay zeka yardımına doğru güçlü bir adım sağlar.

Her gün VB ile şirket kullanma vakaları hakkında günlük bilgiler

Patronunuzu etkilemek istiyorsanız, VB Daily sizi kapsar. Massimo YG için bilgileri paylaşabilmeniz için, şirketlerin üretken yapay zeka ile ne yaptığını, düzenleyici vardiyalardan pratik dağıtımlara kadar içsel bir kepçe veriyoruz.

Bizimkini oku Gizlilik Politikası

Abonelik için teşekkürler. Daha fazla bak Bülten VB burada.

Bir hata oluştu.

Google, madalya kazananı olan Olympiad, Gemini 2.5 “düşün” ü kamuya açık bir şekilde yayınladı-ancak bir yakalama var …

Byadmin

Çünkü “Deep Düşünüyor” çok güçlü

Performans ve kullanım durumlarının referans parametreleri

İkizler 2.5 Deep Think Vs. İkizler 2.5 Pro

Altın madalyanın kazanan modeli değil, sadece bir bronz

Derin Düşünme Şimdi Nasıl Erişilir

Çünkü şirket teknik karar vericileri için önemlidir

By admin

Related Post

Google, yenilik riskleri ile ilgili endişelere rağmen AB kodunu destekliyor – ComputerWorld

Belgeler ve dahili kaynaklar, Huione Della Cambogia Grubu’nun CybersCamcama Asya endüstrisinin çok büyük bir devin büyümesini denetleme biçimini detaylandırıyor (Kai Schultz/Bloomberg)

Sunucu olmadan Amazon DocumentDB veritabanı aracısı hızlandırmaya çalışır ve maliyetleri düşürür

You missed

Google, yenilik riskleri ile ilgili endişelere rağmen AB kodunu destekliyor – ComputerWorld

Jessica Peguula, 2 kez hüküm süren şampiyon, 3. turda şok oldu

Fredrik Backman #Bookreview

Wonkette Film Gecesi: Süpermen: The Film (1978)