Posta kutunuzda daha akıllı bilgiler mi istiyorsunuz? Sadece AI, veri ve güvenlik liderleri için önemli olanı elde etmek için haftalık bültenlerimize kaydolun. Şimdi kaydolun
Google Resmi olarak Gemini 2.5 Deep Think’i başlattı, Modelinin daha derin bir akıl yürütme ve sorunların karmaşık bir çözümü için tasarlanacak yeni bir varyasyonu Geçen ay Uluslararası Matematik Olimpiyatı’nda (IMO) altın madalya kazandığı için haber yaptı – Bir model AI ilk kez şirkete ulaştı.
Fakat, Bu maalesef Olumsuz Altın Madalya’nın aynı kazanan modeli. Google ve Logan Kilpatrick blog yazısına göre, Google’ın çalışması için daha az güçlü bir “bronz” versiyonudur.
GİBİ Kilpatrick Social Network’te yayınladı X: “Bu, günlük kullanım için daha hızlı ve daha optimize edilmiş altın IMO modelimizin bir varyasyonu. Ayrıca, tam becerilerin değerini test etmek için bir dizi matematikçiye altın tam model veriyoruz.”
Şimdi Gemini mobil uygulaması aracılığıyla kullanılabilirBu bronz model, aboneler tarafından erişilebilir. Google’ın en pahalı bireysel planı, ultraBu, yeni aboneler için 3 aylık bir başlangıç promosyonu ile ayda 249,99 $ ‘a mal oldu.
Etki AI serisi San Francisco’ya Dönüyor – 5 Ağustos
Yapay zekanın bir sonraki aşaması burada – hazır mısınız? Otonom ajanların kurumsal çalışma akışlarını nasıl yeniden şekillendirdiğine, gerçek zamanlı olarak uçtan uca otomasyona kadar kurumsal çalışma akışlarını nasıl yeniden şekillendirdiğine özel bir bakış için Block Liderleri, GSK ve SAP’ye katılın.
Yerinizi şimdi koruyor – alan sınırlı: https://bit.ly/3guupf
Google ayrıca sürüm blogundaki yayın yayınında, “önümüzdeki haftalarda” Gemini Uygulamaları (Arılar) programlama arayüzü aracılığıyla “güvenilir test uzmanları” araçlarının entegrasyonu olmadan derinden düşünmeye ve entegrasyona yol açacağını belirtti.
Çünkü “Deep Düşünüyor” çok güçlü
İkizler 2.5 Deep Think, Sofistike Sorunlar aracılığıyla akıl yürütmeye yönelik yeni beceriler ekleyerek Büyük Dilbilimsel Modellerin (LLM) Gemini ailesine dayanmaktadır.
BT Daha fazla fikri aynı anda keşfetmek için “paralel düşünce” tekniklerini kullanır ve zaman içinde adım adım sorunları çözme yeteneğini güçlendirmek için takviye öğrenimini içerir.
Model Matematik varsayım testleri, bilimsel araştırma, algoritma tasarımı gibi kapsamlı bir çözümden yararlanan kullanım durumları için tasarlanmıştır. ve Kod ve Tasarım İyileştirme Kodu gibi yaratıcı yineleme etkinlikleri.
Michel Van Garrel gibi matematikçiler de dahil olmak üzere ilk testçiler, çözülmemiş problemleri araştırmak ve potansiyel testler oluşturmak için kullandı.
Pennsylvania Üniversitesi Wharton İşletme Fakültesi Profesörü Ethan Mollick kullanıcısı ve besleme uzmanı, Ayrıca x’de yayınlandı Yeni modellerin becerilerini test etmek için sık sık kullandığı bir istem alabildiğini – “P5J’de yapıştırabileceğim bir şey yaratıyor, uzak bir gelecekte bir uzay gemisinin kontrol panelini çağıran bir şey yaratmada beni şaşırttı” – ve 3D grafiğe dönüştü, bu da herhangi bir model bunu ilk kez yapıyor.
Performans ve kullanım durumlarının referans parametreleri
Google, Derin Düşünce için Anahtar Uygulamanın Çeşitli Alanını Vurgular:
- Matematik ve Bilim: Model, karmaşık testler için akıl yürütmeyi simüle edebilir, varsayımları keşfedebilir ve yoğun bir bilimsel literatürü yorumlayabilir
- Algoritma kodlaması ve tasarım: Performans, zamansal karmaşıklık ve daha fazla aşamayı uzlaştıran görevlerde iyi gerçekleşir.
- Yaratıcı Geliştirme: Voksel sanatının oluşturulması veya kullanıcı arayüzü gibi tasarım senaryolarında, Deep Think daha güçlü bir yinelemeli iyileştirme ve ayrıntılı bir gelişme gösterir
Ayrıca model LiveCodebench V6 gibi referans değerlendirmelerde Leude Performans (kodlama becerileri için) ve insanlığın son sınavı (Kapak Matematik, Bilim ve Akıl Yürütme).
BT Garip Gemini 2.5 Pro ve GPT-4 Openi ve Grok 4 gibi rakip modeller Bazı kategorilerde çift alan marjları ile (akıl yürütme ve bilgi, kod üretimi ve matematik imo 2025).
İkizler 2.5 Deep Think Vs. İkizler 2.5 Pro
Hem Deep Think hem de Gemini 2.5 Pro, Gemini 2.5 model ailesinin bir parçası olsa da, Google Pozisyonları Derin Düşünce Bir Daha yetenekli ve analitik nitelikli varyantÖzellikle karmaşık akıl yürütme ve sorunların çeşitli aşamalardaki çözümü söz konusu olduğunda.
Bu gelişme, kullanımından kaynaklanır Paralel düşünce VE Takviye öğrenme teknikleribu da modelin daha derin bir bilişsel çözünürlüğü simüle etmesini sağlar.
Resmi iletişiminde Google, derin düşünmeyi en iyi şekilde anlatıyor. Gölgeli talimatları yönetin, çoklu hipotezleri keşfedin ve daha rafine çıkışlar üretin. Bu, Deep Think’in 2.5 Pro’ya kıyasla daha fazla tutarlılık, yapısal sadakat ve bileşimsel çeşitlilik eklediği Arte Voxel üretiminde karşılaştırmalarla desteklenmektedir.
İyileştirmeler sadece görsel veya anekdot değildir. Google, Deep’in düşündüğünü bildiriyor Superforms Gemini 2.5 Birden fazla teknik kriterde profesyonel akıl yürütme, kod üretimi ve çapraz yeterlilik ile ilgili. Bununla birlikte, bu kazançlar reaktivite ve hızlı kabul konusunda uzlaşmalarla donatılmıştır.
İşte bir mola:
Kapasite / öznitelik | İkizler 2.5 Pro | İkizler 2.5 derin düşün |
---|---|---|
Çıkarım hızı | Daha hızlı, düşük gecikme | “Yavaş ve daha kapsamlı düşünce zamanı” |
Akıl yürütmenin karmaşıklığı | Ilıman | Yüksek – Paralel Düşünce Kullanın |
Hazır derinlik ve yaratıcılık | Kuyu | Daha ayrıntılı ve nüanslı |
Referans performansı | Güçlü | Avant -Garde |
Tonun içerik güvenliği ve tarafsızlığı | Eski modellerde gelişti | Daha fazla gelişti |
Reddetme oranı (iyi huylu öneriler) | Alt | Daha yüksek |
Uzunluk | Standart | Daha uzun yanıtları destekler |
Voksel Sanat / Tasarım Sadakati | Temel sahnenin yapısı | Geliştirilmiş detaylar ve servet |
Google bunu gözlemliyor Derin düşünmenin en yüksek reddi oranı Aktif bir anket alanıdır. Bu, 2.5 Pro’ya kıyasla belirsiz veya gayri resmi sorgunun yönetimindeki esnekliğini sınırlayabilir. Aksine, 2.5 Pro, öncelikler veren kullanıcılar için daha uygun olmaya devam ediyor. Hız ve reaktiviteÖzellikle daha hafif görevler ve genel amaçlar için.
Bu farklılaşma, kullanıcıların önceliklerine göre seçim yapmalarını sağlar: Hız ve akışkanlık için 2.5 ProVEYA Ceza ve yansıma ile derin düşünün.
Altın madalyanın kazanan modeli değil, sadece bir bronz
Temmuz ayında, Google Deepmind, daha gelişmiş bir versiyonun İkizler Deep Think Modeli 2025’te Altın Madalyasının Resmi Durumuna ulaştı – Lise öğrencileri için dünyanın en prestijli matematik yarışması.
Sistem Altı talepkar problemden beşini çözdü ve ruhtan altın seviyesinde puan alan ilk AI oldu.
Google DeepMind CEO’su Demis Hassabis, X’in başarısını duyurdu ve modelin doğal dil-senza’daki uçtan uca problemleri resmi programlama sözdiziminde çeviriye ihtiyaç duyması için çözdüğünü belirtti.
IMO kartı, modelin altın eşiğin çok üzerinde 42 puandan 35’ini attığını doğruladı. İkizler 2.5 derinliğinin çözümleri Gregor Dolinar Yarışması Başkanı tarafından tarif edildi Net, hassas ve birçok durumda, Takip etmek insan rakiplerinden daha kolay.
Bununla birlikte, kullanıcılara yayınlanan Gemini 2.5 derin düşünce aynı rekabet modeli değil, daha düşük ama görünüşte daha hızlı bir sürüm.
Derin Düşünme Şimdi Nasıl Erişilir
İkizler 2.5 derin düşünce Yalnızca Google Gemini’nin iOS ve Android için mobil uygulamasında şu anda Google AI’nın Ultra Planının kullanıcılarına kullanılabilirGoogle One abonelik aralığının bir kısmı, fiyatlar aşağıdaki gibi.
- Promosyon Teklifi: 3 ay boyunca 124.99 $/ay, sonra tekme …
- Standart Oran: 249,99 $/ay
- Özellikler: 30 TB depolama alanı, Deep Think ve Veo 3 ile İkizler uygulamasına erişim ve aylık olarak akış, çırpma ve 12.500 kredi gibi araçlar
Aboneler, 2.5 Pro modelini seçmek ve “Deep Think” seçeneğini etkinleştirmek İkizler uygulamasında Deep Think’i etkinleştirebilir.
Günde sabit sayıda talimatı destekler ve kodun yürütülmesi ve Google arayışı gibi işlevsellik ile entegre edilir. Model ayrıca standart sürümlerden daha uzun ve daha ayrıntılı bir çıktı üretir.
Google planı, daha düşük seviyedeki, ayda 19,99 $ (ücretsiz deneme ile) fiyatla, derin düşünmeye erişim veya Ücretsiz İkizler hizmetini içermez.
Çünkü şirket teknik karar vericileri için önemlidir
İkizler 2.5 derin düşünce, araştırmanın büyük bir kilometre taşının pratik uygulamasını temsil eder.
BT Şirketlerin ve kuruluşların Olimpiyat madalyalarının matematik modelinden yararlanmasına ve personeline katılmasına izin verir, Yalnızca tek bir kullanıcı hesabı aracılığıyla bile.
Tüm IMO-dereceli modelini alan araştırmacılar için, matematikte işbirlikçi yardımın geleceğine bir göz atıyor. Ultra aboneler için Deep Think, şimdi avucunun içinde çalışan bağlamın en yetenekli ve bilinçli yapay zeka yardımına doğru güçlü bir adım sağlar.