Posta kutunuzda daha akıllı bilgiler mi istiyorsunuz? Sadece AI, veri ve güvenlik liderleri için önemli olanı elde etmek için haftalık bültenlerimize kaydolun. Şimdi kaydolun
Argee.aiodaklanan bir girişim Küçük yapay zeka modelleri geliştirin Ticari ve kurumsal kullanım için Açılış Küçük şirketler tarafından sınırlı ücretsiz kullanım için AFM-4.5B modeli- Kucaklayan yüzdeki ağırlıklar ve yıllık 1,75 milyon dolardan az gelir elde eden şirketlerin, bir Acree’nin “Acree Model Lisansı.“
Gerçek dünyada kurumsal kullanım için tasarlanan, düzinelerce milyar trilyon önde gelen sınır modelinden 4,5 milyar parametrenin modeli, kompakt bir baskıda maliyet, düzenleyici uyum ve güçlü performansın verimliliğini modellemektedir.
AFM-4.5B Geçen ay Acree tarafından gerçekleştirilen iki bölümlü iki versiyondan biriVe zaten “ayarlanmış talimatlar” veya sohbet, kurtarma ve yaratıcı yazma için tasarlanmış bir “talimat” modelidir ve şirketlerde bu kullanım durumları için hemen dağıtılabilir. Başka bir temel model de, sadece önceden hazırlanmadığı ve müşteriler tarafından daha fazla özelleştirmeye izin verdiği anda yayınlandı. Ancak, her ikisi de sadece ticari lisans şartları aracılığıyla mevcuttu – şimdiye kadar.
Lucas Atkins, Acree’nin Teknoloji Sorumlusu (CTO) Atkins Ayrıca not edildi X’e yerleştirildi en çok “Aracın akıl yürütmesi ve kullanımı için özel modeller de geliyor”.
Etki AI serisi San Francisco’ya Dönüyor – 5 Ağustos
Yapay zekanın bir sonraki aşaması burada – hazır mısınız? Otonom ajanların kurumsal çalışma akışlarını nasıl yeniden şekillendirdiğine, gerçek zamanlı olarak uçtan uca otomasyona kadar kurumsal çalışma akışlarını nasıl yeniden şekillendirdiğine özel bir bakış için Block Liderleri, GSK ve SAP’ye katılın.
Yerinizi şimdi koruyor – alan sınırlı: https://bit.ly/3guupf
“AFM-4.5B inşa etmek büyük bir takım çabasıydı ve bizi destekleyen herkese derinden minnettarız, onunla ne inşa ettiğinizi görmek için sabırsızlanıyoruz”, o Başka bir yazıda yazdı. “Yeni başlıyoruz. Geri bildiriminiz veya fikirleriniz varsa, hiçbir zamanda ulaşmaktan çekinmeyin.”
Model artık donanım kartı için akıllı telefonlardaki buluttan çeşitli ortamlarda dağıtım için kullanılabilir.
Ayrıca, Acree’nin şirket müşterilerinin büyüyen listesine ve özellikle fikri mülkiyeti ihlal etmeden eğitilmiş bir modelin ihtiyaç ve arzularına yöneliktir.
GİBİ Acree, geçen ayki AFM-4.5B’nin ilk görevinde yazdı: “Telif hakkı ile korunan kitapları ve materyalleri belirsiz lisanslarla hariç tutmak için büyük bir çaba sarf edildi.”
Dönüm Notları Üçüncü Partili Veri Tedavi Şirketi ile çalıştı Datoloji Kaynakların karıştırılması gibi teknikleri uygulamak, birleşme ve kalite kontrolüne dayalı filtre, hepsi halüsinasyonları ve entelektüel özellik risklerini en aza indirmeyi amaçlamaktadır.
Şirket müşterilerinin ihtiyaçlarına odaklandı
AFM-4.5b Arcee’nin yanıtıdır. AI üretkeninin kurumsal olarak benimsenmesinde ana zayıf noktaları gördüğüne göre: yüksek maliyetler, sınırlı özelleştirme ve büyük dil modelleri (LLM) hakkında düzenleyici kaygılar.
Geçen yıl, ARCEE ekibi, mevcut LLM’lerin sınırlarını anlamak ve model hedeflerini tanımlamak için yeni başlayanlardan Fortune 100 şirketlerine kadar 150’den fazla kuruluşla görüştü.
Şirkete göre, birçok şirket geleneksel gibi OpenII, antropik veya derin-tetiksel ve sektörün özel ihtiyaçlarına uyum sağlaması zor. Bu arada, Lama, Mistral ve Qwen gibi daha küçük açık ağırlık modelleri daha fazla esneklik sunarken, lisanslar, IP kökenli ve jeopolitik risk konusunda endişeler getirmiştir.
AFM-4.5B, “ticaretsiz” e alternatif olarak geliştirilmiştir: özelleştirilebilir, uyumlu ve maliyet açısından modelin kalitesinden veya kullanılabilirlikten ödün vermeden verimli.
AFM-4.5B, dağıtım esnekliğini düşünerek tasarlanmıştır. Bulut, şirket içi, hibrit ve hatta kenar ortamlarında çalışabilir: Hugging Yüz Transformers, Lama.cpp ve (bekleme sürümü) VLLM gibi açık çerçeve ile verimliliği ve uyumluluğu sayesinde.
Model, düşük RAM veya hatta CPU GPU üzerinde çalışmasına izin veren nicel formatları destekleyerek bağlı kaynaklara sahip uygulamalar için pratik hale getirir.
Şirketin vizyonu destek sağlar
Arcee.Ai’nin daha geniş stratejisi, çocuklar için dil modellerinin inşasına odaklanır (SLM) Aynı kuruluşta birçok kullanım vakası.
GİBİ CEO Mark McQuode geçen yıl VentureBeat tarafından yapılan bir röportajda açıkladı“Kurumsal kullanım durumları için bu kadar büyük olmanıza gerek yok.” Şirket, modelin hızlı yinelemesinin ve özelleştirilmesinin bir çekirdek olarak altını çiziyor.
Bu vizyon, 2024 yılında 24 milyon dolarlık Serie A ile yatırımcıların desteğini aldı.
AFM-4.5B mimarisi ve oluşum süreci içinde
AFM-4.5B modeli, sadece performans ve dağıtım esnekliği için farklı optimizasyonlarla kod çözmek için bir transformatör mimarisi kullanır.
Doğruluğu bozmadan kıtlığı desteklemek için Swiglu yerine daha hızlı çıkarım ve relu² aktivasyonları için gruplandırılmış sorgunun dikkatini içerir.
Eğitim üç faz yaklaşımını izledi:
- 6.5 trilyon genel veri jetonu üzerinde ön hazırlık
- Matematik ve kodu vurgulayan 1,5 trilyon jetonda orta yüzey
- Yüksek kaliteli talimatları izleyen veri kümelerini ve doğrulanabilir geri bildirimle ve tercihlere dayalı olarak takviye öğrenmesini kullanarak talimat ayarlama
Titiz uygunluk ve PI standartlarını karşılamak için model, temizlik ve lisansların güvenliğine dikkat ederek yaklaşık 7 trilyonlarca veri jetonu üzerinde eğitildi.
Rekabetçi bir model, ama lider değil
Daha küçük boyutlarına rağmen, AFM-4.5B çok çeşitli referans parametrelerinde rekabetçi bir performans sergiliyor. MMLU, Mixeval, triviaqa ve ageval gibi değerlendirme paketi arasında ortalama 50.13 puan, Gemma-3 4B-IT, QWEN3-4B ve SMOLLM3-3B gibi benzer boyutlarda eşleşen veya sarkma modelleri arasında ortalama 50.13 skoru ayarlanmış.
Çok dilli testler, modelin Arapça, Mandarin, Alman ve Portekizce dahil olmak üzere 10’dan fazla dilde güçlü performanslar sunduğunu göstermektedir.
Arcee’ye göre, modüler mimarisi nedeniyle ek lehçelere destek eklenmesi basittir.
AFM-4.5B ayrıca kamu değerlendirme ortamlarında güçlü bir erken çekiş göstermiştir. Kullanıcı oyları ve kazanma oranı için konuşma modelinin kalitesini sınıflandıran bir sıralamada, model genel olarak üçüncü sırada ve sadece Claude Opus 4 ve Gemini 2.5 Pro’yu sürükler.
% 59.2’lik bir zafer oranına ve 0,2 saniyeden daha büyük herhangi bir modelin daha hızlı gecikmesine sahiptir ve saniyede 179 jeton üretim hızı ile birlikte.
Temsilciler için entegre destek
Genel özelliklere ek olarak, AFM-4.5B, işlev çağrıları ve oyunculuk akıl yürütmesi için entegre destek sağlanır.
Bunlar Özellikler, yapay zeka ajanları ve iş akışı otomasyon araçları oluşturma sürecini basitleştirmeyi amaçlıyorKarmaşık mühendislik veya orkestrasyon katmanlarına olan ihtiyacı azaltmak.
Bu işlevsellik, şirketlerin üretim için daha hızlı, daha düşük bir toplam sahiplik maliyeti (TCO) ve kurumsal operasyonlara daha kolay entegrasyon ile kişiselleştirilmiş ve hazır modeller oluşturmalarına izin vermek için daha geniş stratejisini hizalamaktadır.
Acree için gelecek nedir?
AFM-4.5b temsil eder ARCEE.AI’nın İşler İçin Hazır Yeni Bir Dil Modeli Kategorisi Tanımlanması İçin İtme: Küçük, Performanslı ve Tamamen Özelleştirilebilir, Genellikle sahipleri veya açık ağırlıklı SLM ile donatılmış uzlaşmalar olmadan.
Rekabetçi referans parametreleri, çok dilli destek, güçlü uygunluk standartları ve esnek dağıtım seçenekleri ile model, şirketin işini, egemenlik ve ölçek ihtiyaçlarını karşılamayı amaçlamaktadır.
Eğer Arcee, AI’nın hızlı üretken manzarasında uzun bir rol oynayabilirse, bu vaadi koruma yeteneğine bağlı olacaktır. Ancak AFM-4.5B ile şirket ilk güvenli bir hamle yaptı.