Ars Teknik
Perşembe günü, Google’dan araştırmacılar, adlı yeni bir üretken AI modelini duyurdular. MüzikLM “Bozulmuş bir gitar riffi ile desteklenen sakinleştirici bir keman melodisi” gibi metin açıklamalarından 24 KHz müzik sesi oluşturabilen. Ayrıca uğultulu bir melodiyi farklı bir müzik tarzına dönüştürebilir ve birkaç dakikalık müzik çıkışı verebilir.
MusicLM, Google’ın “a” olarak adlandırdığı şey üzerinde eğitilmiş bir yapay zeka modeli kullanır. etiketlenmemiş müziğin geniş veri kümesi” ile birlikte MusicCaps, 5.521 müzik-metin çiftinden oluşan yeni bir veri kümesi. MusicCaps, metin açıklamalarını insan uzmanlardan ve eşleşen ses kliplerini Google’ın Ses SetiYouTube videolarından alınan 2 milyondan fazla etiketli 10 saniyelik ses klibi koleksiyonu.
Genel olarak, MusicLM iki ana kısımda çalışır: birincisi, bir dizi ses belirteci (ses parçaları) alır ve bunları eğitim için altyazılardaki anlamsal belirteçlere (anlamı temsil eden kelimeler) eşler. İkinci kısım, kullanıcı altyazılarını ve/veya giriş sesini alır ve akustik belirteçler (sonuçta ortaya çıkan şarkı çıktısını oluşturan ses parçaları) üretir. Sistem, adı verilen daha eski bir yapay zeka modeline dayanır. Ses LM (Google tarafından Eylül ayında kullanıma sunulmuştur) gibi diğer bileşenlerle birlikte Ses Akışı ve MuLan.
Google, MusicLM’nin daha iyi performans gösterdiğini iddia ediyor öncesi Ses kalitesinde ve metin açıklamalarına bağlılıkta AI müzik üreteçleri. MusicLM’de tanıtım sayfası, Google, müziğin hissini tanımlayan “zengin altyazılardan” ve hatta vokallerden (şimdiye kadar anlamsız olan) ses oluşturan yapay zeka modelinin eylem halindeki sayısız örneğini sunar. Sağladıkları zengin altyazıya bir örnek:
Ağır tempolu, bas ve davul ağırlıklı reggae şarkısı. Sürekli elektro gitar. Zil sesleri ile tiz bongolar. Vokaller rahat bir hisle rahat, çok etkileyici.
Google ayrıca MusicLM’nin “uzun nesil” (basit bir istemden beş dakikalık müzik klipleri oluşturma), “hikaye modu” (bir dizi metin istemini alır ve onu değişen bir müzik melodileri dizisine dönüştürür), “metin ve melodi” özelliklerini gösterir. koşullandırma” (insanın uğultulu veya ıslıklı ses girişini alır ve bunu istemde ortaya konan stile uyacak şekilde değiştirir) ve resim altyazılarının havasına uyan müzik üretir.

Google Araştırması
Google, örnek sayfanın ilerisinde, MusicLM’nin belirli enstrümanları (ör. flüt, çello, gitar), farklı müzik türlerini, çeşitli müzisyen deneyim düzeylerini, yerleri (hapishaneden kaçma, spor salonu), zaman dilimlerini (bir kulüp 1950’ler) ve daha fazlası.
Yapay zeka tarafından üretilen müzik, hiçbir şekilde yeni bir fikir değildir, ancak önceki on yılların yapay zeka müzik oluşturma yöntemleri genellikle daha sonra elle veya bir sentezleyici aracılığıyla çalınan müzik notaları oluştururken MusicLM, müziğin ham ses frekanslarını üretir. Ayrıca, Aralık ayında dağılma, benzer şekilde metin açıklamalarından müzik oluşturabilen, ancak yüksek doğrulukta olmayan bir hobi AI projesi. Google, MusicLM’de Riffusion’a atıfta bulunur akademik makaleMusicLM’nin kalite olarak onu geride bıraktığını söylüyor.
MusicLM makalesinde, yaratıcıları, “yaratıcı içeriğin potansiyel olarak kötüye kullanılması” (yani, telif hakkı sorunları), eğitim verilerinde yeterince temsil edilmeyen kültürlere yönelik potansiyel önyargılar ve potansiyel kültürel sahiplenme sorunları dahil olmak üzere MusicLM’nin potansiyel etkilerini özetlemektedir. Sonuç olarak Google, bu risklerin üstesinden gelmek için daha fazla çalışma yapılması gerektiğini vurguluyor ve şu kodu geri alıyor: “Bu noktada modelleri yayınlama planımız yok.”
Google’ın araştırmacıları şimdiden gelecekteki iyileştirmelere bakıyor: “Gelecekteki çalışmalar, metin koşullandırmanın ve ses kalitesinin iyileştirilmesinin yanı sıra şarkı sözü oluşturmaya odaklanabilir. daha yüksek örnekleme hızında müzik ek bir hedeftir.”
Yapay Zeka araştırmacılarının, herhangi biri yalnızca onu tanımlayarak herhangi bir tarzda stüdyo kalitesinde müzik yaratabilene kadar müzik üretim teknolojisini geliştirmeye devam edeceğini söylemek muhtemelen fazla zorlama olmayacaktır; ancak henüz hiç kimse bu hedefe ne zaman ulaşılacağını veya nasıl ulaşılacağını tam olarak tahmin edemez. tam olarak müzik endüstrisini etkileyecektir. Daha fazla gelişme için bizi izlemeye devam edin.