AI, yıllarca sesleriyle geçimini sağlayan insan profesyonellerin hizmetlerinin en azından bir kısmını atlayarak – montaj hattı hızında – insan sesi veren kayıtlar oluşturma yeteneğine sahiptir. (Fotoğraf: Thomas SAMSON / AFP)
NEW YORK, 14 Mayıs 2023 (AFP) – İnsanlar yapay zekanın işler ve günlük yaşam üzerindeki yıkıcı etkisine hazırlanırken, sesli kitap dünyasındakiler kendi alanlarının şimdiden dönüşmekte olduğunu söylüyor.
AI, yıllarca sesleriyle geçimini sağlayan insan profesyonellerin hizmetlerinin en azından bir kısmını atlayarak – montaj hattı hızında – insan sesi veren kayıtlar oluşturma yeteneğine sahiptir.
Birçoğu zaten işinde keskin bir düşüş görüyor.
Tanya Eby, 20 yıldır tam zamanlı bir seslendirme sanatçısı ve profesyonel anlatıcıdır. Evinde bir kayıt stüdyosu var.
Ancak son altı ayda iş yükünün yarı yarıya düştüğünü gördü. Rezervasyonları artık yalnızca Haziran’a kadar devam ederken, normal bir yılda Ağustos’a kadar uzardı.
Meslektaşlarının çoğu benzer düşüşler bildiriyor.
AFP’ye “Yapay zekanın hepimizi etkilemesi mantıklı görünüyor” dedi.
Yapay zeka destekli kayıtları bu şekilde tanımlayan bir etiket yok, ancak profesyoneller şu anda dolaşımda olan binlerce sesli kitabın bir veri bankasından oluşturulan “sesleri” kullandığını söylüyor.
En ileri teknolojilerden biri olan DeepZen, sesli kitap üretme maliyetini geleneksel bir projenin dörtte birine veya daha aza indirebilen oranlar sunar.
Londra merkezli küçük şirket, çeşitli duygusal kayıtlarda konuşması istenen birkaç aktörün sesini kaydederek oluşturduğu bir veri tabanından yararlanıyor.
DeepZen CEO’su Kamış Taylan, “Kullandığımız her ses için bir lisans sözleşmesi imzalıyoruz ve kayıtlar için para ödüyoruz” dedi.
Her proje için “yaptığımız işe göre telif ücreti ödüyoruz” diye ekledi.
Eby, herkesin bu standarda saygı duymadığını söyledi.
“O kadar etik olmayan tüm bu yeni şirketler ortaya çıkıyor” dedi ve bazıları veritabanlarında bulunan sesleri onlar için ödeme yapmadan kullanıyor.
Taylan, birkaç platform tarafından istismar edilen “işte o gri alan” olduğunu kabul etti.
“Senin sesini alıyorlar, benim sesimi, beş kişinin sesini toplayıp ayrı bir ses oluşturuyorlar… Kimseye ait olmadığını söylüyorlar.”
AFP’nin temas kurduğu tüm sesli kitap şirketleri bu tür uygulamaları reddetti.
CEO Dima Abramov, Teksas merkezli bir girişim olan Speechki’nin hem kendi kayıtlarını hem de mevcut veri bankalarından gelen sesleri kullandığını söyledi.
Ancak bu ancak kullanım haklarını kapsayan bir sözleşme imzalandıktan sonra yapılır, dedi.
– Birlikte yaşamanın geleceği? –
ABD’nin en büyük beş yayınevi yorum taleplerine yanıt vermedi.
Ancak AFP’nin temas kurduğu profesyoneller, birkaç geleneksel yayıncının, insan müdahalesi olmadan mevcut içerikten metinler, resimler, videolar ve sesler oluşturabilen sözde üretici yapay zekayı zaten kullandığını söyledi.
Amerikan sesli kitap sektöründe bir dev olan Amazon yan kuruluşunun bir sözcüsü, “Profesyonel anlatım, Audible dinleme deneyiminin her zaman çekirdeği olmuştur ve öyle kalacaktır” dedi.
“Ancak, metinden konuşmaya teknolojisi geliştikçe, insan performanslarının ve metinden konuşmaya üretilen içeriğin bir arada var olabileceği bir gelecek görüyoruz.”
Hızla gelişen AI alanına derinden dahil olan ABD teknolojisinin devlerinin tümü, dijital olarak anlatılan sesli kitapların gelecek vaat eden işini takip ediyor.
– ‘Herkes için erişilebilir’ –
Bu yılın başlarında Apple, yapay zeka anlatımlı sesli kitaplara geçtiğini duyurdu; bu hareketin, başta bağımsız yazarlar ve küçük yayıncılar olmak üzere “sesli kitapların oluşturulmasını herkes için daha erişilebilir hale getireceğini” söyledi.
Google, “otomatik anlatım” olarak tanımladığı benzer bir hizmet sunuyor.
Taylan, “Yayıncılık sektörünü demokratikleştirmeliyiz çünkü yalnızca en ünlü ve büyük isimler sese dönüştürülüyor” dedi.
Speechki’den Abramov, “Sentetik anlatım, hiç kaydedilmemiş eski kitaplara ve gelecekten ekonomi nedeniyle asla kaydedilmeyecek tüm kitaplara kapı açtı” diye ekledi.
İnsan tabanlı kayıt maliyetleri göz önüne alındığında, tüm kitapların yalnızca yüzde beşinin sesli kitaba dönüştürüldüğünü ekledi.
Ancak Abramov, büyüyen pazarın seslendirme sanatçılarına da fayda sağlayacağı konusunda ısrar etti.
Daha çok para kazanacaklar, daha çok kayıt yapacaklar” dedi.
– İnsan unsuru –
“Hikaye anlatıcılığının özü, insanlığa nasıl insan olunacağını öğretmektir. Profesyonel Sesli Kitap Anlatıcıları Derneği’nin (PANA) kurucularından bir aktör ve sesli kitap anlatıcısı olan Emily Ellet, “Bize nasıl insan olunacağını öğretecek bir makineye asla verilmemesi gerektiğine inanıyoruz” dedi.
“Hikaye anlatımı,” diye ekledi, “tamamen insan olarak kalmalı.”
Eby, dijital olarak oluşturulan kayıtlara yönelik sık sık yapılan eleştirilerin altını çizdi.
Bir insan kaydıyla karşılaştırıldığında, bir AI ürününün “duygusal bağlantıdan yoksun” olduğunu söyledi.
Eby, ancak insanların makine tarafından üretilen sürüme alışacağından korktuğunu söyledi ve “ve bence sessizce olan şey bu.”
Dileği basitçe “şirketlerin dinleyicilere yapay zeka tarafından üretilmiş bir parça dinlediklerini bilmelerini sağlaması… Ben sadece insanların bu konuda dürüst olmasını istiyorum.”