Kamuya ilk yayınlandıktan kısa bir süre sonra, metinden resme yapay zeka gibi modeller Kararlı Difüzyon Ve yolculuk ortası kullanımlarının etiği etrafındaki tartışmalarda da odak noktası haline geldi. Anton Troynikov, kurucu ortağıdır. renk, yapay zekanın yorumlanabilirliğini geliştirmeye çalışan, yani yapay zeka sistemlerinin altında olup bitenleri biraz daha az gizemli hale getirmeye çalışan bir girişim. İle AI sanat üreteçleri, Troynikov ve Chroma’daki diğerleri, ortaya çıkan çetrefilli atıf sorunlarından bazılarının ele alınmasını kolaylaştıracak bir araç geliştirme fırsatı gördüler. Troynikov, projeyle ilgili beş kısa soruyu yanıtladı. Kararlı Atıf– ve sanatçıların ve yapay zeka mühendislerinin yapay zeka tarafından üretilen sanat konusunda birbirlerinin arkasından konuşmayı nasıl bırakabileceklerini düşündüğü.
Yapay zeka sanat üreteçleri piyasaya sürüldüklerinde ilk izlenimleriniz nelerdi?
Anton Troynikov: Stable Diffusion yayınlandıktan ve çok daha fazla insan modele eriştikten sonra AI sanat söylemine dikkat etmeye başladım. Ve konuşmanın her iki tarafındaki insanların birbirinin yanından geçtiğini çok çabuk fark etmeye başladım. Teknisyenlerin ve kreatiflerin birbirlerinin düşmanı olmadıklarından emin olma sorununa teknik bir çözüm olup olmadığını görmek istedim.
Kararlı İlişkilendirme ile hedefiniz nedir?
Troynikov: Bu sorunun üstesinden gelinmesinin teknik olarak imkansız olmadığını göstermek istedim. Özellikle yaratıcı tarafta, aynı zamanda teknoloji ve araştırma tarafında da olmak üzere bir grup insanla konuştuktan sonra, onu piyasaya sürdüğümüzde ne tür tepkiler alacağımızı görmenin doğru şey olduğunu düşündük.
Kararlı İlişkilendirmenin nasıl çalıştığının kısa versiyonu nedir?
Troynikov: Kararlı Difüzyon, gizli difüzyon modelleri adı verilen bir model sınıfındadır. Gizli yayılma modelleri, görüntüleri ve bunların metin başlıklarını vektörlere kodlar (temelde her görüntü için benzersiz bir sayısal temsil). Eğitim süresi boyunca, model vektörlere rastgele değerler (gürültü) ekler. Ve sonra biraz daha gürültülü bir vektörden biraz daha az gürültülü bir vektöre geçmek için bir model eğitirsiniz. Başka bir deyişle, model, eğitim setindeki her görüntünün orijinal sayısal temsilini, o görüntüye eşlik eden metin başlığına dayanarak yeniden üretmeye çalışır.
Buradaki düşünce şuydu, çünkü bu sayısal temsiller, görüntüleri vektörlere dönüştüren önceden eğitilmiş bu modellerden geliyor ve fikir şuydu: “Tamam, görüntüleri olabildiğince benzer şekilde yeniden üretmeye çalışıyor.” Bu nedenle, oluşturulan bir görüntü, benzer bir sayısal temsile sahip olarak, onu en çok etkileyen görüntülere benzer olmak ister. Çok kısa açıklama bu kadar.
Bu son adımı nasıl atarsınız ve sanatçıların ve yaratıcıların kim olduğunu belirlersiniz?
Troynikov: Kaynak görüntüleri yaratan insana doğrudan atıfta bulunabilmeyi gerçekten çok isteriz. Elimizde olan ve Stable Diffusion’ın halka açık eğitim veri setinde bulunanlar, resimler için URL’lerdir ve bu URL’ler genellikle bir CDN’den gelir. [content delivery network]. Bu görüntülerin göründüğü sitelerin sahipleri ve bu CDN’lerin sahipleri ve operatörleri abilir o bağlantıyı yap.
Sitede küçük bir başvuru formumuz var. İnsanlar içerik oluşturucunun kim olduğunu bilirlerse bunu bize gönderebilirler ve biz de onu tekrar bağlamaya çalışırız.
Kaynak görüntüleri yaratıcılarına atfetme yeteneğinin yanı sıra, sanatsal yaratıcılığı etkileyen bu tür üretken yapay zekayı nasıl görüyorsunuz?
Troynikov: Bence yapabileceğiniz iki şey var. Birincisi, ilişkilendirme yaparak eğitim setinize katkıda bulunanları herhangi bir nesle katkılarına göre orantılı olarak tazmin edebilirsiniz. Gerçekten ilginç olan diğer bir şey ise, üretken modellerde ilişkilendirmeniz varsa, onları sadece bir üreticiden bir arama motoruna dönüştürür. Beğendiğiniz estetiği yinelemeli olarak bulabilir ve ardından bu görüntünün oluşturulmasına katkıda bulunan şeylere geri dönebilirsiniz.
Anton Troynikov, yapay zekanın davranışını veriler aracılığıyla anlamaya odaklanan bir yapay zeka şirketi olan Chroma’nın kurucu ortağıdır. Daha önce, Troynikov üzerinde çalıştı robotik 3D bilgisayar görüşüne odaklanarak. Yapay zekanın hepimizi öldüreceğine inanmıyor.