• Sat. Oct 1st, 2022

Sanatçı, popüler AI eğitim veri setinde özel tıbbi kayıt fotoğrafları bulur

Byadmin

Sep 22, 2022
büyüt / Yapay zekayı eğitmek için kullanılan LAION-5B veri setinde bulunan sansürlü tıbbi görüntüler. Siyah çubuklar ve bozulma eklendi.

Ars Teknik

Geçen haftanın sonlarında, Kaliforniya merkezli bir sen bir sanatçısın Lapine adını kim kullanıyor? keşfetti 2013 yılında doktoru tarafından çekilen özel tıbbi kayıt fotoğrafları, web’de halka açık görüntülerin bir parçası olan LAION-5B görüntü setinde atıfta bulunuldu. AI araştırmacıları, Stable Difüzyon ve Google Imagen gibi AI görüntü sentezi modellerini eğitmek için bu verilerin bir alt kümesini indirir.

Lapine, tıbbi fotoğraflarını, sanatçıların çalışmalarının LAION-5B veri setinde olup olmadığını görmelerini sağlayan Have I Been Trained adlı bir sitede keşfetti. Lapine sitede metin araması yapmak yerine sitenin tersten görsel arama özelliğini kullanarak yakın zamanda çekilmiş bir fotoğrafını yükledi. Bir yetkilendirme formunda yansıtıldığı gibi, yalnızca doktoru tarafından özel kullanım için izin verilmiş olan yüzünün iki öncesi ve sonrası tıbbi fotoğrafını bulunca şaşırdı. tweetlendi ve ayrıca Ars’a verilmiştir.

Lapine, Dyskeratoz Congenita adlı genetik bir duruma sahiptir. Ars Technica’ya verdiği bir röportajda Lapine, “Cildimden kemiklerime ve dişlerime kadar her şeyi etkiliyor” dedi. “2013 yılında çok sayıda ağız ve çene ameliyatı geçirdikten sonra yüz hatlarını eski haline getirmek için küçük bir dizi işlemden geçtim. Bu resimler bu cerrahla yaptığım son işlemlerden.”

Tıbbi fotoğraflara sahip olan cerrah, Lapine’e göre 2018’de kanserden öldü ve bir şekilde onun muayenehanesinin velayetini bundan sonra bıraktıklarından şüpheleniyor. “Bu, çalıntı mal almanın dijital eşdeğeri” diyor Lapine. “Birisi vefat eden doktorumun dosyalarından bir görüntü çaldı ve bu görüntü internette bir yere ulaştı ve sonra bu veri kümesine kazındı.”

Lapine, tıbbi mahremiyet nedeniyle kimliğini gizlemeyi tercih ediyor. Ars, Lapine tarafından sağlanan kayıtlar ve fotoğraflarla, LAION veri setinde kendisine ait tıbbi görüntülerin bulunduğunu doğruladı. Lapine’in fotoğraflarını aramamız sırasında, veri setinde, her biri benzer şüpheli etik veya yasal statüye sahip olabilecek ve birçoğu muhtemelen şirketlerin beğendiği popüler görüntü sentezi modellerine entegre edilmiş binlerce benzer hasta tıbbi kayıt fotoğrafı keşfettik. Midjourney ve Stability AI, ticari bir hizmet olarak sunulmaktadır.

Bu, herhangi birinin birdenbire Lapine’in yüzünün yapay zeka versiyonunu oluşturabileceği anlamına gelmiyor (şu anda teknolojinin bulunduğu haliyle) – ve adının fotoğraflarla bağlantılı değil – ama özel tıbbi görüntülerin bir ürüne dönüştürülmemiş olması onu rahatsız ediyor. bunları kaldırmak için herhangi bir onay veya başvuru şekli. Lapine, “Bir fotoğrafın sızdırılması yeterince kötü ama artık bir ürünün parçası” diyor. “Ve bu herkesin fotoğrafları, tıbbi kayıtları için geçerli ya da değil. Ve gelecekteki kötüye kullanım potansiyeli gerçekten yüksek.”

İzleyicileri kim izliyor?

LAION, kendisini dünya çapında üyeleri olan, “büyük ölçekli makine öğrenimi modellerini, veri kümelerini ve ilgili kodları genel halkın kullanımına sunmayı amaçlayan” kâr amacı gütmeyen bir kuruluş olarak tanımlıyor. Verileri, yüz tanımadan bilgisayarla görme ve görüntü sentezine kadar çeşitli projelerde kullanılabilir.

Örneğin, bir AI eğitim sürecinden sonra, LAION veri setindeki bazı görüntüler, Stable Diffusion’ın metin açıklamalarından görüntüler üretme konusundaki şaşırtıcı yeteneğinin temeli haline gelir. LAION, web’deki resimlere işaret eden bir URL kümesi olduğundan, LAION resimlerin kendisini barındırmaz. Bunun yerine LAION, araştırmacıların bir projede kullanmak istediklerinde görüntüleri çeşitli yerlerden indirmeleri gerektiğini söylüyor.

LAION veri seti, şu anda ticari makine öğrenimi ürünlerine entegre edilen, bunlar gibi, İnternet'ten toplanan potansiyel olarak hassas görüntülerle doludur.  Gizlilik amacıyla Ars tarafından siyah çubuklar eklendi.
büyüt / LAION veri seti, şu anda ticari makine öğrenimi ürünlerine entegre edilen, bunlar gibi, İnternet’ten toplanan potansiyel olarak hassas görüntülerle doludur. Gizlilik amacıyla Ars tarafından siyah çubuklar eklendi.

Ars Teknik

Bu koşullar altında, belirli bir görüntünün LAION setine dahil edilmesinin sorumluluğu, daha sonra, paranın karşılığını vermenin süslü bir oyunu haline gelir. Lapine’in bir arkadaşı, geçen Cuma günü LAION’un Discord sunucusunun #güvenlik-ve-gizlilik kanalında görüntülerini setten nasıl çıkaracağını soran açık bir soru yöneltti. LAION mühendisi Romain Beaumont, “İnternet’ten bir görüntüyü kaldırmanın en iyi yolu, barındırma web sitesinin onu barındırmayı durdurmasını istemektir” diye yanıtladı Beaumont. “Bu görüntülerin hiçbirine ev sahipliği yapmıyoruz.”

ABD’de, 2019’daki bir davanın sonuçlarının onayladığı gibi, İnternet’ten kamuya açık verileri kazımak yasal görünüyor. Öyleyse, çoğunlukla ölen doktorun hatası mı? Ya da internette Lapine’in yasa dışı görüntülerini barındıran site?

Ars, bu sorular hakkında yorum yapmak için LAION ile temasa geçti ancak basın saatine kadar bir yanıt alamadı. LAION’un web sitesi, Avrupa vatandaşlarının AB’nin GDPR yasalarına uymak için veritabanlarından kaldırılan bilgileri talep edebilecekleri bir form sağlar, ancak yalnızca bir kişinin fotoğrafı görüntünün meta verilerinde bir adla ilişkilendirilirse. Ancak PimEyes gibi servisler sayesinde, birinin yüzünü başka yollarla isimlerle ilişkilendirmek önemsiz hale geldi.

Sonuç olarak, Lapine özel görüntüleri üzerindeki gözetim zincirinin nasıl başarısız olduğunu anlıyor, ancak yine de görüntülerinin LAION veri setinden kaldırılmasını istiyor. “Kişisel bilgilerden ödün vermeden herhangi birinin görüntüsünün veri kümesinden kaldırılmasını isteyebileceği bir yol istiyorum. Sırf web’den sıyırmış olmaları, bunun kamuya açık bir bilgi olması gerektiği anlamına gelmez, hatta bu, kamuya açık bilgi olması gerektiği anlamına gelmez. hiç ağ.”