ImageNet Roulette: Veri Seti ve Sınıflandırma Şiddeti

Filomythos Yapay Zeka

Bu yazıyla bağlantılı kavramları Filomythos arşivinde arayın.

Trevor Paglen ve Kate Crawford’un “ImageNet Roulette” / “ImageNet Ruleti” projesi, yapay zekâ eleştirisinin en çarpıcı örneklerinden biridir. Proje ilk bakışta basit bir arayüz sunar: Kullanıcı fotoğrafını yükler, sistem yüzü tanır ve kişiyi ImageNet’in “person / kişi” kategorileri içinden bir etiketle sınıflandırır. Fakat bu basitlik aldatıcıdır. Çünkü sistemin ürettiği etiketler, makine görüsünün yalnızca teknik bir tanıma işlemi olmadığını gösterir. Makine, insanı tarihsel olarak kurulmuş sınıflandırma düzenleri içinden görür.

Bu proje, Paglen’in “Görünmeyen İmgeler” metninde tarif ettiği makine görüsü çağının somut bir örneğidir. Fakat ImageNet Roulette yalnız Paglen’in düşüncesini uygulamakla kalmaz. Kate Crawford’un veri, yapay zekâ, emek, sınıflandırma ve iktidar üzerine geliştirdiği araştırma hattıyla birleşir. Böylece mesele yalnızca “makineler görüntülere bakıyor” düzeyinde kalmaz. Daha derin bir soru açılır: Makineler görmeyi hangi veri setlerinden, hangi kategorilerden ve hangi tarihsel önyargılardan öğreniyor?

Bu soru, yapay zekâ çağında imajın merkezindedir. Çünkü makine görüsü boşlukta çalışmaz. Görmeyi öğrenmek için etiketlenmiş görüntülere, kategorilere, veri arşivlerine ve sınıflandırma sistemlerine dayanır. Bu veri düzeni tarafsız değilse, makinenin bakışı da tarafsız olamaz. ImageNet Roulette’in önemi, bu soyut tezi her kullanıcının kendi yüzüyle deneyimleyebileceği kamusal bir olaya dönüştürmesidir.

Trevor Paglen and Kate Crawford ImageNet Roulette
Kaynak: https://paglen.studio/2020/04/29/imagenet-roulette/

ImageNet Nedir?

ImageNet, yapay zekâ ve makine görüsü tarihinde en etkili görsel veri setlerinden biridir. Basitçe söylenirse, milyonlarca imgenin belirli kategoriler altında sınıflandırıldığı büyük bir görüntü arşividir. Bu tür veri setlerinde imgeler yalnızca depolanmaz; onlara etiketler verilir. Bir görüntü “köpek”, “araba”, “ağaç”, “insan”, “yüz” ya da daha karmaşık kategoriler altında işaretlenebilir. Makine öğrenmesi sistemleri bu etiketli imgelerden örüntü çıkararak yeni görüntülerde benzer nesneleri tanımayı öğrenir.

ImageNet’in 2009’da Princeton ve Stanford bağlantılı araştırmacılar tarafından geliştirilen, makine öğrenmesi araştırmalarında yaygın kullanılan bir eğitim seti olduğu Paglen’in proje açıklamasında özellikle belirtilir. ImageNet Roulette de bu veri setinin “person / kişi” kategorileri üzerine eğitilmiş bir modelle çalışmıştır.

Bu nedenle ImageNet yalnızca teknik bir veri havuzu değildir. Makinenin dünyayı hangi kategorilerle görmeyi öğreneceğini belirleyen epistemik bir düzenektir. Bir insan için fotoğraf; anı, yüz, manzara ya da belge olabilir. Makine için aynı fotoğraf, eğitim verisidir. Görüntü; piksel, etiket, kategori ve olasılık ilişkisine dönüştürülür.

Bu açıklama, makine görüsünün en temel gerçeğini görünür kılar: Yapay zekâ görmeyi boşlukta öğrenmez. Ona dünya, etiketlenmiş imgeler aracılığıyla öğretilir. Bu yüzden veri seti yalnız mühendislik meselesi değildir. Bilginin, temsilin ve iktidarın kurulduğu yerdir.

ImageNet Roulette Nasıl Çalıştı?

“ImageNet Roulette” / “ImageNet Ruleti”, kullanıcıların kendi fotoğraflarını yükleyebildiği etkileşimli bir projeydi. Sistem, yüklenen fotoğraftaki yüzü algılıyor ve ImageNet’in “person / kişi” kategorileriyle eğitilmiş bir model aracılığıyla kişiye bir etiket veriyordu. Çıkan sonuçlar çoğu zaman sıradan değildi. Kullanıcılar kimi zaman meslek, kimlik ya da toplumsal statü belirten etiketlerle; kimi zaman da aşağılayıcı, ırkçı, cinsiyetçi, kriminalleştirici ya da patolojikleştirici kategorilerle karşılaştı.

Wired’ın 2019’daki haberinde, ImageNet Roulette’in Paglen ve Crawford tarafından geliştirildiği, ImageNet’in yaklaşık 14 milyon imajdan oluşan temel bir veri tabanı olduğu ve aracın ImageNet içinde insanları etiketleyen binlerce kategoriye dayandığı aktarılır. Aynı haberde, sistemin kimi durumlarda saldırgan ve sorunlu etiketler ürettiği de belirtilir.

Projenin sarsıcı tarafı teknik karmaşıklığında değil, deneyimin kişiselliğindedir. Kullanıcı kendi yüzünü yükler ve makinenin onu hangi kategoride gördüğüyle karşılaşır. Bu karşılaşma, yapay zekâ eleştirisini soyut bir tartışma olmaktan çıkarır. Kişi, veri setiyle kendi yüzü arasında doğrudan bağ kurar. Sınıflandırma artık uzaktaki bir teknik işlem değildir; ekranda, yüzün üzerinde, kullanıcıya yönelen bir etikete dönüşür.

Bu nedenle ImageNet Roulette bir sanat projesi olduğu kadar bir epistemolojik deneydir. İnsan, makinenin onu nasıl gördüğünü görür. Daha doğrusu, makinenin “görme” dediğimiz işlemi hangi tarihsel kategorilerle kurduğunu deneyimler.

Sınıflandırma Şiddeti

ImageNet Roulette’in ortaya çıkardığı temel sorun yalnızca hatalı sınıflandırma değildir. Daha derin sorun, insanın sınıflandırılabilir bir nesneye dönüştürülmesidir. Makine, bir yüzü yalnızca yüz olarak görmez. Onu bir kategoriye yerleştirir. Bu kategori bazen görünürde nötr olabilir; bazen doğrudan aşağılayıcı, kriminalleştirici ya da ırkçı bir yük taşıyabilir. Fakat sorun, yalnızca hangi etiketin verildiğinde değildir. Sorun, insanın etiketlenebilir bir veri nesnesi olarak kurulmasındadır.

Crawford ve Paglen’in “Excavating AI: The Politics of Images in Machine Learning Training Sets” / “Yapay Zekâyı Kazmak: Makine Öğrenmesi Eğitim Setlerinde İmgelerin Politikası” başlıklı metni bu meseleyi geniş bir tarih içine yerleştirir. Metin, otomatik imge yorumunun toplumsal ve politik bir proje olduğunu savunur; yapay zekânın imgeleri “görmeyi” öğrenme biçiminin yalnız teknik değil, sınıflandırma politikalarıyla ilişkili olduğunu gösterir.

Bu noktada tarihsel miras belirleyicidir. İnsan yüzünü ölçmek, sınıflandırmak, ayırmak ve normdan sapma üzerinden okumak modernliğin karanlık bilimsel gelenekleriyle bağlantılıdır. Fizyonomi, frenoloji, öjeni, kriminal antropoloji ve psikiyatrik sınıflandırmalar, insanı yüzünden, bedeninden ya da görünüşünden hareketle anlamlandırma iddiası taşımıştır. ImageNet Roulette, makine görüsünün bu mirastan bütünüyle kopmadığını gösterir. Yeni olan yalnızca teknolojidir; sınıflandırma arzusu çok daha eskidir.

Bu nedenle makine bakışı yalnızca “daha hızlı insan bakışı” değildir. O, tarihsel sınıflandırma sistemlerinin teknik olarak yeniden düzenlenmiş biçimi olabilir. Eğer veri seti insanı zaten sorunlu kategorilerle düşünüyorsa, model de insanı bu kategoriler içinde görecektir. Makinenin tarafsızlığı miti burada çöker.

“Training Humans” / “İnsanları Eğitmek”: Eğitim İmgelerinin Tarihi

Crawford ve Paglen’in “Training Humans” / “İnsanları Eğitmek” projesi, ImageNet Roulette’in arkasındaki daha geniş görsel tarihi açar. Fondazione Prada’nın sergi açıklamasına göre bu proje, 1960’lardan bugüne yapay zekâ sistemlerini insanları tanımaya ve sınıflandırmaya eğitmek için kullanılan görüntü setlerinin evrimini görünür kılar. Sergi, eğitim imgelerini yalnız teknik malzeme olarak değil, bir tür imge-altyapısı olarak düşünür.

Bu nokta önemlidir. Çünkü eğitim imgesi klasik anlamda “seyredilmek” için yapılmış imge değildir. Eğitim imgesi, makinenin görsel dünyayı sınıflandırmayı öğrenmesi için vardır. Burada imaj, estetik haz ya da yorum alanına değil, öğrenme ve ayırt etme sürecine bağlanır. Bir yüz imgesi, yalnız portre değildir; yüz tanıma sisteminin ayrım yapmayı öğrenmesini sağlayan veri birimidir. Bir beden imgesi, yalnız figür değildir; poz, kimlik, duygu, yaş, cinsiyet ya da davranış kategorilerinin öğretilmesine hizmet eden teknik malzemedir.

Bu nedenle “İnsanları Eğitmek” başlığı çift anlamlıdır. Bir yandan makineler insanları tanımak üzere eğitilir. Diğer yandan insanlar da bu sistemlerin dünyayı nasıl gördüğünü kabul etmeye alıştırılır. Böylece eğitim yalnız makineye değil, topluma da yönelir. İnsanlar kendilerini sınıflandırılabilir, ölçülebilir, izlenebilir ve tahmin edilebilir veri nesneleri olarak görmeye başlar.

Kamusal Etki ve ImageNet’in Yanıtı

ImageNet Roulette yalnızca sanat çevresinde kalmadı. 2019’da kamuoyuna açıldığında hızla yayıldı. Kullanıcılar sosyal medyada kendi sınıflandırma sonuçlarını paylaştı. Basın projeyi haberleştirdi. Yapay zekâ ve önyargı tartışması teknik ve akademik çevrelerin dışına çıktı. Axios’un haberinde proje, yapay zekâ sistemlerinin teknik ya da matematiksel işlemler gibi görünen süreçlerinin aslında toplumsal ve politik yükler taşıdığını gösteren bir deney olarak ele alınır; aynı haberde projenin kısa sürede çok yüksek erişime ulaştığı aktarılır.

Kısa süre sonra ImageNet ekibi, kişi kategorilerindeki sorunlu alanlara dönük bir temizleme süreci duyurdu. ImageNet’in 17 Eylül 2019 tarihli açıklamasında, “unsafe / güvensiz” olarak belirlenen synset’lerin ve onlarla ilişkili imgelerin kaldırılacağı, bunun 600.040 imgenin çıkarılması ve geriye güvenli kişi kategorilerinde 577.244 imgenin kalması anlamına geldiği belirtilir.

Burada dikkatli olmak gerekir. ImageNet açıklaması ImageNet Roulette’i doğrudan neden olarak göstermeyebilir. Bu nedenle kesin bir nedensellik kurmak doğru olmaz. Fakat zamanlama ve kamusal tartışma birlikte düşünüldüğünde, Paglen ve Crawford’un projesi ImageNet’in kişi kategorileri hakkındaki sorunu geniş ölçekte görünür kılan en güçlü müdahalelerden biri olmuştur. Artsy’nin haberinde de ImageNet’in açıklamasının projeden kısa süre sonra geldiği ve bu zamanlamanın ilişkiyi düşündürdüğü belirtilir.

Bu süreç, sanat pratiğinin teknik bir sistemi doğrudan tartışmaya açtığı nadir örneklerden biridir. Paglen ve Crawford yalnızca eleştiri yazmadı. Bir proje, bir arayüz ve bir kamusal deneyim kurarak sınıflandırma sisteminin içindeki şiddeti görünür hâle getirdi. Böylece veri seti, mühendislik alanının kapalı bir nesnesi olmaktan çıktı; herkesin kendi yüzünde deneyimleyebileceği politik bir sorun hâline geldi.

Sorun Çözüldü mü?

ImageNet’teki bazı etiketlerin kaldırılması ya da filtrelenmesi, sorunun çözüldüğü anlamına gelmez. Çünkü mesele yalnızca tek tek kötü etiketler değildir. Daha derinde, insanı sınıflandırma, ölçme, etiketleme ve karar sistemlerine bağlama mantığı vardır. Veri setinin yüzeyindeki en açık saldırgan kategoriler temizlenebilir; fakat sınıflandırma düzeninin toplumsal kökleri yerli yerinde kalabilir.

Bu nedenle ImageNet Roulette hem bir başarı hem de bir uyarı olarak okunmalıdır. Başarıdır; çünkü kamusal görünürlük somut bir değişiklik yaratmıştır. Uyarıdır; çünkü görünür hâle gelen şey, sorunun yalnızca yüzeyidir. Veri setlerinin daha derin katmanlarındaki önyargılar, model mimarisine işlemiş normlar, eğitim verisinin toplandığı toplumsal koşullar ve insanı veri nesnesi olarak kuran teknik bakış devam eder.

Ayrıca sorun yalnız ImageNet’le sınırlı değildir. Bugün yüz tanıma, duygu analizi, davranış tahmini, reklam hedefleme, güvenlik sistemleri ve platform algoritmaları benzer sınıflandırma mantıklarıyla çalışır. ImageNet Roulette’in önemi, bu geniş alanı tek bir çarpıcı deneyim içinde görünür kılmasıdır. Proje, büyük bir yapının küçük ama etkili bir kesitini gösterir.

Veri Mitosu Açısından ImageNet Roulette

Sentetik Epistemoloji açısından ImageNet Roulette’in en önemli katkısı, Veri Mitosunu kırmasıdır. Veri Mitosu, verinin tarafsız, doğal, kendiliğinden doğru ve dünyayı olduğu gibi yansıtan bir zemin gibi sunulmasıdır. Oysa veri her zaman seçilir, toplanır, ayıklanır, etiketlenir, sınıflandırılır ve belirli teknik-politik amaçlarla düzenlenir.

ImageNet Roulette, bu gerçeği soyut bir iddia olarak bırakmaz. Kullanıcı, veri setinin tarafsız olmadığını kendi yüzü üzerinden deneyimler. Makine ona bir etiket verir. Bu etiket, veri düzeninin içindeki tarihsel ve toplumsal yükleri görünür kılar. Eleştirinin gücü burada ortaya çıkar: Veri seti hakkında bir tez okumak başka şeydir; kendi yüzünün problemli bir kategoriye yerleştirildiğini görmek başka şeydir.

Bu nedenle ImageNet Roulette, Sentetik Epistemoloji için yalnız bir örnek değildir. Veri Mitosu’nun nasıl kırılabileceğini gösteren yöntemsel bir örnektir. Mit, ancak görünmez işleyişi deneyimlenebilir hale geldiğinde çatlar. Crawford ve Paglen’in projesi bunu yapar. Veri setinin politik olduğunu söylemekle kalmaz; verinin insanı nasıl gördüğünü insana gösterir.

Algoritmik Nomos ve Sınıflandırma Düzeni

ImageNet Roulette aynı zamanda Algoritmik Nomos kavramı açısından da önemlidir. Nomos, yalnız yazılı yasa değildir; bir alanın fiilî düzenidir. Algoritmik Nomos ise çağdaş dijital sistemlerde görünürlük, sınıflandırma, erişim ve karar süreçlerini düzenleyen teknik yasadır. Bu yasa çoğu zaman yasa gibi görünmez. Arayüzlerin, modellerin, veri setlerinin ve algoritmik sıralamaların içinde çalışır.

ImageNet Roulette’in gösterdiği şey, bu düzenin insanları nasıl kategorilere yerleştirdiğidir. Sistem kişiyi yalnız görmez; onu bir sınıfa sokar. Bu sınıf daha sonra başka işlemler için kullanılabilir. Kimin riskli, kimin normal, kimin güvenilir, kimin şüpheli, kimin değerli, kimin görünmez sayılacağı bu teknik sınıflandırmalarla ilişki kurabilir.

Bu yüzden sınıflandırma, yalnız bilgi üretimi değildir. Aynı zamanda iktidar üretimidir. Birini adlandırmak, onu bir düzen içine yerleştirmektir. Makine görüsü çağında bu adlandırma, otomatikleşmiş ve ölçeklenmiş hale gelir. ImageNet Roulette, bu otomatik sınıflandırma gücünü estetik bir arayüz üzerinden görünür kılar.

Sanat Pratiği Olarak Eleştiri

ImageNet Roulette’in önemli yanı, eleştiriyi yalnız metinsel düzeyde kurmamasıdır. Proje, kullanıcıyı sistemin içine sokar. Kişi, yapay zekâ hakkında dışarıdan düşünmez; sistem tarafından sınıflandırılır. Böylece eleştiri bir deneyime dönüşür.

Bu, sanat pratiğinin güçlü bir imkânıdır. Akademik metin, bir veri setinin önyargılı olduğunu açıklayabilir. Fakat ImageNet Roulette, bu önyargıyı doğrudan karşılaşma biçimine dönüştürür. Kullanıcı, kendi yüzünün teknik bir kategoriye indirgenmesini izler. Bu deneyim, sınıflandırma sisteminin şiddetini soyutluktan çıkarır.

Paglen ve Crawford’un başarısı burada yatar. Onlar yapay zekâ eleştirisini yalnız uzmanlara ait bir tartışma olmaktan çıkarıp kamusal deneyime dönüştürür. Bu nedenle proje hem sanat hem araştırma hem de politik müdahale olarak okunmalıdır.

Sentetik Epistemoloji Açısından Yeri

ImageNet Roulette, Sentetik Epistemoloji’nin temel sorularından birini somutlaştırır: Bilginin koşulları bugün nerede yazılıdır? Bu projede yanıt açıktır. Bilginin koşulları veri setlerinde, etiketlerde, kategorilerde, model eğitiminde ve sınıflandırma düzeninde yazılıdır. Makine insanı gördüğünde, yalnız pikselleri işlemez. Daha önce kurulmuş bir veri dünyasının içinden görür.

Bu nedenle ImageNet Roulette, Makine Bakışı ile Veri Mitosu arasında kurucu bir örnek olarak yer alır. Makine Bakışı, insanı veri noktaları ve sınıflandırmalar üzerinden görür. Veri Mitosu, bu görmenin tarafsız olduğu iddiasını üretir. ImageNet Roulette ise bu iki düzeyi çarpıştırır: Makine Bakışı’nın nasıl çalıştığını gösterir ve Veri Mitosu’nu kullanıcının kendi yüzünde bozar.

Bu proje ayrıca Algoritmik Nomos’u da görünür kılar. Çünkü sistem, insanı bir kategoriye yerleştirir ve bu kategoriyi teknik bir sonuç gibi sunar. Oysa bu sonuç tarihsel, toplumsal ve politik sınıflandırmaların ürünüdür. Burada yapay zekâ, yeni bir akıl değil; eski sınıflandırma arzularının teknik olarak hızlandırılmış biçimi olabilir.

Projenin Sınırı

ImageNet Roulette çok güçlüdür; fakat yapay zekâ çağındaki bütün veri sorunlarını tek başına açıklamaz. Proje özellikle görüntü, yüz, insan kategorileri ve sınıflandırma şiddeti üzerinde yoğunlaşır. Veri emeği, altyapı, madenler, enerji, veri merkezleri, platform ekonomisi ve küresel tedarik zincirleri bu projenin merkezinde değildir. Bu alanlar için Kate Crawford’un “Atlas of AI” / “Yapay Zekâ Atlası” ve Crawford ile Vladan Joler’in “Anatomy of an AI System” / “Bir Yapay Zekâ Sisteminin Anatomisi” çalışmaları daha doğrudan bir zemin sunar.

Aynı şekilde algoritmik ayrımcılığın benzerlik, korelasyon ve normalleştirme üzerinden nasıl işlediğini ayrıntılı tartışmak için Wendy Hui Kyong Chun’un “Discriminating Data” / “Ayrımcı Veri” çalışması gerekir. Konumlu bilgi meselesi için Donna Haraway, teknik bellek için Bernard Stiegler, yazılım ve veritabanı kültürü için Lev Manovich sonraki halkaları oluşturur.

Bu sınır, ImageNet Roulette’in değerini azaltmaz. Tam tersine, onun yerini netleştirir. Proje, veri setinin tarafsız olmadığını ve makine görüsünün tarihsel sınıflandırma rejimleriyle kurulduğunu gösteren güçlü bir vaka olarak durur. Bu vaka, daha geniş yapay zekâ eleştirisinin kapısını açar.

Sonuç

ImageNet Roulette, yapay zekâ sistemlerinin insanları tarafsız biçimde görmediğini gösteren güçlü bir sanat ve araştırma projesidir. Projenin etkisi, sınıflandırma şiddetini teknik bir tartışma olmaktan çıkarıp kamusal bir deneyime dönüştürmesinden gelir. Kullanıcı kendi yüzünü yükler ve veri setinin onu nasıl adlandırdığını görür. Bu anda makine görüsü, soyut bir teknoloji olmaktan çıkar; kişinin bedenine, yüzüne ve kimliğine yönelen bir sınıflandırma gücü hâline gelir.

Bu proje, veri setlerinin yalnız teknik araçlar olmadığını gösterir. Veri setleri dünyayı kategoriler içinde kurar. Kategoriler geçmişten gelir, iktidar ilişkileri taşır ve makine öğrenmesi sistemleri içinde yeniden işler. Bu nedenle yapay zekâ eleştirisi, yalnız algoritmaya değil, algoritmayı eğiten veri düzenine de yönelmelidir.

Sentetik Epistemoloji açısından ImageNet Roulette’in önemi burada yoğunlaşır: Bilgi ve imaj, artık yalnız temsil alanında değil, veri setleri ve sınıflandırma sistemleri içinde kurulmaktadır. Veri Mitosu, makinenin tarafsız gördüğünü söyler. ImageNet Roulette ise makinenin tarihsel, toplumsal ve politik olarak görmeyi öğrendiğini gösterir.

Kaynak Notu

Bu yazı, Trevor Paglen ve Kate Crawford’un “ImageNet Roulette” / “ImageNet Ruleti”, “Excavating AI: The Politics of Images in Machine Learning Training Sets” / “Yapay Zekâyı Kazmak: Makine Öğrenmesi Eğitim Setlerinde İmgelerin Politikası” ve “Training Humans” / “İnsanları Eğitmek” çalışmaları merkeze alınarak hazırlanmıştır. ImageNet’in kişi kategorilerine ilişkin 2019 güncellemesi ve proje hakkında yayımlanan kamusal tartışmalar da dikkate alınmıştır.

Ele Alınan Proje ve Metinler:
Trevor Paglen & Kate Crawford, “ImageNet Roulette” / “ImageNet Ruleti”
Kate Crawford & Trevor Paglen, “Excavating AI: The Politics of Images in Machine Learning Training Sets” / “Yapay Zekâyı Kazmak: Makine Öğrenmesi Eğitim Setlerinde İmgelerin Politikası”
Kate Crawford & Trevor Paglen, “Training Humans” / “İnsanları Eğitmek”

Paglen ve Crawford: ImageNet Roulette, Veri Setinin Yüzü ve Sınıflandırma Şiddeti -II

Felsefenin “Barbar” Başlangıcı: Diogenes Laertios’un Önsözünde Köken Mücadelesi

Zerdüşt’ün Gathaları: Ahura Mazda, Seçim ve Hakikat

Pers Magları Felsefe Tarihinin Neresinde?