Veri Gazeteciliği ve Twitter Verilerinin Yayınlanmasının Ahlaki Yönü — (Çeviri)
Twitter benzeri sosyal medyadan elde edilen verilerin toplanması ve yayınlanması veri gazetecileri için sıradan bir uygulama. Cardiff Üniversitesi Sosyal Veri Bilimi Laboratuvarı’ndan yakın zamanda elde edilen bulgular, Twitter içeriklerinin kullanıcıların önceden rızası alınmadan yayınlanmasını sorguluyor. Araştırmacılar, terörizm, seçimler, yasa ve sağlık sorunlarındaki değişiklikler gibi belirli konularla elde edilen tweetlerin, aşırı politik görüş, aşırı derecede rahatsız edici yorumlar, oldukça kişisel ifşalar ve tehditler gibi hassas içerik barındırabilecek veri kümeleri oluşturduğunu keşfettiler. Bu verilerin analiz sürecinde işlenmesi (içeriği nefret uyandıran ya da potansiyel yasadışı olarak sınıflandırmak gibi) ve raporlanması, sosyal araştırma ve gazetecilikte sosyal medyanın kullanılmasının ahlaki yönünü odak noktası haline getirdi.
Etik, araştırma ve gazetecilikte sosyal medya verilerinin kullanılması konusunda oldukça göze batan bir sorun haline gelmeye başladı. Dijital devrim araştırma denetimi ve mutabık ürün uygulamasının arasındaki paralel gelişmeleri geride bıraktı. Yirminci yüzyılın ortalarında etik yönetimi üzerine yazılan kodlar, yirmi birinci yüzyılda dijital verilerin toplanması, analizi ve temsiline dayandırılmaktadır. Sosyal medya, verinin ulaşılabilir olmasından ötürü özellikle etik açıdan zordur (özellikle Twitter’dan dolayı). Pek çok platformun hizmet şartları halka açık olan kullanıcı verilerinin üçüncü şahıslara erişimine açık olacağını özellikle belirtir ve bu şartları kabul ederek kullanıcılar buna rıza göstermiş olurlar. Ancak araştırmacılar ve veri gazetecileri, ticari olarak motive edilmiş bu hizmet koşullarını, bu verilerin yasal olarak izin verilen kullanımlarına odaklanmak yerine, içeriğe duyarlı bir yaklaşım anlamına gelen daha dönüşümlü bir mercekle yorumlamalı ve bunlara yakın ilişki kurmalılar.
Sosyal medya araştırmacıları ve veri gazetecileri, Facebook, YouTube, Flickr, Tumblr ve Twitter gibi siteleri içeren geniş yelpazeli kaynaklardan elde edilen verilerle deneyler yapmışlardır. Twitter açık ara üzerinde en çok çalışma yapılan ağ olmuştur. Bunun sebebi Twitter’ın, Facebook gibi ‘arkadaş’ grupları etrafında düzenlenmiş olup bu sebepten ötürü daha ‘açık’ ve veriler araştırmacılara açık halde olan ağlardan farklı olmasıdır. Bu Twitter’ı düşüncelerin paylaşımını destekleyen bir dijital alan haline getirmektedir. Twitter, çevrimiçi vatandaşların ulusal öneme sahip olaylara olan tepkilerini kamuya açık bir şekilde ifade etmeleri ve ayrıca sosyal bilimlerde araştırma yapmak için dijital yayınlarda birincil veri kaynağı haline gelmiştir.
Twitter API’si (Uygulama Programlama Arayüzü), üç düzeyde veri erişimi sağlar: günlük yaklaşık 5 milyon tweeti sağlayan ücretsiz rastgele %1 ve yine rastgele %10 ve %100 (isteğe bağlı olarak akademik araştırmacılar için ücretlendirilebilir ya da ücretsiz olabilir). Sosyal bilimlerde ve gazetecilikte bu ölçeğin sosyal etkileşimleri, erişim hızı ve erişim kolaylığı ile ilgili veri kümeleri şimdiye kadar erişilemez olmuştur ve bu da tamamı metinden oluşan ve yazarın kimliğini içeren günlük makale ve haber taşkınına sebep olmuştur. Bu büyük ihtimalle Twitter’ın açık yapısıyla alakalıdır. Ki bu yapı da ‘bunlar halka açık verilerdir’ ve kullanılmaları etik hataların incelenmesini gerektirmez algısına sebep olmaktadır. İncelenmiş olsalar bile, gazeteciler kullanıcılara neden olacak olası zararları değerlendirecek bir yapının bulunmamasından dolayı ‘halka açık veri’ argümanıyla ikna edilemezler. Sosyal Veri Bilim Laboratuvarı sosyal araştırmalarda sosyal medyanın kullanılması konusunda daha dönüşümsel bir yaklaşım benimsemiş ve kullanıcıların algılarını, online içerik ve algoritmaların potansiyel olarak hassas kullanıcı özelliklerini tahmin etmedeki rolünü dikkatlice göz önünde bulundurmuştur.
Kullanıcıların sosyal medya paylaşımlarının kullanımına ilişkin algılarına yönelik yapılan son bir laboratuvar araştırması şunları elde etti:
- %94 sosyal medya şirketlerinin kullanım şartlarının varlığından haberdar,
- %64 kullanım şartlarını kısmı ya da tamamıyla okumuş,
- %76 kullanım şartlarını kabul ederek bilgilerinin bir kısmının üçüncü şahıslara erişime açılmasına izin verdiklerinin farkında
- %80 sosyal medya bilgilerinin yayınlanması durumunda bir rıza formunun sunulması konusunda hemfikir
- %90 tweetleri izinleri olmadan kullanılırsa anonim olarak kullanılması gerektiğini savunuyor
Bu araştırma bulguları, sosyal paylaşım araştırmacılarının ve veri muhabirlerinin mevcut uygulamaları ile Twitter gönderilerinin içeriğinin yayınlanması ve kullanıcıların yayınlarda çevrimiçi iletişiminin adil kullanımına ilişkin kullanımları ve aynı zamanda veri deneği olarak haklarının kullanımı arasında bir tartışma olabileceğini göstermektedir. Bu kopukluğun çoğu online iletişimlerde halka açık olarak algılanan ve dolayısıyla izinsiz veya anonimleştirmeden korunma olmaksızın veri olarak yayınlanabileceklerden kaynaklanıyor gibi görünüyor.
Halka açık yerlerde yapılan araştırmalar için prensip sağlayan mevcut etik kurallar, veri biçimleri ve veri toplama konusunda geleneksel yönteme odaklanmaktadır. İnternet etkileşimleri gelip geçicilik, anonimlik, sosyal işaretlerde azaltma ve zaman-uzam uzaklaşmasının farkındalığına göre şekillenmektedir. Bu durum da bireyleri, kendileri hakkında offline olarak veya kamuyu ve özeli bulandıracak şekilde paylaşmadan ziyade online ortamlarda daha çok paylaşım yapmaya itmektedir. Araştırmalar, bilgisayar yardımlı iletişimin engelleyici etkisini vurguladı: Internet kullanıcıları bunu, çevreyi bir (yarı) kamusal alan olarak kabul ederken, özel konuşma olarak kabul edilebilecek şekilde kullanmaktadır. Online bilgi, internetteki geniş kamu için hatta internetin ötesindeki kamular için hiç değil, yalnızca akranlardan, destek ağından ya da belirli bir topluluktan oluşan özel ağlara yöneliktir. Hedeflenmemiş kitleler tarafından görüntülendiğinde, bilgi hedeflenen bağlamdan dışarıya aktığından sakıncalı olabilir. Kamu-özel bölünmesinin, akademik ve düzenleyici tanımlarının online bağlamlarda yapılamayacağı ve bu mahremiyet bağlamında beklenti ve fikir birliği içermesi gereken bir kavram olduğu argümanından memnun olabiliriz.
Bu online ağlar içerisinde oluşturulan ve depolanan hassas verilerin bolluğu göz önüne alındığında, bilgilendirilmiş rıza ve anonimlik ayrıca garanti altına alınır. Laboratuvar araştırması, cinsel yönelim, etnik yapı, cinsiyet; kaygı hissi ve anonimlik beklentisi kavramları arasındaki bağlantıyı göstermektedir. Temel bir etik düşünce, veri toplama, analiz etme ve yayınlama sırasında oluşabilecek asıl veya potansiyel zarar riskini en aza indirirken, veri gazeteciliğinden azami kavramayı sağlamaktır.
Hassas veri tahmin edilirken sosyal medya kullanımı veri gazeteciliğinde potansiyel zarar artar. Bu veriler kişisel demografik bilgileri (etnik yapı ve cinsel eğilim gibi), ortaklık üzerine bilgileri (grupların diğer gruplarla ya da bireylerle yaptıkları üyelikler gibi) ve oldukça kişisel ya da zararlı konular üzerine yapılan konuşmaları (ahlaki olarak belirsiz ya da yasadışı faaliyetlerle ilgili detaylar ve aşırı görüş ifadeleri gibi) içerebilir. Bu tür bilgiler, bazı durumlarda kullanıcının bilgiye kimin erişiminin olup olmadığını ya da amacının nasıl değiştirildiğine dair fikri olup olmadığına bakılmaksızın bile bile yerleştirilmekte. Diğer durumlarda hassas bilgi, kullanıcılar tarafından kasten üretilmez, fakat kullanıcılar arasındaki ilişkilerin tanımlandığı ve kişisel özelliklerin algoritmalar tarafından tahmin edildiği analizlerde sıklıkla ortaya çıkabilir.
Twitter kullanıcılarının gizliliğini veri gazetecilerinin ihtiyaçlarıyla dengelememiz gerekirse (çevrenin sınırlandırıcı niteliği ve kabul edilen hassas bilgilerin bolluğu) İleriye dönük mantıklı bir yol, açık onay olmadan veri toplamak ve yayınlarda doğrudan alıntı yapılan tüm içerik için bilgilendirilmiş onay almak olacaktır. Direkt olarak alıntılanmış kullanıcılara anonimlik sağlamanın alternatif yolu, Twitter ilkeleri ve online arama yapma sorunlarından (alıntılanan metin kullanıcıları ve partnerlerini bir araya getirerek kolayca aranabilir) ötürü bu araştırma türünde pratik olmayacaktır. Tweetlerin tekrar üretimi durumunda, Twitter (2016) Broadcast ilkeleri yayımcıların şunları yapması gerektiğini belirtti:
- Her tweet için kullanıcı adı ve Twitter bağlantısını (@kullanıcıadı) içermeli
- Tweetin bütün metni kullanılmalı. Tweeti düzenlemek yalnızca teknik ya da orta kısıtlamalarda mümkündür (örneğin hyperlinklerin kaldırılması).
- Kullanıcının kimliğini silinmemeli, gizlenmemeli ya da değiştirilmemelidir. Tweetler kullanıcı gizliliği gibi istisnai durumlarda anonim biçimde gösterilebilir
- Bazı durumlarda, Twitter kullanıcıları paylaştıkları içerikler üzerinde hak sahibi olduklarından, içerik üreticisinden izin alınmalıdır.
Veri gazetecileri bu kılavuzlara uymak zorundaysa, anonimliğin verilmediği durumlarda araştırma verilerinde doğrudan alıntı yapmak için her tweet paylaşıcısından bilgilendirilmiş onay almalıdır. Twitter’ın kullanıcıların paylaştıkları içerikler üzerinde hak sahibi olduğu düşüncesi göz önünde bulundurulursa bu özellikle önemlidir. Silme ve “unutulma hakkı” konusu, doğrudan alıntı yapmak için onay gerekliliğini artırır. Twitter (2015) API’lerin geliştiriciler tarafından kullanılması için hizmet şartları, veri toplayıcıların silme dâhil olmak üzere kullanıcı içeriğindeki gelecekte yapılacak değişiklikleri yerine getirmesi gerektirir. Ancak veri gazetecileri sosyal medya içeriğinin alışılagelmiş temsilinin engellenmiş olduğu çıkarımını yapmamalılar. Geleneksel gazetecilikte olduğu gibi, gazeteciler sözlü metin örnekleri isteniyorsa sınırlı sayıda posterden bilgilendirilmiş onay almak için çabalayabilirler.
Bu blogda ortaya çıkan noktalar doğrultusunda, araştırmacıların araştırma verilerinde tweet yayınlamadan önce risk değerlendirmesi yapmalarını öneriyoruz. Aşağıdaki karar akış şeması araştırmacılara ve veri muhabirlerine, bir tweet yayınlayıp yayınlamama konusunda karar vermelerine ve hangi bağlamda bilgilendirilmiş onamın (dâhil veya harici) gerekebileceğine karar vermede yardımcı olmak üzere tasarlanmıştır.
Yazar: Matthew Willams
Asıl kaynak: datadrivenjournalism.net