Oamenii de stiinta va studiaza tweeturile si nu este intotdeauna etic

Cine credeti ca va citeste postarile pe retelele de socializare? S-ar putea sa presupuneti ca doar urmasii dvs. va vad tweet-urile si actualizarile de stare – dar altcineva ar putea arunca o privire atenta.

Oamenii de stiinta folosesc din ce in ce mai mult datele publice de social media pentru cercetare si nu examineaza doar tweet-urile – le aduc si in profilele de intalniri online, recenziile dvs. Yelp, postarile dvs. Instagram, videoclipurile dvs. YouTube si chiar comentariile dvs. despre articole ca acesta. . Internetul, in special mass-media sociala, le-a oferit cercetatorilor acces la o multime de informatii despre comportamentul uman care este doar acolo pentru a lua. Iar acesti cercetatori (ca mine!) Au o multime de intrebari la care vor sa foloseasca aceste date pentru a raspunde.

Luati in considerare Twitter, de exemplu. Il putem folosi pentru a prezice tendintele gripei si alegeri, pentru a ajuta la diagnosticarea depresiei, a intelege raspandirea dezinformarii sau a imbunatati comunicarea de urgenta in timpul crizelor.

Zeynep Tufekci a numit pe Twitter „organismul model” al cercetarii in social media: cercetatorii folosesc datele Twitter pentru a raspunde la intrebari, deoarece, la fel ca musca fructului, platforma si utilizatorii sai sunt atat de usor de studiat. De ce este atat de usor? Deoarece datele Twitter sunt aproape in intregime publice.

Array

„Public” este cuvantul magic atunci cand vine vorba de etica cercetarii. „Dar datele sunt deja publice.” Acesta a fost raspunsul cercetatorilor de la Harvard in 2008, cand au lansat un set de date din profilurile de Facebook ale studentilor universitari si ale cercetatorilor danezi in 2016, cand au lansat un set de date razuit de la OKCupid. Organismele de reglementare care supravegheaza etica cercetarii (cum ar fi comisiile de revizuire institutionala din universitatile americane), de obicei, nu considera ca datele „publice” sunt sub aspectul lor. Multi cercetatori vad aceste comisii de revizuire drept arbitrii a ceea ce este etic; daca nu este ceva ce le intereseaza comisiile, atunci nu poate fi lipsit de etica, nu?

Indiferent daca datele sunt publice sau nu  sunt  importante pentru luarea de decizii etice – de fapt, este necesar. (Daca te-a cam ciudat ideea oamenilor de stiinta care iti aduna tweet-urile publice, imagineaza-ti cat de mult mai rau ar fi daca iti culeg postarile intr-un grup Facebook inchis.)

Problema este ca, pentru unii cercetatori, daca datele sunt publice este  singurul  lucru care conteaza. Sugerez (uneori cu voce tare, oamenilor care nu vor sa o auda) ca nu ar trebui sa fie.

Fac parte dintr-un grup de cercetatori, finantat de Fundatia Nationala de Stiinta, care lucreaza la regandirea orientarilor etice pentru studii care folosesc date de socializare. Suntem interesati sa intelegem lucruri precum atitudinile si practicile oamenilor de stiinta, legile si politicile care guverneaza aceasta practica, modalitatile de evaluare si mediere a riscului si impactul pe care cercetarile stiintifice il au asupra oamenilor ale caror date sunt colectate. Am sapat cel mai adanc in aceasta ultima parte, incepand cu un studiu (publicat anul trecut in  Social Media + Society ) pe care l-am realizat cu colaboratorul meu Nicholas Proferes. Am sondat utilizatorii Twitter cu o intrebare simpla in minte: Cum se simt despre cercetatorii care folosesc tweeturile lor si ce ne pot spune acest lucru despre cele mai bune practici pentru cercetatori?

In primul rand, un raspuns simplu: majoritatea (aproape doua treimi) dintre respondenti nu si-au dat seama ca oamenii de stiinta ar putea folosi tweet-urile lor deloc. Acest lucru este in ciuda unei declaratii destul de clare in politica de confidentialitate a Twitter-ului care indica aceasta posibilitate – dar dupa cum stim deja, majoritatea oamenilor nu citesc politicile de confidentialitate.

Cu toate acestea, multi participanti la studiu – dar nu toti – au indicat ca nivelul lor de confort si acceptare depinde de unii factori specifici.

Acesti factori contextuali sunt importanti de inteles; sunt lucruri de care ar trebui sa tina cont cercetatorii atunci cand decid daca si cum sa colecteze si sa raporteze date publice. Nu ne intereseaza oprirea cercetarii care foloseste date publice, dar dorim sa ajutam cercetatorii sa o faca etic.

Nu toate tweeturile sunt la fel

Ideea ca un tweet despre ceea ce a avut cineva la micul dejun este exact aceeasi cu un tweet care dezvaluie starea de sanatate sensibila a cuiva este, pentru a spune, absurd. La urma urmei, unul dintre potentialele prejudicii ale utilizarii datelor publice este amplificarea – raspandirea continutului dincolo de publicul prevazut. Probabil ca nu va face prea mult rau daca mai multe persoane stiu despre cerealele dvs. pentru micul dejun. Dar consecintele negative ar putea urma un tweet despre cineva care are cancer, o boala cu transmitere sexuala sau depresie.

Amplificarea se poate intampla prin distribuirea seturilor de date sau prin reproducerea continutului intr-o lucrare publicata. Si chiar daca lucrarile academice nu pot fi citite pe scara larga, acestea pot avea o acoperire mai larga decat se astepta. In cel putin un caz, un jurnalist a identificat cu usurinta utilizatorii din tweeturile citate intr-o lucrare si apoi a contactat persoanele fizice. Subiectul tweet-urilor a fost destul de inofensiv in acest caz – dar ce se intampla daca nu? Ce se intampla daca, in loc sa afle ca tweet-ul lor despre pescuit a fost citat intr-un articol de cercetare, un utilizator a descoperit ca articolul a inclus tweet-ul lor cu privire la o afectiune sexuala?

As dori sa cred ca majoritatea cercetatorilor se gandesc la asta – ca cineva, de exemplu, nu ar publica tweet-uri verbale care dezvaluie ceva foarte sensibil pentru un utilizator. Dar daca singura noastra regula etica este „Este public?” atunci continutul tweet-ului nu conteaza. Si, in mod surprinzator, studiul nostru a dezvaluit ca confortul respondentilor cu cercetatorii care le citesc postarile depindea foarte mult de continut.

Puteti sustine ca utilizatorii Twitter stiu ca isi exprima cuvintele acolo pentru ca lumea intreaga sa o vada – dar totusi se asteapta ca publicul lor sa fie in primul rand propriii lor adepti, nu o sala plina de oameni de stiinta si, cu siguranta, nu intregul cititor al  The New York Times . De multe ori aud, „Ei bine, ar fi trebuit sa stie”, dar cercetarile au stabilit ca oamenii  nu  au o buna intelegere a acoperirii datelor lor de social media. Ca oameni de stiinta, ar trebui sa avem un standard de ingrijire mai ridicat decat atat.

Nu toate tweeterele sunt la fel

Oamenii de stiinta au, de asemenea, obligatia etica de a exercita un standard mai ridicat de ingrijire pentru persoanele aflate in pozitii mai vulnerabile, iar acest lucru ar trebui sa se extinda la colectarea datelor din grupuri potential vulnerabile din spatiile digitale. Doctoratul meu Studenta Brianna Dym si cu mine am lucrat pentru a dezvolta cele mai bune practici pentru studierea comunitatilor online care au un numar mare de membri care sunt si trans (cum ar fi fandomul online). O caracteristica importanta a acestor spatii este faptul ca multi participanti ar putea sa nu se afle in viata lor fizica si, ca urmare, amplificarea continutului utilizatorilor poate aduce probleme reale de siguranta.

Intr-un caz specific, cercetatorii au colectat videoclipuri YouTube ale unor persoane care trec prin tranzitie de gen, pentru a ajuta la instruirea algoritmilor de recunoastere faciala. Drept urmare, fotografiile de tranzitie ale oamenilor au aparut in lucrari stiintifice, fara permisiunea sau cunostintele lor. Nu numai ca acesti utilizatori YouTube nu si-au propus ca continutul lor sa fie utilizat in acest mod, dar amplificarea acestuia are potentialul de a face mai mult rau unui grup deja vulnerabil.

O problema de baza este ca multe dintre cele mai populare spatii de asistenta – YouTube sau Tumblr, de exemplu – ar putea fi „publice”, dar utilizatorii nu intentioneaza de fapt ca continutul lor sa fie consumat de persoane din afara comunitatilor lor si le impartasesc doar personal sau continut sensibil pentru a ajuta membrii comunitatii.

Insa platformele de socializare incurajeaza, de regula, un numar cat mai mare de continut asupra continutului, ceea ce ingreuneaza utilizatorii sa detina controlul asupra vietii private; pe multe platforme, alegerea este de a face continutul tau vizibil pentru toata lumea sau pur si simplu sa nu folosesti deloc acea platforma. A spune utilizatorilor vulnerabili doar „sa nu-l faca public” daca nu doresc ca continutul lor sa fie scos din context poate insemna eliminarea acestora din spatii de asistenta importante.

Nu toate cercetarile sunt la fel

Normele etice care se concentreaza numai pe caracteristicile datelor in sine ignora etica a ceea ce  facem  cu aceste date. Luati in considerare, de exemplu, algoritmul creat pentru a detecta orientarea sexuala a cuiva dintr-o fotografie. Datele de instruire pentru acest algoritm provin din fotografiile de profil colectate de pe site-urile de intalniri online – imagini care erau deja etichetate cu orientari sexuale. Cu toate acestea, asa cum se recunoaste in lucrarea in sine, un caz de utilizare pentru acest tip de algoritm ar putea fi identificarea si persecutia persoanelor dintr-o tara in care homosexualitatea este ilegala.

In mod similar, in cazul videoclipurilor YouTube de tranzitie de gen, persoanele ale caror imagini au fost utilizate erau ingrijorati in mod clar ca continutul pe care l-au facut public pentru a ajuta comunitatea lor ar avea ca rezultat tehnologia „la fata locului”. Asa cum au aratat cercetarile recente, tehnologia de recunoastere automata a sexului are un risc disproportionat pentru persoanele trans si ca multi o percep ca fiind daunatoare activ. Imaginati-va ca aflati ca  fotografia dvs. a  fost folosita pentru a crea o tehnologie care ar dauna comunitatii voastre.

Acest studiu evidentiaza, de asemenea, o alta caracteristica importanta a cercetarii:  inferenta . Este un lucru pentru ca continutul dvs. sa fie amplificat si, prin urmare, sa dezvaluiti ceea ce ati facut public in mod deliberat (cum ar fi sa va spuneti orientarea sexuala pe un site de intalniri). Acest lucru devine ceva cu totul diferit atunci cand cercetarea dezvaluie ceva ce ati facut  sa nu  faca publice. Imagineaza-ti o lucrare de cercetare care includea selfie-uri de pe Twitter etichetate cu orientarea sexuala sau cu diagnosticul de sanatate mintala pe care algoritmul l-a prezis pentru ei. Este ridicol sa argumenteze ca ceea ce oamenii de stiinta  fac  cu date este irelevant pentru o evaluare etica.

Deci ce facem?

Aceasta cercetare arata de ce este important sa trecem dincolo de ideea ca, de indata ce datele pot fi etichetate „publice”, toate obligatiile etice au fost indeplinite, iar cercetatorii pot face tot ce le place. Cand sugerez acest lucru altor cercetatori, ei raspund adesea cu frustrare. Vor sa faca ceea ce trebuie, dar vor si reguli si asteptari simple. In realitate, exista numerosi factori contextuali in joc atunci cand evaluati etica utilizarii datelor publice. Nu exista o formula matematica. Ca orice decizie etica, exista cateva cazuri clare de corect si de gresit, dar mai des granitele sunt confuze.

Atunci cand vine vorba de a lua cele mai etice decizii pe care le avem in lumina media, metodele si oportunitatile noastre in continua evolutie, este esential sa trecem dincolo de regulile simpliste si sa luam in considerare fiecare situatie individual si holistic. Cercetatorii nu pot pune intreaga povara asupra utilizatorilor; nu ne putem astepta ca acestia sa stie ca suntem acolo, urmarind si nici sa cerem sa anticipeze orice prejudiciu potential care le poate veni acum sau in viitor.

Daca sunteti un utilizator de socializare preocupat de utilizarea neasteptata a datelor dvs., sfatul meu este   sa nu inchideti toate conturile si sa traiti de frica invaziei de confidentialitate. Riscurile de daune sunt scazute pentru majoritatea oamenilor, iar majoritatea cercetatorilor sunt ganditi si fac deja lucruri pentru atenuarea acestui risc.

Mai mult decat atat, multe tipuri de cercetari stiintifice au potentialul de a face o multime de lucruri bune si, probabil, tweet-urile tale il pot ajuta! Acestea fiind spuse, este important sa retineti ca datele dvs. „publice” sunt cu adevarat disponibile publicului – toata lumea, de la marketeri pana la jurnalisti, o poate vedea, iar aparitia Tweet-ului dvs. intr-un articol de stiri are o abordare mult mai mare decat intr-o publicatie academica. Tweet la fel de mult cum iti doresti – dar si cum ar fi vizionat BuzzFeed.

In calitate de cercetatori, avem responsabilitatea sa recunoastem ca factori precum tipul de date, creatorul acestor date si utilizarea noastra intentionata pentru date sunt  importante  atunci cand este vorba de utilizarea informatiilor publice. Acesti factori trebuie sa informeze deciziile pe care le luam despre cum si cum sa colectam date si sa raportam constatarile. Sper ca munca pe care o facem si colaboratorii mei sa ajute la informarea celor mai bune practici, astfel incat, in final, sa putem continua sa contribuim la stiinta mare lumii, respectand, de asemenea, oamenii care isi impartasesc datele cu noi in fiecare zi.

Acest articol a fost publicat initial de Casey Fiesler pe „How We Get On The Next”. 

Cititi mai departe: De ce achizitiile corporative pot fi bune pentru comunitatea open source

Celebrati Pride 2020 alaturi de noi luna aceasta!

De ce este atat de importanta reprezentarea neobisnuita? Cum e sa fii trans-tech? Cum particip practic? Puteti gasi toata acoperirea noastra Pride 2020 aici.