Kutatási paraziták (és boszorkányok) márpedig nincsenek

Január óta furcsa vita borzolja a kedélyeket a klinikai teszteket végző kutatók körében. Ekkor jelent meg ugyanis az egyik legpatinásabb amerikai orvosi lapban, a New England Journal of Medicine-ben (NEJM) egy bizarr szerkesztőségi vélemény, amelyben a lap főszerkesztője, Jeffrey Brazen és helyettese, Dan Longo nagyon markánsan amellett törtek lándzsát, hogy a klinikai tesztek adatait a lehető legkésőbb kelljen csak kiadni, különben félő, hogy az eredeti kutatáshoz nem kapcsolódó kutatók (az ő megfogalmazásukban "kutatási paraziták") is fel fogják a munkájukban azokat használni, így végül a teszteket végző kutatók hoppon (pontosabban publikáció nélkül) maradnak.

Brazen és Longo parazitái tulajdonképpen azok a kutatók, akit a világ másik része adaelemzőként, adattudósként (aka. data scientist) ismer és többnyire tisztel. Tisztel, mivel a gyakran exponenciálisan növekvő adathalmazokból ma már egy külön szakma kihámozni a lényeget, kiszúrni az esetleges az összefüggéseket látszólag nem kapcsolódó részek között. Ennek megfelelően már az első reakciók sem voltak túl barátságosak. És nemcsak a kutatási adatok és eredmények nyílt hozzáféréséért kampányoló kutatók háborodtak fel, bár kétségkívül ők voltak a vitriolos válaszreakció leghangosabb szószólói.

Természetesen egyáltalán nem új jelenség, hogy egyes kutatók nem lelkesen osztják meg adataikat, vagy ferdén tekintenek másokra, ha azok az ők adataikat akarják értelmezni. Ennek egy része az emberi természet számlájára írható: sok kutató meg van arról győződve, hogy saját szűkebb területének ő a legjobb szakértője, épp ezért egója nehezen bírja, ha másik is bele akarják ütni oda az orrukat. Az egyik klasszikus történet szerint a DNS kristályszerkezetén dolgozó Rosalinda Franklin az egyik szemináriuma alkalmával gorombán reccsent rá a szomszédos laborban dolgozó (vele egyébként nem épp baráti viszonyban levő) Maurice Wilkins-re, aki a bemutatott adatok egy alternatív értelmezése mellett érvelt. "Hogy meri értelmezni az én adataimat?!?" - hangzott a kioktató számonkérés.

Erre rakódott rá az utóbbi években a hibás tudományos ösztönzőrendszerből (erről itt írtunk) származó paranoia, hogy valaki az általam fáradtságosan összegyűjtött adatokat gyorsabban/jobban elemzi, esetleg az én eredményeimet megcáfolja, s így keresztbetesz az én érvényesülésemnek. Ez így együtt tökéletes példája annak, hogy az egyéni szempontok felülírják a tulajdonképpen objektíven nézve egész biztosan magassabb rendű társadalmi szempontokat. A jelenség kétségtelenül része a kutatási mindennapoknak, ugyanakkor sokak szerint pont hogy nem bíztatni kellene az efajta attitűdöt, hanem minden lehetséges alkalmat megragadva visszaszorítani. (A paranoiát félretéve, mint arra Branzenék kritikusai rámutattak, ha megpróbáljuk végiggondolni, hogy milyen egyéb potenciális okból nem szeretné valaki az adatait megosztani, nem találunk igazából megalapozottat.)

A legtöbb kutatást, klinikai tesztet napjainkban közpénzből végzik, ahol többnyire a valódi rizikót a "kísérleti nyúlként" működő önkéntesek vállalják és a közjó szempontjából a legfontosabb, hogy a munka minél hamarabb eredményes legyen, kevésbé lényeges, hogy kinek a nevéhez fűződik a sikeres kutatás, vagy adatelemzés.

Nem is szólva arról, hogy az utóbbi évtizedek egyik legproblematikusabb trendje épp az volt, hogy számos kutatás csak szelektíven számolt be klinikai vizsgálatok eredményeiről, vagy esetleg, ha azok nem voltak pozitívak a tesztelt gyógyszer/eljárás szempontjából, teljesen el is hallgatták azokat. Ezek az etikailag igencsak megkérdőjelezhető döntések vezettek aztán oda, hogy orvosok fölösleges, vagy egyszerűen nem is megfelelő gyógyszereket írtak fel (hiszen a mellékhatásokról, problémákról nem is lehetett tudomásuk), emberi életeket veszélyeztetve. Épp ezért az elmúlt pár évben erős lobbizás indult be azért, hogy a klinikai teszteket előzőleg regisztrálni kelljen, és a lezárásuk után pár hónappal, bármilyen eredményre is jutottak, a betegek személyes adatainak megfelelő anonimizálása után nyilvánosságra kelljen hozni őket. Erről szól a brit ismeretterjesztés egyik prominens szereplője, Ben Goldacre által indított és egyre nagyobb támogatást kapó AllTrials kezdeményezés.

Pár hónapja ez a törekvés újabb támogatást kapott, amikor az orvosi újságok szerkesztőinek szövetsége (International Committee of Medical Journal Editors - ICMJE), amelynek paradox módon Drazen is tagja, egy olyan - egyébként szigorúnak nem nevezhető - ajánlást fogalmazott meg, aminek értelmében az első publikációt követő max. féléven belül a teljes adathalmazt elérhetővé kellene tenni.

Pont ez az ajánlás lett aztán a katalizátora, hogy az NEJM beleálljon korábbi álláspontjába és minden kritika ellenére augusztusban reiterálja azt, igaz picit finomítva, egy 33 országból származó, 282 kutató által aláírt levél formájában. Becsületükre legyen mondva, ekkor már több ellenvéleményt is publikáltak, például Elizabeth Warren szenátor publicisztikáját, de végső soron az üzenet egyértelmű volt: "az adatokat mi gyűjtöttük, azt csinálunk velük, amit jónak látunk".

Nem meglepő módon a kritika most sem maradt el. Sokak szerint a levél aláírói egyszerűen a status quo aránytalan hasznélvezői voltak és a privilégiumaikat féltik. De még a mérsékeltebb álláspontok is egyértelműen károsnak tartják az NEJM törekvését. Így például a Boston Globe kiadója által nemrég alapított, de pár hónap alatt az orvosbiológia egyik legfontosabb hírportáljává váló STATNews korábbi véleményére is rátett egy lapáttal.

Más kritikusok pedig pont a vita által generált publicitást meglovagolva alapítottak egy "Kutatási Parazita Díjat", a legeredményesebb másodlagos adatelemzést keresve ezzel.

Ha azonban távolabbra lépünk eggyel, nehéz nem észrevenni, hogy egy kicsit a preprint szerverek körüli felhajtásra emlékeztet a helyzet: az egész ötletben igazából nincs semmi forradalmi és az élettudományok résztvevői (már megint) olyasmin vitatkoznak, ami más tudományterületeken jó ideje adott.

Matematikusok, fizikusok, csillagászok számára, akárcsak egy preprint szerver, az adatok nyílt hozzáférhetősége és újraelemzése a tudomány természetes velejárója. A Hubble űrtávcső méréseire alapozó cikkek közel fele a korábbi adatsorok újraelemzésén alapul, a Kepler űrtávcső új, ún. "K2" missziójából származó adatainak nyílt elérhetősége pedig hihetetlenül nagy lehetőséget biztosított a kezdő kutatóknak (akik többnyire éltek is vele).


A fentiek alapján elég valószínűnek tűnik, hogy a NEJM szerkesztőinek (és szimpatizánsainak) elkeseredett utóvédharca kudarcra van ítélve és a klinikai adatok nyilvánosságra hozatala hamarosan teljesen bevett (és elvárt) norma lesz. Mint ahogy újraelemzésük, meta-analízisekben való felhasználásuk is, amelyből számos hasznos és fontos felfedezés születik majd.

Magyarán az adattudósok jövője miatt nincs miért aggódnunk.

(Köszönet Molnár Lászlónak a csillagászatos adatokért.)

További cikkeink
Uralkodj magadon!
Új kommentelési szabályok vannak 2016. január 21-től. Itt olvashatod el, hogy mik azok, és itt azt, hogy miért vezettük be őket.
;