Bátorfy Attila
10 kérdés az adatújságírásról, amit nem mertél megkérdezni

A Facebookon elindult a napi többszöri frissítésű Databánya blogunk, amely az adatújságírással, adatvizualizációval, tágabb értelemben pedig az újságírás digitális környezetváltozásával foglalkozik. Biztos számos kérdés felmerül ilyenkor, gyorsan meg is válaszoljuk őket, mielőtt valaki feltenné nekünk. Kátéban megírt nagyesszé következik.

Mi a fene az az adatújságírás?

Hiába vár bárki is szabatos definíciót, sehol nem fog ilyet találni. Mondhatjuk rá, hogy a válasz benne van a fogalomban, vagyis olyan újságírás, amely adatokkal dolgozik, de ez nem valami izgalmas és ennél jóval többről van szó. Találkozhatunk olyan kellemetlen hangzású és pozitivista megfejtéssel, amit egy konferencián hallottunk, miszerint „az adatújságírás a világunk megismerésére tett legprecízebb újságírói kísérlet.” Vagy olyan szellemeskedéssel is, mint Andy Holovaty chicagói újságíró-webfejlesztő adatújságírói körben kultikussá vált válasza: „Kit érdekel? De remélem, a versenytársaim a lehető legtöbb időt töltik el a kérdés megválaszolásával.” Simon Rogers, a Guardian Data rovatvezetője szerint viszont nem ez a lényeges kérdés, hanem a gyakorlat, vagyis, hogy „hogyan lehet adatújságírást csinálni?” Azért vannak olyanok, akik nem akarják sem megkerülni a kérdést, sem pedig eljópofáskodni. A Data Journalism Handbookban például Paul Bradshaw, a Birminghami Egyetem professzora ezt írja:

„Sok ember azt gondolja, hogy az „adat” számok gyűjteménye, többnyire egy táblázatban rögzítve. Húsz évvel ezelőtt valóban ennyi volt csak az újságíró kezében. De a digitális világban bármit le lehet írni számokkal: nullákkal és egyesekkel. Képek, videók, hangok, gyilkosságok, szavazatok, betegségek, korrupció és hazugság: mind nullák és egyesek. Mi teszi tehát az adatújságírást mássá? Talán az, hogy új lehetőségek nyílnak meg akkor, ha a hagyományos hírérzékenységünket és történetmesélési képességeinket kombináljuk a lehető legtöbb és legváltozatosabb digitális információval, ami csak elérhető.”

Vagyis bármi lehet adat, bármit adattá lehet alakítani. A kormányzat által megkötött szerződéseket éppúgy, mint az Instagramra feltöltött képeket, vagy egy miniszter zakóinak számát és árát. Az újságíró feladata ezeket az adatokat megszerezni, begyűjteni, rendszerezni, majd egy sztorit kiegészíteni velük, vagy magukból az adatokból a saját eszközeivel készíteni egy tartalmat. Szándékosan nem használjuk azt, hogy „írni”, mert az adatújságírás látványos outputja valamilyen vizuális tartalom is: statikus vagy dinamikus grafikon, infografika, térkép, kapcsolati háló, multimédiás tartalom. De természetesen lehet szöveg is.

Ilyen eddig is volt. Térképekkel találkoztam az iskolában, grafikonokkal az Indexen. Mi ebben az új?

Valóban nem új. William Playfair közgazdász már 1801-ben feltalálta a statisztikai adatok vizualizációjának két archetípusát, az oszlop- és a kördiagramot, Florence Nigthingale nővér, orvos, reformer és statisztikus pedig 1858-ban grafikonokkal győzte meg az angol parlamentet arról, hogy az angol katonáknak sokkal jobb egészségügyi ellátásra van szükségük. Willard Cope Brinton már 1914-ben kifejezetten a nagyközönség és az újságírók számára írta meg a Graphic Methods of Presenting Facts című könyvét, az adatújságírók közössége viszont az információdizájn atyjának tartott Edward Tufte statisztikus 1983-as Visual Display of Quantitative Information című könyvét tartja kulcsműnek. Számítógépeket egyébként az 1960-as évektől használnak újságírók bonyolult statisztikai számítások elvégzésére, főképp a gazdasági rovatok újságírói. És persze a hazai média is készített korábban is grafikonokat, térképeket, de még infografikákat is. Egyébként ha valakit érdekelne az adatvizualizáció története, az kattintson ide. Ami viszont ránk vonatkozik. A jelentős váltás elsősorban a digitális környezet átalakulásának köszönhető. Egyre több és nagyobb mennyiségű, és egyre jobb minőségű digitális adat áll rendelkezésünkre nem csupán klasszikus gazdasági-közéleti témákban, hanem bármilyen területről. Ezzel párhuzamosan egyre több ingyenes online vagy desktop eszköz közül válogathatnak az újságírók, hogy ezeket az adatokat értelmesen és szépen prezentálják. Arról nem is beszélve, hogy a digitális környezet fejlődése tette lehetővé, hogy az adatújságírás túllépjen a hagyományos kördiagram,oszlopdiagram, vonal-szentháromságon, és korábban soha nem látott, összetett, mégis értelmes, új irányokat kísérletezzen ki. Az újdonság tehát a képzelőerőben, a szabadon engedhető kreativitásban van, valamint abban, hogy bárki képes ezeket megcsinálni.

Ha jól értem, megint valami idegesítő divatról van szó?

Bizonyos fokig valóban divatos, és igen, vannak irritáló hittérítői is, de nemzetközi szinten már nem hype, hanem az újságírás szerves része. Lásd fent, adatokkal az újságírók az újságírás megléte óta foglalkoznak, viszont számos oka van annak, hogy az online média az utóbbi öt-tíz évben kapott rá vehemensen. Ezek közül a legfontosabb az, hogy a digitális környezet csak a szöveg, statikus kép és videó befogadására volt alkalmas. Nem véletlen, hogy a legjobb adatalapú médiatartalmak előállításához még ma is érteni kell a kódoláshoz, de egyre kevésbé, mivel az újságírók eszközellátására komplett iparág épült. A Silk gyűjtése szerint jelenleg 150 újságírók számára készült fejlesztés van, melyek jelentős többsége ingyenes, vagy a mindennapos újságírói felhasználásért nem kell fizetni. Emellett az adatújságírásnak időközben lettek fontos központjai (a Guardian 2009-ben indította el a világ első adatrovatát), szaktekintélyei (Simon Rogers, Alberto Cairo, Scott Murray, David McCandless), nemzetközi sztárjai (Nicholás Kayser-Brill és a Journalism++ csapata, Matthew Daniels, a Periscopic-csoport, Daniele Grasso) és saját díjai, például a globálisan legnagyobb, és óriási körítéssel felvert Data Journalism Awards Párizsban, vagy az Information is Beautiful Awards, amit Londonban adnak át. De ha szigorúan a komoly újságírásnál tartunk, nincs olyan fontos nemzetközi oknyomozó újságíródíj, amelyet az utóbbi években ne nyert volna el valamilyen adatalapú újságíróprojekt. Az European Press Prize díjazottjai közül három is ilyen volt tavaly

Várjunk csak! Akkor a legjobb anyagokhoz elkészítéséhez tudni kell programozni? Én újságíró vagyok, nem programozó!

Inkább azt lehet mondani, hogy a tapasztalat szerint a legütősebb, leglátványosabb anyagok mögött rendre van valamilyen programozói tudás is. A már említett Matthew Daniels szerint a New York Times vagy a Bloomberg legjobb anyagai 99 százalékban kódokból állnak, ezeket az anyagokat pedig nem "újságírók" készítik, hanem "mérnökök". Ez azért van így, mert az újságíróknak készített szoftverek egyelőre nem nyújtanak olyan fokú szabadságot és kreatív inputot, hogy bármit meg lehessen velük csinálni. De nem csak a vizualizációhoz lehet szükségünk kódírásra, hanem az adatok begyűjtéséhez és rendszerezéséhez is. Például a Közbeszerzési Értesítő kódalapú adatbázisát csak egy scraper (leszívó)-programmal lehet Excelbe-gyűjteni, ami alapján majd el lehet kezdeni dolgozni. Viszont számos szabadon hozzáférhető, nyílt adatbázis van, amelyet ugyan a vizualizáció szempontjából át kell alakítani, viszont nem kell hozzá programozói tudás, ahogy a szoftverek megtanulása sem jelenthet gondot. Ha a jelen sorok írójának, aki korábban soha nem csinált ilyet, fél órájába telt egy PDF-adatbázisból Excelt készítenie, azt rendbe tennie és kitisztítania, a benne szereplő utcaneveket geokódokká alakítania, majd ezek után mozgó térképeket készítenie két különböző szoftverrel, úgy, hogy értelmes médiatartalom született belőle, akkor bárki képes rá. Bizonyos logikákat nem árt ismerni, de a gyakorlattal egyre több mindenre lesz képes az ember. Plusz a Google segít.

Oké, ha ez ekkora valami, és egyszerre ilyen könnyű, akkor itthon miért nem találkoztam vele még?

Ha a tényleg éppen világsztár státuszban lévő Matthew Daniels az amerikai médiavállalatok konzervativizmusán bosszankodik, akkor mit mondhatunk itthon? A hazai médiacégek az innovációt általában kipipálják azzal, hogy készítenek egy új honlapot a hírszájtnak. Ezen kívül a magyar tartalomipar elsősorban szövegalapú, ma is tudunk olyan online szerkesztőségről, ahol az online tartalmat 8000 karakter fölött nevezik cikknek. Továbbá a magyar online médiacégek lényegében a nyomtatott sajtó és a televízió eszköztárával dolgoznak 2015-ben is. Egy alapvetően nyomtatott sajtóból vagy tévés tartalomból élő kiadó nehezen fogja fel, hogy az interaktív grafikont értelmetlen kinyomtatni, tévében meg nem lehet jól bemutatni. Azt se felejtsük el, hogy nehéz egy főszerkesztőt vagy egy pénzügyi igazgatót meggyőzni arról, hogy szüksége van egy olyan speciális tudású újságíróra, akinek a munkáját nehéz darabra mérni. A hagyományos értelemben valóban nem tartalomgyárosról van szó, nem lehet a nyúzrúmba beültetni (vagy be lehet, de akkor minek vették fel?), ellenben kiszolgálja használható adatokkal és interaktív grafikonokkal a szerkesztőséget, illetve maga is előállít tartalmakat.

A médiacégek itthon ezt nem tudják beárazni, nem tudják, mennyit ér egy ilyen munkaerő. Az is probléma, hogy az ilyesmire fogékony újságírók önképzését vagy továbbképzését a médiacégek nem is támogatják itthon, pedig egyre több – akár ingyenes – alapfokú Excel-, scraping- vagy Tableau-tanfolyam van itthon is, rendre nagyon kevés érdeklődővel. De rengeteg ingyen online kurzus, tutorial videó, how-to-do cikk van már a neten, szóval elméletben nem pénzkérdés a tudás elsajátítása.

A nemzetközi gyakorlat két utat mutat. A Guardiannél, a New York Timesnál, a Washington Postnál, a Süddeutsche Zeitungnál, a Bloombergnél, a spanyol El Confidentialnál, az argentin La Naciónnál vagy a svájci közszolgálati rádiónál (SRF) önálló részlegként dolgozik az adatújságíró- és vizualizációs csapat, de találkoztunk már szerkesztőségben ülő szlovén, román, szlovák, lengyel, bolgár és észt adatújságíróval is – hogy ne csak a nyugat-európai médiapiacról beszéljünk. Rajtuk kívül vannak szabadúszók is, akik különböző kisebb, vagy egészen monumentális projektekben vesznek részt. Ők megbízásos alapon dolgoznak a legnagyobb lapoknak, sok esetben hónapokig. Ez utóbbi típusú munkavégzés szintén teljesen idegen a magyar médiapiactól. Viszont vannak és voltak hazai próbálkozások is. A Vs.hu Mega-rovatában, az Index Chart-rovatában vagy az Átlátszó néhány cikkében, esetleg a 444-nél jó példákat találhatunk. Nemzetközi színvonalú adatvizualizációs munkákat készít Szűcs Krisztina, a CEU Data Stories is kifejezetten az adatvizualizációra specializálódott közösség, az Átlátszó Adatújságírás blogja régóta létezik, illetve érdemes még a Datapussyz csajokat is követni. De nagyon ritkán látni olyat itthon, amely kilépne a chartok világából.

Na jó, de az adatújságírás többnyire mégiscsak grafikonokból áll. Miért kell többnek mutatni, mint ami valójában?

Sokan gondolják azt, hogy az adatújságírás egyenlő a grafikonkészítéssel. Az adatújságírás sokkal inkább egy rendszerszintű gondolkodás, amelynek éppúgy része az adatok szisztematikus gyűjtése és katalogizálása, mint azok témától függő felhasználása. Egyáltalán nincs előírva, hogy adatokat vizualizálni kell. Mindig meg kell találni a módját, hogy az adatainkat a legmegfelelőbb módon használjuk fel, akár úgy is, hogy senkinek ne is jusson eszébe, hogy adatok állnak a médiatartalom mögött. Tipikusan ilyen egy online interaktív térkép, amit böngészve ritkán jut eszünkbe, hogy egy sima Excel-tábla hajtja a háttérben.

Ha már adatokról van szó! Ismert a mondás, hogy csak annak a statisztikának hiszek, amit én állítottam elő. Erre mit léptek?

Nagyon fontos kérdés és talán a legfontosabb kritikai elem is. Adatokkal foglalkozó újságíróként ugyanúgy kell eljárni, mint minden más forrásnál. Az adatokat különböző módszertannal emberek és gépek gyűjtik, emberek és gépek állítanak össze belőlük adatbázisokat és soha nem zárható ki a hiba. Nem kell rossz szándékúan meghamisítani mondjuk a Közbeszerzési Értesítő adatait ahhoz, hogy egy adatrögzítő ne üthessen félre egy cégnevet vagy egy összeget. Ugyanakkor egyre fenyegetőbb, hogy az államok vagy államok felett álló szervezetek előszeretettel hamisítanak utólag statisztikákat, eredményeket – még akkor is, ha digitálisan ennek nyoma marad. A lényeg, hogy minden egyes adatbázisnál mérlegelni kell, hogy a forrásnak érdekében állt-e hamisítani az adatokat és ha igen, akkor milyen mértékben? Szintén érdemes odafigyelni, hogy ugyanarra az adattípusra több forrás is van, így ezeket érdemes összemérni, összehasonlítani. A kormányzatok ugyanis az elbizonytalanítás miatt szívesen készítenek ellenadatbázisokat, vagy próbálnak államosítani korábban piaci cégek által gyűjtött adatokat. Ez Magyarországon éppúgy ismerős lehet, mint Nyugat-Európában. Vagyis téved, aki azt hiszi, hogy az adat tévedhetetlenné teszi őt. Ahogy az is téved, aki azt gondolja, hogy ezeknek a skilleknek a birtokában ő jobb újságíró, mint a hagyományos eszközökkel dolgozók.

Oké, tételezzük fel, hogy rendben vannak az adatok. Mindnyájan tudjuk, hogy ugyanabból az adatbázisból több, akár egymásnak ellentmondó következtetésre is lehet jutni.

Ezzel sem lehet vitába szállni. Az újságírók ugyanúgy képesek az adatokból a saját prekoncepcióik alapján szelektálni, mint a politikusok vagy a tudósok. A kritika élét az újságíró csak úgy veheti el, ha a teljes munkáját transzparenssé, a saját maga által feldolgozott (vagyis nem csak a forrást!) adatait ellenőrizhetővé, letölthetővé teszi – már amennyiben erre módja van. Ezeknek nyilván korrupciós, közéleti vagy gazdasági esetekben van különösen nagy jelentősége. Tény, hogy jelenleg ez az eljárás inkább ritka. A lényeg, hogy önmagában attól, hogy valami adatokat és grafikonokat tartalmaz, még nem lesz hiteles vagy igaz. Már az is óriási csalásnak számít jobb körökben, ha szándékosan elnyújtják a grafikon skáláját, hogy egy apró különbség is bazinagynak tűnjön, ahogy az azóta már megszűnt Dr. Tény nevű szájt rendszeresen tette. Ha egy újságíró tisztességes, akkor ezekre mind odafigyel. Ha nem, az nagyon hamar kiderül.

Fent volt róla szó, hogy a magyar online média köszöni, de el van így is. A közönség részéről sincsen nagy igény erre, akkor meg minek?

Az adatújságírás egyfelől soha nem fogja leváltani a hagyományos újságírást, másfelől nem feltétlenül többet, hanem csak mást nyújt. Hovatovább számos oknyomozó vagy gazdasági újságíró jelenleg is adatok alapján dolgozik, de ezekből végeláthatatlan szöveghalmazt alkot. Hányszor volt már olyan, hogy egy cikkben a tízedik céget olvastuk, de már a harmadiknál nem tudtuk, hogy ki annak a tulajdonosa és mi köze van a gyanús alakhoz? Nem éreztük-e már úgy, hogy a területalapú földtámogatásokról szóló cikkből egyszerűen hiányzik egy grafikon vagy egy térkép? Nem volt-e hiányérzetünk, hogy amikor a menekültkérdés során számokkal dobálózik mindegyik fél, akkor jó lenne mihez mérni a hazai számokat? Az adatújságírás eszközei egyfelől hosszú szövegeket válthatnak ki, másfelől szövegeket illusztrálhatnak, szemléltethetnek. Ha jól vannak megcsinálva, akkor a közönség számára is szórakozást nyújthatnak, hiszen maguk kattinthatják, kereshetik, szűrhetik a vizualizációt. Vagyis jelentősen megdobhatják a médiatartalmak felhasználói élményét is, az olvasó több és értékesebb időt tölthet el egy-egy cikkel vagy tartalommal - már ha akar persze. Az adatújságírással ráadásul jelentősen kibővülhet egy hírszájt vizuális kínálata. Az emberek előszeretettel osztják meg a jól tálalt vizuális tartalmakat, magunk is könnyebben kattintunk a Facebookon vagy bárhol egy olyan anyagra, amelynek a nyitóképe önmagában szép vagy izgalmas.  

Oké. Mennyi esély van arra, hogy itthon is egyre több szerkesztőségben legyen ilyen?

Nézzük meg előbb a Poynter 2014-ben publikált kutatását az amerikai újságírók jövőben elvárható tudásáról. A Poynter 2900 újságírással foglalkozó szakembert és diákot kérdezett meg arról, hogy milyen skillekkel kell rendelkeznie a jövőben egy újságírónak, például tudnia kell-e fényképezőgépet használni, adatokat kezelni, kódolni, infografikákat készítenie, de még az is a kérdések között szerepelt, hogy ismernie kell-e az újságírónak a médiapiac működését és üzleti hátterét. Az amerikai médiapiacon menedzserként és szenior állású újságíróként dolgozó megkérdezettek - nem meglepő módon - jóval konzervatívabb válaszokat adtak a szabadúszóként, oktatóként dolgozóknál, vagy az újságírószakos egyetemi hallgatóknál. A válaszok alapján annyi látható, hogy akik a rendszeren belül dolgoznak, azoknak ezek a tudások nem, vagy kevésbé fontosak, mint a rendszeren kívülieknek. Miközben az újságírás hagyományos értékeit, mint a pontosság, a kíváncsiság, íráskészség, kérdezőképesség, mindegyik fél ugyanolyan fontosnak tartotta. Mindezek az eredmények egy olyan piacon születtek meg, amely nemcsak az adatújságírás, hanem általában a digitális média területén úttörő, innovatív és kockázatvállaló.

Ehhez mérve nyilván nem az adatújságírás és adatvizualizáció hiánya a magyar média legnagyobb baja. Az, hogy ebből szinte semmit nem érzékel vagy vesz át a hazai médiapiac, csupán egy jóval komolyabb problémakörnek a része. A magyar médiacégek számára az online média a nyomtatott sajtó és a televízió digitális kiterjesztése, éppen ezért még a legátgondoltabb fejlesztéseknek is addig merészkednek, hogy a szöveg jól olvasható legyen, a kép nagy legyen, a beágyazott videó pedig elinduljon. A legtöbb hazai online fejlesztés tényleg megáll ott, hogy ráncfelvarráson kell átesnie a szájtnak, mert már nem elég divatos, miközben a szerkesztőségi rendszer és a szájtot kiszolgáló vas ugyanolyan régi marad, vagy nem párhuzamosan követik az újságírói igényeket a dizájn frissességével. A fejlesztések ritkán folyamatosak, leginkább ötlet- és projektszerűek, továbbá nincsen mögöttük hosszú távú stratégiai gondolkodás sem. Még így is beilleszthető lenne a szerkesztőségekbe az adatújságírás, de a médiacégek digitális háttere nem ideális, mivel nem is biztos, hogy a korszerű szoftvereket zökkenőmentesen elbírnák.

Jelentősnek tűnik a hazai online újságírás elhírlapírósodása is, még a fiatal tehetségek számára is a közírói státusz elérése a legfontosabb cél. Szintén probléma, hogy itthon nemhogy adatújságírást, de újságírást sem lehet tanulni egyetemi környezetben, nincsen külön újságírásnak dedikált egyetemi szak. Vannak ötletszerű kurzusok és apróbb, egy délelőttös tanfolyamok. Az alaptudást viszont a szerkesztőségeknek leginkább saját erőből kellene munka közben kitapasztalniuk. A hazai szerkesztőségi környezetbe viszont már nem férnek be kóderek, programozók, dizájnerek sem, mert a sales-re kinevezett újságírókkal szemben nem hoznak azonnal pénzt. Persze mindezt lehetne párhuzamosan is csinálni, de ehhez türelem, bizalom és bátorság kell. Az interneten minden fent van hozzá ingyen.