szerző:
Orosz Márta
Tetszett a cikk?

Nem érti, miért kap az e-mail fiókjába célzott reklámokat? Honnan tudja a feladó, hogy olaszországi nyaralást tervez vagy venne jóga-DVD-t? Miért pontosan akkor kap kedvező ajánlatot mobiltarifájára, amikor a szerződés felmondásán gondolkodik? És belegondolt abba, hogy kinek segít azzal, ha megosztja valamelyik közösségi oldalon, hogy ég a szomszéd háza?

A Google főtanácsadója, Hal Varian 2009-ben azt jósolta, a következő évtized legvonzóbb munkája a statisztikusé lesz. “Azt gondolják, viccelek, de gondolták volna, hogy a kilencvenes években mindenki IT-mérnök akar lenni?” – mondta a híres közgazdász. 

Variannak igaza lett: itt állunk a nap mint nap keletkező, befogadhatatlan mennyiségű adattal, ami egyszer csak óriási kinccsé válik, mihelyt valaki rendszerezni, értelmezni és használni tudja. 

Már a vécén is 

A 360° nevű startup egy osztrák higiéniai cikk gyártóval közösen azt próbálja kideríteni, mikor mennyi WC papírra, folyékony szappanra és papírtörlőre van szükség nyilvános vécéken. Ehhez a cég szenzorok segítségével adatokat gyűjt arról, hogy mikor milyen a kihasználtsága az illemhelyeknek.

Big Data: strukturált, nagy mennyiség
AFP / CQWB

Mindenféle aspektusban mérik a látogatottságot: figyelik az időszak (év, évszak, hétvége/hétköznap, napszak) szerinti forgalmat, az időjárási viszonyok szerinti látogatottságot, a helyszínek frekventáltságát és még egy sor dolgot. Az összegyűlt adatok gyors rendszerezésével és kiértékelésével lényegében naprakészen meg tudják mondani, hogy miképp érdemes gazdálkodni az erőforrásokkal: mikor, hova, mennyi vécépapír és egyéb felszerelés kell. 

Ennél a projektnél is az történik, mint bármely egyéb Big Data-felhasználásnál: különböző forrásokból származó nagy adatmennyiséget dolgoznak fel gyorsan vagy akár valós időben, aminek köszönhetően mérhető haszon keletkezik.

Big Data-forradalom

A technológiai fejlődésnek köszönhetően a feldolgozott adatmennyiségek manapság olyan nagyok is lehetnek, hogy terra-, peta- vagy exabájtokban mérik őket. (Egy terrabájt megfelel kb 1000 gigabájtnak, vagyis annyi adatnak, amennyit több mint 200 DVD-n tárolhatnánk.) Kihívást jelent az adatok rögzítése, tárolása, a köztük történő keresés, strukturálás és statisztikai elemzés. Jelenlegi ismeretek szerint annyi adatot termelünk, hogy az összadatmennyiség világszerte kétévente megduplázódik. Mindez a rendelkezésre álló elektronikus és digitális eszközöknek köszönhető, melyek használatával nyomokat hagyunk, legyen szó mobil- és okostelefon-, internet- vagy bankkártyahasználatról stb. 

Mivel ezeknek az adatmennyiségeknek önmagukban nincs értéke, egyre több üzleti modell épül arra, hogy kiaknázza belőlük a hasznosítható tartalmat: egyénekre, közösségekre, tetszőlegesen szegmentált ember- és termékcsoportokra vonatkozó felismeréseket. A legnagyobb probléma a Big Data-felhasználásokkal az adatok forrása: az emberek többsége egyelőre még nem figyel eléggé a személyes adatai védelmére, sok esetben pedig anélkül is ki vagyunk szolgáltatva az adatdetektoroknak, hogy a megfigyeléshez hozzájárultunk volna.

A készletoptimalizálástól a dinamikus árazásig 

A Big Data-alkalmazások ma számos startupnak jelenthetnek felemelkedési lehetőséget. A Blue Yonder karlsruhei cég például olyan nagy vállalatokkal dolgozik együtt, mint a dm drogérialánc, vagy az Otto online áruház. A dm-nél, például, Big Data-felhasználással tudják előre jelezni, mely napokon, mely órákban mekkora a forgalom az egyes boltokban, és ennek függvényében döntenek előre arról, mikor hány eladóra van szükség. Ez nemcsak a cégnek jelent megtakarítást és az erőforrások ésszerűbb beosztását, hanem a dolgozók is hosszabb távon tudják a munkaidőt a szabadnapokkal egyeztetni.

AFP / DPA

A vaskos árukatalógusai után megismert Otto online áruház is hasznot húz abból, hogy profiknak adta át a tevékenysége során összegyűlő adatok kezelését. Azóta egy-egy termék esetében akár 40 százalékkal pontosabban meg tudja mondani, hogy mekkora sikere lesz, és mennyit kell belőle legyártatni, illetve megrendelni. A Blue Yonder megoldása segítségével az időjárás vagy egy-egy nagyobb esemény kereslethatását (pl. foci-vb, vagy Oktoberfest) is meg tudja becsülni. Ezek a prognózisok lényegesen befolyásolják a készletgazdálkodást: például egy boltnak kevesebb olyan áruja marad meg, amit leárazva kell eladnia, és soha nem fogy ki olyanból, ami után folyamatos az érdeklődés. Fontos eszköze lett az adatelemzés az élelmiszerláncoknak, főleg abban, hogy miképp racionalizálják, csökkentsék a lejárt szavatossági idejű élelmiszerek mennyiségét. 

A Blue Yonder úgynevezett dinamikus árazással is foglalkozik. Segít abban, hogy egyre több termékhez és szolgáltatáshoz egyéni áron férhessünk hozzá, attól függően, hogy a rólunk vagy a környezetünkről összegyűjtött és kiértékelt adatok alapján melyik ügyfélkategóriába sorolódunk, és a megbízó ennek figyelembe vételével milyen csomaggal lep meg minket.

Társadalmilag hasznos

„Bizonyára észrevették már, hogy egyre kevesebb olyan reklámot találunk a postaládánkban, amit kidobunk. Egyszer csak a Big Datának köszönhetően elérkezik a pillanat, amikor a reklámok majdnem kivétel nélkül az egyéni preferenciáinknak megfelelően érkeznek” – mondja az MP3-szabadalomról ismert Fraunhofer Intézet Intelligens Analízis- és Információrendszerek részlegének szóvivője, Stefan Rüping, aki szerint a nagy adatmennyiségeket már régóta használják a fogyasztói csoportok minél hatékonyabb megállapítására.  

A Fraunhofer Intézet a jelenséget társadalmi szinten hasznos alkalmazásokra próbálja kihasználni. Például olyan szolgáltatáson dolgozik, mely főként a közösségi oldalakról nyert adatok alapján értesíti a rendőrséget vagy sürgősségi szolgálatokat esetleges vészhelyzetekről. Ha például valahol tűz üt ki, és ezt valaki a közösségi oldalon közli, a tervezett program segítségével gyorsan és nagyobb részletességgel lehet az eseményről az illetékeseket informálni.

Az idei árvíz a Fraunhofer Intézet egyik kutatójának a rokonait is érintette: Handrik Stange meglepetten állapította meg, hogy megfelelő kereséssel több információt tudott szerezni online arról, hogy milyen helyzetben vannak a rokonai, mint amit tőlük megtudott. A németek az árvíz idején mindvégig aktívan használták a közösségi oldalakat, a leggyorsabb segítőakciók gyakran Facebookon vagy Twitteren szerveződtek, és ezek az oldalak vették át a fő információforrások szerepét is. (Hasonlót lehetetett megfigyelni például március 15-én Magyarországon is, amikor a nagy hóesés- és hóátfúvások miatt az utakon ragadt nagyon sok autós – a szerk.

Segít a katasztrófák kezelésében

A katasztrófavédelem és intelligens információs rendszerek viszonyával foglalkozó Stange elmondta, legkésőbb a Sandy hurrikán óta léteznek működő internetes felületek (pl a Google Crisis Plan), de a németek érdekes módon nem ezt, hanem a Facebook és Twitter által a sokkal közvetlenebb módját választották az információk megosztásának. „A közösségi oldalakon rengeteg ellenőrizetlen adat van, egy összevisszaság mindenféle információkból, amit valamilyen módon használhatóvá kell tenni. Kínálja magát a lehetőség, hogy ezekből az adatmennyiségekből értékes felismeréseket nyerjünk” – magyarázta Stange a hvg.hu-nak. 

Árvíz Németországban
MTI / EPA / Armin Weigel

Mivel a különböző forrásokból érkező adatok bővebb és sokoldalúbb helyzetképet nyújtanak egy-egy történésről, nagy segítségére lehetnek azoknak a katasztrófamentőknek, akiknek a helyszínen kell minél hatékonyabban dolgozni. Ezek az ún. Reality Monitoring rendszerek segítenek abban, hogy egy árvíz esetén például a katasztrófavédelem emberei jobban tudják koordinálni a helyszíni munkát, fel tudják mérni döntéseik következményeit, például a szomszédos településre nézve, és hatékonyabban tudják bevonni a helyi civil lakosságot  a mentésbe.

Adatvédelmi aggályok sem állíthatják meg 

Sokféle terv létezik, a gyakorlati alkalmazást viszont gyakran  a megfelelően kidolgozott adatvédelmi jogi keretek hiánya akadályozza. Az adatvédelmi szempontokat kezdettől fogva be kell építeni ezekbe a programokba, különben az a veszély fenyeget, hogy a fejlesztők és a felhasználók is szürke zónába kerülnek jogilag. Ezt nemcsak állami intézmények, hanem cégek sem engedhetik meg maguknak. 

„Nagyon rontana egy-egy márka vagy vállalkozás arculatán, ha kiderülne, hogy visszaélnek az ügyfelek személyes adataival” – mondja a Blue Yonder cég szóvivője, ezért a közép- és nagyvállalatokkal együtt dolgozó cég anonimizált adatmennyiségeket kér az ügyfeleitől. Kérdés, hogy mennyire vehető készpénznek, ha egy cég a saját ügyfeleinek adatairól azt állítja, hogy anonimizáltak. 

„A Big Data akkor válik veszélyessé, ha az adatokból kiolvasható mintákból az egyének mégis azonosíthatóvá válnak” – mondja Johann-Christoph Freytag, a berlini Humboldt Egyetem professzora. – Az, hogy bizonyos fogyasztói kategóriákba sorolható leszek, válhat az előnyömre vagy hátrányomra is, fontos azonban, hogy az egyének visszakövetése nagy nehézségekbe ütközzön, vagy lehetetlenné váljon.”

"A rák ellen – a holnapért"

A Big Datára építő üzleti lehetőségek jelen pillanatban határtalannak tűnnek: „Bárki építhet erre vállalkozást, ha hozzáfér nagy adatmennyiségekhez, másrészt – és ez a legfontosabb – van működőképes ötlete arra, hogy az adathalmazokból milyen kérdésekre kapjunk választ. Ha a válaszokat valós időben is képes a rendszere feldolgozni, akkor annak komoly sikere lehet” – mondja Freytag professzor, aki nem tart a Big Data-jelenségtől. Szerinte érdemes változtatni azon a perspektíván, mely csak fenyegetést lát az egyre gyűlő adatmennyiségekben.

Freytag professzor diákjai egy olyan alkalmazáson dolgoznak, mely Twitter-bejegyzésekből következtetne küszöbön álló társadalmi és poltikai változásokra. Meggyőző példaként említi azokat az egészségügyi alkalmazásokat, melyek rákos betegek adatait dolgozzák fel. Köztudott, hogy a páciensek nem ugyanúgy reagálnak ugyanarra a kezelésre. Ha viszont a számtalan kórlapi adatból felismerhetők ismétlődések vagy minták, kiderülhet, hogy életkortól, nemtől, vagy más változóktól függően ugyanarra a diagnózis esetén mely kezelésre reagál a legjobban egy adott páciens. Erre mondta a berlini egyetem professzora „Szükségünk van a személyes adatokra ahhoz, hogy jobban előre tudjunk gondolkodni a társadalom érdekében.” 

Ha a cikket érdekesnek találta, látogasson el a hvg gazd Facebook-oldalra, és nyomjon rá egy "Tetszik"-et. Nem bánja meg!