Keresés a KIT archivumában:  
Könyvtár Információ Társadalom
Heti hírlevél információs és könyvtári szakemberek számára - Szemlék, hírek, kommentárok    angol zászló english flag  

Hogyan készítsünk adatbázist eleve digitális dokumentumokból?

Az egyesült államokbeli Georgia Egyetem jogi szakkönyvtárának honlapja a Drupal webtartalom-kezelő rendszerrel működik, ennek frissítését 2020 őszére időzítették. Ezzel egyidejűleg a tartalmat is meg kívánták újítani, aminek keretében az egyetemhez kötődő öt különböző digitális képarchívum dokumentumait a könyvtár Digital Commons repozitóriumában tervezték összevonni.
Míg a digitalizált régi fényképek repozitóriumi archiválása már megoldott volt, az eleve digitálisan született (born-digital) képek (pl. rendezvényfotók) kezelése webes képgalériákban történt, melyekben 2001-től kezdve tároltak fényképeket. A gondot az jelentette, hogy az egyes galériákban más-más rendszert (Drupal, Flash, HTML) használtak, a képeket pedig eltérő formátumokban, eltérő metaadatokkal töltötték fel. A probléma orvoslása érdekében egy webfejlesztő, egy archiválással foglalkozó szakember és egy könyvtáros összefogott, és eldöntötték, hogy automatizált módon gyűjtik össze a képeket az egyes galériákból ún. szkriptek segítségével, majd kötegelt feldolgozással (batch processing) töltik be őket a repozitóriumba. A munka előkészítése, a részletek kidolgozása 2019 őszén kezdődött.
A képek adatait az egyetem öt különböző képgalériájából automatizált módon, PHP programnyelven írt szkriptek segítségével mentették le, első körben egy Excel táblázatba. Négy olyan metaadat volt, amellyel valamennyi galériában lévő kép rendelkezett, így minden kép esetében a következőket vették fel: a kép címe, publikálásának dátuma, képleírás és a kép eredeti URL-je. Annak érdekében, hogy megkönnyítsék a képek részletesebb metaadatokkal történő ellátását, igénybe vették a Google mesterséges intelligencián alapuló, ingyenes Vision API szolgáltatását, amely képes az arcok, tárgyak és szövegek automatikus felismerésére. A terv az volt, hogy az így kinyert információkat is metaadatként tárolják, ám végül ez nem bizonyult célravezetőnek. Ennek ellenére hasznosították a szolgáltatást, mert a képek fájlnevét több esetben sikerült a felismert szövegek alapján megadni (pl. voltak képek, ahol a hallgatók felmutatták a névtáblájukat, így az adott kép fájlnevébe a program a tanuló nevét is beillesztette). (Digitálisan keletkezett dokumentumok megőrzése: a fényképek archiválásának művészete szkriptek és kötegelt feldolgozás segítségével; ref.: Nagy A.)

legyenek kit hírei saját honlapján

Feliratkozás

A heti ingyenes KIT Hírlevelet megrendelheted a kit@gmconsulting.hu-ra írt "Megrendelés" tárgyú levéllel, név és intézmény megadásával, mellyel jelzed az Adatkezelési tájékoztatóban foglaltak elfogadását.

A hírlevél lemondása: ugyanígy, de „Lemondás” tárgymegjelöléssel.




Hírlevélről

A hírlevél hetente (júliusban, augusztusban kéthetente), térítésmentesen, csak elektronikus formában jelenik meg. A KIT nyomtatott példányai megtalálhatók a Könyvtörténeti és Könyvtártudományi Szakkönyvtárban is (Könyvtári Intézet, Budapest).

A KIT-archívum tartalma:
Közel 28.000 hír, 2002-től
A KIT-et az EPA (Elektronikus Periodika Adatbázis) is archiválja.

A megrendelők száma kb.:
700 fő

Olvasói létszám:
kb. 1000 fő

Adatvédelem
A KIT szerkesztői a birtokukba kerülő használói adatokat bizalmasan kezelik, azt csak az eredetileg megjelölt célra használják, harmadik fél részére nem adják át. A használati adatokat csak az egyedi adatközlőket (ha tudomásukra jut) nem visszafejthető módon, összegezve teszik közzé. Pl.: összes olvasói létszám, vagy felmérés eredményeképpen: a KIT-olvasók x%-a vezető beosztású. A használói felmérésekben a válaszadás anonim.
A szerkesztők a KIT-tel kapcsolatos visszajelzéseket egymás között megbeszélik, és visszajeleznek a levélírónak.
Adatkezelési tájékoztató

A KIT tulajdonosa:

GM Info Consulting Kft.
www.gmconsulting.hu


impresszum | szerkesztők | észrevétel e portálról