Keresés a KIT archivumában:  
Könyvtár Információ Társadalom
Heti hírlevél információs és könyvtári szakemberek számára - Szemlék, hírek, kommentárok    angol zászló english flag  

Bajban az AI-szektor: teljesen összezavarhatják az álinformációk a mesterséges intelligenciát

Az AI világa a legértékesebb erőforrás kifogyásának küszöbén áll - ez a valódi adat. Ez a helyzet heves vitát generál az iparág vezetői között, mert egyesek szerint a szintetikus, lényegében "hamis" adatok alternatívát jelenthetnek, mások szerint ez nem megoldás - írja a Business Insider.

Az OpenAI és a Google évek óta az internetről származó adatokat használnak mesterséges intelligencia eszközeik és funkcióik alapjául szolgáló nagyméretű nyelvi modellek (LLM) betanításához. Ezek az LLM-ek az emberek által évszázadokon keresztül előállított szövegek, videók és egyéb online médiamegjelenések tömkelegét emésztették meg - legyen szó akár kutatási tanulmányokról, regényekről vagy YouTube-klipekről. Mostanra azonban a "valódi", ember által generált adatok kínálata kezd kifogyni. Az Epoch AI nevű kutatócég előrejelzése szerint a szöveges adatok 2028-ra elfogyhatnak. Eközben azok a vállalatok, amelyek az internet minden szegletéből kibányászták a felhasználható adatokat - és ennek érdekében néha megszegték a szabályzatukat -, egyre szigorúbb korlátozásokkal szembesülnek.

Egy oxfordi és cambridge-i kutatócsoport által nemrégiben közzétett tanulmány felfedezte, hogy az AI által generált adatokkal táplált modell végül halandzsát produkált. Kutatók figyelmeztettek: a szintetikus adatok túlhasználata visszafordíthatatlan hibákat is okozhat, modellösszeomláshoz vezethet. Jathan Sadowski, a Monash Egyetem senior elemzője ezt a jelenséget Habsburg AI-nak nevezte el, utalva ezzel az osztrák dinasztiáról egyes történészek által terjesztett nézetre, hogy a belterjesség végül elpusztította őket. Az AI kedvezőtlen mutálódására utalt ezzel, ha túl sok AI-által generált szintetikus adatot használnak a fejlesztéshez. Kérdés azonban, hogy mi számít túl soknak. Egy áprilisi tanulmány eredményei szerint a saját generált adatokon edzett modellek nem feltétlenül omlanak össze, ha vegyesen kapnak valódi és szintetikus adatot. A hibrid adatbázisok jelenthetnek így megoldást.

legyenek kit hírei saját honlapján

Feliratkozás

A heti ingyenes KIT Hírlevelet megrendelheted a kit@gmconsulting.hu-ra írt "Megrendelés" tárgyú levéllel, név és intézmény megadásával, mellyel jelzed az Adatkezelési tájékoztatóban foglaltak elfogadását.

A hírlevél lemondása: ugyanígy, de „Lemondás” tárgymegjelöléssel.




Hírlevélről

A hírlevél hetente (júliusban, augusztusban kéthetente), térítésmentesen, csak elektronikus formában jelenik meg. A KIT nyomtatott példányai megtalálhatók a Könyvtörténeti és Könyvtártudományi Szakkönyvtárban is (Könyvtári Intézet, Budapest).

A KIT-archívum tartalma:
Közel 28.000 hír, 2002-től
A KIT-et az EPA (Elektronikus Periodika Adatbázis) is archiválja.

A megrendelők száma kb.:
700 fő

Olvasói létszám:
kb. 1000 fő

Adatvédelem
A KIT szerkesztői a birtokukba kerülő használói adatokat bizalmasan kezelik, azt csak az eredetileg megjelölt célra használják, harmadik fél részére nem adják át. A használati adatokat csak az egyedi adatközlőket (ha tudomásukra jut) nem visszafejthető módon, összegezve teszik közzé. Pl.: összes olvasói létszám, vagy felmérés eredményeképpen: a KIT-olvasók x%-a vezető beosztású. A használói felmérésekben a válaszadás anonim.
A szerkesztők a KIT-tel kapcsolatos visszajelzéseket egymás között megbeszélik, és visszajeleznek a levélírónak.
Adatkezelési tájékoztató

A KIT tulajdonosa:

GM Info Consulting Kft.
www.gmconsulting.hu


impresszum | szerkesztők | észrevétel e portálról