SzavazásSzámít-e a szavad a könyvtárban?
KIT hírlevél évfolyamok2024
|
Bajban az AI-szektor: teljesen összezavarhatják az álinformációk a mesterséges intelligenciát
Címkék: innováció, szolgáltatásfejlesztés | mesterséges intelligencia | minőség, -irányítás, -fejlesztés |
Az AI világa a legértékesebb erőforrás kifogyásának küszöbén áll - ez a valódi adat. Ez a helyzet heves vitát generál az iparág vezetői között, mert egyesek szerint a szintetikus, lényegében "hamis" adatok alternatívát jelenthetnek, mások szerint ez nem megoldás - írja a Business Insider.
Az OpenAI és a Google évek óta az internetről származó adatokat használnak mesterséges intelligencia eszközeik és funkcióik alapjául szolgáló nagyméretű nyelvi modellek (LLM) betanításához. Ezek az LLM-ek az emberek által évszázadokon keresztül előállított szövegek, videók és egyéb online médiamegjelenések tömkelegét emésztették meg - legyen szó akár kutatási tanulmányokról, regényekről vagy YouTube-klipekről. Mostanra azonban a "valódi", ember által generált adatok kínálata kezd kifogyni. Az Epoch AI nevű kutatócég előrejelzése szerint a szöveges adatok 2028-ra elfogyhatnak. Eközben azok a vállalatok, amelyek az internet minden szegletéből kibányászták a felhasználható adatokat - és ennek érdekében néha megszegték a szabályzatukat -, egyre szigorúbb korlátozásokkal szembesülnek. Egy oxfordi és cambridge-i kutatócsoport által nemrégiben közzétett tanulmány felfedezte, hogy az AI által generált adatokkal táplált modell végül halandzsát produkált. Kutatók figyelmeztettek: a szintetikus adatok túlhasználata visszafordíthatatlan hibákat is okozhat, modellösszeomláshoz vezethet. Jathan Sadowski, a Monash Egyetem senior elemzője ezt a jelenséget Habsburg AI-nak nevezte el, utalva ezzel az osztrák dinasztiáról egyes történészek által terjesztett nézetre, hogy a belterjesség végül elpusztította őket. Az AI kedvezőtlen mutálódására utalt ezzel, ha túl sok AI-által generált szintetikus adatot használnak a fejlesztéshez. Kérdés azonban, hogy mi számít túl soknak. Egy áprilisi tanulmány eredményei szerint a saját generált adatokon edzett modellek nem feltétlenül omlanak össze, ha vegyesen kapnak valódi és szintetikus adatot. A hibrid adatbázisok jelenthetnek így megoldást. |
FeliratkozásA heti ingyenes KIT Hírlevelet megrendelheted a kit@gmconsulting.hu-ra írt "Megrendelés" tárgyú levéllel, név és intézmény megadásával, mellyel jelzed az Adatkezelési tájékoztatóban foglaltak elfogadását. A hírlevél lemondása: ugyanígy, de „Lemondás” tárgymegjelöléssel. KIT - hírcsokrok
Néhány tematikus gyűjtemény a lapból
HírlevélrőlA hírlevél hetente (júliusban, augusztusban kéthetente), térítésmentesen, csak elektronikus formában jelenik meg. A KIT nyomtatott példányai megtalálhatók a Könyvtörténeti és Könyvtártudományi Szakkönyvtárban is (Könyvtári Intézet, Budapest). A KIT tulajdonosa: GM Info Consulting Kft. |
impresszum | szerkesztők | észrevétel e portálról |