SzavazásA külföldi könyvtári tapasztalatok, jógyakorlatok...
KIT hírlevél évfolyamok2024
|
Bárkit képes utánozni a Microsoft szövegfelolvasó MI-je
Címkék: innováció, szolgáltatásfejlesztés | mesterséges intelligencia | informatikai fejlesztés, automatizálás |
Mindössze három másodperces minta alapján képes emberszerű beszédet generálni a redmondiak új megoldása, ráadásul a szintetizált hangfelvétel nemcsak a beszélő sajátos tónusait tartja meg, de az akusztikát is mímeli.
A Microsoft kutatói bejelentették a VALL-E szövegfelolvasó MI-modellt, ami egy mindössze három másodperces hangminta alapján képes valós személy hangját szimulálni. Így a beszélő jellegzetes tónusait megtartva bármilyen szöveges hanganyagot előállít, mintha adott személy beszéde lenne hallható. Készítői fejlett szövegfelolvasó- és szerkesztő alkalmazásként képzelik el használatát, akár olyan más generatív MI-modellekkel kombinálva, mint a szöveget generáló GPT-3. A redmondi cég a VALL-E-ra neurális nyelvi modellként hivatkozik, ami a Meta által tavaly bejelentett EnCodec nevű tömörítési neurális hálózaton alapul. Más, a hullámformák manipulálásával dolgozó szövegfelolvasó eljárásokkal ellenben a Microsoft megoldása audiokodek kódokat alkot a megadott szövegből és a minta akusztikus jeleiből. |
FeliratkozásA heti ingyenes KIT Hírlevelet megrendelheted a kit@gmconsulting.hu-ra írt "Megrendelés" tárgyú levéllel, név és intézmény megadásával, mellyel jelzed az Adatkezelési tájékoztatóban foglaltak elfogadását. A hírlevél lemondása: ugyanígy, de „Lemondás” tárgymegjelöléssel. KIT - hírcsokrok
Néhány tematikus gyűjtemény a lapból
HírlevélrőlA hírlevél hetente (júliusban, augusztusban kéthetente), térítésmentesen, csak elektronikus formában jelenik meg. A KIT nyomtatott példányai megtalálhatók a Könyvtörténeti és Könyvtártudományi Szakkönyvtárban is (Könyvtári Intézet, Budapest). A KIT tulajdonosa: GM Info Consulting Kft. |
impresszum | szerkesztők | észrevétel e portálról |