Hoppá! Zuckerberg most valami igazán különlegeset alkotott: bemutatta a digitális Bábel-halat!
**MEGALKUVÁS NÉLKÜL!** A világ gyors ütemben átalakul, és a hírek áradatában könnyen elveszhetünk. Ám van valami, ami megmarad: az ügy, amelyet a Hetek közösen képvisel az olvasóival. A hit, a család és a nemzet iránti elköteleződés. Az előfizetésével most Ön is hozzájárulhat ehhez az értékes munkához: további információkért látogasson el a hetek.hu/elofizetes oldalra!
A munka lehetőséget teremt a gyors és univerzális fordítások elérésére, ráadásul a források nyilvánosan hozzáférhetővé válnak (nem kereskedelmi felhasználás céljából), ezzel támogatva a befogadó beszédfordítási technológiák kutatásának további fejlődését.
A sci-fi kedvelőinek bizonyára ismerős a Bábel-hal, amely a "Galaxis útikalauz stopposoknak" című regényben jelenik meg. Ez a fülbe illeszthető kis teremtmény valós időben képes fordítani két különböző nyelv között, így segítve a galaktikus kommunikációt és megértést.
Egy ilyen innovatív eszköz rendkívül hasznos lenne a globális kommunikáció egyszerűsítésében, különösen egy olyan világban, ahol a kapcsolatok egyre szorosabbá válnak. Jelenleg a legtöbb gépi tanuláson alapuló fordítórendszer a szöveg feldolgozására összpontosít, vagy több lépést igényel – mint például a beszédfelismerés, a szöveg lefordítása és végül a szöveg beszéddé alakítása.
Ezen kívül a jelenlegi beszéd-beszéd modellek nyelvi lefedettsége nem éri el a szöveg-szöveg modellek szintjét. Emellett hajlamosak arra, hogy a forrásnyelvről inkább angolra végezzenek fordítást, mintsem hogy egy másik nyelvről angolra dolgozzanak.
Ezeket a korlátokat figyelembe véve a Meta Seamless Communication Team egy innovatív, egységes modellt alkotott, amely lehetővé teszi a fordítást akár 101 különböző nyelv között, különféle módszerek alkalmazásával.
A SEAMLESSM4T névre keresztelt mesterséges intelligencia modell, amelyet 2023 végén mutattak be, mostanáig részletesebb információkat kapott. Jelenleg 36 különböző nyelv közötti oda-vissza fordításra van képes.
A beszédről beszédre történő fordítás során akár 23%-kal is pontosabb eredményeket érhetünk el, mint a jelenlegi rendszerek. Ez a mesterséges intelligencia modell képes kiszűrni a zavaró háttérzajokat, és rugalmasan alkalmazkodik a beszélő különböző stílusaihoz és akcentusaihoz.
A modellt a kutatók és fejlesztők szabadon hozzáférhetik és letölthetik a GitHub platformjáról.