Gyvename kalbos technologijų revoliucijos amžiuje, kai jos gali kurti rišlų tekstą, versti, spręsti sudėtingus uždavinius, su jomis net galime palaikyti pokalbį.
Vienas ryškiausių kalbos technologijų evoliucijos pasiekimų yra neuroniniais tinklais paremtas gilusis mašininis mokymasis, kurio pagrindu kuriami didieji kalbos modeliai, pavyzdžiui, 2022 m. pabaigoje „OpenAI“ kompanijos pristatytas „ChatGPT“ pokalbių robotas.
Technologijų evoliucija atneša naujų iššūkių kalbos industrijai, keičia kalbos ir kitų sričių tyrimų pobūdį ir metodologiją, net kai kurias profesijas.
Mokslininkams technologijos atveria naują tyrimų sritį
Dirbtinio intelekto (DI) tobulėjimas mokslininkams atveria duris, už kurių slepiasi menkai paliesta, tačiau itin aktuali kalbos technologijų tyrimų sritis. Kauno technologijos universiteto Socialinių, humanitarinių mokslų ir menų fakulteto (KTU SHMMF) kartu su Lietuvos švietimo istorijos muziejumi birželio 13-14 d. surengtoje konferencijoje „LTech 2024“ mokslininkai dalijosi atradimais apie kalbą ir jos iššūkius dirbtinio intelekto amžiuje.
Valstybinės lietuvių kalbos komisijos (iš Lietuvių kalbos prestižo stiprinimo programos lėšų) remiamoje konferencijoje kalbos ekspertai, tarp kurių ir žinomi mokslininkai bei profesoriai, dalijosi tyrimų rezultatais, metodologinėmis įžvalgomis ir patirtimi apie sparčiai besiplečiančią kalbos industriją bei dirbtinio intelekto pritaikymo galimybes.
Dirbtinio intelekto įtaka kalbai
Skaitmeninėje erdvėje dominuoja tos kalbos, kuriomis ekonomiškai stipriose valstybėse kalba dauguma žmonių, todėl kalbos technologijų tobulėjimas yra susijęs su kalbos standartizacijos klausimais, ypač kalbant apie pliuricentrines kalbas.
Freiburgo universiteto (Vokietija) profesoriaus dr. Christian Mair atlikto tyrimo metu paaiškėjo, kad mažiau dominuojantiems pliuricentrinių kalbų standartams (pavyzdžiui, britų anglų kalbos) tenka mažiau dėmesio kuriant didžiuosius kalbos modelius, o generatyvinio dirbtinio intelekto tekstuose taikomi labiau paplitę kalbos variantai.
Įdomu tai, kad pati kalba taip pat daro savotišką įtaką dirbtinio intelekto įrankiams. Pasitelkiant tam tikros struktūros ir turinio pasakojimo formos tekstus, vadinamus dirbtinio intelekto „užkalbėjimais“ (angl. jailbreaks), galima apeiti didžiųjų kalbos modelių draudžiamo turinio apribojimus.