Zespół naukowców z University of Maryland oraz Microsoftu przeprowadził szeroko zakrojone badania nad skutecznością trenowania modeli sztucznej inteligencji w różnych językach. Wyniki okazały się zaskakujące – to właśnie język polski zapewnił najlepsze rezultaty, osiągając aż 88% skuteczności w testach analizy długiego kontekstu.
W eksperymencie badano zdolność AI do wyszukiwania konkretnych informacji w obszernych tekstach, syntezowania treści oraz unikania tzw. halucynacji, czyli tworzenia fałszywych odpowiedzi. Okazało się, że modele uczone w języku polskim radziły sobie z tym zadaniem lepiej niż te trenowane w najbardziej popularnych językach świata – angielskim czy chińskim.
Dla porównania, język angielski uplasował się dopiero na 6. miejscu spośród 26 badanych, z wynikiem 83,9%, a chiński – jednym z najczęściej używanych języków na świecie – był czwartym najgorszym, osiągając zaledwie 62,1% dokładności.
Co ciekawe, w pierwszej dziesiątce znalazły się głównie języki słowiańskie, romańskie i germańskie – te, które korzystają z alfabetu łacińskiego i mają dużą liczbę tekstów w internecie, zwłaszcza w Wikipedii. Badacze zauważyli również, że skuteczność modeli może różnić się nawet o 20% w zależności od języka. To wskazuje na ogromny wpływ struktury gramatycznej i dostępnych danych na zdolności AI.
Choć naukowcy nie sformułowali jednoznacznej przyczyny sukcesu polszczyzny, przypuszczają, że decydującą rolę mogła odegrać złożona, ale precyzyjna struktura języka polskiego, która ogranicza wieloznaczność i ułatwia modelom prawidłowe rozumienie kontekstu.
Polszczyzna, choć uznawana za jeden z trudniejszych języków świata, tym razem okazała się jej ogromną zaletą. Dzięki niej naukowcy mogą zyskać nową perspektywę w rozwijaniu technologii, która coraz mocniej wpływa na nasze codzienne życie – od tłumaczeń maszynowych, przez chatboty, aż po systemy wspierające edukację i medycynę.
Być może już wkrótce język polski stanie się jednym z filarów nowoczesnych technologii, które zmienią sposób, w jaki komunikujemy się ze światem i ze sztuczną inteligencją.
Źródło: next.gazeta.pl
