Tarto ollâopâttuv maašinjurgâleijee keččâlâd meid suomâ-ugrilij kielâiguin – anarâškielâ jurgâlusâi tääsi mulsâšud

Tarto ollâopâttuv tiätuteknik institutist tuáimee TartuNLP-laboratorio lii njuhčâmáánust lasettâm maaŋgâid suomâ-ugrilijd kielâid Neurotõlge-nommâsii maašinjurgâleijeesis, fáárust meiddei anarâškielâ.

Neurotõlge fáálá jurgâlusâid ohtsis 29 kielâ kooskâ. Maašinjurgâleijest puáhtá táttuđ jurgâlusâid siämmáánáál eŋgâlâskielâst anarâškielân ko anarâškielâst maadâsämikielân-uv.

TartuNLP maašinjurgâleijee lii neuralohjelm, mii uáivild tom et, maašin kiäčud jurgâlemvuovijd já -njuolgâdusâid jieš. Iššeen tast láá stuorrâ tekstâamnâstuvah jieškote-uv kielâin. Ucceeb kielâin láá finniimist ucceeb tekstâamnâstuvah ko stuárráb kielâin, já nuuvtpa ucceeb kielâi jurgâlusâi tääsi sáttá mulsâšuddâđ korrâsávt-uv, muštâluvvoo Neurotõlge nettisiijđoin. Lisa Yankovskaja, luándulij kielâi prosessistem totkee Tarto ollâopâttuv tiätuteknik-institutist, muštâl EurekAlert uđđâsist, et maašinjurgâleijee taarbâš macâttâs já lase tekstâamnâstuvâid jurgâlusâi tääsi pyeredem várás.

Yankovskaja mield maašinjurgâleijeeh išedeh sehe kielâtáiđuttes totkeid addiđ ucceeblohokieláid čallum teevstâid, mut meid kielâsárnoid pyevtitmáin ucceeblohokielân čallum teevstâid.

Sämitige anarâškielâ jurgâleijee Tanja Kyrö pargoost maašinjurgâleijeeh iä lah tuáistáážân vala merhâšitteht tiettum. Jurgâlem tyejipiergâsin sust lii eenâb kiävtust ärbivuáválâš jurgâlemmušto. Kyrö arvâl, et maašinjurgâleijee kuittâg sátáččij jođálmittiđ jurgâleijee pargo já heiviiččij pyeremusávt ušom ”koške” äššiteevstâi pyevtitmân. Maašinjurgâleijee lyetittetteevuotâ piäjá suu liijká smiettâđ: Kiävhu-uv kielâ, máttá-uv maašinjurgâleijee valjiđ ain hiäivulumos sääni jieškođe-uv ohtâvuotân já puáhtá-uv ohjelm máttááttiđ tienuuvt, ete tot pyevtit idiomaatlii kielâ? Já tiäđust-uv: noheh-uv sust pargoh mašinij oovdâst?

”Mun keččâlim uánihávt Neurotõlge-ohjelm já jurgâlittim mottoom tiäđáttâsteevstâ, já lijjim kale ete Vau! Mut talle ko keččâlim párnáimainâs jurgâlem, te jiem innig lamaškin nuuvt moovtâ puátusist”, Kyrö pááhud.

Meiddei Taažâ arktisii ollâopâttuv Giellatekno-juávkku lii huksim maašinjurgâleijee, mii pasta jurgâliđ teevstâid tavesämikielâst anarâškielân. Taažâ arktisii ollâopâttuv professor Trond Trosterud mield kuávdáš iäru TartuNLP já Giellatekno maašinjurgâleijei kooskâ lii, et Giellatekno maašinjurgâleijee ij sorjo paldâlâs tekstâamnâstuvâin, pic kiävttá kielâlii analyys já ulmuu miäruštâllâm transfer-njuolgâdusâid jurgâlusâi pyevtitmist.

Trosterud čielgee, et paldâlâs tekstâamnâstuvâiguin škuávlejum jurgâlemohjelmeh pyevtitteh maŋgii uáli šiev celkkuid, mut celkkui siskáldâs ij veltihánnáá västid ain algâalgâlii teevstâ. Njuolgâdussáid vuáđuduvvee ohjelmijn vist pyevtittum celkkuin sättih leđe vááijuvvuođah, mut celkkuu siskáldâsân puáhtá lyettiđ pyerebeht, tondiet ko vááijuvvuođah láá čielgâsávt uáinimist. ”Paradoks lii, et táváliih ulmuuh kevttih neuralohjelmijd kielâ iberdem iššeen, veikkâ pyereeb vyehi ličij-uv kevttiđ teevstâi iberdem várás njuolgâdussáid vuáđuduvvee jurgâleijeid já neuralohjelmijd teevstâ pyevtittem várás”, Trosterud pááhud.

Käldeeh:

– Neurotõlge-maašinjurgâleijee

– Giellatekno tavesämikielâ-anarâškielâ maašinjurgâleijee

– The University of Tartu machine translation engine now supports 17 new Finno-Ugric languages (www.eurekalert.org)

Kove: Gerd Altmann (Pixabay)

Kommenteh

Čääli komment

Kirjoita kommenttisi!
Kirjoita nimesi tähän

Luuvâ meid

Uđđâsumos uđđâseh

23 viärjukenigâsvuođâlâžžâd láá lammâšum Avelist luhottesvuođâst

23 viärjukenigâsvuođâlâžžâd láá lammâšum Avelist luhottesvuođâst, ko telakyermiauto kománij räjijáágárkomppania hárjuttâllâmkuávlust. Kyevtis lává lammâšum viärráht. Suoi lává tolvum Ruávinjaargâ kuávdášpyecceiviäsun. 21 viärjukenigâsvuođâlâžžâd láá tolvum...

Fuji-väärist lii muáttám taan ive eskin skammâmáánust

Fuji-väärist Japanist lii taan täälvi muáttám vuossâmuu keerdi eskin skammâmáánust. Brittilii almosradiofinnoduv BBC mield Jaapaan áimutiettuu lágádâs Shizuoka toimâmčyegis uáinistij muottuu Fuji-vääri čohheest skammâmáánu...

Taan ive nommâ lii Šielâ

Šielâ lii väljejum ive 2024 nommân, tieđeet Helsig ollâopâttâh. Vyeittee jienâstui Nomâttâstutkâmuš peeivij (suom. Nimistöntutkimuksen päivät) ääigi skammâmáánu 8. peeivi. Ive nommâ lii tubdâstâspalhâšume...

Laapist lieggâsub oholoppâ ko kuássin ovdil skammâmáánu historjást

Moonnâm vástuppeeivi ehidispeeivi Njellimist mittedui 12,6 cekkid, mii lii uđđâ liegâsvuotâulâttâs Laapi kuávlust skammâmáánust. Jo iđedisiijâ mittedui paijeel 10 cekkid tave- já koskâ-Laapist, mii...

Suomâ sosialdemokraatlâš piäládâh lii ain-uv Suomâ stuárráámus piäládâh

Yle koijâdâllâm mield Suomâ sosialdemokraatlâš piäládâh juátká Suomâ stuárráámus piäládâhhân. Piäláduv kyedittem lii pajanâm, já tääl tot lii 24,3 %, mii lii 1,7 %...