1 C
Grindavik
28. nóvember, 2020

34 verkefni á fyrsta ári máltækniáætlunar

Skyldulesning

Lilja Dögg Alfreðsdóttir mennta- og menningarmálaráðherra.

Lilja Dögg Alfreðsdóttir mennta- og menningarmálaráðherra.

mbl.is/Kristinn Magnússon

Fyrsta verkefnisári máltækniáætlunar, sem menntamálráðuneytið hleypti af stokkunum, er nú lokið. Áætlunin er til fimm ára og er markmið hennar að smíða innviði í máltækni fyrir íslensku.

„Okkur er sem þjóð umhugað um að íslenskan þróist og dafni á sem flestum sviðum, ekki síst í auknum samskiptum okkar við tölvur og tæki. Það er spennandi að fylgjast með framvindu máltækniáætlunarinnar en með henni leggja stjórnvöld áherslu á uppbyggingu innviða, nýsköpun og virkt samstarf þvert á stofnanir og fyrirtæki. Nýjar tæknilausnir munu hjálpa okkur að tryggja stafræna framtíð móðurmálsins,“ segir Lilja Alfreðsdóttir, mennta- og menningarmálaráðherra, í fréttatilkynningu.

Haustið 2019 gerðu Almannarómur, miðstöð um máltækni, og rannsóknarhópurinn Samstarf um íslenska máltækni (SÍM) samning til eins árs um smíði innviða í máltækni fyrir íslensku. Að SÍM standa níu lögaðilar þ.e. rannsakendur úr háskólasamfélaginu, opinberar stofnanir og frumkvöðlar úr atvinnulífinu.

Jóhanna Vigdís Guðmundsdóttir, framkvæmdastjóri Almannaróms.

Jóhanna Vigdís Guðmundsdóttir, framkvæmdastjóri Almannaróms.

mbl.is/Hari

Megináhersla á gagnasöfn

Á fyrsta ári máltækniáætlunar var unnið að 34 verkefnum: „Megináhersla var lögð á gagnasöfn, bæði texta og tal, en allur máltæknihugbúnaður byggist á gögnum um tungumálið,“ segir Jóhanna Vigdís Guðmundsdóttir, framkvæmdastjóri Almannaróms, í tilkynningunni.

Meðal gagnasafna sem unnið var að á árinu má nefna uppfærða útgáfu íslenskrar Risamálheildar, sem er nýtt í öllum kjarnaverkefnum, m.a. til að hugbúnaður geti lært eðlilegt málfar, stór textasöfn á íslensku og ensku til þess að þjálfa þýðingarvélar, textasafn og greiningar á stafsetningu og málfari til þróunar á málrýnihugbúnaði og vandaðar upptökur á tali til þróunar talgervla.

Jafnframt voru þróaðar frumgerðir nokkurra kjarnalausna sem leggja grunninn að þeim lausnum sem gefnar verða út við lok áætlunarinnar: „Talsverð vinna var lögð í þróun á hugbúnaði til grunngreiningar á texta og tali og þá er búið að leggja traustan grunn að vélþýðingakerfi sem þýðir á milli íslensku og ensku, sem og málrýni fyrir íslensku, sem leiðbeinir við textaskrif,“ segir Anna Björk Nikulásdóttir, verkefnastjóri SÍM, í tilkynningunni.

Á tólfta þúsund tekið þátt

Vel á tólfta þúsund landsmanna hefur nú tekið þátt í að búa til talgagnasafnið Samróm, stórt safn af hljóðupptökum sem á að nota til þess að þjálfa talgreina fyrir íslensku. Samrómur var þróaður í samstarfi Almannaróms og Háskólans í Reykjavík. „Sú söfnun heldur áfram allt næsta ár og er gríðarlega mikilvægt að fjölbreyttur hópur taki áfram þátt, fólk á öllum aldri og hvort sem það talar íslensku sem móðurmál eða annað mál, til að talgreinar framtíðarinnar skilji sem flesta,“ segir Jóhanna og hvetur alla til að taka þátt.

Innlendar Fréttir