Skip to content

Palaa takaisin

Case Kotus – Kielenhuoltoa datan avulla

Murrekeräelmistä miesselittäjään

Kotimaisten kielten keskus eli Kotus on opetusministeriön alainen virasto. Yksi sen päätehtävistä on suomen ja ruotsin kielten huoltaminen. Kotuksen sanakirjaosastossa tehdään muun muassa kaikkien vapaasti käytettävissä olevaa yleiskielen verkkosanakirjaa eli Kielitoimiston sanakirjaa. Verkosta löytyy myös kielenhuollon ohjepankki, josta kuka tahansa voi tarkistaa kielioppi- ja oikeinkirjoitusasioita.

Kotuksella on strategiana laittaa mahdollisimman suuri osa valtavasta materiaalistaan avoimesti verkkoon kaikkien saataville, ja kansalaiset ovat löytäneet palvelut todella hyvin.

Näiden lisäksi Kotus tarkastelee kielten kehitystä ja niiden asemaa yhteiskunnassa, ja Kotuksen yhteydessä toimivat myös suomen kielen, ruotsin kielen ja romanikielen lautakunnat sekä saamen kielten ja viittomakielten lautakunnat.


Dataa monenlaisista lähteistä

Kotus on merkittävä kieliaineiston ylläpitäjä, ja heillä on paljon omaa dataa, kuten valtavat murrekeräelmät ja suuri määrä nauhoitemateriaaleja sekä erilaisia sanastoja. Verkosta voi Aineistot-osion kautta kurkistaa kuinka paljon kielimateriaalia ja lähteitä on käytössä. Oman datansa lisäksi Kotuksella hyödynnetään myös muita tietolähteitä tehokkaasti.

“Esimerkiksi meillä ei ole omaa someaineistoa vaikkapa nykykielestä, emmekä ole kokeneet järkeväksi sitä lähteä kokoamaan”, sanoo Kotuksen erityisasiantuntija ja verkkosivuista vastaava Vesa Heikkinen.

Kotus julkaisee vuoden sanalistoja, joita kielenhuoltajat ja sanakirjantekijät keräävät. Viimeisimpänä tällaisena julkaisuna heiltä tuli juuri sanalista, josta löytyy viime vuoden aikana kerätyt 8 000 sanaa käyttöyhteyksineen. Saadakseen tarjottua kansalaisille kattavan palvelun, Kotus ostaa dataa erilaisista palveluista. He hyödyntävät mediaseurantaa ja heillä on esimerkiksi käyttöoikeus Alma Median media-arkistoon.

“Kun joku kansalainen kysyy jotakin, meidän palveluumme kuuluu hakea se tieto hänelle. Tällöin tarvitsemme monenlaisia aineistoja, jotta voimme kaivaa esille tiettyjä kielen ilmiöitä tai sanoja”, Heikkinen kertoo.


Futusomen työkalu siivittää kielen kehityksen tutkimusta

Kielitoimiston sanakirjan tekijät käyttävät Futusomen materiaalia yhtenä lähteenä pysyäkseen kielen kehityksessä ajan hermolla.

“Futusomella on hyvin kattavat ja jatkuvasti päivittyvät materiaalit, joten ne helpottavat työtämme sanaston seuraamisessa. Lisäksi historia-arkisto mahdollistaa sanojen haun myös muutamien vuosien takaa, jolloin ilmiöiden vertailu helpottuu”, sanoo Heikkinen.

Sanakirjantekijät seuraavat myös tarkasti Futusomen kuukausiraporttia, erityisesti valitessaan kuukauden sanaa. Työkalu on myös hyvä apu päivittäiseen seurantaan, sillä joskus sanoja ja termejä menee ohi ammattilaisiltakin. Raportit auttavat tässä asiassa. Esimerkkinä Heikkinen nostaa esille “miesselittäjä” -sanan.

“Olen ollut kiinnostunut siitä, miten tällainen sana on tullut suomen kieleen ja miten sitä käytetään. Tällaiseen tutkimukseen en lehtikielen aineistosta löydä vastausta, sillä se ei ole varsinaisesti yleiskielinen sana. Kun taas mennään sosiaaliseen mediaan, Twitteriin ja muihin kanaviin, siellä termi näyttää olevan kasvussa, ja tätä on ollut Futusomen datan avulla helppo tutkia”, kertoo Heikkinen.

Yhteistyö Futusomen kanssa on koettu Kotuksella erittäin positiivisena asiana. Futusomen työkalusta ja datasta on viikoittaista ja kuukausittaista hyötyä Kotuksen asiantuntijoille, ja yhteistä kehitystyötä halutaan erittäin mielellään jatkaa myös tulevaisuudessa.

Avainsanat: Päätöksenteko, Data analytiikka, Mediaseuranta

 

Lue miten verkkodataa voi hyödyntää

Lue tuotteistamme