Hakukone joka ymmärtää taivutuksen päälle
Perjantaina, 23. Helmikuuta 2007Joku aika sitten kiinnitin huomiota kotimaisen www.fi -hakupalvelun mainokseen jossa kehuivat palvelun ymmärtävän suomalaista. Toinen hakupalvelu, webinfo.fi, kehui samoihin aikoihin lehdistötiedotteissa osaavansa suomen kielen taivutusmuodot.
Huomasin sittemmin, että myös Google on ottanut vastaavan ominaisuuden suomenkieliseen hakuunsa (jota en ollut tähän asti käyttänyt varmaan koskaan - Firefoxini pikahaku on asetettu etsimään kaikenkielisiä dokumentteja).
Google-haku ‘koirasta pannalla’ suomenkielisistä sivuista tuotti n. 11 200 osumaa joissa molemmat sanat esiintyivät jossain muodossa. Sama haku kaikenkielisistä sivuista tuottaa vain n. 151 osumaa - ne sivut, joissa sanat ovat täsmälleen annetussa muodossa. Harmi ettei hakujätti (vielä) osaa tunnistaa kieltä hakusanan perusteella ja/tai ottaa taivutusmuotoja käyttöön kaikille hauille. Tätä odotellessa tarvinnee askarrella Firefoxiin erillinen Suomi-Google -pikahaku.
Muistaakseni jonkinlaista EU-rahoitustakin saanut webinfo kaivoi samalla kyselyllä puolestaan 5 771 sivua.
Www.fi:n vastaava haku kertoi löytäneensä täsmälleen 24 487 osumaa, epätieteellisen tarkan tutkimuksemme selvä voittaja määrässä siis. Laatua ei tällä kertaa tutkittu, kiitos kysymästä (en ole erityisen kiinnostunut koirista tai pannoista, mutta jostain syystä ne nyt olivat ensimmäiset mieleen tulleet sanat kun lähdin tätä kirjoittelemaan).
Aiheeseen löyhästi liittyen, joku oli ilmeisesti äskettäin julkaissut suomen kielen tuen Malaga -nimiseen kielioppi- ja sanamuotojäsentimeen. Sekä Malaga itse että suomen kielen muoto-opin kuvaus on julkaistu GPL:n alla, ja Malagan pitäisi toimia niin Linuxilla kuin Macilläkin. En vielä ehtinyt Malagaan tutustua, mutta lupaavalta näytti www-sivujen perusteella. Joskus aiemin tutustuin MMorphiin, mutta en muistaakseni löytänyt siihen kunnollista suomen kielen tukea.



