2.7.2026
Kun tekoäly kohtaa Koontipalvelun: viisi ideaa älykkäämpään liikkumiseen
Sarjan ensimmäisessä osassa kerroin, miten Fintrafficin Koontipalvelu yhdistää Suomen joukkoliikennetiedon yhdeksi tietopohjaksi ja toisessa osassa kuvailin mitä mahdollisuuksia syntyy, kun sen yhdistää muihin Fintrafficin avoimiin datapalveluihin. Palaset ovat pöydällä. Mutta kuka – tai mikä – kokoaa ne?
Tässä viimeisessä osassa lisään yhtälöön tekoälyn. En abstraktina muotisanana vaan viiden konkreettisen idean kautta: mitä tekoäly voisi tehdä liikennetiedolla, joka on nyt ensimmäistä kertaa yhtenäisenä, standardimuotoisena ja historiaa kerryttävänä kokonaisuutena saatavilla?
Miksi Koontipalvelun data on otollista tekoälylle
Tekoäly ei tee ihmeitä huonolla datalla. Koneoppimismallit tarvitsevat yhtenäistä, riittävän kattavaa ja mielellään historiaa sisältävää aineistoa. Juuri tässä Koontipalvelu on kiinnostava lähtökohta, ja siihen on neljä konkreettista syytä.
Ensinnäkin yhtenäisyys. Koontipalvelun data on valmiiksi normalisoitu GTFS-standardiin, mikä vähentää merkittävästi sitä esikäsittelytyötä, joka tekoälyprojekteissa tyypillisesti vie suurimman osan ajasta. Malli voi keskittyä oppimiseen, ei datan siivoamiseen.
Toiseksi historiadata. Koontipalvelu tallentaa päivittäin tietoa häiriöistä, muutoksista ja viivästyksistä. Tämä kumuloituva aineisto on juuri sitä, mitä koneoppimismallit tarvitsevat: riittävästi esimerkkejä menneistä tapahtumista, jotta niistä voi oppia ennustamaan tulevia.
Kolmanneksi reaaliaikaisuus. GTFS RT -standardi mahdollistaa reaaliaikaisen datan hyödyntämisen, joten tekoälysovellukset eivät rajoitu pelkkään historian analysointiin. Ne voivat reagoida ja ennakoida reaaliajassa.
Neljänneksi yhdisteltävyys. Kuten sarjan toisessa osassa kuvasin, Koontipalvelun dataa voi rikastaa Digitrafficin tieliikennetiedoilla, junien toteumatiedoilla ja meriliikenteen datalla. Tekoälyn näkökulmasta tämä tarkoittaa, että syötedata voi olla multimodaalia – ja mitä rikkaampi syöte, sitä parempia ennusteita ja suosituksia malli voi tuottaa.
Viisi ideaa: näin tekoäly voisi hyödyntää liikennetietoa
Seuraavat viisi ideaa ovat omaa visiointiani siitä, mitä avoimen liikennetiedon ja tekoälyn yhdistelmällä voisi saada aikaan – eivät Fintrafficin julkaisemia suunnitelmia. Jokaisen idean kohdalla kuvaan, mitä dataa käytettäisiin, miten tekoäly toisi lisäarvon ja kuka hyötyisi.
Idea 1: Ennakoiva häiriöanalyysi
Koontipalveluun kertyy päivittäin tietoa häiriöistä, viivästyksistä ja poikkeustilanteista. Koneoppimismalli voisi analysoida tätä historiadataa ja oppia tunnistamaan kuvioita: mitkä reitit ovat häiriöherkkiä tiettyinä vuodenaikoina, viikonpäivinä tai kellonajoilla? Yhdistämällä tähän Digitrafficin tiesää- ja olosuhdetiedot malli voisi ennakoida häiriöitä ennen kuin ne tapahtuvat.
Hyödynsaajat olisivat sekä operaattorit, jotka voisivat varautua ennalta, että matkustajat, jotka saisivat varoituksen ennen matkan alkua. Viranomaisille ennakoiva analyysi tarjoaisi työkalun liikennejärjestelmän pullonkaulojen tunnistamiseen.
Idea 2: Älykäs matka-avustaja luonnollisella kielellä
Nykyiset reittioppaat toimivat hakukenttien ja valintojen kautta. Entä jos matkustaja voisi yksinkertaisesti kysyä: “Miten pääsen huomenna aamulla Oulusta Helsinkiin niin, että vältän vaihtoja ja pääsen perille ennen kymmentä?”
Suuri kielimalli voisi toimia rajapintana Koontipalvelun ja muiden Fintraffic-datapalvelujen päälle. Se ymmärtäisi luonnollista kieltä, tulkitsisi matkustajan mieltymykset – esteettömyys, vaihtojen minimointi, hinta, aika – ja hakisi datan taustalla olevista rajapinnoista. Vastaus olisi keskusteleva ja mukautuva, ei pelkkä lista yhteyksiä.
Tämä on ideoista kunnianhimoisin ja vaatisi paitsi LLM-integraation myös reaaliaikaisen rajapintaketjun ja käyttöliittymän. Mutta teknisesti peruskomponentit ovat olemassa.
Idea 3: Poikkeusten automaattinen tunnistaminen
Koontipalveluun kertyy tietoa epäloogisista tapahtumista ja ongelmakohdista. Tekoäly voisi automatisoida tämän: koneoppimismalli tunnistaisi datasta poikkeamia – reittejä, jotka eivät vastaa aikataulua, pysäkkejä, joiden ennusteet ovat systemaattisesti virheellisiä, tai operaattoreita, joiden data puuttuu toistuvasti.
Tämä ei ole pelkkää visiointia. Fintraffic hyödyntää jo koneoppimista liikennemäärätiedon laadunvarmistuksessa – LAM-mittauspisteiden dataa korjataan koneoppimiseen perustuvalla sovelluksella. Sama lähestymistapa soveltuisi luontevasti myös Koontipalvelun joukkoliikennetiedon laadunvarmistukseen.
Idea 4: Kysynnän ennustaminen ja kapasiteetin optimointi
Joukkoliikenteen kysyntä vaihtelee merkittävästi: arkipäivien ruuhkahuiput, viikonloppujen hiljaiset tunnit, suurtapahtumien aiheuttamat piikit, sään vaikutus kulkumuotovalintoihin. Tekoäly voisi yhdistää Koontipalvelun historiadataa ulkoisiin datalähteisiin – sääennusteisiin, tapahtumakalentereihin, koulujen loma-aikoihin – ja ennustaa kysyntäpiikkejä etukäteen.
Operaattoreille tämä tarkoittaisi mahdollisuutta optimoida kapasiteettia: lisävuoroja sinne missä niitä tarvitaan, resurssien säästöä hiljaisina aikoina. Viranomaisille se tarjoaisi datapohjaisen työkalun palvelutason suunnitteluun.
Idea 5: Automaattinen palvelutasoraportointi
Viranomaiset ja tilaajat tarvitsevat säännöllisesti tietoa joukkoliikenteen palvelutasosta: toteutuvatko aikataulut, miten häiriöt jakautuvat, missä on parannettavaa. Tällä hetkellä raportointi vaatii manuaalista työtä. Tekoäly voisi tuottaa automaattisesti viikoittaisia tai kuukausittaisia yhteenvetoja Koontipalvelun historiadatasta – luonnollisella kielellä kirjoitettuja raportteja, jotka nostavat esiin poikkeamat ja trendit.
Tämä on ideoista teknisesti yksinkertaisin, koska se ei vaadi reaaliaikaista päättelyä vaan perustuu historiadatan jälkikäteisanalyysiin. Nykyiset kielimallit pystyvät tähän jo varsin hyvin, kunhan niille tarjoaa jäsenneltyä dataa.
Realismi: mikä on lähellä, mikä vielä kaukana
Viisi ideaa, viisi eri kypsyysastetta. On reilua arvioida jokaista rehellisesti.
Lähimpänä toteutusta ovat anomalioiden tunnistaminen ja automaattinen raportointi. Molemmat perustuvat historiadatan analysointiin, ja kummallekin on olemassa valmiita työkaluja ja menetelmiä. Fintrafficin oma kokemus koneoppimisesta LAM-datan laadunvarmistuksessa osoittaa, että organisaatiossa on jo osaamista ja halua soveltaa tekoälyä operatiiviseen dataan.
Vaativat kehitystyötä mutta ovat realistisia ennakoiva häiriöanalyysi ja kysynnän ennustaminen. Molemmat edellyttävät riittävää historiadatan kertymää, ulkoisten datalähteiden integrointia ja mallien validointia oikeassa liikenneympäristössä. Teknisesti mahdollisia jo nyt, mutta luotettavuuden saavuttaminen vaatii aikaa ja iterointia.
Visiontasolla on luonnollisen kielen matka-avustaja. Se vaatii LLM-integraation, reaaliaikaisen rajapintaketjun usean datalähteen läpi, käyttöliittymän ja huolellista testausta. Yksittäiset komponentit ovat olemassa, mutta kokonaisuuden rakentaminen tuotantotasoiseksi on merkittävä projekti.
Kaikkia ideoita yhdistävät samat poikkileikkaavat haasteet. Datan kattavuus vaihtelee – kaikilla alueilla ja operaattoreilla ei ole yhtä laadukasta dataa. Reaaliaikaisten sovellusten vasteaikavaatimukset ovat tiukat. Kustannukset erityisesti LLM-pohjaisissa ratkaisuissa voivat nousta merkittäviksi. Ja henkilöliikenteen datassa on aina huomioitava yksityisyydensuoja.
Mutta kynnys kokeilla on matala. Keskeiset aineistot – kuten Digitrafficin avoin data ja Koontipalvelun matkatiedot – ovat laajasti kehittäjien saatavilla. Koontipalvelu tarjoaa standardimuotoisen pohjan, jota ei tarvitse esikäsitellä. Sovelluskehittäjä, tutkija tai startup voi aloittaa kokeilun ilman investointipäätöstä – ja juuri siinä on avoimen datan suurin vahvuus tekoälysovelluksissa.
Data on valmista – nyt tarvitaan tekijöitä
Tämän kolmiosaisen sarjan aikana olen käynyt läpi, miten Koontipalvelu loi yhtenäisen pohjan Suomen joukkoliikennetiedolle, miten sen arvo kasvaa yhdistettynä muihin Fintrafficin datapalveluihin ja miten tekoäly voisi viedä hyödyntämisen kokonaan uudelle tasolle.
Fintraffic on rakentanut datainfrastruktuurin, joka on kansainvälisestikin poikkeuksellisen avoin ja kattava. Koontipalvelu ratkaisee sen perusongelman, joka on aiemmin estänyt innovaatioita: datan hajanaisuuden. Nyt kun pohja on kunnossa, suurin kysymys ei ole tekninen vaan inhimillinen – kuka tarttuu näihin mahdollisuuksiin?
Jos haluat kokeilla itse, aloitus on yksinkertainen: mene Koontipalvelun sivulle (mobility.mobility-database.fintraffic.fi), lataa yhden alueen tai kulkumuodon GTFS-aineisto ja tutki sitä. Valitse yksi reitti, katso sen häiriöhistoriaa ja mieti, löytäisikö yksinkertainenkin malli siitä toistuvan kuvion. Se on ensimmäinen askel – ja kynnys on tarkoituksella tehty matalaksi.
