Tekoälykokeilun vaihe 2: Testit ohitse, tekoäly toimii

  • Jaa Facebookissa
  • Jaa Twitterissä
30.1.2018 Tomas Lehtinen

Make with Espoo -leimaUsein kaupungeissa on haasteena, että toimialoilla tai palveluissa on sisäisiä palvelupolkuja, sillä data tai tieto voi olla hyvinkin siiloutunutta. Tekoälykokeilussamme, jossa yhdistetään varhaiskasvatus- sekä sosiaali- ja terveysdataa, yhtenä haasteena on ollut yhdistää kahden toimialan ja useiden eri järjestelmien tiedot.

Tällaiset haasteet on selätettävä, jotta pystymme kehittämään palveluja kaupunkitasoisesti, yli toimialarajojen. Kaupunkitasoisessa palvelukehityksessä keskiössä on asiakkaan hyvinvointi ja tarpeet, ei organisaatiorakenne. Näin on mahdollista tuottaa palveluja sekä ennakoiden että kustannuksissa säästäen.

Projektimme tavoitteita ovatkin terveydenhuollon, sosiaalipalvelujen ja varhaiskasvatuksen rekisteritietojenyhdistäminen, yhtenevien palvelupolkujen etsiminen tehokkaan tekoälyn avulla ja sen jälkeen ymmärryksen lisääminen siitä, mitkä kaikki tekijät vaikuttavat espoolaisten hyvinvointiin ja palvelujen käyttöön.

Tiedot yhdistyivät, segmentointi vauhdissa

Ensimmäisiä suuria onnistumisia olikin se, että eri järjestelmien pseudonymisoidut tiedot saatiin yhdistettyä onnistuneesti. Yhdistetty ja anonymisoitu datamassa on iso, sillä Terveys-Efficastamme saimme tiedot noin 500 000 henkilöstä vuosilta 2002–2016. Sosiaali-Efficassa tietoja oli noin 160 000 henkilöstä.

Toinen iso tavoite oli sosiaali- ja terveydenhuollon palvelupolkuihin perustuva datapohjainen segmentointi. Segmentointi on asiakkaiden jakamista erilaisiin ryhmiin eli segmentteihin. Datamassa on valtava eli edellytykset uudenlaiseen segmentointiin ovat olemassa.

Espoon Terveys-Efficassa on dataa yli 37 miljoonasta kontaktista, 3 miljoonasta diagnoosista ja 24 miljoonasta laboratoriotuloksesta. Tekoälyn tuottaminen segmenttien määrää ei ole ennakkoon määrätty, vaan voimme sen itse valita. Olemme tähän mennessä pitäneet segmenttien määrän noin 20:ssa. Dataa on lisätty hallitusti ja olemme antaneet tekoälyn luoda sitten segmentit. Jokainen asiakas on kuulunut jokaisena vuonna johonkin segmenttiin.

Segmenttejä olemme pystyneet tarkastelemaan esimerkiksi kuvan 1 mukaisesti. Tekoäly on nostanut segmenteistä kaupungin keskiarvosta eroavia syitä, esimerkiksi diagnooseja tai päätöksiä, jotka ovat samalla olleet myös syitä segmentoinnille. Ne ovat segmenttejä parhaiten kuvaavat piirteet.

Tekoälykokeilu, esimerkkikaavio segmenteistä

Kuva 1. Esimerkit kahdesta segmentistä. Mukana on segmenttien omia selkeitä erottavia tekijöitä, kuten esimerkiksi diagnooseja.

Olemme myös tarkastelleet käyntisyitä tai diagnooseja segmenteittäin kuvan 2 mukaisesti.

Tekoälykokeilu, esimerkkikaavio diabetespotilaiden käyntisyistä

Kuva 2. Käyntisyy segmenteittäin. Tässä tapauksessa tyypin 2 diabetes.

Lupaavia tuloksia myös ennusteista

Myös ennusteet ovat mahdollisia valtavan datamassan avulla. Kolmas tavoitteemme olikin tulevaisuuden hyvinvoinnin ennustaminen yksilötasolla.

Kuva 3 näyttää ensimmäisiä testejämme segmenttien siirtymien ennusteista. Tässä tarkastellaan, miten päädytään tai päästään segmenttiin 2 tulevaisuudessa. Esimerkiksi jos ihminen on ollut viiden viime vuoden aikana vain segmentissä 2, hän ennusteen mukaan jatkaa 82 prosentin varmuudella samassa segmentissä, jos palvelut pysyvät täysin samoina. Jos siirtymä tai ennuste tapahtuu, niin tekoäly luo vielä perään uuden ennusteen.

Pystymme siis jatkossa arvioimaan tiettyjen palvelujen käytön vaikutuksia hyvin pitkälle tulevaisuuteen.

Tekoälykokeilu, esimerkkikaavio segmenttiennusteesta

Kuva 3. Segmenttiennusteen testi.

Etsinnässä ongelmien juurisyyt

Olemme testanneet myös ennustetta lastensuojeluasiakkuudesta eli eräänlaista riskiennustemallia. Koska datamassa mahdollistaa myös perheen palvelunkäytön tarkastelun eikä vain yksilön, voimme saada uutta tietoa eri ongelmien erilaisista juurisyistä.

Hyödynsimme Espoon koko dataa riskiennustemallin rakentamiseksi. Mukana oli noin 300 000 kotitaloutta 10 vuoden ajalta. Tekoäly tarvitsi sosiaali- ja terveydenhuollon tapahtumadataa viideltä vuodelta, jotta se pystyi tekemään riskiennusteita. Ennusteiden kautta on mahdollista pureutua juurisyihin ja mahdollisiin interventioihin, sillä sosiaali- ja terveyspuolen järjestelmiin kirjatuista tapahtumista löytyi noin 300 piirrettä per henkilö.

Alustavien tulosten pohjalta näyttää siis siltä, että nykyaineistolla lastensuojelun asiakkuutta voidaan ennustaa. Mitä enemmän dataa on saatavilla, sitä paremmaksi malli oppii. Ennustemallilla voidaan ennustaa muitakin palvelujen suunnittelun kannalta keskeisiä asiakkuuspolkuja, ei pelkästään lastensuojelun asiakkuutta.

Tekoäly ja hiljainen tieto tukevat toisiaan

Kun yhdistetään eri toimialojen asiointidataa, voidaan hiljainen tieto ja oletukset saada näkyväksi tuotettavin raportein ja visualisoinnein. Siihen ei kuitenkaan tekoäly yksin pysty, vaan se vaatii paljon yhteistyötä toimialojen asiantuntijoiden kanssa.

Pidimme projektille erittäin tärkeän työpajan sosiaali- ja terveystoimen asiantuntijoiden kanssa. Siellä projektin isoimpana onnistumisena pidettiin kokonaisasiakkuuden ja perhedynamiikan näkymistä.

Tietojärjestelmiemme data ja asiantuntijoiden hiljainen tieto voivat lisätä näkyvyyttä eri toimialojen välillä ja siten auttaa tuottamaan palveluja yhdessä, ennakoivasti, aiempaa tehokkaammin.

Joskus datasta voi nousta esiin yllätyksiä, mutta usein se myös vahvistaa asiantuntijoiden kokemukseen perustuvia käsityksiä. Molemmissa tapauksissa analysoitu data luo vahvaa tietopohjaa päätöksenteon tueksi.

Tomas Lehtinen

Tomas Lehtinen
tekoälykokeilun projektipäällikkö, Espoon 6Aika-hanke

Lue myös aiempi blogikirjoitus: Tekoälykokeilun vaihe 1: Tekoälyä auttamassa

6Aika-logot