Ennustetyökalun kehitystyö

Lasten ja nuorten ongelmia ennakoidaan Suomen laajimmalla keinoälymallilla Lappeenrannassa

Etelä-Karjalan LAPE-hankkeessa on kehitetty keinoälyyn perustuvaa työkalua, jonka avulla voidaan ennakoida lasten ja nuorten ongelmia. Työkalu mahdollistaa tuen antamisen varhaisessa vaiheessa - jo ennen varsinaisten ongelmien syntymistä.

Malli on laajin, mitä Suomessa on toistaiseksi tehty. Siinä yhdistyy tieto, joka kertyy opettajien, varhaiskasvatuksen, terveydenhoitajien, lääkäreiden, sosiaalihuollon ammattilaisten ja mielenterveys-työntekijöiden järjestelmiin.

Projektipäällikkö Katja Antikainen kertoo seuraavissa videoissa, miten työkalua on kehitetty tähän mennessä.

Näin Ennakoivan analytiikan projekti toteutettiin Etelä-Karjalan LAPE-hankkeessa 2018

Katja Antikainen: Projektin tavoitteet

Mitä tavoitellaan? Ja mitä EI tavoitella


Rakentaa työkalu, jonka avulla



Tavoitteena EI OLE

  • voidaan käydä läpi suuria massoja dataa ja löytää yhteisiä tekijöitä erilaisille päätepisteille
  • testata onko löydetyillä tekijöillä tilastollista merkittävyyttä
  • nostaa tilastollisesti merkitseviä riskitekijöitä kunkin kohderyhmän kanssa työskentelevien
    ammattilaisten käyttöön
  • määritellä ja valita etukäteen tekijöitä, jotka voisivat ennustaa tiettyä päätepistettä
  • tehdä tilastollista analyysiä etukäteen valituille tekijöille

Projektin suunta on isosta kuvasta yksityiskohtiin,
EI yksityiskohdista suurempaan kokonaisuuteen.

Projektin käynnistyminen

Katja Antikainen: Projektin käynnistyminen

Projektin taustalla toimii moniammatillinen työryhmä, joka määrittelee millaisiin ongelmiin olisi syytä puuttua. Kun tuloksia eli ennusmerkkejä  syntyy, työryhmä arvioi niiden merkityksellisyyden.

Tavoitteena on tuottaa monistettava malli, jota voidaan hyödyntää esimerkiksi vanhuksille, nuorille aikuisille, diabeetikoille ja muille asiakasryhmille

Projektin vaiheet

Katja Antikainen: Projektin vaiheet

Tiedonkeruu

Katja Antikainen: Tiedonkeruun haasteet

Kun lapset ja nuoret ovat tekemisissä monien eri ammattilaistahojen kanssa, henkilöön liittyvä tieto on hajallaan eri järjestelmissä eri sektoreilla. Käytännössä kokonaisvaltaisen kuvan muodostaminen lapsen tai nuoren tilanteesta on tällä hetkellä mahdotonta. Eksoten yhtenäiset tietojärjestelmät helpottivat terveystiedon keruuta. Haasteena oli opetukseen ja sosiaalitoimeen liittyvän tiedon integrointi.

Projektissa yhdistellään tietoja useista eri lähteistä

  • terveydenhuollon, sosiaalihuollon, opetustoimen ja varhaiskasvatuksen tietojärjestelmistä
  • dataa on toimitettu tietokantojen varmuuskopioina, csv-tiedostoina sekä Excel-taulukoina
  • sekä rakenteiset että tekstitiedot kaikista järjestelmistä

Tietoallas

Katja Antikainen: Tietoallas

  • Eksotelle hankittiin projektia varten tietoallas Tiedolta (vrt. HUS / isaacus)
  • Ennen tietojen siirtoa tiedot pseudonymisoitiin: 1.  tietokantatauluista korvattiin henkilötunnukset uudella merkkijonolla sekä poistetiin nimitiedot 2. vapaamuotoisen tekstin seasta käytiin läpi etu- ja sukunimilistoissa esiintyvät nimet ja korvattiin ne toisella tunnisteella. Lisäksi katuosoitteet, puhelinnumerot, henkilötunnukset ja tilinumerot poistettiin kokonaan tekstin seasta.
  • Kaikki käsitellyt taulut vietiin CSV-tiedostoiksi.

”AI-komponentti”
jakautuu projektin tavoitteen mukaisesti kahteen osaan

  • Laadullinen analyysi: käydään läpi suuria massoja dataa ja haetaan yhteisiä tekijöitä  
       erilaisille päätepisteille
  • Tilastollinen analyysi: testataan onko löydöksillä tilastollista merkitystä

Katja Antikainen: "AI-komponentit"

”AI-komponentit” - päätepisteet

Katja Antikainen: "AI-komponentit" - päätepisteet

Projektissa määriteltiin analysoitavat päätepisteet (kohderyhmänä lapset ja nuoret)

  • keskiarvo alle 6,5 (on indikaatio alla oleviin): vaille peruskoulun päättötodistusta jääminen, vaille peruskoulun jälkeistä opiskelupaikkaa jääminen
  • kurinpitotoimia: enemmän kuin 3-5/lukuvuosi, Kirjallinen varoitus ja/tai opetuksen epääminen
  • yli 20 luvatonta koulupoissaoloa/lukuvuosi
  • kiireellinen sijoitus tai huostaanotto
  • psykiatrinen hoito/osastohoito (mielenterveys/päihde)
  • päihteiden ongelmakäyttö/osastohoito

”AI-komponentit” – analysoitavat tiedot

Katja Antikainen: Analysoitavat tiedot

Projektissa määriteltiin analysoitavat tiedot (kohderyhmänä lapset ja nuoret)

  • Rakenteista dataa (Eksote & Lpr)
     - 66 taulua, 629 muuttujaa (joista 113 tärkeimpiä) + muuttujien hierarkiat
     (Esim. kotihoidon tiedot jätettiin pois lasten ja nuorten osalta; vastaavasti vanhusten osalta voidaan jättää esim. äitiyshuolto pois)
     - Jokainen muuttuja voi saada arvoja välillä 2-14000
  • Lisäksi tekstianalytiikkaa
    - muuttujiksi nostetaan teksteistä tietoja, esim. Kiusaaminen
    - verrataan kohderyhmän ja vertauluryhmän tekstejä ja haetaan eroja
  • Lapset ryhmitellään ikäryhmittäin: 0-1v, 2-6v, 7-12v, 13-15v ja 16-17v
  • Mukaan analyysiin otetaan myös lapsen lähipiiri
    - Sosiaalitoimen perhetiedot, kotipaikkatunnuksen mukaan samassa asunnossa asuvat, terveystoimen läheiseksi ilmoitetut, äitiyshuollosta biologiset vanhemmat, varhaiskasvatuksen ja opetustoimen huoltajatiedot

Katja Antikainen: Analysoitavat tiedot (jatkuu)

Tekstianalytiikka

Katja Antikainen: Tekstianalytiikka


”AI-komponentit”
– laadullinen analyysi

Katja Antikainen: Laadullinen analyysi

Nostetaan analyysiin mukaan vain tiedot, joissa erot analysoitavan ryhmän ja vertailuryhmän välillä on enemmän kuin 5%.

  • Esim. 7-12v tarkastelujaksolla diagnooseja 21 eri ryhmässä ja 2576 eri diagnoosia
  • Näistä 5 diagnoosissa ja diagnoosiryhmässä on tarkastelu- ja verrokkiryhmän välillä ero yli 5%


”AI-komponentit”
– tilastollinen analyysi

Katja Antikainen: "AI-komponenti" - tilastollinen analyysi

  • Tehdään muuttujille kahden otoksen t-testi (“two sample t-test”)
  •  Tarkastellaan tulevatko muuttujien arvot samasta jakaumasta todennäköisyydellä (1-p)
             - Jos KYLLÄ, niin muuttuja EI ole tilastollisesti merkittävÄ
             - Jos EI, niin muuttuja ON tilastollisesti merkittävä
  • Yleensä käytetään p-arvoa 0.05
  • Lisäanalyysit
           – Mille osuudelle toimenpiteen kohteista on tehty huostaanotto?
                - Consistency
           – Mille osuudelle kaikista huostaanotetuista toimenpide on tehty?
                 - Coverage
          – Mitkä eri muuttujat esiintyvät yhdessä?
                - Similarity (Jaccard)

Katja Antikainen: Esimerkki tilastollisesta analyysista

Esimerkki lapsen tiedoista (2-7v)
     – Lapsi on lastensuojelun asiakas
-  Consistency = 0,02
-  Coverage = 1
- Covar1 Lapselle tehty selvitys aiheesta Huolto, tapaaminen, asuminen Jacc1 = 0,605
- Covar2 Lapsella korvatauteihin liittyvä diagnoosi Jacc2 = 0,486
- Covar3 Lapsella on Märkäinen välikorvatulehdus diagnoosi Jacc3 = 0,439

Esimerkki perheen tiedoista (2-7v)
     – Lapselle tehty selvitys sosiaalipäivytyksessä
- Consisteny = 0,029
- Coverage = 0,207
- Covar1 Sisarukselle tehty selvitys sosiaalipäivystyksessä Jacc1 = 1
- Covar2 Aikuisella on käyntejä Naisten ja lasten osaamiskeskuksessa Jacc2 = 0,803
- Covar3 Sisaruksella on käyntejä Naisten ja lasten osaamiskekusksessa Jacc3 = 0,744

Visualisointi ja takaisinkytkentä operatiiviseen työhön – kuvitteellinen esimerkki

Katja Antikainen: Mitä tämän jälkeen?

Ennakoiva analytiikka -projektin tulokset 2018

Lappeenrannan kaupunki ja Eksote ovat yhdessä määritelleet seitsemän päätepistettä, joihin lapsen tai nuoren ei toivota päätyvän:

1. Keskiarvo alle 6,5
2. Kurinpitotoimia enemmän kuin 3-5/lukuvuosi
3. Kirjallinen varoitus ja/tai opetuksen epääminen
4. Yli 20 luvatonta koulupoissaoloa/lukuvuosi
5. Kiireellinen sijoitus tai huostaanotto
6. Psykiatrinen hoito/osastohoito (mielenterveys/päihde)
7. Päihteiden ongelmakäyttö/osastohoito.

Näille seitsemälle päätepisteelle on löydetty satoja tilastollisesti merkitseviä ennakkomerkkejä, joita tuodaan lasten ja nuorten kanssa työskentelevien tietoon. Lisäksi on mahdollista luoda hälytysrajoja tiettyjen riskimäärien ylittyessä.

Kun löytyy tekijöitä, jotka korreloivat vaikkapa luvattomien koulupoissaolojen tai kiireellisten huostaanottojen kanssa, voidaan interventio tehdä parhaimmassa tapauksessa todella ajoissa. Tämä on inhimillisesti ja taloudellisesti järkevää.

Rakennettu ennustemallityöväline on dynaaminen. Välineeseen voidaan lisätä uusia tietolähteitä tai valita vaikka kokonaan uudet päätepisteet. Työväline etsii automaattisesti itse uudet riskiennustetekijät.

Hankkeessa on mukana Eksoten ja Lappeenrannan kaupungin lisäksi digipalveluyhtiö Avaintec, jolla on yli 20 vuoden kokemus tiedonhallinnasta terveysalalla.


Lisätiedot:
Toni Suihko, Eksote
Katja Antikainen, Avaintec


Etelä-Karjalan LAPE: kehittämiskoordinaattori Maija Ström-Ripatti (maija.strom-ripatti at eksote.fi)

TakaisinOppimaa-yhteisö > Etelä-Karjalan LAPE

Vastaa