Tiedonhallinnan blogi: Miksi tietämysgraafit ovat päivän sana?
Kirjoittajat Petri RoponenTekoäly tarvitsee kunnon tietoa. Organisaatioiden data on usein ripoteltuna sinne tänne, järjestelmästä toiseen. Kela, esimerkiksi, voi uinua jopa 800 eri tietojärjestelmän syleilyssä. Jokainen puhuu omaa siansaksaansa. Miten ihmeessä tekoäly voi pullauttaa luotettavaa tietoa, kun pohja on sekaisin kuin Haminan kaupunki? Aihetta pohtii blogissa tietoasiantuntija Petri Roponen.
Vastaus on yhä useammin: tietämysgraafi (Knowledge Graph). Niitä Kelakin kokeilee parhaillaan.
Mikä ihmeen tietämysgraafi?
Yksinkertaisimmillaan tietämysgraafi on kartta: ei paperinen, vaan digitaalinen. Se näyttää asiat – ihmiset, paikat, käsitteet – ja niiden väliset suhteet. Ajattele verkkoa: solmut ovat asioita, ja kaaret kertovat, miten ne liittyvät toisiinsa. Tietämysgraafi ei siis ole pelkkiä rivejä ja sarakkeita, vaan verkosto, jossa tieto elää ja hengittää.
Ominaisuus | Relaatiotietokanta | Tietämysgraafi |
---|---|---|
Tiedon rakenne | Taulukot, sarakkeet, rivit | Graafirakenne, solmut ja kaaret |
Skeeman joustavuus | Jäykkä | Joustava, laajennettavissa |
Suhteet | Määritelty etukäteen viite- ja pääavaimilla | Dynaamiset, monipuoliset |
Kyselyt | Monimutkaisia SQL-liitoksia | Helppo navigoida (SPARQL, Cypher) |
Skaalautuvuus | Haastava monimutkaisille suhteille | Suunniteltu laajojen tietomäärien kanssa |
Käyttötarkoitus | Toistuva tallennus | Semanttinen hallinta, tiedon löytäminen, tekoäly |
Miksi juuri nyt?
Tietämysgraafit ovat nyt pinnalla syystä:
- Tiedon yhdistäminen. Ne kutovat yhteen sirpaleiset tiedot ja antavat niille merkityksen.
- Tekoäly kehittyy. Graafit auttavat tekoälyä ymmärtämään paremmin ja ovat läpinäkyvämpiä. Näemme, mihin päätökset perustuvat.
- Datan tulva. Perinteiset tietokannat hukkuvat, kun tietoa on liikaa ja suhteet monimutkaistuvat.
- Hakukoneet ja suositukset. Google käyttää sitä, kun etsit vaikka Alexander Stubbia – saat enemmän kuin vain nimen.
- Siilojen purku. Organisaatioissa tieto on usein bunkkereissa. Graafit yhdistävät ne yhdeksi kokonaisuudeksi.
Tietämysgraafien merkitys korostuu erityisesti, kun puhutaan tekoälyagenteista, säännellyistä ympäristöistä (terveydenhuolto, raha-ala) ja pirstaloituneen tiedon yhdistämisestä. Ne ovat siis modernin tiedonhallinnan ja tekoälyn työrukkanen.
Mihin niitä käytetään?
Tietämysgraafeilla tehdään kaikenlaista:
Hakukoneet ja tekoälyavustajat: Google ja Siri osaavat asiansa paremmin niiden avulla.
Asiakaskokemus: Amazon osaa suositella paremmin, chatbotit ymmärtävät syvemmin.
Väärinkäytösten havaitseminen: Pankit löytävät huijarit helpommin.
Lääketiede: Uudet lääkkeet ja diagnoosit hyötyvät tiedon yhdistelystä. Mayo Clinicillä on jo oma jättimäinen graafinsa.
Toimitusketjut: Varastot ja kuljetukset toimivat sulavammin.
Tietohallinto: Siilot murtuvat, tiedonhallinta paranee.
Tutkimus ja kehitys: Tieto jäsentyy, uusia yhteyksiä löytyy.
Kelassa tietämysgraafeja voisi soveltaa vaikka asiakaspalvelun chatboteissa, sosiaaliturvan kokonaisuuden kartoittamisessa, monimutkaisten etuuslogiikkojen hahmottamisessa ja tiedonhallinnan yhtenäistämisessä.
Historiallinen katsaus
Google lanseerasi oman tietämysgraafinsa vuonna 2012, mutta niiden juuret ovat syvemmällä – semanttisessa webissä ja ontologioissa. Ne ovat vuosikymmeniä vanhaa tiedon esittämisen ja jäsentämisen tutkimusta.
Tunnettuja graafeja ovat Googlen lisäksi Wikidata, DBpedia, Facebookin Social Graph ja LinkedInin Economic Graph.
Mielenkiintoinen käänne on Samsungin hankittua Oxford Semantic Technologies -yritys. Heidän RDFox-graafimoottorinsa on niin tehokas ja kevyt, että se sopii jopa puhelimeen – esimerkiksi Galaxy S25 -malleihin. Tämä tarkoittaa, että käyttäjä voi saada personoidut suositukset suoraan puhelimesta: Laite oppii sinusta itse, ilman jatkuvaa pilviriippuvuutta. Puhelin osaa ajatella itse, diagnosoida ja toimia nopeasti. Myös yksityisyys paranee, kun tiedot pysyvät laitteessa, eivät lennä pilviin.
Tämä osoittaa, että graafit eivät ole enää vain isojen järjestelmien asia, vaan ne tulevat yhä lähemmäs arkea ja käyttäjää.
Kelassa kokeillaan tietämysgraafien hyötyä sosiaaliturvan tiedonhallintaan
Kelan IT-innovaatio- ja kasvuyksikössä on käynnissä kokeilu, jossa selvitetään tietämysgraafien soveltuvuutta sosiaaliturvan tiedonhallintaan. Haasteita riittää, sillä uudet teknologiat, resurssit ja osaaminen vaativat panostusta. Suuret organisaatiot ovat jo ottaneet ne käyttöön, mutta Kela katsoo nyt, miten tämä toimii sosiaaliturvan viidakossa.
Kokeilussa tavoitteena on:
- Selvittää, miten tietämysgraafi sopii sosiaaliturvan tietämyksen hallintaan.
- Kartuttaa tiedon integroinnin ja uudelleenkäytön mahdollisuuksia.
- Tunnistaa graafin mahdollisuudet tekoälyn tietoperustana.
- Kartoittaa käyttöönoton esteitä.
Tietämysgraafit eivät siis ole pelkkä muotisana, vaan vakavasti otettava työkalu, joka muuttaa tapaa, jolla käsittelemme ja ymmärrämme tietoa.
Linkkejä ja lisätietoja
Introducing the Knowledge Graph: things, not strings (blog.google)(Avautuu uuteen välilehteen)