lauantai 11. toukokuuta 2013

Verkostovisualisointi gone wrong

Ensinnäkin täytyy kiittää ja onnitella Helsingin Sanomia ja Tuomas Peltomäkeä todella hienosta jutusta koskien eduskunnassa kuultavina olleita tahoja, joka perustui itse hankittuun dataan. Tämä on juuri sen kaltaista datajournalismia, jonka parissa toivoisin itsekin viettäväni enemmän aikaa. Tähän kuitenkin loppuvat tällä erää kiitokset sillä haluan keskittyä muutamaan epäkohtaan, jotka havaitsin jutun verkkoversion yhteydessä julkaistusta verkostovisualisoinnista.

Aluksi kuitenkin muutama huomio verkostoanalyysistä yleisesti.

Verkostoanalyysi on visualisointikeino, joka mahdollistaa ja jolla voidaan kuvata asioiden (solmu, node) välisiä yhteyksiä (edge, yhteys). Verkostoanalyysilla voidaan kuvata esimerkiksi Facebook:ssa olevien käyttäjien välisiä kaverisuhteita. Verkostoanalyysin avulla on siis mahdollista visualisoida millä tavalla Facebook-kaverini ovat kavereita keskenään. Kuvassa 1 nähtävästä verkostovisualisoinnista, jossa solmut ovat Facebook-kavereitani, voidaan lukea mm. että:
  • Sukulaiseni ovat Facebook:ssa keskenään kavereita, mutta eivät juuri ole kavereita muiden kavereitteni kanssa.
  • Muutamat yliopistokaverini ovat kavereita lapsuuden kavereitteni kanssa, mutta pääosin näiden ryhmien jäsenet ovat kavereita vain keskenään.
  • Muutamilla minulle keskeisimmät ihmiset ovat kavereita kaikkien verkostossa nähtävien pääryhmien kanssa.

Parhaimmillaan verkostovisualisointi on erittäin tehokastyökalu asioiden välisten yhteyksien ymmärtämisessä. (Kuva 1)
Verkostovisualisointeja on karkeasti mahdollista manipuloida kolmella eri tavalla, jotka ovat:
  • Ladonta-algoritmi
  • Solmun koko
  • Yhteyden voimakkuus
Mahdollisia ladontatapoja ovat mm. paino-ohjattuladonta kuten Force Atlas ja spatiaalinen ladonta, joka voi perustua esimerkiksi geokoordinaatteihin. Solmun koko taas voidaan määritellä esimerkiksi solmuun tulevien yhteyksien määrällä tai se voidaan esimerkiksi määrittää asukasluvun perusteella jos yksittäisen solmu kuvaa valtiota. Solmujen välinen yhteys voi olla joko nolla, yksi tai jokin lukuarvo. Eli toisin sanoen joko yhteyttä ei ole, yhteys on olemassa tai sitten yhteydellä on jokin arvo, joka kuvaa yhteyden voimakkuutta suhteessa muihin yhteyksiin. Yhteys voidaan määritellä myös suunnattuna tai suuntaamattomana.

Esimerkiksi edellisessä Facebook-esimerkissä yhteys on suuntaamaton, koska yksisuuntaiset kaveruussuhteet eivät ole Facebook:ssa mahdollisia (ainakaan teknisessä mielessä). Twitter-seuraajia visualisoitaessa yhteydet taas ovat suunnattuja, koska Twitter:ssä käyttäjän ei tarvitse seurata toista, jotta toinen voi seurata häntä.

Mikä sitten meni vikaan Helsingin Sanomien julkaisemassa verkostovisualisoinnissa. Se, että se ei noudattanut verkostovisualisointien lainalaisuuksia vaan siinä oli tehty visualisointiteknisiä ratkaisuja graafisin perustein. Minulle verkostoanalyysia ja verkostovisualointeja tehneenä tämä tarkoittaa samaa kuin, että pylväsdiagrammista leikattaisiin pala pois, jotta visualisoinnista saataisiin graafisesti miellyttävämmän näköinen tai paremmin luettava. Kuvassa 2 nähdään erittäin banaali esimerkki pylväsdiagrammista, joka on visualisointiteknisesti pielessä, koska arvon 900 omaavan pylvään tulisi olla korkeampi kuin arvon 700 omaava pylväs.
Pylväsdiagrammissa pylvään korkeuden mielletään kuvaavaan asian suuruutta eikä kyseisen kaltainen pylväiden esitystapa ole siten luonnollinen. (Kuva 2)
Facebook:n Finnish Open Data Ecosystem ryhmässä keskusteltiin kyseessä olevasta Helsingin Sanomien jutusta ja sen yhteydessä käytetystä datasta sekä tehdystä visualisoinnista. Toivomuksena keskustelussa oli, että kerätty data pistettäisiin avoimesti jakoon. Peltomäki ei ollut kuitenkaan valmis suoraan valmis jakamaan dataa vaikka toteutus olikin julkaistu CC-lisenssillä.

Käydystä keskustelusta innostuneena päätin kaivaa datan suoraan toteutuksesta, jotta halukkaat voisivat sitä käyttää. Kaivoin siis verkostovisualisoinnissa käytetyn datan suoraan toteutuksen lähdekoodin uumenista. Toteutuksessa käytetty data oli .json-formaatissa, joka oli toteutuksessa käytetyn Sigma.js:n käyttämä formaatti ja jotta datalle oli mahdollista tehdä mitään järkevää jatkojalostusta oli se siis muunnettava johonkin toiseen formaattiin.

Itselleni luontevin tavoitetila oli .gexf-formaatti, koska tällöin data oli mahdollista avata Gephi-verkostovisualisointityökalussa. "Reverse engineerasin" datan siis verkostoformaattiin, jossa itseasiassa luulen datan alunperinkin olleen ennen sen muuntamista .json-formaattiin, koska itse toteutus näytti hyvin paljon Gephi:n Sigma.js-lisäosalla toteutetulta. Sinällään molemmat tiedostomuodot (.json ja .gexf) ovat muodoltaan hyvin rakenteisia ja kuvaavat erikseen solmut ja erikseen niiden väliset yhteydet, joten muuntaminen onnistui käytännössä muutaman etsi-korvaa komennon avulla.

Avattuani muuntamani datan (.gexf) Gephi:ssä minua alkoi kuitenkin ihmetyttämään miten en saanut aikaan samankaltaista lopputulosta kuin se, joka oli nähtävissä Helsingin Sanomien toteutuksessa. Tutkittuani numeroita tarkemmin huomasin, ettei toteutuksessa olleet visuaaliset komponentit kuten solmujen koko määräytynytkään niin kuin olin ajatellut. Oletin, että solmun koko olisi määräytynyt kuulemiskertojen mukaan ja juteltuani kollegoitteni kanssa oli tämä ollut myös heidän tulkintansa visualisoinnista.

Jutussa mainittiin, että Elinkeinoelämän keskusliittoa oli kuultu useimmin, yhteensä 1 761 kertaa. Alkuperäisen visualisoinnin perusteella seuraavaksi eniten oli kuultu Suomen Yrittäjiä, yhteensä 927 kertaa. Kuitenkin visualisoinnissa nämä kuvattiin noin samankokoisina solmuina vaikka kuulemiskertoja EK:lla on siis yli kaksi kertaa vähemmän. Samalla huomasin, että visualisoinnissa valionkunnat oli normalisoitu samankokoisiksi solmuiksi riippumatta niiden kuulemiskertojen määrästä. Enimmillään valiokuntia oli kuultu yhtä monta kertaa kuin EK:ta eli n. 1 700 kertaa. Toteutuksessa oli siis haluttu korostaa ulkopuolisten tahojen kuulemisia.

Keskusteltuani Peltomäen kanssa sain selville myös, että verkostosta oli rajattu pois ne kuultavat joita oli kuultu vähemmän kuin 50 kertaa (tämä kerottiin myös visualisoinnin lisätietoja kohdassa). En kuitenkaan saanut selville mitä muuta verkostosta on rajattu pois, koska jos tämä olisi ollut ainoa rajaus olisivat käsitykseni mukaan jäljelle jääneiden kuultavien kaikki kuulemiskerrat olleet edelleen mukana verkostossa.

Näin ei kuitenkaan ollut vaan jutussa mainittujen kuulemiskertojen määrä ei täsmännyt kuultavista lähteneiden yhteyksien määrään. Esimerkiksi visualisoinnin mukaan Finnet-liitto ry:tä on kuultu 59 kertaa, mutta tämä määrä ei vastaa verkostossa nähtäviin kuulemiskertoihin eli solmusta lähteneiden yhteyksien määrään.

Verkostosta ei ollut siis luettavissa yksittäisen kuultavan kaikkia kuulemiskertoja, joka kertoo minulle, että verkostosta oli täytynyt tiputtaa pois myös lakialoitteita, joissa kuulemisia on tapahtunut. Yritin selvittää Facebook-ryhmän keskustelussa taustoja näihin epäselvyyksiin, mutta en jankkaamisenkaan jälkeen saanut tyhjentäviä vastauksia.

Verkostovisualisoinnit ovat lähtökohtaisesti monille vaikealukuisia ja hankalasti hahmoteltavia, koska ne eivät ole meille tuttuja, mutta niiden helpompaa tulkintaa ei tulisi kuitenkaan lähteä ohjaamaan puhtaasti graafisin perustein, koska tällöin niiden tulkinta tulee mahdottomaksi tavallisen kansan lisäksi myös ammattilaisille jollaiseksi nyt tässä itseni omahyväisesti lasken.

Miten sitten esimerkiksi tässä tapauksessa oli kannattanut toimia, jotta verkostosta oltaisiin saatu helpompilukuinen ja samalla pidetty kiinni siitä, että ei määriteltäisi verkoston muuttujia joillakin muilla kuin matemaattisilla perusteilla. Itse olisin lähestynyt ongelmaa siten, että olisin romahduttanut verkoston "yksinoodiseksi".

Nyt toteutuksessa oli mukana kahdenlaisia solmuja. Ensinnäkin verkostossa olivat mukana eduskunnassa kuultavina olleet tahot ja toiseksi lakialoitteet joissa kuulemiset olivat tapahtuneet. Yhteyksiä solmujen välillä oli vain eri tyyppisten solmujen välillä eli kuultavina olleista lähti yhteyksiä lakialoitteisiin. Kuultavina olleet solmut tai lakialoitteet eivät olleet suoraan yhteydessä toisiinsa. Toisin sanoen lakialoitteet solmivat yhteen eri kuultavina olleet tahot.

Verkosto olisi siten ollut mahdollista romahduttaa valitusta kaksinoodidesta esitystavasta yksinoodiseksi niin, että verkostoon olisi piirretty vain kuultavina olleet tahot ja yhteydet näiden välille olisi piirretty sen perusteella miten tahot olivat olleet kuultavina samoissa lakialoitteissa. Näin tieto siitä missä lakialoitteissa kukin taho oli ollut kuultavana olisi koodattu yhteyksiin eikä erillisiin solmuihin.

Tämä esitystapa olisi myös paljastanut verkostoteknisesti selkeämmin mitkä tahot ovat sellaisia, että heitä molempia kuullaan kun eri lakialoitteita valmistellaan ja toisaalta mitkä tahot ovat sellaisia, että he ovat lakialoitteissa ainoita kuultavana olevia. Tässä esitystavassa ainoat kuultavina olevat tahot olisivat piirtyneet verkoston reunoille kun runsaasti kuultavina toisten tahojen kanssa olisivat piirtyneet verkoston ytimeen. Näin siis etenkin kun verkosto olisi ladottu painovoimaohjatusti.

Vaikka siis verkostovisualisoinnit ovat viehättävännäköisiä ja usein niitä tulkitaan enemmänkin suurella kunnioituksella kuin asiantuntijuudella tulisi niitä toteuttaessa olla yhtä tarkka tiedon oikeellisuudesta kuin muidenkin visualisointitekniikoiden kanssa.

Toivottavasti tämä herättää keskustelua ja lopputuloksena on edelleen entistä parempaa (data)journalismia, joka varmasti kaikkien etu. Toivottavasti saamme myös alkuperäisen datan jossain vaiheessa aktiivisesti jakoon avoimena datana kuten eduskunta on ilmeisesti luvannut, jotta me kansalaiset pääsemme siitä nauttimaan.

Muokkaus 13.5.2013 klo 18:58

Lisätty linkki .gexf-muotoiseen dataan, joka on siis tuotettu HS:n toteutuksen .json-tiedostosta.

8 kommenttia:

  1. Hei Teemo, ja kiitos hyvästä juttuuni liittyvästä bloggauksesta.

    Mielestäni avaat verkostoanalyysien toimintalogiikkaa hienosti myös niille, jotka eivät niitä tunne.

    Lyhyesti voisin kuitenkin kiinnittää huomiota pariin seikkaan.

    Ensinnäkin, toivoisin ettet sanoisi ottamasi JSON-tiedoston olevan sitä dataa, jonka pohjalta juttu on tehty.

    Ymmärrät verkostoanalyysien tekemisessä käytettäviä ohjelmistoja selvästi niin hyvin, että ymmärrät myös JSON-tiedoston sisältävän Gephissä olevan verkostovisualisoinnin kuvausdataa, eikä sitä dataa, jonka pohjalta kuvaus on tehty.

    Kömpelöä kielikuvaa käyttääkseni: katsot valmista ateriaa, mutta sekotat keskenään reseptin ja ostoslistan. Puhut ostoslistasta, mutta kädessäsi on resepti.

    JSON-tiedostossa siis kuvataan nodejen ja edgejen koko *sen jälkeen* kun ne on Gephissä visualisoitu ja käsitelty. Mainitsin tämän kyseisessä Facebook-keskustelussa, joten olisit voinut mainita sen täälläkin.

    Lisäksi, kuten samaisessa FB-keskustelussa ja itse jutussa mainitsin, appissa on todellakin toteutettu kovaakin valintaa, josta merkittävimpänä se, ettei kaikkein heikoimpia yhteyksiä visualisoitu lainkaan.

    Tältä osin kritiikkisi on ilman muuta aiheellista, mutta sen ei pitäisi kohdistua datan vääristymiin -- tämä on osaltasi väärinkäsitys -- vaan sen pitäisi kohdistua siihen tietoiseen valintaan jonka appia tehdessäni tein.
    Kuten FB-keskustelussa sanoin, syy tähän on se että visualisoinnista olisi tullut epäselvä harmaa pallo. Mielestäni journalistilla on velvollisuus myös pyrkiä selkeyteen ja siihen että lukija pystyy myös ymmärtämään lukemansa.

    Tein tällaisia valintoja sen vuoksi, että appin ei ollut lainkaan tarkoitus olla verkoston pääasiallinen visualisointikeino. Appin oli tarkoitus antaa lukijalle niin halutessaan mahdollisuus tutkiskella, missä asioissa etujärjestöt ja valiokunnat ovat keskenään tekemisissä. Sen ei siis ollut tarkoitus kuvata voimasuhteita sellaisenaan. Sen funktion toteuttivat juttupaketin muut visualisoinnit.

    Juttupaketin pääasialliset suhteita osoittavat visualisoinnit olivat lehdessä ja myös digitaalisesti esitellyt diagrammit.

    Summa summarum, kiitos ansiokkaasta ja varmasti myös aiheellisesta kritiikistä. Omasta mielestäni näyttää siltä että olet sekoittanut keskenään visualisointia koskevan kuvauksen ja varsinaisen datan.

    Varsinainen datahan on nyt saatavilla vapaasti eduskunnan sivuilta, kuten eduskunta ja myös minä itse olemme kertoneet.

    Myös olin ehkä epäselvästi ilmaissut, mikä appin funktio oli. Siis jos sinulle on siis syntynyt kuva, että sen pääasiallinen tarkoitus oli toimia verkoston voimasuhteiden representaationa.
    Appi noudattelee melko tarkasti näitä voimasuhteita, mutta sen pääasiallinen tarkoitus oli antaa Helsingin Sanomien lukijalle mahdollisuus tutustua niihin asiayhteyksiin, joita etujärjestöjen ja valiokuntien välillä on.

    VastaaPoista
  2. Kiitos kattavasta vastauksesta!

    Tosiaan en missään vaiheessa tarkoittanut tai edes mielestäni sanonut, että juttu olisi tehty analysoimani .json datan pohjalta. Yritän kokoajan puhua nimenomaan tästä verkostovisualisointitoteutuksesta, joka jutun yhteydessä julkaistiin. Tämän yritän tuoda heti alussa selväksi sanoessani:
    "Tähän kuitenkin loppuvat tällä erää kiitokset sillä haluan keskittyä muutamaan epäkohtaan, jotka havaitsin jutun verkkoversion yhteydessä julkaistusta verkostovisualisoinnista."

    Json-data on kuitenkin se, joka kuvaa visualisoidun verkoston ja jonka perusteella on se piirretty. Pahoittelut, etten tuonut tätä paremmin esille, mutta linkitin kyllä käymäämme keskusteluun useampaan kertaa eli ehkä kiinnostuneet ovat sen sieltä myös osanneet lukea.

    En yritäkään sanoa, että itse jutussa olisi asiavirheitä tai muutenkaan kommentoida jutun journalistista sitältöä vaan nimenomaan, että jutun yhteydessä julkaistu verkostovisualisointi ei noudattanut niitä verkostovisualisoinnin periaatteita, jotka minä olen mm. jatko-opinnoissani oppinut ja jotka olisivat mahdollistaneet minulle aineiston kattavan ja läpinäkyvän tutkimisen.

    Ja ymmärsin oikein hyvin, ettei kyseinen verkostovisualisointi kuvannut koko sitä dataa, jota olet analyyseissä käyttänyt enkä yritä väittää mitään muuta vaikka hieman toki provokatiivisesti aiheesta kirjoitinkin :), mutta tässä juuri lepääkin se ongelma. Esität jutun tueksesi dataa verkostovisualisoinnin keinoin, mutta visualisointi on toteutettu niin, että se tukee juttua eikä niin että juttu perustuu visualisoinnista tehtävään tulkintaan.

    Kuten sanot, ei tämä visualisointi ollut pääasiallisen visualisointikeino, jolla juttua haluttiin viedä eteenpäin ja sellaiseksi sen itsekin tulkitsin. Sen havaitsee siitä millä tavalla se jutussa tuotiin esille. Olen myös samaa mieltä, että ei ole järkeä julkaista sellaista sisältöä journalistisena joka ei ole lukijan ymmärrettävissä (toki tässä on sanottava, että minulla ei ole millään muotoa journalistista koulutusta).

    Nämä kaksi näkökulmaa pääasiattomuudesta ja luettavuudesta ovat kuitenkin mielestäni ristiriidassa. Olisi ollut mielestäni mielekkäämpää valita vain toinen lähestymiskulma eli joko tarjota lukijoille sellainen visualisointi joka kuvaa suhteita selkeällä tavalla joka on ymmärrettävä ja jättää kutsumatta toteutusta verkostovisualisoinniksi tai sitten olla rajoittamatta ja uudelleen määrittelemättä dataa luettavuuden ehdoilla ja jättää data sellaisten ihmisten analysoitavaksi ja tulkittavaksi jotka siihen pystyvät.

    Eli kun sanot, että:
    "Appin oli tarkoitus antaa lukijalle niin halutessaan mahdollisuus tutkiskella, missä asioissa etujärjestöt ja valiokunnat ovat keskenään tekemisissä."

    niin mielestäni toteutus ei täyttänyt tätä vaatimusta sellaisella tavalla ammattilaiselle eikä verkostovisualisointeihin harjaantumattomille, joka olisi ollut mielekäs.

    Ja huomiona vielä, että ei millään muotoa ole väärin rajata dataa, mutta mikäli näin tehdään tulisi visualisoinnin olla edelleen koherentti näihin rajauksiin perustuen ja tehdyt rajaukset tulisi olla hyvin selkestä esillä ja ne pitäisi pystyä perustelemaan. Näin siis ihan yleisesti ottamatta kantaa siihen tehtiinkö tässä tapauksessa niin.

    En ole huomannutkaan vielä tuota, että eduskunta on jo pistänyt tuon aineiston vapaasti saataville. Kiitettävän nopeaa toimintaa eduskunnalta ja kiitos sinulle, että olet saanut tällaisen aikaan! Ja kuten mainittua niin aivan loistavaa dataan perustuvaa journalistista sisältöä.

    VastaaPoista
  3. Kiitos asiallisesta kommentista.

    Tässä nyt ehkä vähän kaksi eri maailmaa kohtaa. Sinun toiveenasi verkostoanalyysejä jatko-opiskelleena (tietotekniikan ammattilaisena?) tuntuu olevan, että tekemäni appi kuvaisi etujärjestöjen ja eduskunnan välistä yli kymmentätuhatta yhteyttä sellaisenaan.

    Minun taas toimittajana olen halunnut tarjota lukijoille mahdollisuuden löytää heitä itseään kiinnostavia yhteyksiä ja asioita, jotka ovat suomalaisessa yhteiskunnassa merkityksellisiä.
    Olen yrittänyt tehdä tämän karsimalla kymmenien tuhansien yhteyksien sekametelistä samantekevät yhteydet pois. Se antaa mielestäni lukijalle paitsi selkeyttä, myös ylipäänsä mahdollisuuden tutustua ja kiinnostua.

    Myös olen tasapäistänyt valiokunnat, koska jutun päähuomio ei ole valiokuntien omassa aktiivisuudessa, vaan etujärjestöissä. Tämä tasapäistäminen osaltaan on tasoittanut etujärjestöjen keskinäisiä kokoeroja, mutta se lienee anteeksiannettavaa koska etujärjestöjen nokkimisjärjestys puolestaan on visualisoitu juttupaketin yhteydessä isommin.

    Ehkä tässä siis kohtaavat tutkijan ja toimittajan näkökulmat. Tutkijat tekevät arvokasta työtä, mutta se on eri työtä kuin toimittajan työ. Siitä toiminee osoituksena se, etteivät ihmiset lue tutkimuksia samaan tapaan kuin journalismia.

    VastaaPoista
  4. Kiitos vastauksesta.

    Oma taustani on puhtaasti tekninen, mutta vaikka tosiaan mainitsen, että olen opiskellut mm. verkostovisualisointeja jatko-opinnoissani ja olen lisäksi toiminut tutkijana lähestyin tätä kuitenkin enimmäkseen nykyisen toimenkuvani kautta eli ns. "datajournalistina".

    Tavoitteemme ovat yhteisiä. Myös minä toivoisin, että lukijoille tarjotaan sellaista sisältöä ja visualisointeja joiden perusteella esimerkiksi tässä he olisivat voineet löytää suomalaisessa yhteiskunnassa merkityksellisiä asioita. Tämä on mielestäni yksi dataan perustuvan journalismin keskeisiä mahdollisuuksia.

    Näkemykseni on kuitenkin, että tätä ei tueta sillä, että dataa ei esitetä "oikein". Nykyisellään visualisoinnin tulkinta tukee väärien johtopäätöksien tekemistä. En ole edelleenkään esimerkiksi ymmärtänyt miten EK:n ja Suomen Yrittäjien solmujen koko on sama? Mihin solmun koko perustuu? Miten valiokuntien "tasapäistäminen" on vaikuttanut muihin solmuihin?

    Ja kyllä, mieluummin olisin nähnyt koko verkoston sellaisenaan kun sillä tarkoitetaan sitä, ettei dataa olisi manipuloitu nykyisellä tavalla. En sano, että olisin verkostoa sellainakaan itse kuitenkaan julkaissut. Se miten itse olisin datan visualisoinut, että se olisi ollut samalla luettavampi ja matemaattisesti oikein on kuvattu bloginikirjoitukseni lopussa.

    Ja mielestäni tutkijan ja toimittajan näkökulmat eivät tulisi olla erit. Mielestäni kummankin tulisi esittää oikeata tietoa perustellusti lähteisiin viitaten mahdollisimman ymmärrettävässä muodossa omalle lukijakunnalle. Enkä kyllä oikein ymmärrä pointtia, että ihmiset lukisivat journalismia eri tapaan kuin tutkimuksia. Monet journalistiset julkaisuthan perustuvat tutkimustyöhön. Esimerkiksi itse olen julkaissut tutkimustyötäni lehdissä. Toisaalta datajournalismi häivyttää tätä rajaa vielä entuudestaan. Lähdekriittisyys ja se mikä on kunkin julkaisun sisällön odotusarvo toki vaihtelee.

    VastaaPoista
  5. Jatkan kiitoslinjalla ja kiitän tästä keskustelusta, mainiota ajatustenvaihtoa hyvistä käytännöistä, joiden määrittäminen ei ole lainkaan yksinkertaista.

    Lukijana arvostan kovasti applikaatiossa (http://dynamic.hs.fi/2013/eduskunta/) tehtyä karsintaa, itse asiassa olisin tykännyt paljon karsitummastakin, sillä nykyinenkin on niin raskas, että kynnys sen kaiveluun kasvaa tarpeettomasti.

    Jäin itse miettimään hybridimallia, jossa on journalistisin perustein valikoitu massalukijaystävällinen kerros, jolla pääsee nopeasti alkuun ja jonkin napin takaa löytyisi versio, jossa on kaikki data kiinnostuneille.

    Samaa lähteet sisältävää kerrosteita mallia olen tosin haaveillut tekstijuttuihinkin, mutta ehkä tällä saralla on paremmat toteutusmahdollisuudet.

    Esitysmuoto kun ei pakota valitsemaan kahden hyvin perustellun väliltä.

    VastaaPoista
    Vastaukset
    1. Kiitos kommentista,

      Tosiaan karsiminen ei ole millään muotoa väärin, mutta kuten on huomioitu tässä se karsinta ei ole tehty aivan verkostoanalyysin sääntöjen mukaisesti.

      Tosiaan suurempi karsinta olisi ehkä tuonut selkeyttä ja esimerkiksi olisi voinut olla hyvä rajata esimerkiksi kokonaan valiokunnat pois verkostosta jos verkoston lähtökohtainen tarkoitus oli esittää etenkin noita etujärjestöjä.

      Poista
  6. Ehkä paras kompromissi olisi tarjota jonkinlaiset filtterit, joilla itse lukija voi valita minkä verran tahtoo sitä dataa nähdä. Silloin voisi oletuksena lähteä pelkistetymmästä ulkonäöstä liikkeelle, mutta sitten zoomata lähemmäs siihen dataan ja saada näkyviin enemmän yksityiskohtia.

    Pääasia on siinä ettei pyritä tarjoamaan toimituksellista sisältöä liian tarkoitushakuisesti. Tilastojahan on tunnetusti ajoittain esitetty väärin ja harhaanjohtavasti (tarkoituksella tai vahingossa) niin kauan kun niitä on ollut olemassa.

    Tutkijan näkökulma ei itsessään eroa journalistin näkökulmasta. Kummatkin pyrkivät kertomaan todellisuudesta. Näkökulmaeroja voi olla painotuksissa ja näkökulma voi kääntää samasta asiasta tehdyt jutut täysin päinvastaisiksi. Kysymys onkin lähinnä siitä että tahdotaanko rehellisesti näyttää se että millä perusteella niitä uutisia tehdään.

    Ymmärrän kyllä kohtalaisesti toimituksellisen prosessin haasteista (ja kiireistä), mutta se ei saisi olla syy sille että pelätään julkaista ne "reseptit minkä perusteella kakku on tehty". On ollut mielenkiintoista nähdä miten esim. "Chicago Tribune News Applications Team" julkaisee avoimesti työkalujaan https://github.com/newsapps ja pyrkii tavalla tai toisella avaamaan http://www.chicagotribune.com/news/data/ lähdedataa, jos se vain on järkevällä vaivalla mahdollista. He ovat luoneet myös rajapintoja (esim. Chicago Crime API) joilla viranomaisten heikosti tarjoamia datoja voidaan helpommin hyödyntää.

    Esimerkkejä löytyy, mutta pääpointti taitaa olla siinä että kaikesta tekemisestä huolimatta ollaan Suomessa vielä aika lapsenkengissä siihen nähden mitä maailmalla on jo ehditty tekemään. Tärkeintä on kuitenkin että yritetään jatkuvasti kehittyä ja pystyä oppimaan myös kritiikistä. Jokainen tekee virheitä joskus. Myös toimittajat.

    VastaaPoista
    Vastaukset
    1. Moro Daniel,

      Usein kun puhutaan laajoista datamassoista tullaan usein tuohon keskusteluun, että julkaistaan koko data ja annetaan se kansalaisten selailtavaksi erilaisten käyttöliittymien avulla, joista he voivat sitten luoda itselleen uutta tietoa ja olla aktiivisia kansalaisia.

      Omien kokemuksieni perusteella tämä ei ole kuitenkaan itseisarvo johon aina tulisi pyrkiä vaan kannattaa jutun ohjata prosessia ja rakentaa tekniikka jutun ympärille. Usein tuntuu olevan hedelmällisempää tarjota lukijoille hyvin tiivis näkökulma yksittäiseen aiheeseen ja pyrkiä selittäämään se journalistisesti mahdollisimman kattavasti.

      Monimutkaiset datat esiintyvät ihmisille myös monimutkaisina ja silloin on journalismin tehtävä tehdä niistä ymmärrettäviä. Ymmärrettävyyttä ei yksin lisätä käyttöliittymien avulla vaikka ne kuinka avaisivat portit datan selailuun.

      Hyviä linkkejä nuo Chicago Tribunen aineistot. Kiitos niistä. Olet ilmeisesti viime aikoina ottanut ihan kattavasti haltuun datajournalismia maailmalta.

      Poista