perjantai 28. syyskuuta 2012

Naistutka 2000 – minne naiset menneet on?

Viikolla eksyin keskusteluun, jossa yhtenä argumenttina esiin nousi, että datajournalismista tulisi tehdä kansantajuista ja suosittua. Ratkaisumalliksi ongelmaan ehdotimme, että datajournalismin tulisi käsitellä seksiä tavalla tai toisella, koska se tunnetusti myy.

Ihan siihen ei nyt vielä päästä, mutta tässä jokaiselle opiskelupaikkakuntaansa pohtivalle nuorelle miehelle (sexism intended) työkalu, joka tekee valinnasta helppoa. (Kuva 1)

Antakaa minun esitellä....

Naistutka 2000
  – minne naiset menneet on?

Naistutka 2000 kertoo, että naisia on etelän suurissa keskuksissa. Kaupungeissa on kuitenkin eroja. (Kuva 1)
Yleisestihän meillä Suomessa on ihan hyvä tilanne, koska naisia on yli 100 000 miehiä enemmän. Tämä johtuu osittain naisten pidemmästä odotetusta eliniästä. Naisilla 0-vuotiaan ennakollinen elinajanodote on tällä hetkellä 83,2 ja miehillä 76,7 vuotta. (Lähde)

Päivitys 29.9.2012

Sottungassa tilanne on optimaalisin sillä sadan ihmisen kunnassa on tasan 50 naista ja 50 miestä. Kyseessä on muuten myös asukasluvultaan Suomen pienin kunta. Ilmeisesti pienessä kunnassa asiat on helpompi järjestää kuntoon asian osalta. Sottungan alapuolelle sijoittuu Jalasjärvi ja yläpuolelle Siilinjärvi missä naisia siis on juuri ja juuri enemmän kuin miehiä.

Kommenteissa on toivottu siviilisääty sekä ikäjakauman tietojen lisäämistä visualisointiin. Jääköön nähtäväksi jos nämäkin tiedot kävelisivät vastaan jossain vaiheessa. Toki olisi hieman ikävää huomata parikymppisenä, että pääosa naisvaltaisuudesta koostuu oman ikähaitarin ulkopuoltelta tai pelkästään jo parisuhteessa elävistä vastakkaisen (tai saman) sukupuolen ihmisistä.

Data visualisointiin löytyi väestörekisterikeskukselta ja tiedot on päivitetty 31.8. Käyttämäni .csv-muotoinen data, jossa on laskettu suhdeluvut, on ladattavissa Dropbox-palvelusta.

lauantai 22. syyskuuta 2012

Bensan hinta, no sehän kiinnostaa meitä ~kaikkia!

Heräsin aamulla aikaisin tukkoisuuteen – hieman nuhaa tuntuu olevan liikkeella – ja aloin selailemaan Amppareita puhelimellani. Silmiini osui Taloussanomien artikkeli: "Suomessako kallis bensa – näin kurjaa on muualla". Sinänsä räväkästi otsikoitu artikkeli ja ihan kiinnostava avata, koska yleinen näkemyshän on, että etenkin me Suomessa maksamme polttoaineesta todella paljon. Lisäksi itsellänikin on auto ja joskus jopa tykkään tankata sitä.

Sinällään en juttua jaksanut kovin tarkkaan lukea, mutta mielenkiintoni kohdistui artikkelin yhteydessä julkaistuun taulukkodataan, jossa esitetään jutussa hyödynnetyt EU-maiden keskimääräiset polttoaineiden hinnat ajankohdalta 16.7. ja 17.9. sekä E95-polttoaineen kuin myös dieselin osalta. (Kuva 1)

Taloussanomien julkaisema taulukkodata on desimaaleineen vaikeasti tulkittava. (Kuva 1)
Ajattelin, että tämähän on hienoa kuten se onkin. Ongelma vain on, että julkaistu taulukkomuotoinen data on todella epäinformatiivinen ja vaikealukuinen. Huomasin kerta toisensa jälkeen tavaavani mitä eri sarakkeet oikeastaan tarkoittavatkaan ja mitkä luvut ovat keskenään vertailukelpoisia. Esimerkiksi taulukon tapa esittää data ei-kronologisessa järjestyksessä on todella aivojani niksauttava. Jokainen ensisilmäys taulukkoon näyttäytyy minulle, että hinnat olisivat järjestäen tippuneet valitulla kahden kuukauden tarkkailujaksolla. Toiseksi se, että polttoainetyyppien vertailuarvot eivät ole taulukossa vierekkäin vaikeuttaa tulkitsemista.

Nämä ovat helposti korjattavissa olevia asioita. Kyseisen taulukossa on kuitenkin myös muita ongelmia. Toteutustapa ei esimerkiksi mahdollista sarakkeiden uudelleenjärjestelyä, jotta lukijan olisi mahdollista helposti tarkistaa missä muutos on esimerkiksi E95-polttoaineen hinnassa on ollut pienintä ja suurinta. Dataa ei ole myöskään sivustolta mahdollistaa tallentaa suoraan Excel-muodossa omalle koneelle missä tarkempi aineiston tutkiminen olisi mahdollista. Tavallisen käyttäjän työkalupakkiin ei kuulu sisällön maalaaminen www-sivulta ja sen kopioiminen käytettävissä olevaan taulukkolaskentaohjelmistoon.

Ylipäänsä taulukkomuotoisen datan lukeminen on vaikeaa. Numerot alkavat hyppiä silmille ja eikä datan julkaiseminen mielestäni ole tässä muodossa tarkoituksenmukaista. On erinomaista toimintaa Taloussanomilta jakaa sivujensa kautta jutussa hyödynnetty raakadata, mutta kyseinen data olisi ollut mielekkäämpää julkaista puettuna interaktiiviseksi visualisoinniksi. Mieleen tulee kaksi hyvin ilmeistä tapaa visualisoida kyseessä oleva data.

Ensinnäkin data voitaisiin esittää pylväsdiagrammina, joka järjestää maat annetun attribuutin mukaan suurimmasta pieninpään. Tämän kaltainen diagrammi havainnoi lukijalle helpolla tavalla datan olemuksen. Missä polttoaine on halvinta, missä kalleinta ja mikä on todellinen absoluuttinen ero näiden välillä. Taulukkomuotoisesta datasta suurimman ja toiseksi suurimman arvon etsiminen on vielä helppoa, mutta sen hahmottaminen miten nämä arvot suhteutuvat muihin data-alkioihin onkin vaikeampaa.

Toiseksi, koska kyse on spatiaalisesta, valtioita koskevasta, datasta olisi arvot mielenkiintoista nähdä Euroopan kartalle piirrettynä. Visualisointi voisi paljastaa esimerkiksi trendejä Etelä- ja Pohjois-Euroopan hintojen välillä. Nykyinen taulukkoesitystapa ei tämänkaltaista analyysiä tue, koska keskivertokansalainen – ja tällä tarkoitan itseäni – ei osaa edes absoluuttisesti sijoittaa datassa olevia maita Eurooppaan.

Mitä asialle voidaan tehdä. Kello on nyt 11:00. Aloitan työt....

...11:34 pylväsdiagrammi on valmis (Kuva 2).

Visualisoinnista voimme helposti lukea miten polttoaineen hinta Suomessa on Euroopan kärkiluokkaa, mutta hinnan kasvu on ollut muuta Eurooppa hitaampaa. (Kuva 2)
Kuvassa 2 olevasta diagrammista ja sen takaa avautuvasta interaktiivisesta visualisoinnista on helppo nähdä missä Euroopan maassa polttoaineen hinta on korkein ja millä tavalla tilanne on muuttunut valitun tarkastelujakson aikana. Interaktiivisesta visualisoinnista on mahdollista valita tarkasteluun haluttu attribuutti (E95-polttoaineen hinta tai dieselin hinta valituilla tarkastelupisteillä sekä muutos näille molemmille).

Mielestäni tämänkaltainen visualisointi olisi antanut juttuun aivan erilaista lisäarvoa nykyiseen taulukkoesitykseen verrattuna. Lisäksi se, että datalla on nyt mahdollista "leikkiä" pidentää lukijan vierailuaikaa sivustolla, joka taas näyttäytyy hyvältä tuloksellisesta näkökulmasta. Näen hyvin selkeästi, että tämänkaltaisten interaktiivisten datan esitystapojen on pakko tulla osaksi verkkomediaa ja ne näyttäytyvät tulevaisuudessa todellisina kilpailuvaltteina suhteessa kilpailijoihin.

Päivitetty: 22. syyskuuta 19:30

Kuvassa 3 näemme saman polttoaineenhintadatan piirrettynä Euroopan kartalle. Kuten nähdään on lopputulos visuaalisesti hyvin miellyttävä ja pelinomainen. Etenkin naapurivaltioiden ja muutenkin valtioiden lähialueiden eroja on kartasta helppo vertailla. Esimerkiksi on helppo nähdä, että Ruotsissa polttoaine on meitä kalliimpaa, mutta meillä hinnan nousu taas on ollut suurempaa.

Kartasta nähdään mm. kuinka Baltianmaissa polttoaine on Euroopan tasolla huokeaa. (Kuva 3)
Karttavisualisoinnin tekemiseen meni muutama tunti, koska minulla ei ollut valmista Euroopan karttapohjaa vaan jouduin tekemään sellaisen mallista.

Nyt sitten vain odottamaan Taloussanomien yhteydenottoa ja isoja rahoja.</sarkasmi>

Ps. Kartta näyttää Euroopan bensahinnat uudella tavalla