maanantai 30. huhtikuuta 2012

Wappumusiikkien visualisointi

Tässä nopea päähänpistovisualisointi albumeista, jotka ovat olleet kuuntelussa viime Wappuina (2008 - 2012). Kuvissa näkyvät kuunneltujen albumien nimet, mahdollinen kuunteluformaatti sekä tieto onko albumista tykätty. Se, että albumi on kuunneltu tarkoittaa, että albumi on kuunneltu illan aikana alusta loppuun. Tiedot on kerätty Statster.info-verkkopalvelusta, joka tallentaa käyttäjän kuuntelemat albumit.

Kuvassa 1 illan 2008 kuuntelut.

Vuosi 2008. Klikkaa suuremmaksi. (Kuva 1)
Kuvassa 2 vuoden 2009 kuuntelut.

Vuosi 2009. Klikkaa suuremmaksi. (Kuva 2)
Kuvassa 3 vuoden 2010 kuuntelut.

Vuosi 2010. Klikkaa suuremmaksi. (Kuva 3)
Kuvassa 4 vuoden 2011 kuuntelut.

Vuosi 2011. Klikkaa suuremmaksi. (Kuva 4)
Ja kuvassa 5 tämän illan kuuntelut tähän asti.

Vuosi 2012. Klikkaa suuremmaksi. (Kuva 5)
Näillä tunnelmilla Hyvää ja iloista Wappua kaikille blogia seuraaville!

perjantai 13. huhtikuuta 2012

Verotietojen visualisointi

On taas aika vuodesta kun posti tuo koteihin veroilmoitukset. Sain omani tällä viikolla ja ajauduin visualisoimaan elämäni verotiedot.

Alkuun pieni disclaimer...


Tähän asti tässä blogissa on käsitelty ensisijaisesti erilaisia verkostovisualisointeja. Ne ovatkin mielenkiintoisia ja teknologiaseksikkäitä. On kuitenkin hyvä muistaa, että usein perinteinen viiva-, pylväs- tai piirakkadiagrammi on visualisointikeinona hyvin tehokas. Niiden etu on laaja tunnistettavuus ja siten niitä on lähtökohtaisesti helppoa lukea ja ymmärtää. Verkostovisualisointien tulkinta ja tiedon omaksuminen on usein jopa kaltaiselleni "ammattilaiselle" ongelmallista.

Toki visualisointimenetelmä ja käytetyt -komponentit tulee ensisijaisesti valita käyttötarkoituksen ja datan ehdoilla, mutta nyt itse asiaan.

Datan hankinta


Olen saanut veroilmoituksen vuodesta 2003 lähtien eli dataa on kertynyt vuoden 2011 veroilmoitus mukaan lukien yhdeksältä verovuodelta. Keräsin datan käsin paperisista veroilmoituksista, jotka olen kuuliaisena kansalaisena mappiin säilönyt. Totesin myös jälkikäteen, että näin oli tehtävä, koska vero.fi-verkkopalvelu pitää ilmeisesti sisällään vain viimeisimmän verovuoden tiedot. Datan kerääminen tuotti yllättävän paljon työtä, koska veroilmoitukset ovat vuosien saatossa muuttaneet muotoaan ja tämä teki datan siistimisestä ja yhtenäistämisestä vaivalloista.

Keräsin veroilmoituksista jokaiselle vuodelle seuraavat neljä lukuarvoa:
  • Palkkatulot
  • Etuudet
  • Ennakonpidätys
  • Pakolliset Eläke- ja työttömyysvakuutusmaksu
Kaksi edellä mainuttua ovat luonnollisesti tuloja ja kun kaksi jälkimmäistä ovat maksuja. Omat veroilmoitukseni ovat siis tähän asti koostuneet oikeastaan pelkästään näistä neljästä tiedosta. Datan tallensin suoraan visualisointikomponentin koodiin. Alla esimerkki datasta:

series: [{
  type: 'column',
  name: 'Palkka',
  data: [2473.38,96.9,0,0,2136.01,1034.99,21620.83,25169.36,29790.87]
}, {
  type: 'column',
  name: 'Etuudet',
  data: [774.92,984.24,2214.54,2214.54,2214.54,2362.7,0,0,0]
}]


Arvot syötin siis taulukkomuodossa ja ne kuvaavat tässä tapauksessa vuosikohtaisesti saatua palkkaa ja etuuksia euromääräisinä *.

Visualisointityökalun valinta


Visulisointikomponentiksi valitsin Highcharts-kirjaston. Highcharts on monipuolinen JavaScript-kirjasto, jolla on mahdollista tehdä monipuolisesti selaimessa toimivia diagrammeja. Etenkin kaksiulotteisten viiva- ja pylväsdiagrammien piirtäminen ovat Highchartsin vahvuus. Highchartsin vahvuus on myös, että se on riittävästi dokumentoitu ja etenkin, että käyttäjälle annetaan paljon valmiita esimerkkejä siitä miten kirjastoa voidaan käyttää. Oman toteutukseni pohjana käytin tätä loistavaa esimerkkiä, joten tehtäväkseni jäi pääasiassa pelkästään lukuarvojen muuttaminen halutuiksi.

Lopputulos ja yhteenveto


Highcharts osoittautui siis tehokkaaksi työkaluksi. Kirjaston sisäänrakennetut toiminnallisuudet tietojen osoittamiselle ja näytettävien tietojen valitsemiselle toimivat tehokkaana apuvälineenä tulosten tulkinnassa. Kuvassa 1 nähdään kaksi esimerkki kuvankaappausta, josta ylemmässä näkyvillä ovat kaikki tiedot ja alemmassa tiedoista esillä vain osa. On siis helppoa tarkastalla arvoja, jotka muuten peittyvät hallitsevimpien arvojen taakse. Koko visualisointi on saatavilla täällä *.

Highcharts-kirjasto tuottaa selainympäristössä toimivan visualisoinnin, joka reakoi käyttäjän toimiin. Käyttäjä voi mm. osoittaa haluamaansa datapistettä ja valita visualisointiin piirrettävät datajoukot. (Kuva 1)

Lopputulos ei toki datajournalisesti ole kovin "skuuppaava", koska kyse on vain yksittäisen henkilön verotiedoista, mutta se on erittäin kiinnostava näin egosentrisestä näkökulmasta. Esimerkiksi opintotuesta ja kesätöistä saatavien tulojen ero kokopäivätöistä saataviin tuloihin tulee tämän visualisoinnin kautta esille hyvin selkeästi (tulot näkyvät kuvassa 1 sinisellä viivalla). Lisäksi visualisoinnista nähdään miten kaltaiseni normaalin palkkatyöläisen veroprosentti on saavuttanut pääomatuloista maksettavan 28%:n suuruuden.

Voisin kuvitella kuitenkin, että tämänkaltainen visualisointi voisi olla monelle kiinnostava omien verotietojensa kannalta ja mieleen tulisi, että olisi hienoa jos jokaiselle suomalaisella olisi käytössään samankaltainen visualisointi esimerkiksi vero.fi-palvelussa *vink*.

En tällä kertaa tohtinut jakaa yksityiskohtaisia verotietojani kaiken kansan pällisteltäväksi, joten arvot on suolattu sattumanvaraisella korjauskertoimella.