Alkuun pieni disclaimer...
Tähän asti tässä blogissa on käsitelty ensisijaisesti erilaisia verkostovisualisointeja. Ne ovatkin mielenkiintoisia ja teknologiaseksikkäitä. On kuitenkin hyvä muistaa, että usein perinteinen viiva-, pylväs- tai piirakkadiagrammi on visualisointikeinona hyvin tehokas. Niiden etu on laaja tunnistettavuus ja siten niitä on lähtökohtaisesti helppoa lukea ja ymmärtää. Verkostovisualisointien tulkinta ja tiedon omaksuminen on usein jopa kaltaiselleni "ammattilaiselle" ongelmallista.
Toki visualisointimenetelmä ja käytetyt -komponentit tulee ensisijaisesti valita käyttötarkoituksen ja datan ehdoilla, mutta nyt itse asiaan.
Datan hankinta
Olen saanut veroilmoituksen vuodesta 2003 lähtien eli dataa on kertynyt vuoden 2011 veroilmoitus mukaan lukien yhdeksältä verovuodelta. Keräsin datan käsin paperisista veroilmoituksista, jotka olen kuuliaisena kansalaisena mappiin säilönyt. Totesin myös jälkikäteen, että näin oli tehtävä, koska vero.fi-verkkopalvelu pitää ilmeisesti sisällään vain viimeisimmän verovuoden tiedot. Datan kerääminen tuotti yllättävän paljon työtä, koska veroilmoitukset ovat vuosien saatossa muuttaneet muotoaan ja tämä teki datan siistimisestä ja yhtenäistämisestä vaivalloista.
Keräsin veroilmoituksista jokaiselle vuodelle seuraavat neljä lukuarvoa:
- Palkkatulot
- Etuudet
- Ennakonpidätys
- Pakolliset Eläke- ja työttömyysvakuutusmaksu
series: [{
type: 'column',
name: 'Palkka',
data: [2473.38,96.9,0,0,2136.01,1034.99,21620.83,25169.36,29790.87]
}, {
type: 'column',
name: 'Etuudet',
data: [774.92,984.24,2214.54,2214.54,2214.54,2362.7,0,0,0]
}]
Arvot syötin siis taulukkomuodossa ja ne kuvaavat tässä tapauksessa vuosikohtaisesti saatua palkkaa ja etuuksia euromääräisinä *.
Visualisointityökalun valinta
Visulisointikomponentiksi valitsin Highcharts-kirjaston. Highcharts on monipuolinen JavaScript-kirjasto, jolla on mahdollista tehdä monipuolisesti selaimessa toimivia diagrammeja. Etenkin kaksiulotteisten viiva- ja pylväsdiagrammien piirtäminen ovat Highchartsin vahvuus. Highchartsin vahvuus on myös, että se on riittävästi dokumentoitu ja etenkin, että käyttäjälle annetaan paljon valmiita esimerkkejä siitä miten kirjastoa voidaan käyttää. Oman toteutukseni pohjana käytin tätä loistavaa esimerkkiä, joten tehtäväkseni jäi pääasiassa pelkästään lukuarvojen muuttaminen halutuiksi.
Lopputulos ja yhteenveto
Highcharts osoittautui siis tehokkaaksi työkaluksi. Kirjaston sisäänrakennetut toiminnallisuudet tietojen osoittamiselle ja näytettävien tietojen valitsemiselle toimivat tehokkaana apuvälineenä tulosten tulkinnassa. Kuvassa 1 nähdään kaksi esimerkki kuvankaappausta, josta ylemmässä näkyvillä ovat kaikki tiedot ja alemmassa tiedoista esillä vain osa. On siis helppoa tarkastalla arvoja, jotka muuten peittyvät hallitsevimpien arvojen taakse. Koko visualisointi on saatavilla täällä *.
Lopputulos ei toki datajournalisesti ole kovin "skuuppaava", koska kyse on vain yksittäisen henkilön verotiedoista, mutta se on erittäin kiinnostava näin egosentrisestä näkökulmasta. Esimerkiksi opintotuesta ja kesätöistä saatavien tulojen ero kokopäivätöistä saataviin tuloihin tulee tämän visualisoinnin kautta esille hyvin selkeästi (tulot näkyvät kuvassa 1 sinisellä viivalla). Lisäksi visualisoinnista nähdään miten kaltaiseni normaalin palkkatyöläisen veroprosentti on saavuttanut pääomatuloista maksettavan 28%:n suuruuden.
Voisin kuvitella kuitenkin, että tämänkaltainen visualisointi voisi olla monelle kiinnostava omien verotietojensa kannalta ja mieleen tulisi, että olisi hienoa jos jokaiselle suomalaisella olisi käytössään samankaltainen visualisointi esimerkiksi vero.fi-palvelussa *vink*.
* En tällä kertaa tohtinut jakaa yksityiskohtaisia verotietojani kaiken kansan pällisteltäväksi, joten arvot on suolattu sattumanvaraisella korjauskertoimella.
Hieno homma! Kävin heti vinkkaamassa Veronleimaus -blogiin http://blogit.ts.fi/veronleimaus/2012/04/10/on-taas-aika-tarkistaa-veroilmoitus/
VastaaPoista