torstai 12. heinäkuuta 2012

Hjälp Calle!

Viime perjantaina tein yhteistyössä Svenska YLE uutisten:n kanssa joukkoistus/verkkokysely -kokeilun, jonka tarkoituksena oli kerätä tietoa kansalaisilta siitä minkälaista linjaa uuden puolustusministerimme Carl Haglund:n tulisi politiikassaan ajaa.

Lomakkeen toteutus


Toteutimme kyselyn Google Form -työkalulla, joka löytyy yhtenä komponenttina Google Drive -palvelusta. Google Form:lla on mahdollista helposti ja nopeasti tuottaa yksinkertaisia kyselykaavakkeita, joissa on erilaisia komponentteja. Esimerkiksi valintalaatikko, vapaatekstikenttä, pudotusvalikko ja muut tavalliset lomakkeiden komponentit ovat käytettävissä. Monimutkaisempia ehdollisia kyselylomakkeita, jotka mukautuvat käyttäjän valintojen mukaan, ei työkalulla kuitenkaan ymmärrykseni mukaan ole mahdollista toteuttaa.

Kyselymme sisälsi viisi toimittajan valitsemaa kysymystä, joissa kussakin oli kaksi vastausvaihtoehtoa, joten Google Form toimi tarkoitukseemme hyvin (Kuva 1). Myöskin käytettävissä ollut aika ja resurssit puolsivat Google Form:n kaltaisen valmiin työkalun käyttämistä. Käytännössä koko juttu toteutettiin tekniseltä osuudeltaan vajaassa tunnissa.

Google Form on usein riittävän monipuolinen työkalu kyselylomakkeiden toteuttamiseen. (Kuva 1)

Laajempana tarkoituksenamme oli myös kokeilla tämänkaltaisen journalismin toimivuutta. Erilaiset joukkoistusprojektit ovat ottaneet yhä suurempaa roolia eri mediataloissa ja ne tuntuvat myös kiinnostavan ihmisiä. Joukkoistamisen voima piilee siinä, että onnistuessaan ne sitouttavat ihmisiä, joka vaikuttaa positiivisesti sisältöjen kulutukseen.

Datan visualisoinnit


Google Form toimii periaatteessa Google Spreadsheet -työkalun (taulukkolaskentaohjelma) päällä, joten vastausdatan visualisoinnissa voidaan hyödyntää samoja visualisointikomponentteja, jotka ovat käytössä myös tehtäessä normaalia taulukkolaskentaa. Vaihtoehdoista löytyy siis mm. piirakka-, viiva- ja pylväsdiagrammit, joihin data syötetään taulukkolaskentaohjelmistoista tutulla tavalla määrittelemällä solut, joista data on saatavilla.

Google Form kerää datan taulukkoon tekstimuotoisena, joten jotta datan syöttäminen visualisointikomponentteihin onnistuu tulee kerätty data muuntaa numeeriseen muotoon. Tämä on suhteellisen helppoa, koska käytössä ovat tutut taulukkolaskentafunktiot, joten seuraavankaltaisella käskyllä kerätty data on mahdollista koostaa lukuarvoiksi:

=COUNTIF(B2:B2592, "Gör en gir åt höger")

Käsky laskee B-sarakkeesta löytyvien "Gör en gir åt höger" -vastausten lukumäärän. Vastaavalla tavalla kyseinen kaava voidaan kirjoittaa myös toiselle vastausvaihtoehdolle, jolloin näihin perustuen on esimerkiksi mahdollista piirtää piirakkadiagrammi (Kuva 2). Kaikki yksittäisten kysymysten tulokset ovat nähtävissä alkuperäisestä artikkelista.

Google Form:n keräämä data on mahdollista visualisoida ja jakaa kuvana tai interaktiisena toteutuksena. (Kuva 2)

Kysely keräsi hyvin vastauksia ja maanantaina kun kysely oli ollut avoinna perjantaista viikonlopun yli oli vastauksia kertynyt n. 500kpl:tta (lopulta 594 vastausta). Minulla oli mielenkiintona selvittää minkälaista korrelaatiota kysymysten väliltä oli löydettävissä. Entuudestaan minulle on tuttu käsite rinnakkaiskoordinaatistoista, mutta usein tähän ajattelutapaan perustuvat toteutukset vaativat käyttöönsä numeerista dataa. Meidän tapauksessamme data oli periaatteessa mahdollista kuvata numeerisesti antamalla vastausvaihtoehdoille numeeriset vastineet, mutta tämä olisi tuonut mukanaan ylimääräistä kompleksisuutta.

Löysin kuitenkin D3.js:n sivuilta esimerkin, jossa kuvattiin Titanic:n matkustajien kategorisia ominaisuuksia rinnakkaiskoordinaatistossa. Otin tämän esimerkkitoteutuksen oman analyysini pohjaksi ja sainkin melko nopeasti vaihdettua datan haluamaani (Kuva 3).

Vastausdatan esittäminen rinnakkaiskoordinaatistossa paljastaa vastausrivien keskinäisen suosituimmuuden. (Kuva 3)

Intekaktiivinen versio visualisoinnista on käytettävissä täällä ja vastausdata on ladattavissa .csv-muodossa siitä kiinnostuneille. Visualisoinnista nähdään, että vastausrivi:
  1. Gör en gir åt höger
  2. Stoppa pengaflödet från städerna till landsbygden
  3. Gör SFP till ett sant tvåspråkigt parti
  4. Se till att snuset blir lagligt
  5. Flytta utbildningen till Obbnäs och gör det till ett tvåspråkigt truppförband
oli selkeästi suosituin vastaajien keskuudessa keräten jopa 33% kaikista vastauksista. Seuraavaksi suosituin vastausrivi sai 9%:n suosion. Mahdollisia vastausvaihtoehtorivejä tämänkaltaisessa viiden kysymyksen kyselyssä on 2^5 eli 32 kappaletta. Toisinsanoen sattunnaisjakaumassa yksittäisen vastausrivin suosio tulisi olla 1/32 eli n. 3%:a. Selkeästi siis vastanneiden keskuudesta löytyy yhteisiä mielipiteitä kyseessä olleisiin aiheisiin.

Emme kuitenkaan lähteneet viemään uutisoinnissa tulosten arviointia näin pitkälle, koska Google Form:ssa kuten ei kyselyissä yleensäkään ole kovin helppoa varmistua, ettei tuloksia ole manipuloitu vastaamalla useita kertoja. Tuloksista kirjoitettiin kyllä juttu, mutta siihen ei otettu mukaan esimerkiksi tätä vastausten korrelaatiota esittävää visualisointia, koska sen nähtiin esittävän asia liian pelkistetysti.

Journalismissa on usein vaarallista väittää asioita, joille ei ole mahdollista määritellä yksikäsitteisesti lähdettä. Gallup-kyselyiden tapauksessa pidetään huolta, että yksittäinen vastaaja voi vaikuttaa kyselyyn vain kerran, mutta Google Form:lla toteutussa Internetlomakekyselyssä yksittäiset henkilöt pystyvät vääristämään helposti tuloksia, joka täytyy ottaa huomioon johtopäätöksiä tehtäessä.Loppukaneettina sanottakoon, että koimme tämän positiivisena kokeiluna ja tulemme oletettavasti tekemään vastaavanlaisia adhoc-tyyppisiä joukkoistusprojekteja myös tulevaisuudessa.

Tässä viestissä jaetut datasetit ovat lisensoitu Nimeä-Tarttuva (CC BY-SA).

Ei kommentteja:

Lähetä kommentti