(Jaký) má sběr dat o sobě smysl?

Sbírat o sobě nějaká data je nesmírně jednoduché. Kolik jste za den ušli kroků, vypili vody, utratili peněz nebo strávili času u počítače? Taková data mohou zaznamenat aplikace, případně si je můžete ručně zapisovat. Ale co s nimi?

Příznivci Quantified self[1] tvrdí, že data nám mohou pomoci odpovědět na otázky, které jsme si o sobě zatím nepoložili. Jenže kdy ty odpovědi (a otázky) přijdou? Špatná zpráva: pokud s nimi nijak nepracujeme, data k nám sama o sobě promlouvat nemohou a nebudou. Ani když jich máme opravdu hodně  – čím víc dat, tím více sebepoznání, sebereflexe ani jiného prospěchu bohužel neplatí.

Mít o sobě nějaká data je fajn. Nemůžeme se však tvářit, že nám k něčemu jsou, pokud je prostě jenom máme. Jistě, můžeme se pochválit, pochlubit se ostatním nebo se poměřovat s kamarády, kdo je lepší. Nic víc nám ale nepřinesou. Není to trochu málo? Ideální je mít už od začátku nějakou představu, co chceme s daty dělat. Proč je sbíráme? Co chceme zjistit? K čemu nám vhled do takových dat poslouží?

Možností, jaké otázky si ještě před samotným sběrem dat položit je celá řada. Například zda věnujeme čas, který prosedíme u počítače opravdu nějaké produktivní činnosti, ať už práci nebo učení, nebo každou chvilku nevědomky odbíháme k něčemu jinému. Jak je možné, že strávím u počítače celý den, ale nemám za sebou žádné výsledky? Kolik denně ujdu kroků – je to hodně nebo málo, pokud vím, že je doporučeno, aby dospělý člověk denně nachodil alespoň 10 000? Piju dostatek tekutin a rozkládám jejich příjem průběžně do celého dne? Kolik běžně vypiju kávy a prospívá mi to? Za co utrácím své peníze? Jsou nějaké oblasti, ve kterých mám zbytečné výdaje? Čím víc se budeme už na začátku ptát, tím víc nám data mohou prozradit.

fitbit dashboard

Fitbit dashboard (zdroj obrázku: http://www.odopod.com/assets/imgcache/images/fitbit-dashboard-odopod__70...)

Důležité je však také to, jak s takovými daty pracujeme. Postup, který zvolíme, se samozřejmě odvíjí od toho, co bychom chtěli zjistit. Obecně vzato však není potřeba žádných složitých datových kouzel – pro spousty základních analýz bohatě postačí tabulkový procesor a uživatelská znalost práce s ním. Je potřeba něco víc? Dá se sáhnout třeba po R[2] či jiných nástrojích – Google či diskuzní fóra[3] na webu Quantified self určitě dobře poradí.

Jenže! You can't tell if a book is any good by the number of words it contains, even though it's quite easy and direct to measure this. (Seth Godin) Co to znamená? Na špatné otázky sice taky dostaneme odpovědi, ty nám ale stejně nakonec nic neřeknou. Je tedy potřeba také trochu kritického přístupu. A v tom spočívá největší a nezásadnější otázka práce s daty – nejen těmi, která jsme si o sobě nasbírali, ale v podstatě s jakýmikoliv, a tou je PROČ. To je otázka, která by se měla linout celým procesem a je dobré mít ji stále na paměti. Proč vůbec nějaká data sbírám? Proč je analyzuji? Mám nějaký cíl, kterého chci dosáhnout? Mají mi v tom data nějak pomoci? Mohou mi data vůbec nějak pomoci? Chci zjistit něco konkrétního? Hledám souvislosti mezi více druhy dat?

Tady však narážíme na další problém. Jak moc takovým datům můžeme věřit? Research paper s názvem Accuracy of Smartphone Applications and Wearable Devices for Tracking Physical Activity Data, který vyšel v The Journal of the American Medical Association[4] (což vypadá jako důvěryhodný zdroj) tvrdí, že mezi různými zařízeními pro sledování počtu nachozených kroků nejsou žádné výrazné rozdíly v přesnosti, ať už jde o samostatná zařízení nebo mobilní aplikace. Pokud se však podíváme na metodologii, zjistíme hned několik problémů – například malý vzorek, krátká testovaná trasa, a zejména – v podstatě laboratorní podmínky. Sledování přesnosti měření na předem vytyčené trase je jedna věc, v praxi však přicházejí rozdíly mnohem větší. Různé aplikace a zařízení jsou totiž různě náchylné ke zkreslením, záleží na tom, jakým způsobem měří. Některým pořádně zamotá hlavu výpadek GPS signálu, u jiných po čase zjistíte, že jste ušli několik kilometrů po dálnici, protože otřesy dopravního prostředku vnímá měřící nástroj jako krok.

Co praktického z toho tedy plyne? Je potřeba se nad samotnými daty zamyslet. Nevrhnout se bezhlavě do hledání toho, co chceme najít, ale uvědomit si, že data mají pravděpodobně spousty chyb. Je důležité naučit se nejen chápat data, ale také chápat to, co samotné aplikace nechápou (a umět si tak vysvětlit ten neskutečný nepořádek, který vám v datech občas napáchají).

Odradilo vás to? Čím více nad daty přemýšlíte, tím spíše se dostanete zpět k fázi “pokývat hlavou a pochlubit se”. Což nemusí být nutně špatně, pokud zjistíte, že vám to k ničemu není. Data mají totiž právě takový smysl, jaký jim dáme. Samotná data nejsou pravda, ale práce s nimi může být hledání pravdy. Cestou můžeme pochopit víc než v cíli, kterého nakonec ani nemusíme úspěšně dosáhnout. Nebo nepotřebujeme.



Fotogalerie

Líbil se vám článek?
Stáhnout článek v PDF

1 komentář

Obrázek uživatele Anonym
Anonym
7. 9. 2015

Data o nás sbírá dost dobře už Google. Tady píšou co o nás big brother http://www.sprava-site.com/2015/09/07/jake-informace-o-vas-google-shroma...

Přidat komentář

(If you're a human, don't change the following field)
Your first name.
(If you're a human, don't change the following field)
Your first name.

Přečtěte si také

Přihlášení Registrace
RSS Facebook Twitter YouTube
Zobrazit standardní verzi webu

Taky děláme

Feedback