Data ze sociálně-vědných výzkumů a datové archivy

3. 1. 2013

Příloha č. 1/2013

Autorka přílohy: Lucie Kořistková

Liveblogging najdete jako obvykle v Blogu z Bloku.


ČSDA je národní centrum, které zpřístupňuje datové soubory ze sociálních výzkumů v elektronické podobě  pro nekomerční výzkum a pro využití při výuce na vysokých školách. Funkcí ČSDA je kromě jiného akvizice, archivace a zpřístupňování dat, podpora velkých mezinárodních výzkumů. Dále vytváří přednášky na podporu využití dat a hlavně se snaží podpořit využití datových souborů tím, že je zpřístupňují veřejnosti.

Tomáš Čížek - Data ze sociálně-vědních výzkumů a datové archivy from KISK on Vimeo.

 

Datový archiv

Datový archiv je vytvářen z několika částí:

  • Depozitáře - tím jsou myšleny tvůrci dat do datového archívu. Jsou to např. výzkumné projekty, které jsou odporované z veřejných zdrojů, státní administrativa, oficiální statistiky či komerční výzkumné organizace.
  • Datový archiv - místo uložení dat; zabezpečení dat, akvizice, dokumentace.
  • Uživatelé - kteří pak základní data z výzkumů využívají.

Proč datový archiv?

Vytváření datových archivů je pozitivní hned v několika směrech. Především je to úspora nákladů pro sekundární výzkumy, snadněji se tak časově i prostorově srovnává a lépe se tak „kontroluje" věda. Navíc existuje směrnice OECD (Organisation for Economic Co-operation and Development), která doporučuje data sdílet, aby byla maximálně využita. Navazuje na tzv. otevřený přístup v publikování.

 

Omezení datových archivů

ČSDA pracuje s kvalitativními a kvantitativními daty. U kvalitativních dat je omezení kvůli ochraně osobních dat. Musí se opatrně zacházet s citlivými údaji, jako jsou jména, otázky bydliště, náboženské otázky, atd. U kvantitativních výzkumů osobní data nejsou - stačí jen případně odstranit jména, přičemž výzkum nám to nijak neohrozí. Omezené jsou také údaje ohrožující obchodní tajemství, duševní vlastnictví, či které jsou v zájmu národní bezpečnosti. Také díky přístupu v elektronické podobě je zde omezení z technické stránky.

 

Historie datových archivů

První datové archívy vznikají v 60. letech 20. století. Jedním z prvních byl UK Data archive, který zabezpečoval sčítání lidu. Největším archívem v Evropě byl Zentralarchiv. V roce 1998 vznikl český Sociologický datový archív, který se později přejmenoval na Český sociálně-vědný datový archiv (ČSDA).

 

Současné datové archivy

V současné době existuje velké množství datových archivů, které mezi sebou většinou spolupracují. Vzniklo jejich sdružení - CESSDA - Evropské sdružení datových archivů.


Známé projekty jsou:

  • Data českého statistického úřadu - nezapojuje se do spolupráce s velkými datovými archivy, má vlastní databázi (http://www.czso.cz/).

Technické řešení datových archivů

DDI (Data Documentation Initiative)
DDI je mezinárodní projekt, který vytvořil standard pro popis informací statistických a sociálně-vědných dat. Dokáže popsat výzkum naprosto dokonale; lze popsat až desítky informací a je založen na XML. Neustále se vyvíjí.


NESSTAR
Nesstar je konkrétní příklad programu, přes který se uživatel může dostat do samotné databáze ČSDA. Využívá právě DDI k vyhledávání. Je to komerční platforma, kterou vyvinul norský archiv.

Nesstar je složen z několika částí:

  • Server - místo, kde jsou uložena data.
  • Program Publisher - nástroj pro převod datových souborů do Nesstaru.
  • Nesstar Webview - program k nahlížení či stahování datových souborů do PC.

Nesstar je program, který se využívá ve většině datových archivů. Jeho nevýhodou je ale pomalé vyhledávání a občasné zasekávání.

 

ČSDA prakticky

ČSDA pracuje s platformou Nesstar, do které lze vstoupit přes http://nesstar.soc.cas.cz/webview/ . Díky němu se dostaneme do vyhledávání ve dvou částech, ze kterých je datový archív vytvořen - ČSDA a Medard.


Můžeme v něm procházet jakékoliv výzkumy; otevírat otázky, sledovat odpovědi - např. výzkumy veřejného mínění, které proběhly od roku 1989. Zajímavé jsou např. volební preference či názory politiků. S těmito daty lze provádět různé statistické procesy (korelační a regresivní analýzy), můžeme je exportovat do PDF či Excelu, díky DDI je zde dobrá možnost vyhledávání. Pokud však chceme data přímo stahovat do PC, je zde nutná registrace, při které uživatelům přijde poštou smlouva, která se uzavírá mezi archívem a uživatelem, aby se zamezilo zneužití dat.

 

MEDARD

Medard je knihovna kvalitativních dat, která je provozována taktéž ČSDA. Oproti kvantitativním datům v ČSDA má Medard jeden velký problém - otázku ochrany osobních údajů. Zde jdou data více do hloubky tématu, je nutný souhlas respondenta při následném publikování v elektronickém archívu. Prakticky je to složitá situace, protože by se měla vytvářet smlouva mezi sociologem a dotazovaným, ale v praxi se nedělá.
Materiály jsou zde v různých formátech, a tak se otevírá otázka dlouhodobého uchovávání dat. Některé soubory již nejdou otevřít a je potřeba se této problematice věnovat hlouběji.
Financování Medardu probíhá prostřednictvím grantových agentur či veřejných rozpočtů.

Zdroj titulního obrázku: http://archiv.soc.cas.cz/articles/cz/1/O-ARCHIVU.html.  

Fotogalerie

V kategorii: InHD
Štítky: Inflow magazín
Líbil se vám článek?
Stáhnout článek v PDF

1 komentář

Obrázek uživatele Anonym
Anonym
6. 7. 2019

The article is very nice, https://tikban.com/%D8%B3%D8%A7%D9%85%D8%A7%D9%86%D9%87-%D8%B1%D8%B2%D8%B1%D9%88-%D9%87%D8%AA%D9%84 thank you for sharing it! I'm not fully through yet (it is extremely long) https://tikban.com/%D8%B3%D8%A7%DB%8C%D8%AA-%D8%B1%D8%B2%D8%B1%D9%88-%D9%87%D8%AA%D9%84 but it seems well researched and detailed.

Přidat komentář

Přečtěte si také

Přihlášení Registrace
RSS Facebook Twitter YouTube
Zobrazit standardní verzi webu

Taky děláme

Feedback