1. Úvod
Dublin Core. Pro někoho je to neznámý pojem, u jiného asociuje irské město a jen někdo tuší, co se pod tímto označením skrývá. Není to ani irské město, není to ani nový akronym sloužící pro značení moderních vícejádrových procesorů a nejedná se ani o jadernou fůzi či něco podobného. Dublin Core je standard pro metadatový popis digitálních objektů a jako takový se může týkat všech uživatelů internetu, digitálních knihoven a databází a elektronických dokumentů, se kterými miliony uživatelů dnes a denně pracují a mnohdy i nevědomky. Ve své eseji se budu zabývat právě oblastí týkající se Dublin Core, nejprve ve stručnosti popíšu, co se pod pojmem Dublin Core skrývá a jak jej lze využít. Ve druhé části se zaměřím na jednoduchý průzkum jeho reálného používání v praxi na webových stránkách vybraných informačních institucí, portálů a služeb.
2. Dublin Core
Dublin Core je, jak jsem již dříve uvedl, „...soubor metadatových prvků, jehož záměrem je usnadnit vyhledávání elektronických zdrojů. Původně byl vytvořen jako popis zdrojů na WWW sestavený přímo autorem, postupně ale zaujal instituce zabývající se formálním zpracováním zdrojů, jako jsou muzea, knihovny, vládní agentury a komerční organizace."[1] Název Dublin Core je odvozen od amerického města Dublin ve státě Ohio, kde se v roce 1995 konala první konference, kde byl tento standard ustaven. Dublin Core je zaštiťován The Dublin Core Metadata Initiative, což je organizace pod křídly OCLC, která má za úkol propagovat široké přijetí interoperabilních metadatových standardů a vyvíjet specializované metadatové slovníky pro popis zdrojů, jenž umožní dále rozvíjet vyhledávací informační systémy a procesy. OCLC je Online Computer Library Center, což je nezisková organizace zaměřená na poskytování knihovních služeb a výzkum v této oblasti. Dublin Core byl zařazen nadnárodními standardizačními organizacemi mezi standardy, konkrétně např. ISO Standard 15836 a NISO Standard Z39.85-2007. Dublin Core je rovněž součástí formátu Office Open XML, který je ve fázi procesu standardizace (ISO/IEC 29500).
2.1. Charakteristika Dublin Core
Jaký byl tedy důvod vzniku DC? S rozvojem internetu a masivním nástupem elektronických dokumentů bylo nutné tyto dokumenty (a obecně všechny digitální objekty) nějak popisovat za účelem jejich kvalitnějšího a jednoduššího pořádání. Toho lze s výhodou dosáhnout právě pomocí metadat, což jsou v podstatě data o datech. Tato metadata mají za úkol popisovat jiná data, v tomto případě data reprezentující digitální objekty. Metadata dávají digitálním objektům sémantický smysl.
Samozřejmě bylo vyvinuto a existuje mnoho různých metadatových standardů, které lze za tímto účelem použít, avšak náročnost jejich implementace, popis a struktura klade nemalé nároky na osoby a systémy, které je zpracovávají. Příkladem takového obsáhlého a komplikovaného standardu je metadatový formát MARC. Dublin Core byl a je odpovědí na tyto složité systémy, jeho primárním účelem je nabídnout jednoduchý standard napomáhající vyhledávání, sdílení a správu informací, jako jsou video, obrazové, zvukové a textové objekty a dokumenty a jejich kombinace (např. web stránky apod.).
Druhé slovo v pojmenování Dublin Core indikuje další vlastnost tohoto standardu, kterou se právě v době svého vzniku odlišoval od většiny jiných metadatových schémat. Core znamená jádro, ale také lze slovo core přeložit jako hlavní. Dublin Core se tedy nezabýval snahou popsat podrobně veškeré aspekty digitálního objektu pomocí velkého množství metadatových termínů, ale zaměřil se pouze na ty nejdůležitější, které tvoří právě ono jádro a které jsou typické pro všechny typy digitálních dokumentů, ať už reprezentují obrazová data, zvuková data, textová data a nebo jejich kombinaci. Základní sada metadatových termínů čítá pouhých patnáct elementů.
Mezi klíčové charakteristiky Dublin Core lze tedy právem zařadit tyto vlastnosti[2]:
- § jednoduchost - systém je navržen tak, aby jej mohla používat veřejnost i specialisté
- § sémantická interoperabilita - DC nabízí jednotný popis objektů napříč Internetem bez závislosti na použité platformě, vědního oboru či disciplíny
- § mezinárodní konsensus - standard je prosazován v mnoha zemích celého světa i v prostředí globální počítačové sítě
- § rozšiřitelnost - DC lze rozšiřovat dle individuálních potřeb, je umožněno používat i komplikovanější sémantiku či strukturu popisu
- § modifikovatelnost - základní sada prvků je přesně definovaná, avšak lze ji pomocí kvalifikátorů dále rozšiřovat tak, aby uspokojila nároky a potřeby všech uživatelů
2.2. Metadatové prvky
Metadatové schéma Dublin Core se skládá z 15 základních elementů (prvků). Pomocí těchto prvků lze vyjádřit (popsat) většinu hlavních údajů v kterémkoli typu dokumentu:
|
Anglicky |
Česky |
Popis |
|
Title |
Název |
Jméno dané zdroji. |
|
Creator |
Tvůrce |
Entita primárně odpovědná za vytvoření obsahu zdroje. |
|
Subject |
Předmět |
Téma obsahu zdroje. |
|
Description |
Popis |
Vysvětlení obsahu zdroje. |
|
Publisher |
Vydavatel |
Entita zodpovědná za zpřístupnění zdroje. |
|
Contributor |
Přispěvatel |
Entita, která přispěla k obsahu zdroje. |
|
Date |
Datum |
Datum události, která se vyskytla během existence zdroje. |
|
Type |
Typ |
Povaha nebo žánr (druh) obsahu zdroje. |
|
Format |
Formát |
Fyzické nebo digitální provedení zdroje. |
|
Identifier |
Identifikátor |
Jednoznačný odkaz na zdroj v rámci daného kontextu. |
|
Source |
Zdroj |
Odkaz na zdroj, ze kterého je popisovaný zdroj odvozen. |
|
Language |
Jazyk |
Jazyk intelektuálního obsahu zdroje. |
|
Relation |
Vztah |
Odkaz na příbuzný zdroj. |
|
Coverage |
Pokrytí |
Rozsah nebo záběr obsahu zdroje. |
|
Rights |
Práva |
Informace o právech vztahujících se k popisovanému zdroji. |
Prvky se mohou libovolně opakovat. Žádný z těchto prvků není povinný. Výše uvedené prvky lze využívat libovolně a nezáleží ani na jejich pořadí, je však dána jejich přesná sémantika. DCMI publikovala standardy a řízené slovníky termínů, podle kterých se doporučuje jednotlivé prvky přesněji specifikovat, od nich je pak odvozen tzv. kvalifikovaný Dublin Core, který popisuji v další kapitole.
Uživatelé, resp. tvůrci digitálních dokumentů tedy mohou využívat DC pro sémantický popis svých dokumentů, webových stránek a dalších digitálních objektů, aniž by museli být experty na věcný popis dokumentů nebo aniž by museli složitě a dlouze studovat jiné metody a standardy sloužící k těmto účelům.
Metadata Dublin Core se typicky vyjadřují prostřednictvím RDF (Resource Description Framework) nebo XML (eXtensible Markup Language) a nebo pomocí meta a link elementů v kódu HTML/XHTML (HyperText Markup Language / eXtensible HyperText Markup Language).
XML je obecný značkovací jazyk, který byl vyvinut a standardizován konsorciem W3C. Umožňuje snadné vytváření konkrétních značkovacích jazyků pro různé účely a široké spektrum různých typů dat.
RDF je rovněž vytvořeno konsorciem W3C a jedná se o skupinu standardů navržených pro datové modely metadat.
2.3. Kvalifikovaný Dublin Core
Volnost, kterou jednoduchý Dublin Core přinesl, se v některých případech ukázala jako prvek, který je příliš zobecňující. Bylo potřeba v některých případech blíže specifikovat obsah jednotlivých elementů DC, dát jim jakási pravidla. S tímto záměrem byl uveden tzv. kvalifikovaný Dublin Core. Kvalifikovaný Dublin Core vychází z původního, ale je navíc doplněn o údaj, který zpřesňuje význam hodnoty prvku pomocí kvalifikátoru.
Existují dvě množiny kvalifikátorů, první z nich pomáhá se specifikací a interpretací hodnoty prvku - typicky se jedná např. o řízené slovníky. Ukažme si praktický příklad: element Subject (Předmět) je takovým typickým prvkem, kde se mohou řízené slovníky využívat, pro předmětový popis digitálního objektu lze například využít řízeného slovníku (tezauru) LCSH a v elementu Subject používat termíny jen z tohoto slovníku.
Druhou množinou kvalifikátorů jsou ty, které zpřesňují či omezují význam jednotlivých prvků, ale nerozšiřují je. Opět praktický příklad: element Date (Datum) může být kvalifikátorem zpřesněn tak, že datum je vyjádřeno v předem definovaném formátu, nebo element Language (Jazyk) může být v souladu se standardem ISO 639 pro jazyky.
Mimo to ještě existují kvalifikátory vlastních prvků. Například prvek Description (Popis) lze kvalifikovat jako Description.Abstract nebo Description.Table Of Content atd. Nebo prvek Date (Datum) lze kvalifikovat na Date.Created, Date.Revised atd.
Důležitou vlastností kvalifikovaného Dublin Core je to, že pokud kvalifikátor (resp. jeho kvalifikační schéma) není čitelná pro stroj (aplikaci), hodnota elementu může být stále čitelná člověkem.
2.4. Příklad zápisu DC v HTML
Následující ukázka[3] zobrazuje příklad zápisu kvalifikovaného Dublin Core v HTML kódu. Jsou použity jak kvalifikátory prvků (např. Creator, Subject), tak i kvalifikátory hodnot prvků (např. Date kvalifikovaný dle ISO8601 nebo prvek Language kvalifikovaný dle ISO639-1).
<HTML>
<HEAD>
...[TITLE = název dokumentu]...
<meta
name="DC.Date" content="(SCHEME=ISO8601) 2001-04-15">
<meta name="DC.Title" content ="Obecná pravidla pro používání
Nástroje pro tvorbu metadat Dublin Core">
<meta name="DC.Creator" content="Celbová, Ludmila">
<meta name="DC.Creator.Address" content="ludmila.celbova@nkp.cz">
<meta name="DC.Creator" content="Celbová, Iva">
<meta name="DC.Creator.Address"
content="iva.celbova@nkp.cz">
<meta name="DC.Subject.keyword" content="Dublin Core,
metadata, instrukce">
<meta name="DC.Type" content="text, metodické
příručky">
<meta name="DC.Identifier" content="(SCHEME=URL)
http://www.webarchiv.cz/generator/dc_locale/cz/n...
<meta name="DC.Language" content="(SCHEME=ISO.639-1)
cs">
</HEAD>
<BODY>
...[text dokumentu]...
</HTML>
Vzhledem k tomu, že veškeré prvky DC jsou libovolné, je doporučeno používat jako minimum následující skupinu prvků pro popis internetového zdroje (objektu, dokumentu):
TITLE (NÁZEV)
CREATOR (TVŮRCE)
SUBJECT (PŘEDMĚT)
PUBLISHER (VYDAVATEL)
IDENTIFIER (IDENTIFIKÁTOR)
2.5. Nástroje pro generování metadat Dublin Core
K dispozici je mnoho různých nástrojů pro práci s metadaty Dublin Core, které by měly uspokojit různé zájmy a potřeby z řad autorů, správců a uživatelů. Na webu DCMI jsou uvedeny některé z nich, jedná se především o pomůcky pro integraci DC metadat do dalších aplikací, šablony pro tvorbu metadat a jejich úpravu, software pro jejich extrakci a shromažďování (sklízení metadat), konvertory mezi metadatovými formáty, aplikace pro jejich automatické vytváření.
Na adrese http://www.webarchiv.cz/generator/dc.php je dostupný český generátor metadatových záznamů Dublin Core, který je zdarma k dispozici pro všechny zájemce. Vytvořená metadata lze ukládat do formátů HTML, XML a RDF.
3. Průzkum využívání Dublin Core v praxi
V předchozích kapitolách jsme se dozvěděli, že existuje jednoduchý a široce akceptovaný standard pro metadatový popis digitálních objektů, dokumentů a webových stránek, který za dobu své existence měl šanci zaujmout tvůrce a správce informací tak, aby jej aktivně využívali a pracovali s ním. Tomu by mělo odpovídat i jeho zařazení mezi obecně přijímané standardy ISO, NISO, W3C apod. Tato skutečnost mne přivedla na myšlenku provést jednoduchý průzkum zaměřený na praktické využívání Dublin Core na internetových stránkách. Jelikož u zrodu DC byli aktivně účastni kromě informatiků také knihovníci a další informační pracovníci a právě knihovníkům a knihovnám by měla být problematika Dublin Core známá a blízká, svůj cíl jsem volil se zaměřením na knihovny a příbuzné instituce. Webová stránka je digitální objekt (resp. dokument), tudíž cílem mého průzkumu je zjistit, v jakém rozsahu je rozšířeno používání metadat Dublin Core pro popis webových stránek vybraných knihoven, institucí a nejnavštěvovanějších stránek (webů) na českém Internetu.
3.1. Metodika průzkumu
Do prohlížeče Mozilla Firefox verze 3.0 jsem nainstaloval doplněk Dublin Core Viewer 0.6.[4] Tento doplněk umožňuje přehledně prohlížet Dublin Core metadata právě zobrazované webové stránky, pokud nějaké stránka obsahuje.
Vybral jsem náhodně 30 knihoven v České republice a postupně jsem si zobrazoval jejich webové stránky. Zaměřil jsem se vždy pouze na první - úvodní - web stránku knihovny. Pokud webová stránka obsahovala nějaká DC metadata, instalovaný doplněk mi je umožnil zobrazit.
Dále jsem si postupně zobrazil v prohlížeči 11 nejnavštěvovanějších web stránek v České Republice. Údaje o návštěvnosti byly převzaty ze statistik NetMonitor za květen 2008.[5] Typicky se jedná o portály nebo média. Pokud statistiky NetMonitoru uváděly více stránek (služeb), které jsou zastřešeny jedním portálem, byla brána v potaz pouze primární stránka tohoto portálu (např. firmy.cz patří pod seznam.cz, v potaz jsem tedy bral pouze seznam.cz). Opět jsem se zaměřil jen na úvodní stránky.
Nakonec jsem náhodně vybral 5 webových stránek, které tvoří jakýsi mix - zastupují odlišné obory a zaměření. Jejich úvodní stránky byly rovněž podrobeny průzkumu.
3.2. Výsledky průzkumu
Následující tabulka zobrazuje seznam webových stránek, které byly předmětem průzkumu a výsledek, zda stránky obsahují metadata Dublin Core - alespoň jeden prvek (řazeno abecedně ve skupinách):
| Název | URL | DC |
|---|---|---|
| Centrum informačních a knihovnických služeb VŠE | http://ciks.vse.cz/ | X |
| Jihočeská vědecká knihovna | http://www.cbvk.cz/ | X |
| Knihovna Akademie věd ČR | http://www.lib.cas.cz/cs | X |
| Knihovna Jiřího Mahena v Brně | http://www.kjm.cz/ | X |
| Knihovna města Hradce Králové | http://www.knihovnahk.cz/ | X |
| Knihovna města Olomouce | http://www.kmol.cz/ | X |
| Knihovna města Ostravy | http://www.kmo.cz/ | X |
| Knihovna města Plzně | http://www.kmp.plzen-city.cz/ | X |
| Knihovna Národního muzea | http://www.nm.cz/knihovna-nm/ | X |
| Knihovna Neziskovky.cz | http://neziskovky.cz/cz/infosluzby/knihovna/ | ANO |
|
Knihovna UPM |
X |
|
|
Krajská knihovna Karlovy Vary |
X |
|
|
Krajská knihovna v Pardubicích |
X |
|
|
Krajská vědecká knihovna v Liberci |
X |
|
|
Krajská knihovna Františka Bartoše |
ANO |
|
|
Městská knihovna Benešov |
X |
|
|
Městská knihovna v Novém Jičíně |
ANO |
|
|
Městská knihovna v Praze |
X |
|
|
Městská knihovna v Semilech |
X |
|
|
Moravská zemská knihovna v Brně |
X |
|
|
Moravskoslezská vědecká knihovna v Ostravě |
X |
|
|
Národní knihovna ČR |
X |
|
|
Národní lékařská knihovna |
X |
|
|
Parlamentní knihovna |
ANO |
|
|
Regionální knihovna Teplice |
X |
|
|
Státní technická knihovna |
X |
|
|
Studijní a vědecká knihovna v Hradci Králové |
X |
|
|
Ústřední knihovna FF MU |
X |
|
|
Ústřední knihovna VŠB-TU |
X |
|
|
Ústřední knihovna VUT |
X |
|
|
aktualne.cz |
X |
|
|
atlas.cz |
X |
|
|
aukro.cz |
X |
|
|
blog.cz |
X |
|
|
centrum.cz |
X |
|
|
iDNES.cz |
X |
|
|
nova.cz |
X |
|
|
novinky.cz |
X |
|
|
seznam.cz |
X |
|
|
stream.cz |
X |
|
|
super.cz |
X |
|
|
|
X |
|
|
Inflow.cz |
X |
|
|
Jednotná informační brána |
X |
|
|
Lupa |
ANO |
|
|
Portál veřejné správy ČR |
ANO |
Z celkem 46 zkoumaných webových stránek jich pouze 6 obsahuje alespoň jeden metadatový prvek Dublin Core.
Následující část přináší bližší pohled na stránky, které DC metadata obsahují. Na obrázcích jsou vždy zobrazeny výstupy z doplňku Dublin Core Viewer:
1) Knihovna Neziskovky.cz

Tento web knihovny využívá všech možností, které DC nabízí, jsou použity kvalifikátory prvků i jejich hodnot. Knihovna Neziskovky.cz mne velmi příjemně překvapila a měla by si od ní vzít příklad většina ostatních knihoven.
2) Krajská knihovna Františka Bartoše

Zlínská knihovna využívá o něco jednodušší kvalifikovaný Dublin Core než v předchozím případě, jsou použity jen kvalifikátory hodnoty prvků, ale obsah metadat je zcela dostatečný. Opět lze doporučit ostatním knihovnám jako příklad.
3) Městská knihovna v Novém Jičíně

Je využito pouze jediného prvku DC metadat - prvek language (jazyk). Mohu konstatovat, že zde je použití DC naprosto nedostatečné.
4) Parlamentní knihovna

Parlamentní knihovna příjemně překvapila, na její webové stránce je využíváno kvalifikovaného Dublin Core v dostatečné míře (využito kvalifikátorů prvků i hodnot).
5) Lupa - Server o českém Internetu

Tak jako v případě novojičínské knihovny je využito pouze jediného prvku metadat, tentokrát jde o prvek identifier (identifikátor), jehož obsahem je ISSN tohoto periodika. Opět naprosto nedostatečné využití DC.
6) Portál veřejné správy ČR

Veřejná správa opět překvapila a to ve velmi pozitivním slova smyslu. Na stránkách je používán Dublin Core v širokém rozsahu. Kvalifikovaná metadata podrobně popisují dokument - webovou stránku. Kvalifikovány jsou jak prvky tak i jejich hodnoty. Tento web může sloužit jako etalon pro většinu ostatních.
4. Závěr
Dublin Core je silný metadatový nástroj, který lze využívat v běžné praxi každým uživatelem, a to velmi snadným způsobem. K dispozici je několik aplikací, které jeho využití podporují a ještě více usnadňují. Uživatelé a instituce, ve smyslu tvůrců, autorů a správců, jeho využíváním velmi zjednoduší přístup a zpracování svých dokumentů a digitálních objektů v prostředí Internetu a digitálních knihoven či databází.
Průzkum však ukázal tristní stav využívání DC v současných webových stránkách. Ze 46 zkoumaných webů jich pouze 6 obsahuje alespoň jeden metadatový element, přičemž z těchto šesti jsou smysluplné jen čtyři webové stránky, u kterých metadata obsahují dostatečné spektrum informací. Zarážející je tento fakt zejména u knihoven, kde by se dalo předpokládat využívání DC na vyšší úrovni, než u ostatních subjektů. Pochvalu si jistě zaslouží zkoumaný vzorek webů státní správy, kde je plně využito možností DC. Nejnavštěvovanější weby a portály v ČR naopak vůbec nevyužívají potenciálu metadat Dublin Core.
5. Použité zdroje a literatura
1. About OCLC [OCLC - Home] [online]. OCLC, c2008 [cit. 2008-07-17]. Dostupný z WWW: <http://www.oclc.org/us/en/about/default.htm>.
2. BARTOŠEK, Miroslav. Vyhledávání v Internetu a DUBLIN CORE. Zpravodaj ÚVT MU[online]. 1999, roč. 9, č. 4[cit. 2006-02-15], s. 1-4. Dostupný z WWW: <http://www.ics.muni.cz/zpravodaj/articles/153.html >. ISSN 1212-0901
3. CELBOVÁ, Ludmila. Dublin Core Metadata Element Set : Stručný návod k použití s příklady. Praha : Národní knihovna ČR, 2003. 14 s. Dostupný z WWW: <http://www.webarchiv.cz/files/dokumenty/reference/navodDC.pdf>.
4. Doplněk Dublin Core Viewer :: Doplňky aplikace Firefox [online]. Mozilla, c2005-2008 [cit. 2008-07-17]. Dostupný z WWW: <https://addons.mozilla.org/cs/firefox/addon/528>.
5. Dublin Core [online]. Wikipedia, 2008 , 19 June 2008 [cit. 2008-07-16]. Dostupný z WWW: <http://en.wikipedia.org/wiki/Dublin_Core>.
6. Dublin Core : Czech [online]. [2000] , 26. února 2000 [cit. 2008-07-16]. Dostupný z WWW: <http://www.ics.muni.cz/dublin_core/index.html>.
7. Dublin Core Metadata Iniciative [online]. c1995-2008 , 17 July 2008 [cit. 2008-07-16]. Dostupný z WWW: <http://dublincore.org/>.
8. Generátor metadat Dublin Core [online]. [2007] [cit. 2008-07-17]. Dostupný z WWW: <http://www.webarchiv.cz/generator/dc.php>.
9. ISO 15836:2003 : Information and documentation - The Dublin Core metadata element set [online]. ISO, c2008 [cit. 2008-07-16]. Dostupný z WWW: <http://www.iso.org/iso/iso_catalogue/catalogue_tc/catalogue_detail.htm?csnumber=37629>.
10. Měsíční zpráva - Květen 2008 : Výzkum návštěvnosti internetu v České Republice. [s.l.] : SPIR - NetMonitor, 2008. 12 s. Dostupný z WWW: <http://netmonitor.cz/outputs/2008_05_NetMonitor_offline_report.xls>.
11. NISO Standards [online]. National Information Standards Organization, c2008 , 19 Mar 2008 [cit. 2008-07-16]. Dostupný z WWW: <http://www.niso.org/kst/reports/standards?step=2&gid=&project_key=9b7bffcd2daeca6198b4ee5a848f9beec2f600e5>.
12. Obecná pravidla pro používání Nástroje pro tvorbu metadat Dublin Core [online]. 2007 [cit. 2008-07-16]. Dostupný z WWW: <http://www.webarchiv.cz/generator/dc_locale/cz/napoveda/obecnapravidla.html>.
[1] Dublin Core : Czech [online].
[2] Volně dle Dublin Core : Czech [online].
[3] Převzato z Obecná pravidla pro používání Nástroje pro tvorbu metadat Dublin Core [online].
[4] Dostupný na URL: https://addons.mozilla.org/cs/firefox/addon/528
[5] Dostupný na URL: http://netmonitor.cz/outputs/2008_05_NetMonitor_...
















Poslední komentáře
před 13 hod 4 min
před 1 týden 1 den
před 1 týden 1 den
před 1 týden 4 dny
před 1 týden 5 dnů
před 1 týden 5 dnů
před 1 týden 6 dnů
před 1 týden 6 dnů