Cíle a vymezení projektu
Cílem projektu bylo vytvořit online databázi konferencí spojených s oborem Informační studia a knihovnictví a rovněž i příbuzných oborů, jelikož v současné době neexistuje žádný významný portál či databáze, která by se snažila tuto oblast mapovat a zpracovávat v širším pojetí aniž by byla nějak jednostranně zaměřena, případně aniž by se jednalo o čistě nekomerční produkt. Databáze má být zaměřena především na významnější a mezinárodní konference pořádané v roce 2008 v České republice, Slovensku, Polsku, Rakousku, Německu. Zahrnuty však mohou být i další významné konference pořádané po celém světě. Cílovou skupinou uživatelů databáze jsou všichni, kteří hledají informace o pořádaných konferencích především v Evropě a které se alespoň vzdáleně týkají informační vědy a knihovnictví a ti uživatelé, jenž nechtějí komplikovaně shánět informace z mnoha rozdílných a mnohdy těžko dosažitelných informačních zdrojů.
Technologické a funkční cíle
Databáze a její veřejné webové rozhraní má nabízet uživatelsky přístupnou praktickou formu pro vyhledávání a procházení konferencí a poskytnout přehledné a na jednom místě dostupné požadované informace o konferencích. Uživatelé tak budou moci prohledávat databázi např. dle zemí a regionů, dle časových kritérií, dle jednotlivých oborů (či multioborově) apod. Systém má být navržen od samého počátku jako otevřený pro budoucí možná rozšíření a přidávání nových funkcí a má využívat volně dostupná řešení jako svůj technologický základ. Samozřejmostí by měla být možnost multijazyčného prostředí rozhraní databáze, pro první verzi je předpokládána anglická a česká jazyková mutace. Webové rozhraní a jednotlivé záznamy o konferencích by měly být SEO optimalizovány pro vyhledávače, tzn. že jednotlivé odkazy a adresy by měly být srozumitelné a čitelné vyhledávači ale i uživateli a měly by být permanentní.
Mezi základní funkce a nástroje databáze konferencí budou tedy patřit:
- hierarchické třídění oborů smožností procházení (katalog)
- možnost procházení konferencí podle zemí konání
- kalendář probíhajících konferencí smožností procházení
- vyhledávání (fulltextové, časové, místo konání, klíčová slova, atd.)
- vícejazyčné rozhraní
- registrace uživatele a stím související personalizace obsahu
Vymezení oborů
Jelikož obor informační vědy a knihovnictví přesahuje do dalších oborů, bylo potřeba vymezit, jaké konkrétní obory kromě vlastní informační vědy a knihovnictví budou nejprve v projektu mapovány. Jako základ bylo využito vymezení souvisejících oborů dle prof. Cejpka[1]:
A - Filozofie, přírodní a humanitní vědy a vědy interdisciplinární zabývající se informací z různých hledisek, např. neurofyziologie a neuropatologie, psychologie, pedagogika, andragogika, kulturologie, antropologie, sociologie, kybernetika, systémové teorie apod.
B - Informatika a computer science (= široká množina oborů spadající do této skupiny)
C - Aplikovaná informační věda (zde zahrnujeme i knihovnictví)
D - Teoretická informační věda
Konkrétní výčet oborů, které jsou v tomto okamžiku v databázi zahrnuty, jsou uvedeny níže.
Vymezení evidovaných údajů
Ke každé konferenci mají být v databázi vedeny minimálně tyto údaje:
- název
- pořadatel
- země a místo konání
- zaměření / obor
- termín konání
- anotace
- odkaz na webové stránky pořadatele
- kontakty na pořadatele
Konkrétní výčet údajů, které jsou v tomto okamžiku v databázi zahrnuty, jsou uvedeny níže.
Provázanost s časopisem Inflow
Databáze konferencí bude na internetu prezentována jako samostatná a nezávislá sekce časopisu Inflow[2] (např. s adresou konference.inflow.cz), přičemž bude využit rámcový design tohoto časopisu. Oba projekty mohou tak navzájem využívat synergický efekt, který toto spojení přinese. V budoucnu může jít např. o obohacení záznamu konference o odkaz na článek či zápis z konference, které byly v časopise Inflow uveřejněny.
Technologické řešení databáze
Pro realizaci databáze a webového rozhraní byl vybrán open source content management systém (CMS) Drupal[3]. Jeho instalace je provozována na webserveru Apache, databáze je MySQL a jako skriptovací jazyk je použit PHP. Celý systém je provozován na platformě Linux OS.
CMS
Drupal byl zvolen jako CMS pro realizaci online databáze konferencí. Jedná se o velmi populární a rozšířený CMS, který je vyvíjen open source komunitou a má širokou uživatelskou a vývojářskou základnu. Tento CMS je založen na modulární architektuře a umožňuje tak ke svému jádru přidávat množství různých funkčních modulů a tak lze snadno rozšiřovat jeho funkcionalitu o nové nástroje a možnosti. Počty nabízených modulů se pohybují řádově ve stovkách, což umožňuje uspokojit téměř jakýkoli požadavek na realizaci jednotlivých projektů. Samozřejmostí je multijazyková podpora, dodržování webových standardů, skinovatelnost prostředí, definice uživatelských rolí a práv, pokročilá správa obsahu a také automatická syndikace obsahu přes RSS. Dalším argumentem pro výběr tohoto systému je fakt, že na shodném CMS je provozován i časopis Inflow. To bude moct v budoucnu snížit požadavky na administraci, jelikož oba systémy mohou být integrovány v jeden celek, který lze spravovat dohromady. Příklad realizované úvodní stránky databáze konferencí v Drupalu viz příloha 1.
Správa uživatelů
V systému databáze konferencí bylo vytvořeno několik uživatelských rolí tak, aby byly uspokojeny požadavky na správu uživatelů. V první řadě je to nejvyšší role administrátora, který má plná práva a kontrolu nad všemi funkcemi systému. Další rolí jsou redaktoři, kteří mají oprávnění vkládat nový obsah - záznamy o konferencích a případně upravovat již stávající záznamy. Kromě toho mohou zakládat nové ankety a psát články. Další skupinou jsou registrovaní uživatelé, kteří si mohou zakládat vlastní personalizované stránky nazvané Má databáze a rovněž mohou přispívat do komentářů a hlasovat v anketách. Nakonec to jsou neregistrovaní uživatelé, kteří mohou systém používat pro vyhledávání a procházení konferencí.
Pořádání informací o konferencích
Při návrhu databáze bylo nutné se zabývat pořádáním zpracovávaných informací. Jako nejvýhodnější řešení se ukázalo vytvoření jednoho řízeného slovníku - tezauru a dvou klasifikačních schémat. Pro klasifikaci bylo vytvořeno hierarchické schéma, které dělí záznamy o konferencích dle zemí, ve kterých se daná konference pořádá. Schéma zahrnuje světadíly a v nich hierarchicky řazené jednotlivé státy. Při vkládání konference redaktor vždy vybírá patřičnou zemi z tohoto klasifikačního schématu. Jako druhé klasifikační schéma byly zvoleny primární jazyky, ve kterých je daná konference pořádána. Redaktor může danému záznamu přidělit více než jeden jazyk. Toto schéma je jednoúrovňové. Poslední, avšak neméně důležitý, je tezaurus vědních oborů a témat, kterými se konference zabývají. Tezaurus umožňuje při indexaci přidělování více řízených termínů jedné konkrétní konferenci. Je použita induktivní metoda, tzn. že slovník je vytvářen za pochodu a termíny jsou přidávány tak, jak jsou vkládány nové záznamy o konferencích. Tezaurus tak umožňuje zachycení více specifičtějších témat. Pro tvorbu tezauru je striktně využíváno databáze autorit Národní knihovny ČR. Za správnost indexace je odpovědný redaktor daného záznamu.
Použité moduly
V databázi konferencí jsou použity mimo jiné i následující moduly, které je vhodné podrobněji zmínit (řazeno abecedně):
-
Captcha
Slouží pro odfiltrování spamu a nevyžádaných strojových přístupů zejména za účelem masového šíření reklamy, pokusů o útoky na systém, zakládání fiktivních uživatelů apod. Modul je použit při registraci nových uživatelů a může být nasazen kdekoli je ho v systému potřeba (např. i v komentářích). Příklad viz příloha 2.
-
CCK
Tento balík modulů slouží administrátorům pro úpravu a definici nových typů obsahu a polí. Byl použit zejména pro úpravu modulu Event tak, aby modul splňoval požadavky na evidenci konferencí.
-
Comment
Umožňuje uživatelům komentovat příspěvky. Funkce komentářů je dostupná pouze registrovaným uživatelům a je aktivní pouze u některých typů příspěvků.
-
Event
Modul Event byl použit jako základní stavební prvek pro zpracovávání záznamů o konferencích. Modul umožňuje evidovat události v čase včetně jejich periodicity. Velkou výhodou je interaktivní kalendář, který umí zobrazovat události a procházet mezi nimi, dále nabízí i další formy zobrazení událostí, v našem případě konferencí. Tento modul byl upraven pomocí CCK tak, aby vyhovoval potřebě zaznamenávat konference a vést u nich požadované údaje.
-
MySite
Umožňuje uživatelům personalizovat si obsah na databázi konferencí a vytvářet si tak vlastní osobní stránky (nazvané Má databáze), kde se jim zobrazují jen konference a příspěvky, které je zajímají. Dále si mohou zvolit vlastní layout a barevné schéma databáze, které jim vyhovuje. Použití modulu v projektu databáze konferencí si vyžádalo jeho lokalizaci do českého jazyka. Příklad viz příloha 3.
-
Pathauto
Modul zajišťuje automatické generování adres a odkazů tak, aby splňovaly zásady SEO a byly tak čitelné nejen pro vyhledávače ale i běžné uživatele.
-
Poll
Modul pro vytváření uživatelských anket. Administrátoři a redaktoři mohou vytvářet ankety, na které pak mohou uživatelé odpovídat. Data získaná v anketách mohou být například použita pro zlepšení a integraci nových funkcí, které si uživatelé žádají apod. Jako příklad této funkce byla vytvořena anketa, která se ptá uživatelů na to, jak se jim databáze konferencí líbí. Příklad viz příloha 4.
-
Search
Povoluje uživatelům vyhledávat obsah dle klíčových slov a dalších kritérií, jedná se o hlavní modul, pomocí kterého uživatelé mohou vyhledávat záznamy o konferencích. Modul vyhledává pomocí vnitřního indexu obsahu a také pomocí klíčových slov, které jsou v našem případě definovány námi vytvořenou taxonomií. Příklad viz příloha 5.
-
Statistics
Modul slouží pro generování a zaznamenávání statistiky přístupů a jeho funkce slouží především administrátorům a redaktorům pro sledování návštěvnosti uživatelů, popularity stránek, záznamů, vytížení systému, atd. Příklad viz příloha 6.
-
Taxonomy
Tento velmi důležitý modul poskytuje kategorizaci obsahu, tzn. vytváření vlastních řízených slovníků - tezaurů a klasifikačních schémat, které obsahují hierarchicky řazené termíny, jenž jsou pak následně použity pro pořádání vkládaných záznamů o konferencích, jejich vyhledávání a procházení pomocí klíčových slov (viz samostatná kapitola výše).
-
TaxonomyDHTML
Modul v databázi slouží k dynamickému zobrazování hierarchie oborů, států a jazyků, ve kterých jsou konference pořádány. Uživatel tak může pomocí tohoto modulu procházet záznamy tak, jako by se jednalo o webový katalog. Příklad viz příloha 7.
-
Views
Tento modul umožňuje vytvářet specifické náhledy na obsah. Modul je použit pro zobrazování některých typů informací v požadovaném formátu.
Grafické rozhraní
Pro prvotní verzi online databáze bylo použito standardní grafické rozhraní CMS Drupal s názvem Garland. Pro tuto verzi nebyla uvažována tvorba vlastního grafického designu, naopak předpokládá se ve velmi krátkém čase nasazení již existujícího designu z časopisu Inflow, pouze s mírnými úpravami. Do systému byl pro ověření základní kompatibility pokusně importován stávající grafický vzhled Inflow bez jakýchkoli úprav - příklad viz příloha 8. Výsledkem je pozitivní zjištění, že stávající grafický design Inflow lze implementovat po mírných změnách CSS šablon i do databáze konferencí. Změny v designu je nutno učinit ve spolupráci s tvůrci Inflow a jsou odhadovány na cca 1 den práce.
Dostupnost na Internetu
Pilotní verze databáze je dostupná na testovací adrese. Tato adresa je v tuto chvíli neveřejná, bude sdělena pouze na vyžádání v odůvodněných případech. Tato verze obsahuje plnou, zde popisovanou funkcionalitu a kompletní validní data. Po dokončení implementace grafického rozhraní převzatého z Inflow se předpokládá, že projekt bude jednoduše a rychle integrován do společné domény inflow.cz a bude přesunut na profesionální webhostingovou službu, zajišťující spolehlivý provoz.
Problematika akvizice informací
Postupy získávání dat
Akvizice vstupních informací o pořádaných konferencích je jedním z klíčových procesů při zpracování dat. Důležitý je zejména výběr informačních zdrojů a postupy, z nichž některé se ukázaly být méně vhodné a jiné zase naopak.
Nejprve jsme se pokusili oslovit dopisem (e-mail) s požadavky na získání přístupu k informačním zdrojům o konferencích v primárních zemích významné organizace a instituce, jako jsou národní a velké knihovny, univerzity na nichž se vyučuje obor ISK včetně univerzitních knihoven apod. Ačkoli jsme vyzkoušeli varianty, kdy byl dopis formulován jako soukromá žádost, tak i dopis, ve kterém jsme se zaštítili Filozofickou fakultou a kabinetem ISK Masarykovy univerzity, odpovědi byly převážně negativní. V mnoha případech na dopis nebylo vůbec reagováno, případně byl dopis rovnou odmítnut, nebo byla přislíbena odpověď, které se nám již nedostalo. V několika ojedinělých případech (Bayerische Staatsbibliothek, univerzitní knihovna ve Vídni, Slovenská národná knižnica v Martine) nám byly poskytnuty odkazy na zdroje, ze kterých se dalo čerpat. Tento postup se tedy ukázal jako nesprávný, přinesl pouze minimální počet konferencí.
Dalším krokem, který jsme učinili, bylo vyhledání významných organizací (např. IFLA, IEEE, IADIS) a zjištěním, jaké konference pořádají.
Stěžejním postupem se však stal harvesting informací o konferencích na webu. Postupným procházením webových prezentací univerzit, knihoven a dalších organizací byla získána velká část požadovaných dat. Zbytek údajů o konferencích bylo získáno pomocí vyhledávačů (Google apod.) za pomocí klíčových slov a kombinovaných dotazů a také z některých dalších informačních portálů.
Problémy
Mezi hlavní problémy, se kterými jsme se při akvizici informací setkali, patří zejména tyto:
- Nelze zachytit všechny konference, které by nás mohly zajímat pro zařazení do databáze, pokusili jsme se ale zaznamenat co nejvíce významných konferencí po celém světě se zaměřením na ČR a sousedící státy
- Při vyhledávání informací z Rakouska se jevil zásadní problém v tom, že byly mnohdy vyhledány konference z Německa z důvodu shodných jazyků, zúžení dotazů však zřejmě nechtěně odfiltrovalo i jinak relevantní konference
- Oficiální stránky konferencí jsou často pouze v národním jazyce (italština, španělština, atd.), bez jehož znalosti nelze data korektně zpracovat
- Strohost oficiálních webových stránek o konferencích, které neobsahují často mnohé základní informace - tyto nebyly z důvodu chybějících údajů zpracovávány
- Chybějící údaje o zaměření konferencí, nedostatečná identifikace, neaktuální informace
- Stránky avizující konference (např. v druhé polovině roku 2008), ale dosud zde nejsou žádné podrobnější informace
- Konference byly zrušeny poté, co jsme je již zavedli do naší databáze (zde by bylo vhodné zajistit nějaký mechanismus kontroly - otázka pro budoucí vývoj)
Naplnění cílů
Následující přehled porovnává funkce a údaje pilotní verze databáze konferencí s cíli, které byly vytýčeny na počátku projektu:
- Nezávislé řešení založené na otevřených standardech (splněno)
- Systém umožňující budoucí rozšiřitelnost a škálovatelnost (splněno)
- Online přístup k webovému rozhraní databáze (splněno)
- Konference z regionu Střední Evropy a dalších zemí - seznam viz příloha 9 (splněno)
- Zahrnutí oborů a témat z oblasti informační vědy a příbuzných oborů - seznam oborů ke dni 21.2.2008 viz příloha 10 (splněno)
- Vlastní taxonomický systém pro pořádání informací (splněno)
- Procházení databáze - katalog - dle místa konání, oboru, jazyka (splněno)
- Kalendář probíhajících konferencí s možností časového procházení (splněno)
- Vyhledávání - dle klíčových slov, fulltext, jednoduché, pokročilé (splněno)
- Vícejazyčné rozhraní - nyní anglicky a česky, systém je otevřen pro implementaci dalších jazyků (splněno)
- Registrace uživatelů a personalizace obsahu (splněno)
- SEO optimalizace (splněno)
- Integrace s Inflow - systém je připraven a otestován, zbývá mírně upravit design Inflow a převést databázi pod společnou doménu (částečně splněno)
- Evidované záznamy o konferencích: název originální, název český, pořadatel, místo konání, URL web stránek, e-mail, telefon, jiný kontakt, anotace, časový údaj (splněno)
- Možnost vkládat ankety (splněno nad rámec projektu)
- RSS syndikace obsahu (splněno nad rámec projektu)
- Upozornění na aktuální konference (splněno nad rámec projektu)
- Byl napsán podrobný návod pro redaktory jak vkládat a indexovat konference - lze využít i pro osoby, které nemají z projektem dosud žádné zkušenosti (splněno nad rámec projektu)
- Možnost exportu informací z kalendáře databáze do formátu iCalendar, se kterým dokáží pracovat kalendáře nástrojů jako jsou např. MS Office Outlook, Apple iCal, mobilní telefony a komunikátory apod. (splněno nad rámec projektu)
Ke dni 21.2.2008 (12:00 hod) obsahovala databáze 157 konferencí z 21 zemí
na 5 kontinentech, jenž jsou pořádány v 11 jazycích a které zahrnují celkem 89 oborů a témat.
Kontinuita projektu
Úspěšnost projektu je závislá na průběžné akvizici a vkládání dat o konferencích. Jen tak může být databáze vždy aktuální a poskytovat relevantní výsledky, může být atraktivní pro uživatele. Naším cílem je pokračovat alespoň po dobu několika dalších měsíců v akvizici nových informací, avšak z dlouhodobého hlediska by bylo vhodné zajistit návaznost těchto prací zajištěním dalších kapacit a zdrojů, a to zejména z řad našich kolegů studentů z mladších ročníků. Dokážeme si tedy představit, že správu databáze by postupně přebírala vždy další „generace" studentů, kteří by zajistili pokračování projektu. V této oblasti bychom jistě uvítali úzkou spolupráci s kabinetem ISK, který má možnosti nové kolegy do tohoto projektu zainteresovat. Další velkou oblastí, kde lze v projektu pokračovat, je implementace nových a pokročilých funkcí do systému, reakce na žádosti a připomínky uživatelů a optimalizace systému. Existuje mnoho nápadů, jak databázi dále vylepšit, mnohé z nich však opět narážejí na nedostatek volných zdrojů.
Závěr
Věříme, že vytvořená databáze konferencí splnila všechny cíle, které jsme si na začátku projektu stanovili. Zbývají udělat dva poslední kroky, aby její prvotní verzi mohli začít aktivně používat i uživatelé. Prvním krokem je úprava a portace grafického designu Inflow na stávající rozhraní databáze a přesun databáze pod společnou doménu. Věříme, že tento krok se povede realizovat v brzké době ve spolupráci s tvůrci Inflow. Druhým krokem je propagace databáze vůči uživatelům tak, aby o tomto nástroji měli tušení a naučili se jej používat. Zde opět sázíme na spolupráci s Inflow, který nám může poskytnout své zázemí a prostor tematicky zaměřeného časopisu. Přímé oslovení studentů a mnohé další formy propagace jsou rovněž po vzájemné dohodě vítány prostřednictvím kabinetu ISK a jeho představitelů.
[1] CEJPEK, Jiří. Informace, komunikace a myšlení. 1. vyd. Praha : Karolinum, 1998. 179 s. ISBN 8071847674. Str. 134-135
[2] Inflow: information journal [online]. Dostupný z WWW: <http://www.inflow.cz/>. ISSN 1802-9736.
[3] Drupal.org : Community plumbing [online]. 2008 [cit. 2008-03-04]. Dostupný z WWW: <http://drupal.org/>.
| Příloha | Velikost |
|---|---|
| Prilohy.pdf | 427.38 KB |
















Poslední komentáře
před 3 hod 48 min
před 1 týden 1 den
před 1 týden 1 den
před 1 týden 4 dny
před 1 týden 5 dnů
před 1 týden 5 dnů
před 1 týden 5 dnů
před 1 týden 5 dnů