Zpráva o projektu Databáze konferencí

Abstrakt: 
Závěrečná zpráva pojednává o projektu Databáze konferencí, nejprve jej vymezuje v širších souvislostech a definuje jeho cíle. Následuje popis realizace projektu, zejména technologické řešení databáze, taxonomii, použité moduly aj. Samostatná část je věnována problematice akvizice informací do databáze. Na závěr je pojednáno o naplnění stanovených cílů a je naznačena i další kontinuita projektu.

Cíle a vymezení projektu

Cílem projektu bylo vytvořit online databázi konferencí spojených s oborem Informační studia a knihovnictví a rovněž i příbuzných oborů, jelikož v současné době neexistuje žádný významný portál či databáze, která by se snažila tuto oblast mapovat a zpracovávat v širším pojetí aniž by byla nějak jednostranně zaměřena, případně aniž by se jednalo o čistě nekomerční produkt. Databáze má být zaměřena především na významnější a mezinárodní konference pořádané v roce 2008 v České republice, Slovensku, Polsku, Rakousku, Německu. Zahrnuty však mohou být i další významné konference pořádané po celém světě. Cílovou skupinou uživatelů databáze jsou všichni, kteří hledají informace o pořádaných konferencích především v Evropě a které se alespoň vzdáleně týkají informační vědy a knihovnictví a ti uživatelé, jenž nechtějí komplikovaně shánět informace z mnoha rozdílných a mnohdy těžko dosažitelných informačních zdrojů.

Technologické a funkční cíle

Databáze a její veřejné webové rozhraní má nabízet uživatelsky přístupnou praktickou formu pro vyhledávání a procházení konferencí a poskytnout přehledné a na jednom místě dostupné požadované informace o konferencích. Uživatelé tak budou moci prohledávat databázi např. dle zemí a regionů, dle časových kritérií, dle jednotlivých oborů (či multioborově) apod. Systém má být navržen od samého počátku jako otevřený pro budoucí možná rozšíření a přidávání nových funkcí a má využívat volně dostupná řešení jako svůj technologický základ. Samozřejmostí by měla být možnost multijazyčného prostředí rozhraní databáze, pro první verzi je předpokládána anglická a česká jazyková mutace. Webové rozhraní a jednotlivé záznamy o konferencích by měly být SEO optimalizovány pro vyhledávače, tzn. že jednotlivé odkazy a adresy by měly být srozumitelné a čitelné vyhledávači ale i uživateli a měly by být permanentní.

Mezi základní funkce a nástroje databáze konferencí budou tedy patřit:

  • hierarchické třídění oborů smožností procházení (katalog)
  • možnost procházení konferencí podle zemí konání
  • kalendář probíhajících konferencí smožností procházení
  • vyhledávání (fulltextové, časové, místo konání, klíčová slova, atd.)
  • vícejazyčné rozhraní
  • registrace uživatele a stím související personalizace obsahu

Vymezení oborů

Jelikož obor informační vědy a knihovnictví přesahuje do dalších oborů, bylo potřeba vymezit, jaké konkrétní obory kromě vlastní informační vědy a knihovnictví budou nejprve v projektu mapovány. Jako základ bylo využito vymezení souvisejících oborů dle prof. Cejpka[1]:

A - Filozofie, přírodní a humanitní vědy a vědy interdisciplinární zabývající se informací z různých hledisek, např. neurofyziologie a neuropatologie, psychologie, pedagogika, andragogika, kulturologie, antropologie, sociologie, kybernetika, systémové teorie apod.

B - Informatika a computer science (= široká množina oborů spadající do této skupiny)

C - Aplikovaná informační věda (zde zahrnujeme i knihovnictví)

D - Teoretická informační věda

Konkrétní výčet oborů, které jsou v tomto okamžiku v databázi zahrnuty, jsou uvedeny níže.

Vymezení evidovaných údajů

Ke každé konferenci mají být v databázi vedeny minimálně tyto údaje:

  • název
  • pořadatel
  • země a místo konání
  • zaměření / obor
  • termín konání
  • anotace
  • odkaz na webové stránky pořadatele
  • kontakty na pořadatele

Konkrétní výčet údajů, které jsou v tomto okamžiku v databázi zahrnuty, jsou uvedeny níže.

Provázanost s časopisem Inflow

Databáze konferencí bude na internetu prezentována jako samostatná a nezávislá sekce časopisu Inflow[2] (např. s adresou konference.inflow.cz), přičemž bude využit rámcový design tohoto časopisu. Oba projekty mohou tak navzájem využívat synergický efekt, který toto spojení přinese. V budoucnu může jít např. o obohacení záznamu konference o odkaz na článek či zápis z konference, které byly v časopise Inflow uveřejněny.

Technologické řešení databáze

Pro realizaci databáze a webového rozhraní byl vybrán open source content management systém (CMS) Drupal[3]. Jeho instalace je provozována na webserveru Apache, databáze je MySQL a jako skriptovací jazyk je použit PHP. Celý systém je provozován na platformě Linux OS.

CMS

Drupal byl zvolen jako CMS pro realizaci online databáze konferencí. Jedná se o velmi populární a rozšířený CMS, který je vyvíjen open source komunitou a má širokou uživatelskou a vývojářskou základnu. Tento CMS je založen na modulární architektuře a umožňuje tak ke svému jádru přidávat množství různých funkčních modulů a tak lze snadno rozšiřovat jeho funkcionalitu o nové nástroje a možnosti. Počty nabízených modulů se pohybují řádově ve stovkách, což umožňuje uspokojit téměř jakýkoli požadavek na realizaci jednotlivých projektů. Samozřejmostí je multijazyková podpora, dodržování webových standardů, skinovatelnost prostředí, definice uživatelských rolí a práv, pokročilá správa obsahu a také automatická syndikace obsahu přes RSS. Dalším argumentem pro výběr tohoto systému je fakt, že na shodném CMS je provozován i časopis Inflow. To bude moct v budoucnu snížit požadavky na administraci, jelikož oba systémy mohou být integrovány v jeden celek, který lze spravovat dohromady. Příklad realizované úvodní stránky databáze konferencí v Drupalu viz příloha 1.

Správa uživatelů

V systému databáze konferencí bylo vytvořeno několik uživatelských rolí tak, aby byly uspokojeny požadavky na správu uživatelů. V první řadě je to nejvyšší role administrátora, který má plná práva a kontrolu nad všemi funkcemi systému. Další rolí jsou redaktoři, kteří mají oprávnění vkládat nový obsah - záznamy o konferencích a případně upravovat již stávající záznamy. Kromě toho mohou zakládat nové ankety a psát články. Další skupinou jsou registrovaní uživatelé, kteří si mohou zakládat vlastní personalizované stránky nazvané Má databáze a rovněž mohou přispívat do komentářů a hlasovat v anketách. Nakonec to jsou neregistrovaní uživatelé, kteří mohou systém používat pro vyhledávání a procházení konferencí.

Pořádání informací o konferencích

Při návrhu databáze bylo nutné se zabývat pořádáním zpracovávaných informací. Jako nejvýhodnější řešení se ukázalo vytvoření jednoho řízeného slovníku - tezauru a dvou klasifikačních schémat. Pro klasifikaci bylo vytvořeno hierarchické schéma, které dělí záznamy o konferencích dle zemí, ve kterých se daná konference pořádá. Schéma zahrnuje světadíly a v nich hierarchicky řazené jednotlivé státy. Při vkládání konference redaktor vždy vybírá patřičnou zemi z tohoto klasifikačního schématu. Jako druhé klasifikační schéma byly zvoleny primární jazyky, ve kterých je daná konference pořádána. Redaktor může danému záznamu přidělit více než jeden jazyk. Toto schéma je jednoúrovňové. Poslední, avšak neméně důležitý, je tezaurus vědních oborů a témat, kterými se konference zabývají. Tezaurus umožňuje při indexaci přidělování více řízených termínů jedné konkrétní konferenci. Je použita induktivní metoda, tzn. že slovník je vytvářen za pochodu a termíny jsou přidávány tak, jak jsou vkládány nové záznamy o konferencích. Tezaurus tak umožňuje zachycení více specifičtějších témat. Pro tvorbu tezauru je striktně využíváno databáze autorit Národní knihovny ČR. Za správnost indexace je odpovědný redaktor daného záznamu.

Použité moduly

V databázi konferencí jsou použity mimo jiné i následující moduly, které je vhodné podrobněji zmínit (řazeno abecedně):

  • Captcha

Slouží pro odfiltrování spamu a nevyžádaných strojových přístupů zejména za účelem masového šíření reklamy, pokusů o útoky na systém, zakládání fiktivních uživatelů apod. Modul je použit při registraci nových uživatelů a může být nasazen kdekoli je ho v systému potřeba (např. i v komentářích). Příklad viz příloha 2.

  • CCK

Tento balík modulů slouží administrátorům pro úpravu a definici nových typů obsahu a polí. Byl použit zejména pro úpravu modulu Event tak, aby modul splňoval požadavky na evidenci konferencí.

  • Comment

Umožňuje uživatelům komentovat příspěvky. Funkce komentářů je dostupná pouze registrovaným uživatelům a je aktivní pouze u některých typů příspěvků.

  • Event

Modul Event byl použit jako základní stavební prvek pro zpracovávání záznamů o konferencích. Modul umožňuje evidovat události v čase včetně jejich periodicity. Velkou výhodou je interaktivní kalendář, který umí zobrazovat události a procházet mezi nimi, dále nabízí i další formy zobrazení událostí, v našem případě konferencí. Tento modul byl upraven pomocí CCK tak, aby vyhovoval potřebě zaznamenávat konference a vést u nich požadované údaje.

  • MySite

Umožňuje uživatelům personalizovat si obsah na databázi konferencí a vytvářet si tak vlastní osobní stránky (nazvané Má databáze), kde se jim zobrazují jen konference a příspěvky, které je zajímají. Dále si mohou zvolit vlastní layout a barevné schéma databáze, které jim vyhovuje. Použití modulu v projektu databáze konferencí si vyžádalo jeho lokalizaci do českého jazyka. Příklad viz příloha 3.

  • Pathauto

Modul zajišťuje automatické generování adres a odkazů tak, aby splňovaly zásady SEO a byly tak čitelné nejen pro vyhledávače ale i běžné uživatele.

  • Poll

Modul pro vytváření uživatelských anket. Administrátoři a redaktoři mohou vytvářet ankety, na které pak mohou uživatelé odpovídat. Data získaná v anketách mohou být například použita pro zlepšení a integraci nových funkcí, které si uživatelé žádají apod. Jako příklad této funkce byla vytvořena anketa, která se ptá uživatelů na to, jak se jim databáze konferencí líbí. Příklad viz příloha 4.

  • Search

Povoluje uživatelům vyhledávat obsah dle klíčových slov a dalších kritérií, jedná se o hlavní modul, pomocí kterého uživatelé mohou vyhledávat záznamy o konferencích. Modul vyhledává pomocí vnitřního indexu obsahu a také pomocí klíčových slov, které jsou v našem případě definovány námi vytvořenou taxonomií. Příklad viz příloha 5.

  • Statistics

Modul slouží pro generování a zaznamenávání statistiky přístupů a jeho funkce slouží především administrátorům a redaktorům pro sledování návštěvnosti uživatelů, popularity stránek, záznamů, vytížení systému, atd. Příklad viz příloha 6.

  • Taxonomy

Tento velmi důležitý modul poskytuje kategorizaci obsahu, tzn. vytváření vlastních řízených slovníků - tezaurů a klasifikačních schémat, které obsahují hierarchicky řazené termíny, jenž jsou pak následně použity pro pořádání vkládaných záznamů o konferencích, jejich vyhledávání a procházení pomocí klíčových slov (viz samostatná kapitola výše).

  • TaxonomyDHTML

Modul v databázi slouží k dynamickému zobrazování hierarchie oborů, států a jazyků, ve kterých jsou konference pořádány. Uživatel tak může pomocí tohoto modulu procházet záznamy tak, jako by se jednalo o webový katalog. Příklad viz příloha 7.

  • Views

Tento modul umožňuje vytvářet specifické náhledy na obsah. Modul je použit pro zobrazování některých typů informací v požadovaném formátu.

Grafické rozhraní

Pro prvotní verzi online databáze bylo použito standardní grafické rozhraní CMS Drupal s názvem Garland. Pro tuto verzi nebyla uvažována tvorba vlastního grafického designu, naopak předpokládá se ve velmi krátkém čase nasazení již existujícího designu z časopisu Inflow, pouze s mírnými úpravami. Do systému byl pro ověření základní kompatibility pokusně importován stávající grafický vzhled Inflow bez jakýchkoli úprav - příklad viz příloha 8. Výsledkem je pozitivní zjištění, že stávající grafický design Inflow lze implementovat po mírných změnách CSS šablon i do databáze konferencí. Změny v designu je nutno učinit ve spolupráci s tvůrci Inflow a jsou odhadovány na cca 1 den práce. 

Dostupnost na Internetu

Pilotní verze databáze je dostupná na testovací adrese. Tato adresa je v tuto chvíli neveřejná, bude sdělena pouze na vyžádání v odůvodněných případech. Tato verze obsahuje plnou, zde popisovanou funkcionalitu a kompletní validní data. Po dokončení implementace grafického rozhraní převzatého z Inflow se předpokládá, že projekt bude jednoduše a rychle integrován do společné domény inflow.cz a bude přesunut na profesionální webhostingovou službu, zajišťující spolehlivý provoz.

Problematika akvizice informací

Postupy získávání dat

Akvizice vstupních informací o pořádaných konferencích je jedním z klíčových procesů při zpracování dat. Důležitý je zejména výběr informačních zdrojů a postupy, z nichž některé se ukázaly být méně vhodné a jiné zase naopak.

Nejprve jsme se pokusili oslovit dopisem (e-mail) s požadavky na získání přístupu k informačním zdrojům o konferencích v primárních zemích významné organizace a instituce, jako jsou národní a velké knihovny, univerzity na nichž se vyučuje obor ISK včetně univerzitních knihoven apod. Ačkoli jsme vyzkoušeli varianty, kdy byl dopis formulován jako soukromá žádost, tak i dopis, ve kterém jsme se zaštítili Filozofickou fakultou a kabinetem ISK Masarykovy univerzity, odpovědi byly převážně negativní. V mnoha případech na dopis nebylo vůbec reagováno, případně byl dopis rovnou odmítnut, nebo byla přislíbena odpověď, které se nám již nedostalo. V několika ojedinělých případech (Bayerische Staatsbibliothek, univerzitní knihovna ve Vídni, Slovenská národná knižnica v Martine) nám byly poskytnuty odkazy na zdroje, ze kterých se dalo čerpat. Tento postup se tedy ukázal jako nesprávný, přinesl pouze minimální počet konferencí.

Dalším krokem, který jsme učinili, bylo vyhledání významných organizací (např. IFLA, IEEE, IADIS) a zjištěním, jaké konference pořádají.

Stěžejním postupem se však stal harvesting informací o konferencích na webu. Postupným procházením webových prezentací univerzit, knihoven a dalších organizací byla získána velká část požadovaných dat. Zbytek údajů o konferencích bylo získáno pomocí vyhledávačů (Google apod.) za pomocí klíčových slov a kombinovaných dotazů a také z některých dalších informačních portálů.

Problémy

Mezi hlavní problémy, se kterými jsme se při akvizici informací setkali, patří zejména tyto:

  • Nelze zachytit všechny konference, které by nás mohly zajímat pro zařazení do databáze, pokusili jsme se ale zaznamenat co nejvíce významných konferencí po celém světě se zaměřením na ČR a sousedící státy
  • Při vyhledávání informací z Rakouska se jevil zásadní problém v tom, že byly  mnohdy vyhledány konference z Německa z důvodu shodných jazyků, zúžení dotazů však zřejmě nechtěně odfiltrovalo i jinak relevantní konference
  • Oficiální stránky konferencí jsou často pouze v národním jazyce (italština, španělština, atd.), bez jehož znalosti nelze data korektně zpracovat
  • Strohost oficiálních webových stránek o konferencích, které neobsahují často mnohé základní informace - tyto nebyly z důvodu chybějících údajů zpracovávány
  • Chybějící údaje o zaměření konferencí, nedostatečná identifikace, neaktuální informace
  • Stránky avizující konference (např. v druhé polovině roku 2008), ale dosud zde nejsou žádné podrobnější informace
  • Konference byly zrušeny poté, co jsme je již zavedli do naší databáze (zde by bylo vhodné zajistit nějaký mechanismus kontroly - otázka pro budoucí vývoj)

 

Naplnění cílů

Následující přehled porovnává funkce a údaje pilotní verze databáze konferencí s cíli, které byly vytýčeny na počátku projektu:

  • Nezávislé řešení založené na otevřených standardech (splněno)
  • Systém umožňující budoucí rozšiřitelnost a škálovatelnost (splněno)
  • Online přístup k webovému rozhraní databáze (splněno)
  • Konference z regionu Střední Evropy a dalších zemí  - seznam viz příloha 9 (splněno)
  • Zahrnutí oborů a témat z oblasti informační vědy a příbuzných oborů - seznam oborů ke dni 21.2.2008 viz příloha 10 (splněno)
  • Vlastní taxonomický systém pro pořádání informací (splněno)
  • Procházení databáze - katalog - dle místa konání, oboru, jazyka (splněno)
  • Kalendář probíhajících konferencí s možností časového procházení (splněno)
  • Vyhledávání - dle klíčových slov, fulltext, jednoduché, pokročilé (splněno)
  • Vícejazyčné rozhraní - nyní anglicky a česky, systém je otevřen pro implementaci dalších jazyků (splněno)
  • Registrace uživatelů a personalizace obsahu (splněno)
  • SEO optimalizace (splněno)
  • Integrace s Inflow - systém je připraven a otestován, zbývá mírně upravit design Inflow a převést databázi pod společnou doménu (částečně splněno)
  • Evidované záznamy o konferencích: název originální, název český, pořadatel, místo konání, URL web stránek, e-mail, telefon, jiný kontakt, anotace, časový údaj (splněno)
  • Možnost vkládat ankety (splněno nad rámec projektu)
  • RSS syndikace obsahu (splněno nad rámec projektu)
  • Upozornění na aktuální konference (splněno nad rámec projektu)
  • Byl napsán podrobný návod pro redaktory jak vkládat a indexovat konference - lze využít i pro osoby, které nemají z projektem dosud žádné zkušenosti (splněno nad rámec projektu)
  • Možnost exportu informací z kalendáře databáze do formátu iCalendar, se kterým dokáží pracovat kalendáře nástrojů jako jsou např. MS Office Outlook, Apple iCal, mobilní telefony a komunikátory apod. (splněno nad rámec projektu)

Ke dni 21.2.2008 (12:00 hod) obsahovala databáze 157 konferencí z 21 zemí
na 5 kontinentech, jenž jsou pořádány v 11 jazycích a které zahrnují celkem 89 oborů a témat.

Kontinuita projektu

Úspěšnost projektu je závislá na průběžné akvizici a vkládání dat o konferencích. Jen tak může být databáze vždy aktuální a poskytovat relevantní výsledky, může být atraktivní pro uživatele. Naším cílem je pokračovat alespoň po dobu několika dalších měsíců v akvizici nových informací, avšak z dlouhodobého hlediska by bylo vhodné zajistit návaznost těchto prací zajištěním dalších kapacit a zdrojů, a to zejména z řad našich kolegů studentů z mladších ročníků. Dokážeme si tedy představit, že správu databáze by postupně přebírala vždy další „generace" studentů, kteří by zajistili pokračování projektu. V této oblasti bychom jistě uvítali úzkou spolupráci s kabinetem ISK, který má možnosti nové kolegy do tohoto projektu zainteresovat. Další velkou oblastí, kde lze v projektu pokračovat, je implementace nových a pokročilých funkcí do systému, reakce na žádosti a připomínky uživatelů a optimalizace systému. Existuje mnoho nápadů, jak databázi dále vylepšit, mnohé z nich však opět narážejí na nedostatek volných zdrojů.

Závěr

Věříme, že vytvořená databáze konferencí splnila všechny cíle, které jsme si na začátku projektu stanovili. Zbývají udělat dva poslední kroky, aby její prvotní verzi mohli začít aktivně používat i uživatelé. Prvním krokem je úprava a portace grafického designu Inflow na stávající rozhraní databáze a přesun databáze pod společnou doménu. Věříme, že tento krok se povede realizovat v brzké době ve spolupráci s tvůrci Inflow. Druhým krokem je propagace databáze vůči uživatelům tak, aby o tomto nástroji měli tušení a naučili se jej používat. Zde opět sázíme na spolupráci s Inflow, který nám může poskytnout své zázemí a prostor tematicky zaměřeného časopisu. Přímé oslovení studentů a mnohé další formy propagace jsou rovněž po vzájemné dohodě vítány prostřednictvím kabinetu ISK a jeho představitelů.


[1] CEJPEK, Jiří. Informace, komunikace a myšlení. 1. vyd. Praha : Karolinum, 1998. 179 s. ISBN 8071847674. Str. 134-135

[2] Inflow: information journal [online]. Dostupný z WWW: <http://www.inflow.cz/>. ISSN 1802-9736.

[3] Drupal.org : Community plumbing [online]. 2008 [cit. 2008-03-04]. Dostupný z WWW: <http://drupal.org/>.

Kresta Jaroslav. Zpráva o projektu Databáze konferencí. Inflow: information journal [online]. 2008, roč. 1, č. 3 [cit. 2013-05-22]. Dostupný z WWW: <http://www.inflow.cz/zprava-o-projektu-databaze-konferenci>. ISSN 1802-9736.
PřílohaVelikost
Prilohy.pdf427.38 KB



Syndikovat obsah

Inflow magazín

Zvukové zpravodajství z konference Inforum 2013

inforum13.jpg

Inflow magazín je místo pro náročné. Rozhovory, úvahy, zajímavosti.

Číslo přílohy: 14/2013
Vyšlo: 20.05.2013
Typ přílohy:  

» všechny typy příloh

Poslední komentáře

posledních 25 komentářů

Kalendář akcí

Vyzkoušejte

Quizlet

Kar­tičky = oblí­bená forma učení! Quizlet je opravdu obrov­ská „kar­tič­kárna“, která čeká jen na vás. Umožní vám nau­čit se prak­ticky coko­liv — jazyky, his­to­rii umění, geo­me­t­rii i ban­kovnic­tví.
Kromě toho si můžete vytvá­řet své vlastní kar­tič­kové sady a samo­zřejmě spo­lu­pra­covat s kama­rády studenty!

» všechny Vyzkoušejte

Novinky na Inflow

Inflow.cz on Facebook

Read or Die

» všechny příspěvky

Spřízněné projekty

KISK

Partsip

Nakliv

Kwído

LibFFest

Guerrilla Readers

ČteSyRád

BiblioHelp - léčba knihou

všechny projekty

Portál Competitive Intelligence

Kurz projektového managementu

Kulturně informační web

VIAKISK

Antypa

ELka

SAR

KPI

Muniport

ProInflow

Audioknihy