Problematika velkého indexu

Abstrakt: 
V současné době jsou uživatelé zvyklí zadat jednoduchý vyhledávací dotaz do Googlu a získat okamžitě nabídku různých zdrojů informací. Dnešní seminář se zamýšlel nad tím, jak podobným způsobem zprostředkovat čtenáři maximum informací o tištěných i digitálních zdrojích dostupných v dané knihovně. Na semináři byl představen jeden ze softwarových způsobů sjednocení vyhledávání, kdy uživatel v rámci jednoho vyhledávacího dotazu získává informace o dostupných tištěných i elektronických dokumentech. Jedno konkrétní řešení tohoto vyhledávání je systém Primo od firmy Ex Libris. Významnou částí systému je způsob prohledávání elektronických zdrojů – část Primo Central

1. Pořadatel semináře a systémové nástroje pro knihovny

Na seminář jsem šla s představou, že se dozvím něco o nástupci knihovnického systému Aleph, a tento nástupce bude při ve svém vyhledávání nabízet kromě vyhledaných knížek i dostupné elektronické zdroje. Firma Multidata u nás dodává IT technologie knihovnám a distribuje v České republice produkty společnosti Ex Libris: např. Metalib, SFX, bX, DigiTool, Verde a také Primo a Primo Central.

Seminář vedl Martin Vojnar a pohled na začleňování elektronických zdrojů do online katalogů knihoven nám nejprve rozšířil, a posléze naopak zúžil.       

Martin_Vojnar.jpg

2. Proč optimalizovat vyhledávacího prostředí?

V dnešní době začíná 80% uživatelů své hledání na webu. Proto se v posledních pěti letech se pracuje na nových online katalozích, tzv. next-generation OPACích - „discovery systémech": došlo k posunu paradigmatu způsobu hledání, sílí snaha nabídnout ucelené vyhledávání. Velká část zahraničních knihoven přešla nedávno na nová rozhraní. Je to luxus nebo součást strategie knihoven?

Nové systémy kladou důraz na koncového uživatele, jeho potřeby, jeho samostatnost a spokojenost. V akademickém prostředí tyto systémy pomáhají tomu, aby studující a pedagogové využívali elektronické informační zdroje. Velmi užitečný je portál těchto nových systémů vytváří v posledních třech letech Marshall Breeding.

3. Discovery systémy

Discovery systémy:

  • vyhledávají rychle
  • vyhledávají jednoduše
  • vyhledávají intuitivně (bez zaškolení)
  • podporují fasetovou navigaci
  • podporují RSS
  • mají relevantní obsah

Discovery systémy mají výraznou přidanou hodnotu: jedno společné rozhraní znamená méně práce s lepšími výsledky. Výkonnější vyhledávání umožňují nové způsoby indexace. Vytvořením jednotného indexu informačních zdrojů knihovny umožňuje snadnou a efektivní cestu k celé kolekci knihovny (tištěnému fondu i elektronickým fulltextům) z jediného vyhledávacího prostředí.

Zastaralejší vyhledávací systémy nemají jednotné vyhledávacího prostředí:

  • navštěvujeme více vyhledávacích míst
  • musíme přecházet mezi systémy
  • opakovaně se přihlašujeme
  • ztrácíme kontinuitu vyhledávání
  • „jdeme přes Google"
  • systém nám nenabízí jednotné výsledky
  • knihovna si nemůže do systému zařadit libovolný zdroj

Discovery systémy pomáhají v boji s množstvím informací:

  • mají konfigurovanou relevanci (řadí výsledků: rozliší „zlato" versus „šum")
  • personalizují výpočet relevance - při seskupování výsledků zohledňují uživatele: studenti 1. ročníku dostanou jiné řazení dokumentů než doktorandi
  • seskupují výsledky (FRBR)
  • využití chování jiných uživatelů - doporučení dalších titulů
  • zapojení uživatelů

Cíle discovery systémů jsou:

  • zodpovědět vyhledávací dotaz všemi zdroji knihovny
  • dát každému ze zdrojů stejnou šanci na zodpovězení dotazu
  • pro výsledky se stejnou relevancí se zobrazit 1 výsledkovou množinu
  • plné texty dostupné na 1 kliknutí
  • jediné přihlašování, pouze 1 hledání

Mezi tyto systémy patří systém Primo:

K vyhledávacímu dotazu se zobrazí po 1 kliknutí vyhledané informace na stejném místě (včetně vlastnictví nosičů) a zprostředkuje se dodání (pokud jsou dostupné plné texty). Celý proces je oproti současným možnostem rychlejší a ve vyhledávání důkladnější -  rychle získáváme více dokumentů.

V souvislosti s tím, že danou službu poskytuje knihovna, je samozřejmé, že vyhledané informace jsou uspořádané a výsledky jsou seřazené podle relevance; způsoby řazení výsledků lze nastavit. Zde je možné nahlédnout do zkušební verze systému Primo.

4. Co je to velký index?

Systém vyhledává dokumenty pomocí discovery indexu. Discovery systém si index buduje sám. Discovery systém se stará totálně o lokální zdroje a na dálku (nemá je u sebe) o elektronické informační zdroje (EIZ).

EIZ.jpg

Všechny zdroje knihovny jsou indexovány a prohledávány, největší část zdrojů tvoří elektronické zdroje, pouze tato největší část je nazývána „velký index".

konf_.jpg

Příkladem velkého indexu je indexační služba Primo Central (jedná se pouze o část systému Primo), viz You Tube. Indexační služba Primo Central není lokalizována v knihovně, běží na vzdálených serverech, připojují se k ní různé knihovny. 

5. Velký index versus metavyhledávání

Obvyklá struktura uživatelských dotazů je:

  • ½ dotazů je na 1 konkrétní dokument - discovery systémy by měli preferovat tento typ dotazu (dokument měl by být vždy nabízený v první desítce výsledků)
  • tematické dotazy - dotaz, který má uživatele dovést dál - zde má uživatel získat širokou nabídku výsledků

Při metavyhledávání (například Jednotná informační brána (JIB) nebo 360 Search) systém paralelně hledá ve sbírkách; my víme, kde hledáme a co za výsledky se nám vrací.

Velký index vyhledává v obsahu, a pak se přesměruje do plného textu: má oddělené vyhledávání a dodávání. Dodávání může být omezeno na jednu nebo více plnotextových databází (např. z finančních důvodů):

  • vyhledání (např. v databázi Gale, EBSCO, ProQuest)
  • indikace, jestli k plnému textu můžu
  • zobrazení plného textu

Dostupnost zdrojů pro uživatele může být různá:

  • zdroje dostupné všem, obsah také dostupný komukoliv; vyhledávání zdarma, dodávání zdarma (např. Guttenberg.org)
  • je povoleno vyhledávání, text dodán jen pokud je předplácen
  • není povoleno ani vyhledávání: např. Web of Knowledge  - i vyhledávání je placené

Dodávání vychází z elektronických holdingů: informace o exemplářích pochází z linkovacího serveru. Elektronické holdingy mají smysl jen pro uživatele dané knihovny. Nejpřesnější informace o EIZ (elektronických informačních zdrojích) poskytují dodavatelé. Velcí dodavatelé EIZ zatím své databáze do velkého indexu neuvolnily.

EBSCO
se v roce 2010 rozhodlo, že do projektu velkého indexu nevstoupí, protože má kvalitní databázi a rozhraní (a také vyvíjí svůj discovery systém). ProQuest proklamuje, že se chce dohodnout, ale jednání již trvají 3 roky - zatím zvolil vyčkávací taktiku.
Tyto firmy mají svá aktivní rozhraní, která pro jejich zdroje nejlépe fungují a jsou nejlépe optimalizována.

Ovšem paralelní vyhledávání je vždy o jednu třídu horší než narativní rozhraní:

pokud velký index zapojíme do metavyhledávače (např. do JIB), tak ten je potom výrazně rychlejší; nenajde všecky zdroje, ale nalezne zdroje nejfrekventovanější. U Primo Central je za poplatek cca 3000€ možné získat přístup k EIZ jiné knihovny, např. Harward Library. Velký index může být také cílem v paralelním vyhledávání.

6. Jak vzniká velký index - plnění a vlastnosti

Firma Ex Libris buduje velký index od roku 2009. Vkládají se data od tradičních agregátků a doplňují se volná data.

Vyhledávání ve velkém indexu probíhá na úrovni článků.
Velký index má svou „cestovní mapu": správce velkého indexu ví, co v něm má a co nemá, a o co by měl usilovat.

Petice IGELU chce přesvědčit Ebsco, aby do projektu velkého indexu vstoupilo. V budoucnosti je pravděpodobné kombinování více velkých indexů (např. lokálního aglobálního).

Pro kvalitu velkého indexu je rozhodující:

  • pokrytí
  • relevance
  • dostupnost
  • neutralita vůči knihovně
  • jak zaleží na pokrytí lokálním obsahem?

7.  Zapojení českého obsahu do velkého indexu

Národní knihovna ČR ukončila vytváření článkové bibliografie (databáze ANL), v ideálním případě by ji mohl velký index „nahradit"! Jaké české články by mohly být v „českém" velkém indexu?

U článků jsou důležité tyto dva aspekty:

  • obsah musí být k dispozici online (nemusí být pro všechny zdarma)
  • dodávání vázáno na licenci

Potenciál na vložení do velkého indexu mají:

Nová média:

  • české wiki stránky
  • archivy vysílání
  • e-knihy
  • databáze publikační činnosti
  • moodle, doporučená literatura, nástroje pro podporu vzdělávání
  • institucionální repozitáře

= zařazení zdrojů, které byly doposud na okraji zájmů knihoven

  • další volné zdroje

Národní knihovna by mohla být ideálním nositelem řízení národní strategie plnění velkého indexu. (Pro větší vstřícnost potenciálně konkurenčních subjektů je nutná participace knihovny nebo jiná nestranné organizace.)

8. Vyzkoušení velkého indexu v praxi

Při ukázce vyhledávání ve velkém indexu se otevíralo dost otázek, ale již nebylo mnoho času. Změny k lepšímu byly provázeny nečekaným „znásobením" výsledků - systém neprovádí deduplikace. Bude velký index reálná cesta pro přiblížení se ke Googlu?

V závěru semináře byl zmíněn článek Viléma Sklenáka  v ProInflow.

prost__ed__.jpg

Seminář byl pořádán ve velmi příjemném prostředí.

9. Vlastní shrnutí

Před knihovnami je další výzva - jak zjednodušit a rozšířit online vyhledávání informací. Z nových systémů na vyhledávání mi nejvíce líbí holandský Aquabrowser. Systém Primo včetně Primo Centralu má velkou šanci u nás uspět. Dalším placeným discovery systémem, který se u nás nyní prezentuje, je Ebsco discovery system (EDS). Ale budou mít naše knihovny na tyto systémy prostředky a pro co se rozhodnou?

Pro zájemce je k dispozici prezentace ze semináře.

Beránková Monika. Problematika velkého indexu. Inflow: information journal [online]. 2011, roč. 4, č. 5 [cit. 2013-05-22]. Dostupný z WWW: <http://www.inflow.cz/problematika-velkeho-indexu>. ISSN 1802-9736.



Syndikovat obsah

Inflow magazín

Zvukové zpravodajství z konference Inforum 2013

inforum13.jpg

Inflow magazín je místo pro náročné. Rozhovory, úvahy, zajímavosti.

Číslo přílohy: 14/2013
Vyšlo: 20.05.2013
Typ přílohy:  

» všechny typy příloh

Poslední komentáře

posledních 25 komentářů

Kalendář akcí

Vyzkoušejte

Quizlet

Kar­tičky = oblí­bená forma učení! Quizlet je opravdu obrov­ská „kar­tič­kárna“, která čeká jen na vás. Umožní vám nau­čit se prak­ticky coko­liv — jazyky, his­to­rii umění, geo­me­t­rii i ban­kovnic­tví.
Kromě toho si můžete vytvá­řet své vlastní kar­tič­kové sady a samo­zřejmě spo­lu­pra­covat s kama­rády studenty!

» všechny Vyzkoušejte

Novinky na Inflow

Inflow.cz on Facebook

Read or Die

» všechny příspěvky

Spřízněné projekty

KISK

Partsip

Nakliv

Kwído

LibFFest

Guerrilla Readers

ČteSyRád

BiblioHelp - léčba knihou

všechny projekty

Portál Competitive Intelligence

Kurz projektového managementu

Kulturně informační web

VIAKISK

Antypa

ELka

SAR

KPI

Muniport

ProInflow

Audioknihy