Sdružení knihoven ČR
Předseda:RNDr. Tomáš Řehák
Sídlo:Mariánské náměstí 98/1, 110 00 Praha 1
Tel./Fax.:+420 222 113 456/+420 734 684 729
IČ:70282170
DIČ:CZ70282170 - nejsme plátci DPH
Číslo účtu:2300910355/2010, Fio banka a.s.
   

Zápis z jednání sekce SDRUK pro IT ze 13.-14.2.2007

­ Zápis z jednání sekce SDRUK pro IT, 13.-14.2.2007, Vědecká knihovna Olomouc

(jednání řídil předseda sekce RNDr. Tomáš Řehák, program jednání sekce vytvořen ve spolupráci se Slezskou univerzitou v Opavě)

Jednání sekce SDRUK pro IT, 13.2.2007

Přivítání (VKOL, doc. J. Kubíček za SDRUK, T. Řehák za sekci IT).

Digital Library Initiative - Adolf Knoll (NK ČR)

Společná iniciativa Evropské unie založená na strategii i-2010. Původní záměr rozšířen z kulturního dědictví i na vědecké dědictví (otevřený přístup k informacím). Rozhodnutí Evropského parlamentu vedlo k vyjádření Evropské komise, která vypracovala zmíněnou iniciativu 2010. Na počátku nedorozumění, členské státy usilovaly o prostředky na digitalizaci, ale rozhodnutí Komise bylo od počátku stejné, tj. financuje pouze "evropskou přidanou hodnotu" a výsledek spojení národních iniciativ. Naopak na národní úrovni si musí jednotlivé země samy zajistit digitalizaci, zpřístupnění a archivaci.

Očekávání:

  • vyrovnat se s tempem digitalizací asijských zemí
  • vyrovnat se s aktivitami Google

Je ale zatím nejasné, jakou podobu a roli má Evropská digitální knihovna mít. Proto byla v únoru 2006 vytvořena pracovní skupina expertů, která se podílela na zpracování doporučení Komise s cílem jasněji formulující dělbu práce na evropské a národní úrovni. (http://ec.europa.eu/information_society/activities/digital_libraries/doc/recommendation/comm_recomm/cs.pdf)

Další rozvolněná doporučení formou indikativní tabulky akcí byla přijata i na národní úrovni, obvykle se ale vytrácí důraz na budování center pro masovou digitalizaci.

Pro 7. rámcový program se připravuje podpora konkrétních institucí a jejich digitalizačních center ("network of excellence").

Základem Evropské digitální knihovny je nyní TEL (http://theeuropeanlibrary.org/), základním komunikačním standardem je OAI-PMH.

Analýza aktivit výzkumu a vývoje evropských národních knihoven - Adolf Knoll (NK ČR)

Postupně zapojovány do TEL-ME-MOR a jeho pokračování EDL (v rámci programu eContent+). Ukázalo se, že původní hypotéza (staré členské země jsou na tom dobře, nové členské země se podaří začlenit a ostatní ne) neplatí.

Zkoumaná kritéria:

  • objem prostředků na VaV,
  • účast v mezinárodních projektech,
  • různorodost pokročilých systémů,
  • kvalita připojení k Internetu
  • speciální technologie digitálních knihoven (více pozornosti metadatům než obrazům)
  • ochrana digitálních dat
  • množství digitálních dat ve srovnání s asijskými zeměmi (např. Korejská národní knihovna má více než 39 národních knihoven dohromady, z toho Francouzi a Španělé mají více než 75%)
  • zajímavá je analýza množství digitálních dat podle stáří/druhu dokumentu
  • aplikace metod zpřístupnění, omezená spolupráce s uživateli
  • podíl knihoven, muzeí a archivů ve strategických dokumentech

Diskuse: dotaz na problematiku autorských práv.

  • V. Richter: Komise doporučuje jednání a nalezení vhodného kompromisu na národní úrovni.
  • A. Knoll: rakouská praxe po dohodě umožnila zveřejňování do r. 1935 (70 let ne od smrti, ale od uveřejnění díla).
  • M. Bartošek: přílišná regulace na evropské úrovni.
  • J. Polišenský: sirotků není v Krameriovi mnoho, vybízí k jednání a nalezení mechanismu vypořádání s Dilií.
  • M. Lhoták: aktuální zkušenost ze zveřejňování vědeckých prací, jednání Matematického ústavu a Springeru, autorská práva nejsou ošetřena, Springer řeší vyhlášením (má-li autor námitky, nechť se ozve).
  • Reakce V. Richtera: je to protiprávní - cílem by mělo být najít způsob, jak legalizovat.
  • M. Svoboda: hnacím motorem u autorského práva (tj. copyright) je zábavní průmysl a vydavatelé.

Manuscriptorium v roce 2007 - Adolf Knoll (NK ČR)

Důraz na rozšíření mezinárodní spolupráce, jeho rozvoj bude spojen s projektem ENRICH, který byl přijat v druhé výzvě eContent+. Dvouletý projekt jaro 2007-2008. Jednotlivé etapy projektu:

  • analýza dostupnosti digitalizovaných rukopisů
  • technické podmínky pro vzájemnou komunikaci a integraci
  • konverze MASTERu z formátu TEI P4 na TEI P5
  • implementace OAI-PMH harvesteru
  • implementace kontejneru METS coby interního formátu
  • zvýšit podporu UNICODE
  • přívětivost vůči uživateli, zpracování sbírek
  • umožnit přispívání on-line (personalizace)
  • testování a validace
  • propagace

Seznam technických a obsahových partnerů (členové EU i asociovaní členové) v projektu ENRICH.

Dnes už Manuscriptorium obsahuje data ze Slovenska, Turecka, Lotyšska, Polska aj.

Diskuse: zpracování a zpřístupňování mapových sbírek a listin.

  • T. Gec: najít společnou platformu pro zpřístupnění.
  • P. Žabička: koordinace projektu staremapy.cz s kartografickou konferencí na Historickém ústavu AV.
  • A. Knoll: v Manuscriptoriu nemají na koordinační roli v této oblasti vlastní síly.
  • M. Svoboda: chybí kompetenční centrum pro digitalizaci, které by mohlo sloužit jako poradenský orgán pro typy dokumentů a objektů, které nejsou běžné.
  • T. Řehák: vhodná chvíle pro přijetí standardů, cena za jejich aplikaci je nyní rozhodně nižší (i když ne malá) než pozdější přechod v budoucnosti.

přestávka

IS MU z pohledu studijní administrativy dotýkající se knihoven - Jitka Brandejsová (MU)

Informační systém jako celistvý homogenní systém pro komunikaci se všemi uživateli, s ohledem na knihovny byly vyvinuty zejména následující agendy:

  • publikace z informačního systému do katalogu knihovny
  • závazky čtenářů vůči knihovně
  • archiv závěrečných prací, předpoklady pro fungování:
  • bez omezení velikosti
  • sleduje životní cyklus práce (zadání, práce, posudky, obhajoba)
  • distribuované úložiště dat
  • zveřejnění všech prací, automatická konverze do textového formátu a do formátu pdf
  • funkce pro vyhledávání plagiátů

Všeobecná spokojenost s užíváním informačního systému, veřejný archiv má řadu výhod (růst kvality prací, zveřejnění výsledků vědy…). V roce 2007 zaměření na uživatelskou studii rozhraní a chování uživatelů.

Nový projekt: digitalizace vybraných starších závěrečných prací (cca 200 tis. stran, o obsahu budou rozhodovat fakulty).

Diskuse: rozsah zveřejňování a plnotextové prohledávání celého informačního systému.

T. Gec - dotaz na možné začlenění diplomových prací do oborových bran ; odpověď - obecně možné je - do budoucna se s ohledem na registr VŠ kvalifikačních prací plánuje doplnění OAI-PMH, se kterým umí Metalib pracovat.

Nové možnosti systému Kramerius - René Michálek (Qbizm)

stručná charakteristika současné verze systému :

  • vlastní software je poskytován pod licencí GPL
  • podpora pro typy dokumentů: pro monografie a periodika
  • vývoj financovaly NK ČR a Knihovna AV ČR
  • za udržování hlavní verze odpovídá fa Qbizm
  • replikace titulů mezi jednotlivými instalacemi Krameria
  • export části titulů do formátu pdf/html pro periodika (nikoliv pro monografie)
  • podpora protokolu OAI-PMH pro publikování metadat do jiných systémů (TEL)
  • implementace formátu METS a jeho zapouzdření do protokolu OAI-PMH

formát METS zapouzdřením umožňuje výrazně rozšířit spolupráci s externími systémy:

  • Kramerius implementuje všechny sekce kromě behaviourSec
  • v dmdSec podporuje Dublin Core a MARCXML
  • v admSec podporuje PREMIS, MIX a METS-rights
  • protože DTD pro monografie/periodika neobsahují administrativní metadata, importují se samostatně

Diskuse: na jaké typy dokumentů nelze Kramerius použít?

R. Michálek, J. Polišenský: Jednak musí být definované DTD (NK v roce 2003 definovala ještě muzejní objekty a zvukové dokumenty), jednak musí být podporované a implementované v Krameriovi (jsou nyní pouze monografie a periodika).

Formát METS a metadata - Jan Hutař (NK)

Ve světě je v rámci formátu METS běžná podpora pro tato schémata popisných metadat:

Pro administrativní metadata:

  • techMD (MIX, PREMIS objects) - jejich extrakce typicky probíhá automatizovaně (např. pomocí JHOVE)
  • rightsMD (METS rights, PREMIS rights)
  • sourceMD
  • digiprovMD (PREMIS events)

Lze používat volitelně další dostupná schémata ve všech sekcích (např. EAD).

V NK se nyní rozhoduje o výběru polí, které se budou v jednotlivých sekcích vyplňovat. Výběr perzistentních identifikátorů v Krameriovi by měl proběhnout během letošního roku (hledání schématu, bude se pravděpodobně používat více typů).

Noviny a časopisy uložené v Českém registru reformátovaných dokumentů (viz http://www.nkp.cz/pages/page.php3?page=weba_seznam.htm).

P. Novák, užitečný odkaz ke hledání plagiátů http://www.docoloc.de/.

Digitální knihovna šedé literatury - Petr Novák (STK)

Otázka vymezení pojmu "šedé literatury", např. zdrojové kódy programů, schémata aj. Problematika zpřístupnění plného textu pak není triviální. Svým pojetím patří šedá literatura do Koncepce trvalého uchování knihovních sbírek.

Národní úložiště šedé literatury budované v STK bude přijímat dokumenty z následujících zdrojů:

  • národní registr VŠKP
  • VŠ repozitáře
  • AV ČR (ASEP)
  • rezidua SIGLE v STK
  • soukromé/podnikové VÚ

Preferovaným komunikačním protokolem bude OAI-PMH nebo vlastní XML rozhraní, popisná metadata bude tvořit Dublin Core, otázkou zůstává výběr formátů dokumentů (pdf, xml, Tex, …). Přidanou službou by bylo dodání plného textu (nejlépe on-line). Pro zapouzdření objektů bude rovněž použit formát METS kontejneru. Značný důraz chce klást STK na možnosti a kontrolu zpřístupnění nejen uživatelům-lidem, ale i uživatelům- agentům. V letošním roce by měl proběhnout kvalifikovaný výběr systému.

Jako bod k podrobné analýze se ukazuje samotná volba formátu PDF. Má řadu verzí a rozšíření samotnou firmou Adobe. Obsahem pdf nemusí být jen text, ale i jiné objekty (audio, video, obrázek, JavaScript aj.). Ve formátu pdf lze zajistit bezpečnost obsahu pdf dokumentu různými způsoby, který z nich zvolit? (plug-in, heslo, …)

Diskuse: otevřena řada témat, která bude třeba v projektu prakticky realizovat.

  • M. Bartošek: doporučuje věnovat pozornost výběru zdrojů a hledání přidané hodnoty.
  • B. Stoklasová: je vhodné provést srovnání s obdobnými řešeními v zahraničí.
  • M. Svoboda: přidanou hodnotu bude sjednocené vyhledávání nad metadaty.
  • M. Lhoták: upozorňuje, že otázka zpřístupnění plných textů bude velmi záviset na vztahu autorů.

přestávka

Zpřístupňování eVŠKP - Iva Horová (AMU)

Lze se ztotožnit s příkladem IS MU, který slouží jako vlajková loď, jak by měly být VŠKP zpřístupňovány. Vysoké školy se staví ke zveřejňování různorodě, některé pozitivně, některé negativně (jedná se o citlivý výzkum, obchodní tajemství, postoj archivářů). Pro usnadnění budování repozitářů VŠKP vydala Asociace knihoven vysokých škol ČR několik doporučení, z nichž nejdůležitější je standard popisných metadat. O zpřístupňování byl proveden průzkum v prosinci 2006 formou dotazníkové akce, respondenty byly knihovny (26 odpovědí - 19 univerzit). Okruhy dotazů:

  • zajištění a koordinace: na úrovni univerzity (velký úspěch!), obvykle knihovna
  • reakce na novelu (většina ano nebo už byli připraveni, nejčastěji změny se vztahem k technickým parametrům, formální úpravě, archivaci elektronické verze, způsobu trvalého zpřístupňování)
  • popisná metadata (převaha používá doporučený standard)
  • zpřístupnění bibliografických záznamů (každá škola zpřístupňuje, většinou formou katalogu knihovny a/nebo zvláštní databází)
  • povinnost elektronické verze (15 škol z 19 sbírá elektronickou podobu textových prací, není ale vždy stanoveno jako povinnost; u netextových prací je sběr elektronické podoby nižší)
  • plné texty (většinou se zpřístupňuje na intranetu, na internetu méně)
  • výběr softwaru (nyní 3x na míru, 1x komerční, 1x open source; plánované systémy budou většinou integrované jakou součást IS na míru)

Plánována příprava národního registru (společný projekt 10 škol, koordinátorem VŠE), v rámci RP pro rok 2007. Každá škola bude řešit vlastní problematiku, ale s dopadem na národní registr. V prvním roce se počítá se sběrem metadat do databáze. Projekt ovšem nebyl přijat, a tak nyní školy hledají další možnosti financí.

Zpřístupňování výzkumných zpráv a dalších výstupů AV v digitální podobě - Jana Doleželová (KNAV)

Pohled na problematiku z hlediska zpracovatele dat, centrálního správce dat a vědce. Od roku 1994 vznik databáze ASEP (bibliografické záznamy publikací ústavů AV ČR). Vybraná data se pravidelně exportují do RIV (každým rokem úpravy podle požadavků Úřadu vlády - některé ústavy se tomu přizpůsobují velmi pružně).

Současné zpracování probíhá v systému ARL (EPCA), katalog je k dispozic na stránkách KNAV ČR. Má možnost připojení plného textu a jeho filtrování. Plný text může být umístěn lokálně, vzdáleně nebo k volně dostupným zdrojům v Internetu. V případě plných textů ze zahraničních impaktovaných titulů se zpřístupňují pouze na půdě dotyčného ústavu.

KNAV ČR má velký zájem na propojování bibliografických záznamů a digitálního obsahu, záleží ale na spolupráci a aktivitě ústavů.

Základní informace o grantu HISPRA - Záchrana pragensijních a dalších historických dokumentů z fondu MKP - Zuzana Kopencová (MKP)

Na začátku bylo odhodlání digitalizovat, podařilo se realizovat z finančních mechanismů EHP/Norska. Schvalování trvalo více než rok a půl. V listopadu 2006 byl poskytnout grant cca 400 tis. EUR na vybudování digitalizačního pracoviště. Cílem pořídit digitální kopie vzácných pragensií a zpřístupnit je.

Projekt je čtyřletý:

  • v roce 2007 vznikne digitalizační pracoviště
  • v letech 2008-2010 jeho ostrý provoz
  • následně vytvořit digitální knihovnu a zpřístupnit čtenářům/uživatelům
  • v posledním roce propagace projektu vůči veřejnosti

Aktuální stav digitalizace v MSVK Ostrava - Aleš Drahotušský

V roce 2005 vybavení pracoviště firmou Elsyst Engineering (planetární skener Atlas, sw Atlantis a Sirius). Digitalizace obsahu z fondu MSVK, dále z Archivu města Ostravy, plánuje se spolupráce se Slezským muzeem. Archivace na DVD nosičích, zpřístupnění sw Kramerius (cca 13000 stran - 2 tituly periodik, 18 titulů monografií) ve formátu DJVU.

Cílem vybudovat digitální knihovnu Moravskoslezského kraje, do které budou vybírány dokumenty ve vazbě na Retrospektivní regionální bibliografii.

Časté technické problémy na skeneru Atlas.

Kramerius - aktuální možnosti a předpokládaný vývoj v roce 2007 - Martin Lhoták (KNAV ČR)

Aktuální velikosti digitalizovaných sbírek NK a KNAV.

Instalace: digitální knihovna je instalována v KKV Havlíčkův Brod, SVK Hradec Králové, MSVK Ostrava, KFB Zlín a muzejních knihovnách (UPM Praha, Židovské muzeum, Muzeum východních Čech).

Podpora grafických formátů DJVU, JPEG, PNG, PDF a připravuje se podpora dvouvrstvého PDF. Vyhledávání plného textu prostřednictvím komerčního Convera RetrievalWare (od r. 2007 implementace Lucene). V roce 2006 byla doplněna možnost generování vícestránkových pdf.

Plánovaný vývoj v roce 2007:

  • perzistentní identifikátory
  • rozšíření metadat o technická a administrativní (prostřednictvím METS)
  • zaměření se na popis jednotlivých článků
  • příjem digitálních dokumentů, spolupráce s redakcemi časopisů AV ČR
  • podpora pro řízení práv a zpřístupňování jednotlivých dokumentů
  • podpora OpenURL (podle možností)

Výkon digitalizačního centra v roce 2006: digitalizováno 800 tis. stran, zpracováno 360 tis. stran. Kapacita skenerů je tak k dispozici za příznivé ceny (2 Kč/str. A4 400 dpi, 2,90 Kč/str. A4 600 dpi).

Debata - v rámci debaty dr. Polišenský doplnil, že v tomto roce je plánován vývoj OCR pro oblast periodik z 19. století;

Otázka V. Richtera ohledně software OCR na rozeznávání švabachu; reagoval p. Hermann z fy Elsyst - vzhledem k různorodosti použitých písem je nereálné - i SRN jenom některém typy švabachu

Stav digitalizace v KKV v Havlíčkově Brodě - Marta Balounová (KKV HB)

Digitalizace zahájena v roce 2006, spolupráce otevřena s muzejními a zámeckými knihovny. Zájem by byl ze strany muzeí o méně tradiční dokumenty (dopisy, historické hudebniny). Skenovací linku tvoří Atlas+Sirius, pro zpřístupnění chtějí použít Kramerius. Uvítali by DTD pro hudebniny.

Jednání sekce SDRUK pro IT, 14.2.2007

Portál STM - Martin Svoboda (STK)

Příspěvek byl věnován aktuálnímu stavu a perspektivám portálu STK s následným otevřením debaty k možnostem dalšího vývoje portálu STM.

  • STM je ukázka využití prostředků grantového programu LI nejenom na nákup informačních zdrojů (oblasti technických věd + medicína); spolupráce s JIB - zatím platonická
  • snaha zahrnout do katalogu STM všechny elektronické zdroje pořízené v rámci v LI ( ještě doplněno volnými zdroji) - snaha o zpřístupnění až na úroveň primárního zdroje s cílem maximálně využít veškeré nákupy elektronických zdrojů v rámci ČR za cca 100 mil Kč/ročně (v tom spočívá hlavní rozdíl mezi portálem STM a rozcestníkem Infozdroje, který nabízí pouze přehled licencí)
  • v rámci STM se uvažovalo o statistice k přehledu využívání - pro nezájem (až odpor) účastníků projektu se neuskutečnilo; naopak se povedlo vytvořit dotazy různým způsobem do katalogu licencovaných zdrojů nebo databáze volných zdrojů (SFX); všichni, kdo mají licence (cca 100 odkazů - rovnou na fulltexty)
  • volné zdroje - cca 1000 pravidelně udržovaných; dále existuje adresář výzkumných ústavů
  • katalog STM - popis na bázi DC + PSH; aktualizace 2x ročně
  • databáze dostupných zdrojů - popis na bázi PSH + min. záznam ze SK
  • celkem využívá cca 80.000 návštěvníků za rok
  • plány do budoucna - portál nekončí; v plánu je sjednocení obou bází (licencovaných + volných zdrojů); doplnění anglického rozhraní (zájemci z domén mimo .cz sice přicházejí, ale pokud narazí na české rozhraní, tak vzápětí odcházejí)

Diskuse: možné rozšíření záběru STM

  • T. Gec - dotaz na integraci STM do brány JIB - odpověď J.Pospíšilová - předpokládá se, nyní testováno;
  • T. Gec - otázka - je možné rozšířit STM jako portál všech volně dostupných českých periodik v el. podobě?
  • J. Kaňka - něco podobného již řeší část EZB - Directory of Free Access Journals - DFAJ (http://rzblx1.uni-regensburg.de/ezeit/dfaj - vytvářené University Library of Regensburg)
  • T. Gec - obecný námět na nějakou formu integrace vybraných volně dostupných webových zdrojů (nyní 3 řešení - STM pro oblast techniky a medicíny, WebArchiv pro zdroje s uzavřenou smlouvou na zpřístupnění, v brzké budoucnosti SKAT) do uceleného řešení

Možné způsoby měření využití databází a elektronických informačních zdrojů - Vít Richter (NK ČR)

Prezentace je o problematice a možných způsobech evidence statistických údajů této čím dál využívanější části služeb knihoven.

Po obecnějším úvodu byl prezentován:

  • přehled shromažďovatelů statistiky veřejných knihoven - NIPOS (VK, knihovny muzeí a galerií; registrované veřejné knihovny ostatních zřizovatelů) + další shromažďovatelé (NLK, AV ČR, ÚIV)
  • stávající statistika zahrnuje v oblasti využívání el. služeb 7 parametrů (připojení k Internetu; počet počítačů na připojení; počet návštěvníků používajících internet; existence on-line katalogu; poskytování vzděláváni v oblasti IT; virtuální návštěvy webových stránek - od roku 2007)
  • s měřením souvisí některé problémy typu jasné vymezení el. dokumentů a služeb, definice uživatele, ošetření možnosti toho, že knihovna je součástí nějaké instituce (potřeba rozlišení požadavků směřujících přímo na ni) - v důsledku toho jsou data zatím neporovnatelná, v nevhodných formátech nebo se vůbec nezjišťují
  • obecné požadavky - používat stejné a srozumitelné definice; používat stejné metody zjišťování; potřeba snadného zjišťování údajů; aplikovatelnost statistiky ve všech typech knihoven (jednoduchý webový formulář)
  • celá problematika měření el. služeb je poznamenaná nejasným vymezením toho, co do pojmu el. služby a dokumenty patří
  • problematika sledování statistik v jednotlivých oblastech:
    • návštěvy webových stránek - existuje metodický pokyn (určen typ počitadla; po roce vyhodnocení) - odchylka od mezinárodní normy (neodlišuje se zatím, zda zvnitřku nebo zvenku)
    • využívání OPACu či dalších bází knihovny - jakým způsobem
    • Využívání licencovaných zdrojů - prosazuje se iniciativa COUNTER - zapojen široký záběr firem a zdrojů a iniciativa získává respekt
  • COUNTER vymezuje typy reportů - pro časopisy (2 typy), knihy (6 typů) a databáze (3 typy); dále pak definici datových položek a statistické reporty
  • byla položena otázka - jaké údaje u využívání OPACu a dalších bází sledovat (východiska norma ČSN 2789 pro knihovnickou statistiku či COUNTER - nezbytná je domluva na seznam indikátorů ke sledování
  • na vyřešení této otázky by bylo vhodné vytvořit pracovní skupinu

Diskuse: problematika vhodné statistiky, hlavní otázkou je zadání a způsob výběru vhodných indikátorů

V Richter upřesnil, že pracovní skupina v rámci SDRUKu pro IT by řešila problematiku statistiky el. zdrojů, jinou oblast by řešila pracovní skupina v rámci Sekce SDRUKu pro RF

I. Horová doplnila, že obdobný problém řeší i VŠ knihovny; odpovědnou osobou je pí ing. Katolická, vedoucí sekce AKVŠ pro elektronické zdroje - V. Richter doplnil, že s ní je v kontaktu

K výběru nástroje pro Toplist pro měření návštěvnosti webových stránek upřesnil P. Žabička důvody (Toplist zveřejňuje údaje; Google Analytics - nezveřejňuje; Na vrcholu - od určité hranice se platí); různé hodnoty u vybraných měřených stránek z různých nástrojů - nejdůležitější je použití stejného nástroje u všech knihoven

P. Straka (KJM Brno) - upozornil, že dle zveřejněného metodického pokynu může vykazovat nereálné hodnoty (interval mezi 20.000-600.000 přístupy/měsíc, rozdíl způsobuje počítání přístupu zevnitř a z venku, , horní hranice je dosaženo nastavením domovské stránky KJM jako přednastavené na všech počítačích v knihovně); dále je zde otázka, jak řešit mnohopobočkové knihovny (jak vykázat, když jdu z pobočky na web ústřední knihovny atp.)

T. Řehák - reagoval upozorněním, že variant zkreslení statistik počtu přístupů na website může být více (dle způsobu řešení OPACu); je třeba ustavení pracovní skupiny, která se těmito problémy bude zabývat. Klíčovou otázkou je - Co vlastně chceme měřit?

P. Straka upozornil na další možné problémy s měřením návštěvnosti dle stávající metodiky (intergrace OPACu do webových stránek, způsob řešení webu obecních knihoven - záleží kdo vloží na stránky (problém s informatiky obcí; možné problémy na vnitřní webové síti za firewallem)

M. Svoboda - dle jeho názoru je cílem statistiky měřit návštěvy z venku (virtuální); fyzické osoby (včetně využití různých služeb knihovny) měříme jinou statistikou

V. Richter - u virtuální návštěvníků - jak specifikovat to, co je třeba sledovat

T. Řehák - letos lze předpokládat data nesrovnatelná; hlavní je zadání, co chceme změřit - dle jeho názoru jde o extenzi fyzických návštěv (slouží i jinak, než že do ní člověk přijde)

V. Richter doplnil, že jde o celosvětový problém - SRN vydala až loni některé parametry statistiky

B. Stoklasová doplnila, že v překladu výše zmíněné normy jsou chyby; zkoumání počitadel - zveřejnění v rámci výroční zprávy; dohoda s dodavatelem

T. Gec se zeptal na zadání toho, co sledovat - jde především o virtuální návštěvy z venku (s tím, že využití OPACu + databází typu EBSCO se bude řešit jinak)?

M. Svoboda sdělil, že dle jeho názoru jednoznačně jde o evidenci návštěv zvenku (bez využití OPACu); J. Kaňka se připojil s názorem, že OPAC by měl být sledován zvlášť od virtuálních návštěv

T. Řehák doplnil seznam problémů k řešení o to, zda evidovat i jiné formy přístupů než jenom webové (ftp; emailem)

Závěr debaty - k řešení této problematiky byla ustavena pracovní skupiny pod vedením dr. Víta Richtera ve složení - Martin Vojnar (VKOL), Petr Žabička (MZK), Pavel Straka (KJM Brno), Lukáš Gebauer, Jan Vávra (oba MKP), která bude doplněna o 3 zástupce malých knihoven.

přestávka

Následovala společná prezentace zástupců Národní knihovny (E. Bartůňková, V. Kapsa, J. Pilař, ) a Ústavu výpočetní techniky Univerzity Karlovy (M. Ledinský, J. Pokorný, J. Pavlík)

Oborová informační brána Knihovnictví a informační věda a Musica - NK ČR a ÚVT UK

Na úvod byla stručně představena JIB a její provazba na odkazové zdroje - již realizované oborové brány a a portály (portál EDU.CZ, portál STM, Virtuální umělecká knihovna, Fyzikální portál, Portál životního prostředí, České zoologické bibliotéky, Slovenská knižnica, EconLib, Medvik, Agronavigátor, Česká literatura). Demo viz data/xinha/sdruk/den2/kiv_sdruk3.swf.

Následně zástupci NK E. Bartůňková a V. Kapsa představili parametry aktuálně spuštěných oborových bran KIV a Musica, které zástupci ÚVT UK M. Ledinský, J. Pokorný, J. Pavlík doplnili popisem mechanismu fungování nástroje Metalib, nad kterým oborové brány běží.

  • Strategie (metodika) oborových bran sestává z kritérií výběru zdrojů, zpracování a zpřístupnění zdrojů, a správy elektr. sbírky
  • KIV - zaměření je dáno charakterem oboru; jde o kvalitativní a formální kritéria
  • Cílová skupina - knihovníci a informační pracovníci, studenti oborových SŚ a VŠ škol a pedagogové SŚ a VŠ
  • Stanovení záběru - vše co by mohlo knihovníky při jejich práci mohlo zajímat; jádro zdrojů je z oboru; zdroje z příbuzných oborů jsou zařazeny jenom pokud zde je průnik s KIV
  • MUS - cílová skupina - hudební vědci, pedagogové a studenti VŠ a SŚ hudebního zaměření, hudebníci, pedagogové ZUŚ, publicisté apod.
  • Specifika zdrojů - zvláštní druhy dokumentů (hudebniny, nahrávky), hudební dokumenty v obecně zaměřených zdrojích; omezení nabídky s ohledem na nezpracovanost hudebních fondů
  • Nabídka strukturována dle druhů dokumentu (literatura, www zdroje, hudebniny, zvukové dokumenty)
  • v portálu doplňuje hledání záchranná síť (nabídka Nenašli jste?, kde jsou odkazy na další zdroje)
  • KIV - 2 typy zdrojů - databáze (popis v Metalibu) - licencované i volné; primární dokumenty (katalogizace v bibliografické bázi - problém - nestálost zdrojů)

Technické řešení OIB

  • J. Pokorný - představení Plone + Metalib (uživatelské rozhraní je v portálovém systému Plone, aplikačním jádrem portálu je vyhl. stroj Metalib, který je do prostředí Plone zasazen jako jeden z portletů)
  • Představení Metalibu (=paralelní prohledávač doplněný SFX serverem)
  • 4 základní moduly (snadné hledání, nalézt zdroje, profi vyhledávání, můj prostor)
  • Zabudované zdroje dokáže obhospodařovat ve 3 režimech - plně integrované, částečně integrované a odkazované
  • Plone - open source; Metalib je integrován jako portlet; pracuji s Plonem - výsledek vyhledávání v okně pro Metalib - přes API rozhraní volám
  • přichází Metalib 4 (důraz na standardy - W3C, Blind Friendly Web, optimalizace na všechny prohlížeče - mj. IE7), rozhraní - usnadnění kusmotizace; podpora clusterů a faset (podpora postkoordinovaného zobrazení výsledků, technologie Vivisimo - vpravo tematické skupiny vyčleněné z popisu dokumentů analýzou textu - následně seskupení výsledků; fasety - nabídka skupin z určité třídy - podle Data, Autora …)
  • SFX - link server, odkazy na přidané služby (popis služeb - např. Citation Linker)
  • rozsáhlá znalostní báze (řádově statisíce); autentifikace (IP adresa, Shibboleth)
  • služby nabízené v rámci SFX u oborových bran - plné texty EBSCO a volně přístupných archivů, ověření dostupnosti v katalozích NKP a oborových archivů, ukázky/recenze na i-legalne, allmusic.com, autor na Groove

Diskuse -

T. Řehák - dotaz na možnost komunikace Metalibu i jiná než přes Z39.50; J. Pokorný - ano, i jiná rozhraní pro komunikaci (OAI-PMH, částečně zpřístupnění zdroje přes webové rozhraní - podpora open-URL, lze i proprietární rozhraní - pouze ve výjimečných případech s ohledem na množství potřebné práce na intergraci do JIBu)

T. Gec - dotaz k výběru zdrojů do brány KIV (katalogy krajských knihoven, knihovnické časopisy online); E. Bartůňková - zatím nebylo předmětem úvah, na webu je metodika výběru zdrojů, kterou je možno připomínkovat

T. Gec - dotaz na možnost on-line hradit objednávku EDD; M. Svoboda reagoval sdělením, že problematika byla již otevřena a jako problém se jeví určení částky ke složení v okamžiku objednání, kdy ještě výsledná suma není známa; P. Žabička upozornil na možnost strhnout rovnou zálohu z karty a na zavedení systému Pay-pal v ČR

Souborný katalog SKAT a elektronické zdroje - Jiří Šilha (SKAT)

Příspěvek se týkal rozšíření záběru souborného katalogu SKAT o elektronické zdroje (webové i další). V rámci prezentace postupně následovalo:

  • představení sdružení SKAT a plánovaných změn 2 hlavních bází stávající verze
  • u SK knih jde o změnu SW z Lania na Clavius, změnu databáze z FoxPro na MySQL5 a především změnu frekvence aktualizace www rozhraní katalogu SKAT ze čtvrtletní na průběžnou
  • u SK knihy již proběhla optimalizace rychlosti vyhledávání v souvislosti se zapojením zdroje do JIB; nyní je v plánu stahování záznamů z účastnických knihoven pomocí protokolu OAI-PMH téměř on-line (zůstane jakási předběžná kontrola)
  • statistika počtu vyhledávání - nárůst z 21116 v roce 2000 na 165 378 v roce 2006
  • u SK článků - ANSKAT - nově začne stahování všech záznamů (zatím jen článků periodik s regionální působností) a bude spuštěno automatické odstraňování duplicit
  • u SK elektronických zdrojů - stejně jako u článků budou stahovány všechny zdroje pomocí technologie anish;
  • v plánu je koordinace metodiky tvorby záznamů; automatické odstraňování duplicit; www přístup v rámci databáze ANISH
  • záběr SK el. zdrojů směřuje jenom na seriózní zdroje; pro přehled obsahu báze se počítá s využitím konspektu; v případě zájmů vytvoření stromu hesel spíše http://lii.org/ (lidská síla - spíše v budoucnu)
  • cílem je db zajímavých zdrojů, které knihovny používají
  • součástí řešení - automatická kontrola existence zdroje; možnost využití těchto zdrojů v lokálních zdrojích zapojených knihoven
  • do www-OPACu Clavius byly nově zabudovány odkazy z autorit na hesla Wikipedie (generované automaticky) - např. Městská knihovna Tábor

Diskuse - na téma dalších možností AKS a SK SKAT

N. Andrejčíková - informace o databázi regionálních zdrojů Rapid Library - báze (testovací) - využití některými knihovnami - integrace do JIB?

M. Svoboda - námět - bylo by vhodné otevření SKATu elektronických zdrojů pro další zájemce

Možnosti využití programového vybavení WebArchivu dalšími subjekty - Petr Žabička (MZK Brno)

V rámci prezentace byly představeny SW nástroje, na kterých funguje Webarchivu a zároveň model jeho práce

  • WebArchiv - základní fakta - 134,5 mil. sklizených souborů, 5,465 GB dat a první dokument archivován 3.9. 2001
  • nástroje - převážně z dílny konsorcia pro archivaci webu IIPC
  • na sklízení se používá Heritrix (open source na platformě javy, vylepšena ochrana před pádem do pastí, ale i tak nelze dlouhodobě sklízet bez odborných zásahů)
  • Heritrix doplňuje nástroj Deduplikator pro detekci duplikátů (mj. zda se nestahuji 2 obrázky ze dvou míst - velký objem dat);
  • dalším nástrojem pro správu sklízení je Webcurator Tool - usnadňuje práci se sklízením po prvotním nastavení i laickým uživatelům (nyní se testuje)
  • Nepoužívaný nástroj - DeepArc (produkt Francouzské národní knihovny 2 roky nevyvíjený)
  • Indexace (indexovací nástroj Nutch - open source odpověď na Google), vrací na dotaz i XML strukturu
  • Nástavba vyhledávacího rozhraní pro WebArchiv - NutchWAX,
  • Pro zpřístupnění se dále používá WERA - velmi snadná navigace obsahující práci s časovou osou (pravděpodobně bude zastaven vývoj) , problém s java skripty a odkazy; nástupce Wayback
  • Wayback - podpora hvězdičkové konvence; 3 režimy zpřístupnění - Archival URL, proxy, timeline
  • WAXToolbar - plug-in pro Firefoxu (upřesňuje období, které chce uživatel i po Waybacku)
  • XIng (produkt z Austrálie) - zabývá se archivací hlubokého webu

Doplňující informace - IIPC- NK členem (vývoj řídí výbor; finanční podpora individuálního vývoje X po ukončení může jednotlivá organizace vývoj uzavřít)

V rámci debaty padl tip na Workflow - smlouvy; spadne do režimu častějšího stahování

Různé - všeobecná debata

Dotaz na přijímání platebních karet (užívání a podmínky užívání karet, hlavně poplatky) - ze zúčastněných zatím nikdo nemá

T. Gec - v rámci BMI by stálo za to propagovat v médiích nějakou službu knihoven na národní úrovni typu Ask your Library, v optimálním případě umístěnou na snadno zapamatovatelné centrální webové adrese typu www.knihovny.cz ; V. Richter doplnil, že před cca 5 lety byla takto konkrétně služba Ask your library propagována

M. Svoboda - námět - stálo by za to vytvořit na webu jakýsi přehled nevyužitých nápadů; V. Richter doplnil možné vystavení zajímavých přednášek, které jejich autor nabízí k prezentaci

T. Gec - námět - v rámci Sekce SDRUK pro IT by stálo za to na webové adrese sekce vystavit přehled vlastního pomocného SW účastnických knihoven, které vznikly v rámci vlastní činnosti IT oddělení a lze ho případně využít i jinde (např. kompletní intranetové řešení čí adresář knihoven)

Příští setkání na úrovni informatiků by mělo proběhnout na podzim opět v Olomouci

Forma velkého setkání - optimální ve stávající podobě 1x za rok; T. Gec navrhl, že kromě automaticky informovaných členů sekce se může v konferenci dotázat na tipy na další vhodné účastníky a tipy na program.

­­
Knihovny současnosti 2019
Copyright © 2019 Sdružení knihoven ČR Tvorba www stránek Winternet