Základní schéma vyhledávacího mechanismu je následující:
Výsledkem projektu ve zjednodušeném pojetí je vyhledávací mechanismus.
Zkušenosti s požadavky na vyhledávací mechanismy při vyhledávání informačního zdroje, ať už v knihovně, nebo na Internetu, vedly v praxi k určitým zvyklostem v knihovnické praxi a v praxi budování vyhledávacích mechanismů na Internetu. Z těchto zvyklostí lze zpětně odvodit požadavky kladené na vyhledávací mechanismy.
Pokud jde o shrnutí požadavků (kategorií dotazů) uživatelů, se kterými se obrací na vyhledávací mechanismy, při vytváření jemnějšího filtru na odfiltrování informačního šumu, lze vyjít z praktických zkušeností, jejichž zrcadlem je například struktura metadat ve standardu Dublin Core (viz např. projekt Národní knihovny ČR na http://webarchiv.nkp.cz, resp. http://webarchiv.nkp.cz/cgi-bin/dc_cz.pl, nebo domovskou stránku DC - http://dublincore.org/). Základními prvky tohoto standardu jsou:
(pozor na smysl jednotlivých termínů, jako „zdroj“, „dílo“, „intelektuální obsah“...)
Název (Title)
název přidělený zdroji tvůrcem nebo vydavatelem
Tvůrce (Creator)
osoby nebo organizace, které primárně vytvořily intelektuální obsah zdroje
Předmět (Subject)
téma obsahu zdroje
Popis (Description)
popis obsahu zdroje
Vydavatel (Publisher)
u elektronických zdrojů je to entita (osoba) odpovědná za aktuální zpřístupnění zdroje
Přispěvatel (Contributor)
další entita (osoba), která významně přispěla k vytvoření zdroje
Datum (Date)
datum vydání (zpřístupnění) zdroje v aktuální podobě
Typ (Type)
kategorie zdroje (homepage, technická zpráva, slovník, román, ...)
Formát (Format)
ASCII, text/html, JPEG, ...
Identifikátor (Identifier)
číslo nebo alfanumerická řada jednoznačně identifikující zdroj (k identifikaci shody, resp. duplicit)
Zdroj (Source)
číslo nebo alfanumerická řada jednoznačně identifikující dílo, z něhož byl zdroj získán (k identifikaci shody, resp. duplicit)
Jazyk (Language)
jazyk intelektuálního obsahu zdroje
Vztah (Relation)
Vztah zdroje k jiným zdrojům
Pokrytí (Coverage)
prostorové a/nebo časové charakteristiky zdroje
Práva (Rights)
copyright, správa práv
Tyto hlavní prvky je třeba zařadit do relačních vztahů
v terciální relační databázi.
Odběratel |
Poskytovatel |
Specifikace licence poskytovatele |
Licenční podmínky |
STK |
Elsevier |
|
|
NK |
EIFL |
|
|
|
|
|
|
Poskytovatel |
Specifikace licence poskytovatele |
Seznam poskytovatelem nabízených zdrojů dle specifikace- jméno |
Typ zdroje |
Elsevier |
|
|
Periodikum |
EIFL |
|
|
Databáze |
Elsevier |
|
|
Sekundární zdroj |
Jméno |
Věcný popis |
Bibliografický popis (minimálně DC) |
Další údaje |
|
|
|
|
|
|
|
|
|
|
|
|
Databáze-jméno |
Věcný popis |
Bibliografický popis (minimálně DC) |
Další údaje |
|
|
|
|
|
|
|
|
|
|
|
|
Databáze jméno |
Věcný popis |
Bibliografický popis (minimálně DC) |
Další údaje |
|
|
|
|
|
|
|
|
|
|
|
|
Naznačené relace jsou pouze schematické, ve skutečnosti půjde o dosti složité struktury, které budou podchyceny v souborech XML a vzhledem k různorodosti mnohojazyčných popisů zdrojů budou v kódu UTF-8 nebo UTF-16.