V souladu s normou ISO/TR 9007:1987 je znalostní báze rozčleněna na pojmové schéma a datovou základnu. Na nejobecnější úrovni pohledu jsou definovány tyto základní komponenty architektury:
- Datový prvek
- Entita
- (1) Výrok/Věta (ontologie)
- (1.1) Pojem (subjekt/objekt)
- (1.2) Vztah / Predikát
- (2) Deskriptivní metadata
- (2.1) Nedokumentový zdroj / Pojmenovaná entita
- (2.2) Dokumentový zdroj
Obr. 1 Sémantická architektura znalostní báze
-
Třída nazvaná Datový prvek je metatřída. Zahrnuje informace o sémantice všech prvků z pojmového schématu znalostní báze a jejich mapování do relevantních jmenných prostorů.
- Abstraktní třída nazvaná Entita zobecňuje veškerý datový obsah znalostní báze. Každá entita může vstupovat do libovolných asociativních vztahů s ostatními entitami, což znázorňuje rekurzivní asociace vzájemný vztah entit. Vzájemný vztah asociace se může týkat jak entit z různých tříd, tak entit v rámci stejné třídy. Příkladem binární asociace je např. vztah autorství mezi agentem a dokumentovým zdrojem nebo vztah realizace mezi dílem a vyjádřením. Příkladem unární asociace je např. hierarchie vztahů, vztahy pojmů, vzájemná souvislost akcí, vztahy dílo-dílo, vyjádření-vyjádření ad. Každá entita, definovaná v znalostní bázi organizace znalostí, je identifikována prostřednictvím URI.
- Entity se člení na dva základní typy: výroky (třída (1) Výrok/Věta), které obsahují „čistou znalost“ a jsou strukturovány v souladu s pravidly jazyka RDF, a deskriptivní metadata o zdrojích (abstraktní třída (2) Deskriptivní metadata).
- Abstraktní třída (2) Deskriptivní metadata se člení na dva typy – metadata o dokumentových zdrojích a metadata o ostatních zdrojích, jež nemají charakter dokumentu.
- Nedokumentové zdroje (abstraktní – agregační třída (2.1) Nedokumentový zdroj/Pojmenovaná entita) jsou ve stávající verzi znalostní báze představovány čtyřmi typy: Agent – tato abstraktní třída se v souladu s pojetím modelu FRBR člení na osoby (Osoba) a na instituce (Korporace), jež mohou být asociovány s libovolnou entitou vztahem vytvoření, produkce, distribuce apod. Třída Událost/Akce zachycuje údaje o konání konferencí, projektů, o výzkumných aktivitách, publikování významných děl. Třída Nástroj je určena pro zachycení popisných metadat o nástrojích, pomůckách a metodikách organizace znalostí (software, jazyky, formáty, pravidla, technologie). Třída Aktivita/Proces je rezervovaná pro jednotky procedurálních znalostí, potřebných pro zdárný průběh aktivit a procesů realizovaných během organizace znalostí.
- Soubory metadat o dokumentových zdrojích jsou konceptuálně modelovány v souladu s modelem FRBR: jádrem je trojice tříd (2.2) Dokumentový zdroj (Dílo / Vyjádření / Provedení), vzájemně spojených asociacemi vyjadřujícími skutečnost, že dílo je realizováno pomocí vyjádření a vyjádření je ztělesněno v provedení.
- Třída Výrok/Věta je agregátem tří komponent – subjektu a objektu, jež mají stejnou vnitřní strukturu, a proto jsou modelovány jednou třídou (1.1) Pojem (subjekt/objekt). Třetí komponentou je predikát, jehož vlastnosti zachycuje třída (1.2) Vztah/Predikát. Obsah této třídy je použitelný dvojím způsobem: jednak jako konstrukční prvek výroků a jednak jako označení typu vzájemného vztahu entit.
Na obrázku 2 je znázorněna znalostní báze organizace znalostí ve formě komponenty balíček v jazyce UML. Prostřednictvím přerušovaných šipek vedoucích ve směru od znalostní báze k externím entitám (třídy v UML) je vyznačeno propojení obsahu znalostní báze s externími zdroji/daty.
Typy propojení:
- Mapování metadat – propojení metadat ve znalostní bázi se sémanticky ekvivalentními metadaty v externích zdrojích
- Linkování (propojení) zdrojů – přímé a nepřímé propojení metadat ve znalostní bázi se zdroji (agenti, dokumentové zdroje)
- Mapování pojmů (subjektů a objektů) a predikátů ve znalostní bázi na sémanticky ekvivalentní zdroje
- Mapování termínů a interních číselníků
- Mapování struktury – mapování datových prvků pojmového modelu znalostní báze
Obr. 2 Typy mapování a propojování obsahu znalostní báze