V rámci řešení projektu byla zpracována detailní modulární specifikace pracovního postupu (workflow), využitelná jak při tvorbě nové znalostní báze, tak při editaci a aktualizaci stávajícího obsahu.
1. fáze – akvizice znalostí
Proces: Vyjádření znalostí prostřednictvím výroků v přirozeném jazyce.
Výstup: Výrok v přirozeném jazyce.
Zdroje:
- definice termínů ve výkladovém slovníku (definice z TDKIV, vlastní formulace)
- výroky odvozené z výsledků obsahové analýzy vybraných odborných dokumentů (uplatnění principu literary warrant)
- výroky zpracované doménovým expertem
Kroky:
- Vytvoření výroku. Vyjádření znalostí větami přirozeného jazyka (např. „Funkcí systému organizace znalostí je podpora procesů organizace znalostí a přístupu ke znalostem“).
- Určení typu výroku: deklarativní – procedurální. Další fáze se týkají deklarativních výroků.
2. fáze – analýza znalostí
Proces: Nalezení a vyjádření subjektů, objektů a predikátů.
Výstup:
Standardizované vyjádření pojmů a predikátů.
Zdroje:
- výroky v přirozeném jazyce
- termíny z rejstříků odborných publikací
Kroky:
- Nalezení subjektů a objektů (např. „organizace znalostí“).
- Doplnění seznamu subjektů a objektů o termíny z rejstříků odborných publikací.
- Standardizace vyjádření subjektů a objektů (1. pád sg., přirozený slovosled u víceslovných výrazů).
- Výběr preferovaných termínů, jež budou označovat pojmy.
- Nalezení predikátů.
- Standardizace vyjádření predikátů (domain – definiční obor, range – obor hodnot)
3. fáze
Proces: Indexování (kategorizace, zatřídění) pojmů a predikátů podle definovaných ontologických tříd, tj. podle faset a podle Klasifikačního systému literatury oboru organizace znalostí (klasifikace KO Literature ). Rozdělení pojmů na 2 skupiny: 1. „jádro“ oboru organizace znalostí, 2. kontext oboru organizace znalostí.
Kroky:
- Definování faset (využití metodiky Denton – Spiteri).
- Kategorizace pojmů (tj. preferovaných termínů) do faset.
- Kategorizace pojmů do skupin – jádro a kontext.
- Klasifikace pojmů (tj. preferovaných termínů) do klasifikace KO Literature.
- Kategorizace predikátů.
Výstup:
Definované vztahy pojem–faseta a pojem–klasifikace.
Vytvoření dvou skupin pojmů – jádro a kontext oboru organizace znalostí.
Definovaný vztah predikát–kategorie.
4. fáze
Proces: Určení vzájemných vztahů pojmů a vzájemných vztahů predikátů: hierarchie, asociace.
Kroky:
- Definování generických hierarchických vztahů mezi pojmy z jádra.
- Definování asociativního vztahu k pojmu z jádra pro každý pojem z kontextu.
- Definování ostatních potřebných vztahů mezi pojmy z jádra a z kontextu.
- Definování vzájemných vztahů predikátů.
- Zápis vztahů do databáze.
- Automatické vytvoření odvozených vztahů.
Výstup:
Definované vzájemné vztahy pojmů a predikátů.
5. fáze
Proces: Propojení pojmů a predikátů (viz Propojená data).
Vnitřní propojení:
- Pojem–Pojem, Pojem–Dílo, Pojem–Agent ad.
Vnější propojení:
- Propojení na externí pojmy a zdroje z relevantních jmenných prostorů (např. česká Wikipedie, česká DBpedie, TDKIV, KZK, NA ČR, EUROVOC, PSH).
- Propojení na externí predikáty z relevantních jmenných prostorů (např. SKOS, FRBR, RDF, FOAF, OWL).
Výstup:
Začlenění pojmů a predikátů do RDF linků s informací o jejich vnitřním a vnějším propojení.
6. fáze
Proces: Tvorba formalizovaných výroků
Kroky:
Nahrazení provizorních definic (ty se přesunou do poznámky) formalizovanými výroky v RDF formátu, sestavenými z definovaných pojmů (ve funkci subjektů/objektů) a predikátů.
Výstup:
Formalizované výroky.
Příklad:
subjekt: ontologie
predikát: má nástroj
objekt: axiom
7. fáze
Proces: Vizualizace znalostí.
Zpracování UML diagramů (vizuální vyjádření „znalostního grafu“):
- pro deklarativní znalosti diagram tříd
- pro procedurální znalosti diagram aktivit (aplikační profil Eriksson-Penker)