Zdrojovým materiálem pro údaje znalostní báze jsou výroky zformulované v přirozeném jazyce, jež mohou obsahovat abstraktní znalosti a faktové údaje, případně jejich kombinace.
Příklad
Shiyali Ramamrita Ranganathan je autorem díla Prolegomena to library classification (1967) a tvůrcem Dvojtečkové klasifikace, založené na principu faset. Na jeho myšlenky navazuje CRG (Classification Research Group), která byla ustavena v roce 1952 a věnovala se zkoumání fasetové analýzy. Člen CRG Jack Mills je editorem 2. vydání Blissovy Bibliografické klasifikace (BC2), jež se stala praktickou realizací (je výsledkem) teorií CRG. Henry Evelyn Bliss (1870–1955) je tvůrcem Bibliografického třídění. 2. revidované vydání Blissova bibliografického třídění (BC2) připravuje od roku 1970 Bliss Classification Association (BCA) z podnětu Jacka Millse, člena Skupiny pro výzkum klasifikace (CRG). Revize klasifikace je založená na principu faset, který zavedl S. R. Ranganathan a který dále rozvíjela CRG. Faseta je kategorie entit vytvořená podle jedné klasifikační charakteristiky (principium divisionis). Obsahem fasety je specifická a samostatná množina pojmů, patřících k jedné základní kategorii, jež umožňuje organizovat obsah podle kritéria členění daného těmito základními kategoriemi.
Poznámka: Výroky v tomto příkladu jsou ukázkou principu AAA (anyone can say anything about anything) – o stejném tématu jsou zpravidla k dispozici různá tvrzení, jež nemusí být navzájem konzistentní, ale nemusí se ani vzájemně vylučovat.
Výroky v přirozeném jazyce jsou následně analyzovány, což zahrnuje dekompozici na subjekty, predikáty a objekty, sjednocení terminologie, přiřazení subjektů a objektů k ontologickým třídám, přiřazení predikátů k ontologickým predikátům. Následuje syntéza, která spočívá v propojení subjektů a objektů formalizovanými predikáty a v propojení subjektů a objektů na externí data. Výsledkem je množina formalizovaných výroků, připravených k uložení do znalostní báze.
1. fáze - nalezení subjektů a objektů
2. fáze - začlenění subjektů a objektů do ontologických tříd a jejich indexování podle klasifikačního systému KO Literature
Formalizované výroky:
<je instancí třídy> Dílo
<má předmět> http://www.isko.org/kolit.php?cl=045 (klasifikační znak třídění KO Literature)
<je instancí třídy> Vyjádření
<je instancí třídy> Vyjádření
Bliss Classification Association
<je instancí třídy> Agent
<má předmět> http://www.isko.org/kolit.php?cl=925 (klasifikační znak třídění KO Literature)
<je instancí třídy> Agent
<má předmět> http://www.isko.org/kolit.php?cl=925 (klasifikační znak třídění KO Literature)
<je instancí třídy> Dílo
<má předmět> http://www.isko.org/kolit.php?cl=046 (klasifikační znak třídění KO Literature)
<je instancí třídy> Pojem
<má předmět> http://www.isko.org/kolit.php?cl=325 (klasifikační znak třídění KO Literature)
<je instancí třídy> Agent
<má předmět> http://www.isko.org/kolit.php?cl=922 (klasifikační znak třídění KO Literature)
<je instancí třídy> Agent
<má předmět> http://www.isko.org/kolit.php?cl=922 (klasifikační znak třídění KO Literature)
Prolegomena to library classification
<je instancí třídy> Dílo
<má předmět> http://www.isko.org/kolit.php?cl=111 (klasifikační znak třídění KO Literature)
<je instancí třídy> Agent
<má předmět> http://www.isko.org/kolit.php?cl=922 (klasifikační znak třídění KO Literature)
3. fáze - propojení subjektů a objektů pomocí formalizovaných predikátů
Formalizované výroky:
Bibliografické třídění
<má (používá) nástroj> faseta
<má realizaci> Bibliografické třídění BC1
<má realizaci> Bibliografické třídění BC2
Bibliografické třídění BC2
<je výsledkem (teorií)> Classification Research Group
<je založeno na> Bibliografické třídění BC1
Bliss Classification Association
<je editor> Bibliografické třídění BC2
Classification Research Group
<je pokračováním (navazuje na)> Shiyali Ramamrita Ranganathan
Dvojtečkové třídění
<má (používá) nástroj> faseta
faseta
<má definici> „Kategorie entit vytvořená podle jedné klasifikační charakteristiky (kritéria členění)“
Henry Evelyn Bliss
<je tvůrce> Bibliografické třídění
Jack Mills
<je člen> Classification Research Group
<je editor> Bibliografické třídění 2
Shiyali Ramamrita Ranganathan
<je autor> Prolegomena to library classification
<je tvůrce> Dvojtečkové třídění
4. fáze - propojení subjektů a objektů na externí zdroje z relevantních jmenných prostorů
Formalizované výroky:
Bibliografické třídění
<je předmětem> http://cs.dbpedia.org/page/Blissovo_t%C5%99%C3%ADd%C4%9Bn%C3%AD (článek v DBpedii)
<je předmětem> https://cs.wikipedia.org/wiki/Blissovo_t%C5%99%C3%ADd%C4%9Bn%C3%AD (článek ve Wikipedii)
<má ekvivalentní entitu> http://viaf.org/viaf/183040827 (identifikátor v bázi VIAF)
<má ekvivalentní entitu> http://bartoc.org/en/node/462 (metadata v registru Bartoc)
Classification Research Group
<má ekvivalentní entitu> http://isni.org/isni/0000000110110690 (identifikátor v bázi ISNI)
<má ekvivalentní entitu> http://viaf.org/viaf/133663593 (identifikátor v bázi VIAF)
Dvojtečkové třídění
<má ekvivalentní entitu> http://bartoc.org/en/node/862 (metadata v registru Bartoc)
faseta
<má ekvivalentní entitu> http://aleph.nkp.cz/F/?func=direct&doc_number=000001528&local_base=KTD (heslo v TDKIV)
Henry Evelyn Bliss
<je předmětem> http://cs.dbpedia.org/page/Henry_Evelyn_Bliss (článek v DBpedii)
<je předmětem> https://cs.wikipedia.org/wiki/Henry_Evelyn_Bliss (článek ve Wikipedii)
Prolegomena to library classification
<má ekvivalentní entitu> http://www.worldcat.org/oclc/60497 (metadata v katalogu WorldCat)
<má ekvivalentní entitu> http://aleph.nkp.cz/F/?func=direct&doc_number=001036313&local_base=NKC (metadata v katalogu NK ČR)
<popisuje> http://hdl.handle.net/10150/106370 (zdroj v repozitáři)
Shiyali Ramamrita Ranganathan
<má ekvivalentní entitu> http://viaf.org/viaf/49268668 (identifikátor v bázi VIAF)
Ukázka inference
Díky tomu, že je tranzitivně vyjádřen vztah Dvojtečkového třídění a Bibliografického třídění, jež obě používají fasety, lze odvodit, že panuje vztah asociace i mezi tvůrci těchto klasifikací H. E. Blissem a S. R. Ranganathanem, i když znalostní báze neobsahuje explicitní informaci o tomto vztahu ve formě přímé asociace obou tvůrců.
Propojená otevřená data
Data ze znalostní báze jsou k dispozici také ve formátech RDF, TTL a JSON.
K získání těchto dat můžete použít například cURL.
Příklady příkazů k získání dat ve formátech RDF, TTL a JSON:
curl -L -H "Accept: application/rdf+xml" http://ko.cuni.cz/node/2130
curl -L -H "Accept: application/ttl" http://ko.cuni.cz/node/2130
curl -L -H "Accept: application/json" http://ko.cuni.cz/node/2130
Kromě toho můžete využít SPARQL endpoint (rozhraní je v angličtině).
Vzorový dotaz v jazyce SPARQL, ve kterém je možné pokládat dotazy:
PREFIX foaf: <http://xmlns.com/foaf/0.1/>
SELECT ?name
WHERE {
?name a foaf:Agent.
}