Semantische Technologien & Wissensmanagement der Zukunft

Foto: Unsplash/ Clint Adai​

Ursprünglich veröffentlich in “279.Tirol” (GemNova), November 2020, Seite 86-87 (https://www.yumpu.com/de/document/read/65002755/279tirol-november-2020/87 ).

Die Suche nach Information hat sich innerhalb weniger Jahre mehrfach gewandelt. Die Rolle, die ursprünglich Bücher, Zeitschriften, Printmedien, Television und Radio einnahmen, wurde sehr schnell von Computer oder Handy übernommen. Die Information beziehen diese neuen Medien aus dem Internet, oder genauer, dem World Wide Web. Das Web, wie es kurz genannt wird, ist auch die Informationsquelle für die neueste Entwicklung in der Informationsbeschaffung, nämlich die Suche durch intelligente Assistenten, wie Alexa, Google Home, Siri oder diverse Chatbots. Doch die Intelligenz dieser Systeme ist begrenzt und die Messlatte dafür ist die Verfügbarkeit von relevanten Informationen von digitalisiertem Wissen.

Die dafür nötigen technischen Voraussetzungen werden gesammelt als semantische Technologien bezeichnet. Beispiele dafür sind Ontologien. Dies sind Sammlungen von Typen und deren Eigenschaften, um Datensätze maschinenlesbar zu beschreiben. Ein weiteres Beispiel sind Knowledge Graphs. Hierbei handelt es sich um graph-basierte Speicherstrukturen, die auf die Speicherung semantisch angereicherter Daten spezialisiert sind. Auch Systeme, die Webseiten und Knowledge Graphs durchsuchen und automatisch mit den dort gefundenen Daten umgehen können, werden als semantische Technologien bezeichnet. Diese Technologien, auf Daten angewandt, um daraus Wissen zu machen, helfen Assistenzsystemen Wissen zu verstehen und entsprechend weiterzugeben.

In diesem Beitrag wollen wir vorstellen wie Wissen, basierend auf semantischen Technologien, so verwaltet werden kann, dass es maschinell besser und einfacher verarbeitet und verstanden wird und wie semantische Technologien dazu beitragen, das Web lesbarer und verständlicher zu machen. Um Wissen mit semantischen Technologien anzureichern, zu bereinigen, zu speichern und dann weiter zu publizieren beschreiben die Autoren des Buches “Knowledge Graphs” [Fensel et al., 2020] den Knowledge Management Lifecycle. Dieser besteht aus vier Schritten: Knowledge Creation (Wissenserzeugung), Knowledge Hosting (Wissensspeicherung), Knowledge Curation (Wissensaufbereitung) und Knowledge Deployment (Wissensverbreitung). Jeder dieser vier Schritte benötigt in seiner Anwendung ein hohes Maß an Aufmerksamkeit und in seiner Umsetzung  einen hohen Level an Know-How und Technologischen Grundlagen.

Bei der Knowledge Creation zum Beispiel ist es wichtig, dass die Daten mit einer möglichst weit verbreiteten “semantischen Sprache”, einer Ontologie, beschrieben werden. Hier bietet sich schema.org, aufgrund seiner weltweiten Verbreitung, sehr gut an. Beim Knowledge Hosting ist es wichtig, dass die semantisch annotierten Daten in einem  speziellen Format gespeichert werden, um den vollen Funktionsumfang den semantische Technologien mit sich bringen, zum Beispiel das effiziente abarbeiten komplizierter Anfragen, abrufbar zu machen. Die Knowledge Curation, der wohl schwierigste Schritt im Knowledge Management Lifecycle, beschäftigt sich mit der Qualität der Daten. Duplikate müssen eliminiert oder integriert werden, fehlerhafte Informationen erkannt und bestenfalls behoben werden – und das möglichst automatisiert, da beim Knowledge Management mitunter Milliarden von Datensätzen betrachtet werden. Schließlich gilt es beim Knowledge Deployment die semantisch annotierten Daten einer möglichst breiten Anwenderschicht einfach und effizient zur Verfügung zu stellen um damit nützliche Anwendungen zu bauen.

In der Praxis gibt es dazu viele Anwendungsbeispiele in denen die Verwendung semantisch annotierter Daten gegenwärtig oder zukünftig zum Einsatz kommt. Neben den angesprochenen Chatbots oder intelligenten Assistenzsystemen wie Alexa, Google Home oder Siri sind semantische Technologien vor allem in der Publikation von Open Data von großer Bedeutung. Klassisches Open Data, wie zum Beispiel Open Government Data, ist meist nicht oder nur bedingt maschinenlesbar und zur Verwendung müssen Daten mühsam von Hand aufbereitet werden. Bei der Publikation der Daten als “5 Sterne Linked Open Data” jedoch, werden Daten so mit semantischen Annotationen angereichert, dass sie implizit maschinenlesbar und -verständlich sind.

Das Tiroler Unternehmen GemNova arbeitet derzeit mit dem Semantic Technology Institute Innsbruck (STI2), einer Forschugsgruppe am Institut für Informatik der Universität Innsbruck, an einem Projekt das sich mit semantisch annotierten Daten beschäftigt. Dabei wird der Knowledge Management Lifecycle auf den Themenbereich Pflege angewandt. Daten zum Thema Bedarf, Bedürfnisse, Personal, Qualifikationen und Verfügbarkeiten werden erfasst, semantisch aufbereitet, in einem teilweise offenen Knowledge Graph gespeichert und dann in einer Matchmaking Plattform zur Anwendung gebracht. Letztere nutzt die hervorragenden Eigenschaften semantisch angereicherter Daten hinsichtlich des semantic matchmakings, des Verknüpfens zweier Datensätze, hier, dem Pflegebedarf und der Deckung des Bedarfs durch das passende Pflegepersonal.

Zukünftig werden wir immer mehr auf semantische Technologien zurückgreifen und vertrauen können. Neben semantisch annotierten Daten werden auch semantisch annotierte Services verfügbar sein. Diese bringen dann Maschinen in die Lage Verkaufs- und Buchungsschnittstellen auf Webseiten oder in Knowledge Graphs selbständig zu finden und eigenständig darauf zu handeln. Dadurch könnten große Aggregationsplattformen wie Amazon oder Booking.com deutlich an Marktmacht verlieren und kleine Anbieter von Produkten und Services wieder mehr an Sichtbarkeit und somit Wichtigkeit gewinnen.

Referenzen:
Fensel, D., Şimşek, U., Angele, K., Huaman, E., Kärle, E., Panasiuk, O., Toma, I., Umbrich, J. & Wahler, A. (2020). Knowledge Graphs. Springer International Publishing.

Fortbildungen und mehr Informationsangebot zu diesem und weiteren Themen finden Sie bei unseren DIH West Terminen. 

Autoren

Elias Kärle

Elias Kärle

Semantic Technology Institut der Universität Innsbruck
elias.kaerle@sti2.at
Dieter Fensel

Dieter Fensel

Semantic Technology Institut der Universität Innsbruck
dieter.fensel@sti2.at