Semantic Web - Grundlagen Pascal Hitzler - Markus Krötzsch - Sebastian Rudolph - York Sure e-ISBN 978-3-540-33994-6 (c) Springer Verlag Berlin Heidelberg 2008 Kapitel 1 - Die Idee des Semantic Web Preview: - strukturiert - sehr aktuelle Veroeffentlichung - renommierte Autoren - wissenschaftliche Arbeit - Ueberschriften enthalten wichtige Begriffe - erste deutsche Veroeffentlichung zu dem Thema - Verfuegbarkeit in (online-) HfT-Bibliothek - Hoffnung auf weitere Einfuehrung in das Thema - trotz Renommee der Autoren Ausfuehrlichkeit der Antworten auf vermeintlich einfache Fragen Questions: - 1 - Was ist das Web ? - 2 - Was ist ueberhaupt Semantik ? - 3 - Warum semantisches Web ? - 4 - Welche Probleme hat das (nicht-semantische) Web ? - 5 - Wie loest man die Probleme ? - 6 - Welche Technologien kommen zum Einsatz ? Read: - 1 - Das Web als Kurzform des "World Wide Web" stellt die markanteste Ausprägung des Übergangs zwischen Industrie- und Informations- gesellschaft dar. És ist eine staendig anwachsende Menge von Informationen. Durch die geschickte Organisation der Informationen und der zugrundliegenden Infrastruktur bietet das Web gegenüber den herkömmlichen Methoden des Informationsaustausches eine Reihe von erheblichen Vorteilen. Diese sind beispielsweise Aktualitaet, Verfuegbarkeit und vor allem Bereitstellung der Information von und fuer viele Menschen zu verschwindend geringen Kosten. Eine weiter essentielle Dimension der Entwicklung des Webs sind die Moeglichkeiten der kommerziellen Nutzung. - 2 - Semantik steht im allgemeinen fuer die Bedeutung von Woertern, Phrasen oder Symbolen. In der Informatik steht es fuer die Bedeutung von Worten und Zeichenketten und ihrer Beziehung untereinander. Es gibt noch weitere Bedeutungen zum Beispiel in den Bereichen der Linguistik, formalen Logik, ... - 3 - Um die Probleme zu loesen die unter - 5 - eroertert werden. Die moeglichen Herangehensweisen sind Techniken der kuenstlichen Intelligenz anzuwenden oder von vornherein die Informationen in einer Art und Weise abzulegen, sodass diese von Maschinen gelesen und verarbeitet werden koennen. - 4 - Die unueberschaubare Menge der praesenten Information ist auf menschliche Nutzer ausgerichtet. Dieser kann die Information dann erfassen und in andere Darstellungsformen ueberfuehren und mit anderen Informationen in Verbindung setzen. Das Problem ist eben die prinzipiell verfuegbare Information auch tatsaechlich zu finden. Auch problematisch ist die Mehrdeutigkeit von Begriffen. Ein weiteres Problem ist die Heterogenitaet in der die Informationen im Web vorliegen (von Plattformen, Darstellungen, Dateiformaten, Kodierungstechniken, ...). Zuletzt koennte die gesuchte Information nur durch eine Zusammensetzung von Informationen die an verschiedenen Stellen hinterlegt ist gefunden werden. - 5 - Mit dem Semantic Web. Man koennte versuchen die Informationen mit Methoden aus der kuenstlichen Intelligenz aus den bestehenden fuer Menschen gemachten Informationen zu beschaffen. Der Ansatz des Semantic Web moechte direkt von vornherein die Informationen in einer durch Maschinen lesbaren und verarbeitbaren Art und Weise hinterlegen. Die Grundvoraussetzungen hierfuer sind offene Standards um grundsaetzlich Interoperabilitaet zu ermoeglichen. Auch muss Flexibilitaet und Erweiterbarkeit moeglich sein. Der Schaffung der Standards hat sich das W3C verschrieben und grundlegende Standards fuer Informationsspezifikationssprachen geschaffen (XML, RDF, RDF-S und OWL). RDF und OWL sind sogenannte Ontologiesprachen die spezielle fuer das Semantic Web entwickelt wurden. Weiter wichtig ist die Schaffung von Methoden um Schlussfolgerungen (neue Information) aus gegebenen Informationen abzuleiten - implizitie Information muss extrahiert werden koennen, ein Bereich der formalen Logik. Auch wird davon gesprochen Maschinen die Moeglichkeit zu geben Informationen zu "verstehen", jedoch handelt es sich hierbei um kein explizites Ziel des semantischen Webs. - 6 - Sogenannte Grundlagentechnologien, semantische Technologien. Hierzu gehoeren Wissensrepraesentationssprachen fuer Ontologien, Methoden und Werkzeuge zur Erstellung, Wartung und Anwendung dieser Ontologien. Diese Technologien sind nicht (mehr) nur auf das Web beschraenkt, sondern erstrecken sich ueber viele Bereiche der Informatik (Wissensmanagement, Medieninformatik, maschinelles Lernen, Kognitive Systeme, Datenintegration, ...). Es ist davon auszugehen, dass sich die Anwendung semantischer Technologien zunaechst weniger auf das World Wide Web auswirken wird, sondern vielmehr industrielle Loesungen zum Wissensmanagement darstellen werden. Reflect: Grundlagentext der "ganz vorne" anfaengt um aber (so hoffe ich) im Verlaufe der ganzen Quelle alle weiteren Aspekte des semantischen Webs aufgreift. Es fehlen leider die Informationen der "Methoden der kuenstlichen Intelligenz". Letztendlich ist die Information nunmal "so" vorhanden wie man sie im Internet vorfindet und es ist ja auch oft beeindruckend wie gut Suchmaschinen die Informationen vorfiltern koennen sodass man nicht "Lost in Cyberspace" ist. Der grundsaetzliche Ansatz die Information "neu" in geeigneter Art und Weise zu hinterlegen scheint jedoch sinnvoll wenn auch sehr aufwaendig. Recite: Die Informationen im Internet liegen heterogen vor was Datenformate, dezentrale Speicherung, Kodierungsformate usw. angeht. Es ist fuer einen Menschen durchaus moeglich Informationen zu erkennen, zuzuordnen und in andere Formate zu ueberfuehren. Auch ist es fuer einen Menschen moeglich die Informationen in Zusammenhaenge zu setzen oder Informationen aus verschiedenen Quellen zusammenzusetzen und so Fragen zu beantworten. Maschinen und automatische Prozesse tun sich hier sehr schwer. Es gibt Ansaetze aus der kuenstlichen Intelligenz die aber auch an ihre Grenzen stossen. Auch ist denkbar, dass wichtige Informationen die prinzipiell vorhanen sind selbst von Menschen nicht gefunden werden. Zur Loesung dieser Probleme waere eine Informationsspeicherung wuenschenswert, die von vornherein die Informationen maschinenlesbar ablegt. Nicht nur das, sondern es sollen auch Informationen miteinander verknuepft werden koennen, sodass implizites Wissen automatisiert extrahiert werden kann. Hierfuer kommen Wissensrepraesentationssprachen zum Einsatz, die momentan mehr in der Industrie im Rahmen von Wissensmanagement zum Einsatz kommt, die aber laengst auch Einzug ins Netz gefunden haben. Ein solches Netz, welches nicht nur Informationen in korrekter Weise (Praesentationssprache) enthaelt sondern auch Bedeutung dieser Information enthaelt und verarbeiten kann wird semantisches Netz genannt. Review: Die Quelle macht einen sehr wissenschaftlichen Eindruck, wurde von renommierten Autoren verfasst und ist in einem sehr renommierten wissenschaftlichen Verlag erschienen. Diesem Erscheinen ist mit Sicherheit eine wissenschaftliche Pruefung auf inhaltliche Korrektheit vor der Veroeffentlichung vorausgegangen. Das Buch ist eine/die erste Veroeffentlichung zu diesem Thema in deutscher Sprache. Die Korrektheit der Quelle und die hohe Qualitaet der Inhalte wird von mir also angenommen. Es handelt sich bei der untersuchten Textstelle lediglich um ein Kapitel eines ganzen Buches. Der Rest des Buches wird sicherlich von grossem Wert sein fuer die Ausarbeitung.