Tuesday, September 15, 2009

Corporate Semantic Web Workshop in Berlin, 15.09.2009


Heute findet im Rahmen der XInnovations 2009 der Corporate Semantic Web Workshop an der HU Berlin statt, der heute abend im 3. Semantic Web Meetup seinen Abschluss finden wird.

9 Uhr morgens, noch ist alles ruhig. Kaffee allerdings scheint am morgen ein Fremdwort zu sein. Zumindest reicht es 30 Minuten vor Beginn der Veranstaltung lediglich für ein anscheinend vom Vorabend "geplündertes" Buffet mit zwei leeren Thermoskannen und ein Paar verlorener und zum Teil gebrauchter Kaffeetassen. Da lob ich mir doch Graz und die I-Semantics, bei der wir vor gut einer Woche rund um die Uhr mit leckerem illy-Kaffee (Ja! ich würde mich über eine Product-Placement-Vergütung sehr freuen...:) und Espresso versorgt wurden....

Prof. Adrian Paschke von der FU Berlin eröffnet den Corporate Semantic Web Workshop mit einer kurzen vorstellung der 'Vision' des Corporate Semantic Web Projekts, das vom BMBF seit 2008 gefördert wird. Für mich natürlich interessant der Unterpunkt und Forschungsbereich 'Corporate Semantic Search', also bin ich auf den später geplanten Vortrag zum Thema gespannt.

Gökhan Coskun aus Adrian Paschkes Forschungsgruppe schließt an mit einem Vortrag über 'Effiziente Verwaltung von Unternehmenswissen - Corporate Ontology Management'. Wozu braucht man Ontologien in einem Unternehmen? Ganz einfach, zur Steigerung der Produktivität und der Effizienz der Informationsverarbeitung (typische Wirtschaftsinformatikerantwort...). Als Hinderungsgrund für den Einsatz im Unternehmen identifiziert Coskun die 'Akademische Orientierung' vorhandener Werkzeuge. Er sieht Ontologien als normativ und allgemeingültig, was einen weiteren Hinderungsgrund bzgl. deren Einführung im Unternehmen darstelle. Dem möchte ich widersprechen, da Ontologien stets auf einer 'gemeinschaftlichen Vereinbarung' beruhen (explicit, formal specification of a shared conceptualization), die den jeweiligen Blickwinkel der Beteiligten abbildet. Allgemeingültigkeit wäre eine Eigenschaft, die gar nicht erreicht werden soll. Wir betreiben ja schließlich Informatik und nicht Metaphysik, d.h. unser Ziel ist nicht die normative und allgemeingültige Beschreibung der gesamten Welt, da eine Ontologie stets der Interpretation des Benutzers, seinem Kontext und seiner Pragmatik unterliegt.

Nach der viel zu kurz geratenen Kaffeepause geht es weiter mit Olga Streibel von der FU Berlin und dem Thema 'Semantische Suche: Tagging und Wissensgewinnung'. Als 'Extreme Tagging' werden jetzt Tags eingeführt, die selbst als Objekte für das Tagging hergenommen werden können, d.h. die eigentliche Tag-Relation lässt sich taggen. Was gewinnt man dadurch? Streibels Erklärung, dass man 'durch Tags Assoziationen bildet, mit denen man Ontologien erzeugt', hilft mir hier nicht besonders weiter. Leider wurde meine diesbezügliche Frage am Ende mit der Bemerkung, dass wir das offline diskutieren sollten, etwas unschön abgebügelt. Dabei wäre es meines Erachtens für den Vortrag von zentraler Bedeutung, eben diesen Vorteil des Ansatzes herauszustellen und gegenüber einem einfachem (individuellem) Konzept-Mapping abzugrenzen.

Ralf Heese von der FU Berlin referiert als nächstes über 'Einfach Verlinken in Wikis / Experten mittels Wikis finden'. Es geht beim ersten Thema dabei darum, den Benutzer mit Hilfe von Hintergrundwissen beim Setzen von Links durch entsprechende Vorschläge zu unterstützen. Das zweite Thema widmet sich der Frage, wie sich aus den History-Logdaten eines Wikis Experten zu bestimmten Themen bestimmen lassen.

Gleich Mittagspause....! Leider nur mit Gulaschsuppe/Möhrensuppe und Rundgang über den 'Büchermarkt' im Hof vor dem HU-Hauptgebäude.

Wieder einmal ein paar Minuten zu spät bei Richard Hubers (FIZ Chemie GmbH) Kurzvortrag über 'ChemgaPedia - virtuelle Forschungsumgebung'. Und schon wieder eine Wortneuhülse: 'Wissenscloud' - ohne sich darüber im Klaren zu sein, was exakt damit gemeint ist.

Änderung im Programm, 'Semantic Profiles in Universal Plug and Play AV', Vortrag eines Diplomanden zur semantischen Anreicherungen von UPnP AV Daten.

Weiter geht es mit Johannes Krug von x:hibit, der das Berliner Museumsportal (finanziert durch entsprechende E-Commerce Anteile, z.B. E-Ticketing, u.a.) vorstellt, gefolgt von Radoslav Oldakowski von der FU Berlin mit dem Thema 'Semantische Datenintegration und Suche im Museumsportal Berlin'. Semantisch unterstützte Suche, die Suchbegriffe um verwandte Begriffe ergänzt...mal sehen, ob sie dies auch (1) intelligent und (2) visuell ansprechend tut.

Sebastian Hellmann gibt mit 'DBPedia Live Extraction' als erstes eine kurze Einführung in das zentrale Hub der Linked Open Data Cloud, der DBPedia, gefolgt von diversen Anwendungen rund um die DBPedia. Übrigens nutzt yovisto.com (including semantic features) ebenfalls DBPedia-Daten zur Implementierung einer echten explorativen (semantischen) Suche.

[...to be continued @ Semantic Web Meetup ]

Monday, September 14, 2009

W3C-Tag an der HU Berlin, 14.09.2009

Es ist mal wieder soweit: W3C-Tag an der HU Berlin im Rahmen der XInnovations 2009, diesmal mit Prof. Felix Sasaki als Vertreter des lokalen W3C-Büros an der Uni Potsdam....und es geht auch schon gut los. Prof. Robert Tolksdorf, der die Veranstaltung eröffnen sollte, steckt im Berliner Verkehr fest und so warten wir erst einmal 20 Minuten bis hier irgendetwas heute morgen passiert.

Atemlos kommt Herr Tolksdorf mit 20 minütiger Verspätung an, entschuldigt sich kurz (ohne dabei nicht auch einen kurzen Hinweis auf die Situation der Berliner Verkehrsbetriebe zu geben und auf seine Solidarität mit den Berliner S-Bahn-Fahrern hinzuweisen) und stellt das STI (Semantic Technology Institute) vor.

Interessanter wird es jetzt schon mit dem ersten, dem 'Semantic Web' gewidmeten Vortrag, genauer geht es dem Titel entsprechend über das 'Rule Interchange Format' (RIF) und das neue OWL 2, von Prof. Adrian Paschke von der FU Berlin. OWL 2 verwirft die übliche Dreiteilung in OWL-Light, OWL DL und OWL full und definiert verschiedene OWL DL Sprachprofile bzgl. ihrer 'worst case' Berechnungskomplexität. Dabei lässt sich OWL EL sogar in Polynomialzeit berechnen (daneben existieren noch OWL QL und OWL RL). RIF als Austauschformat für Regeldialekte bringt ebenfalls wieder eine Unmenge an neuen Syntaxvarianten. In diesem Zusammenhang wird auch auf ein Handbuch hingewiesen (Handbook of Research on Emerging Rule-Based Languages and Technologies, IGI Global), das sich allerdings nicht gerade durch seinen Preis (> 300 Euro) empfiehlt...

Prof. Felix Sasaki vom deutsch-österreichischen W3C-Office stellt als nächstes die aktuellen Entwicklungen rund um den neuen HTML5 Standard vor (hier ein Link auf die im Vortrag gezeigten Beispiele). Warum eigentlich jetzt HTML 5, nachdem bereits 2000 XHTML 1.0 veröffentlicht wurde und die Entwicklung von XHTML 2.0 auf vollen Touren lief? Nun, die Entwicklung von XHTML 2.0 wurde abgebrochen, der Anspruch ein 'sortenreines' XML im Browser einzuführen (eine 'Revolution') ist gescheitert. Nach einer von Opera durchgeführten Studie 2008, ist lediglich 4.13% des gesamten Web-Codes tatsächlich valide. Daher versucht man mit HTML 5 eine (fehlertolerante) 'Evolution' des alten Standards zu realisieren.
Eigentlich ist HTML5 genau genommen sogar ein Rückschritt, da es auf eine dezentrale Erweiterung über einzubindende Namensräume zugunsten eines eindeutig zu interpretierenden DOM-Baumes verzichtet. Dahingehend sind Probleme mit semantischen Erweiterungen, wie z.B. RDFa oder Microformats vorprogrammiert!

Mittagspause im Café Chagall mit Bliny und saurer Sahne mit anschließendem Rundgang zu Dussmanns Kulturtempel...

Thomas Caspers spricht zunächst einmal über Barrierefreiheit (Die deutsche Übersetzung der WCAG 2.0 a.k.a. Web Content Accessibility Guidelines). 'POUR' steht für die vier Grundprinzipien der Richtlinien für barrierefreie Webanwendungen: Perceivable, Operable, Understandable und Robust. Allerdings konnte ich die beschriebenen Übersetzungsprobleme ('programmatically determined' usw.) nicht nachvollziehen...vielleicht hätte man mal einen Informatiker fragen sollen....

Mit gut 20 minütiger Verspätung (dank der Ausdauer des Vorredners) beginnt der Vortrag von Joachim Neuberth über SKOS (Simple Knowledge Organization Systems). Warum müssen manche Vortragende nur immer so leise sprechen. Das Verfolgen des Vortrags gestaltet sich nicht wirklich einfach (was nicht etwa in der Komplexität des Themas begründet liegt). Zugegebenermaßen ist aber auch die Entwicklung von SKOS und das dahinter liegenden Datenmodell nicht so besonders spannend. Besser wird es erst, als unterschiedliche Ressourcen, wie z.B. die Library of Congress Headings oder die französische Nationalbibliothek aufgezeigt werden und am Ende dann doch Linked Open Data angesprochen wird.

Prof. Felix Sasaki widmet sich als nächstes dem Thema Metadaten für Multimedia und berichtet von der W3C Metadata Annotations Group. Das Ziel der Metadata Annotation Group kann als "DublinCore + X" paraphrasiert werden, also ein minimales Multimediametadatenschemas mit Mapping zu bereits existierenden Formaten. Der zweite Teil des Vortrags beschäftigt sich mit XProc (XML Pipeline Language) zur Modellierung und Beschreibung von XML-Verarbeitungsketten, die eine Pipeline-artige Verarbeitung von wechselnden Validierungs- und Transformationsschritten unter Ausnutzung einer rudimentären Programmlogik (konditionale Verarbeitung, Iterationen, Selektive Verarbeitung, Ausnahmebehandlung, u.a.) mit heterogenen XML-Daten erlaubt.

[Nach der noch folgenden Diskussion, weiter mit "Brezeln und Wein" im Foyer..... :)]

Links:

Friday, September 04, 2009

i-Semantics 2009 in Graz (Day 03)

The second day of i-Semantics ended with party and dancing to live music performed by 'Egon 7', and of course with a lot of interesting talks with interesting and nice people :) This morning at breakfast, Jörg really looked as if he had not really had got enough sleep (he continued to party after the official ending somewhere downtown :)

Keynote
Peter Kropsch (Austrian Press Agency): When technologies are drivers, integrated concepts are needed for success,
talking about scenarios of future media convergence, the development of the information technologies and the possibilities opened up by them, esp. about the expectations of APA what to get out of semantic technologies. In general, keynotes without some slides (to get hold of the information structure of this 60 minutes talking) are rather difficult to follow, if the speaker is not able to awake sufficient enthusiasm in the audiences...

The Role of Semantic Technologies in Future Internet Track,
Klaus Tochtermann (Know-Center, TU Graz): The Role of Semantic Technologies in the Future Internet
explained, why the vision of the future internet is not only 'old wine in some new bottles'. Although all the components that consttute the Future Internet (Content, Services, Security, People, etc.) is already around, the main contribution of FI is the integrated view and interaction of thes components.

Marco Pistore (FBK): Highlights of the Future Internet Conference Berlin
In parallel to i-Know/i-Semantics in Berlin the 2nd Future Internet Symposium took place...

Jan Reichelt (Mendeley): Mendeley - A Last.fm for Research?
Mendeley wants to help researchers to manage their resources. Research is inherently social. Mendeley offers a desktop tool, similar to last.fm audioscrobbler that (a) analyzes your search papers and enables full-text search and (2) smart metadata extraction and generation. The mendeley web service offers an online backup of your own research library and enables on-click import from google scholar and other citation services.
Interesting stuff...I have just registered and download my desktop client for Mac OSX...

Paolo Rosso (Universidad Politecnica de Valencia): Geographical Information Retrieval and Toponym Disambiguation
Geographical filtering of information retrieval results by expanding query strings with semantically related geographical information (...like that stuff!).

Thursday, September 03, 2009

I-Semantics 2009 in Graz (Day 02)

The first day of i-Semantics ended with a guided tour through the old section of the town (that we already had enjoyed the day before), and a welcoming party located in the Kunsthaus Graz. The Kunsthaus Graz has some extraordinary architecture and reminds me more of some strange submarine lifeform than of a building. Unfortunately we had to leave earlier to prepare our talk for today....

The second day of i-semantics 2009 started in a very conveniant way - again great espresso, fresh fruits, and nice talking.

Linked Data Track
Harald Sack (HPI): How can Software Developers benefit from Linked Data Vocabulary,
Well, the title is misleading somehow. Of course software developers do benefit from the use of linked data, but.....the problem is the feasibility of APIs and automated tools for mapping knowledge representations to object-oriented data structures. I had to deliver the talk (instead of Matthias, who actually was the main contributor, but is STIL on vacations) and I'm afraid that I have overstressed my audience with lots of software engineering details (bad for an introductory first talk of a session on linked data...).

Jörg Waitelonis (HPI): How to augment Video Search with Linked Data,
Jörg introduced yovisto.com and its connection to the Linked Open Data cloud, featuring our 'exploratory search' widget, suggesting additional search results to the user and providing seredipenditios findings.

Atif Latif (Know-Center, TU Graz): The Linked Data Value Chain: A Lightweight Model for Business Engineers
First, Atif stated significant differences between the aims of the scientific community and enterprise level business. He introduced the concept of Linked Data Value Chain, where the most valuable output consists out of an increase of the (code/data) readability for the human engineer, thus also serving the same duty as Matthias work in making semantic web software engineering very, very simple. So.....let's make Semantic web a No-Brainer (finally) ;-)

I had to skip parts of the afternoon sessions (Poster/Short-Paper and Student Sessions) due to interesting talks and reviewing work (deadline today...unfortunately). But I'm looking forward to more interesting contacts, lots of delicious espresso, maybe again some cake and pastries, and then of course the Gala Diner in the evening...

The Gala Diner startet with an interesting performance of Austrian cultural heritage. In particular, we listened to a musical performance of 4 original "Wurzelhorns" (Wurzelhorn is a variation of the well known Alphorn).

Wednesday, September 02, 2009

i-Semantics 2009 in Graz (Day 01)

Although already having been at the PC of i-Semantics some years ago, this year it's the very first time for me being in Graz. We've already arrived yesterday and spent an beautiful day with sight seeing in the baroque historic section of the town (including the Schlossberg with 260 steps in the midday sun).

The conference is starting right now with greetings by Hermann Maurer (TU Graz) and Klaus Tochtermann (Know-Center, TU Graz). I will report about all upcoming the conference highlights...

Keynote 01,
Paolo Traverso: Towards a future Internet of Services and Content
Pointing out differences between real worl services and software services (duration, accessibility, time contraints, etc.) towards the proposition of a 'Future Internet', where research is focussed on modeling, compositing, and monitoring real world services...

Social Semantic Web Track,
Liana Razmerita: Towards a New Generation of Social Networks: Merging Social Web with Semantic Web
Conclusion: Semantic Web Technologies will enable the development of a new generation of social networking applications...nothing new up to now..

Web 2.0 und Neue Medien Track,
Watraud Wiedermann (APA Defactor): Semantische Suche in Medienarchiven
Demonstration of search application on newspapers, deploying synonym search and search for significant co-occurrences.

Knowledge Visualization Track,
Sven Havemann (TU Graz): Patterns of shape Design
Raising the question 'What's the point on semantic enrichment of images?' One of the problems in computer graphics is that different communities use slightly different vocabularies with inherent ambiguities. Furthermore, there is also a 'semantic gap' in the way that (correct) CG-algorithms often do not deliver the expected result, due to the lack of a proper vocabulary. This leads Haveman to the development of a conceptual reference model (like CIDOC-CRM) for shapes.


Innovative Funktionen für E-Learning Track,
Viktoria Pammer (TU Graz): Intelligente Ad-hoc Erstellung von Lerninhalten mit semantischen Technologien
Presentation of the APOSDLE system that proposes learning material to the learner according to his current skills and needs. Seems to be an Intranet (non web based) system...

...and now on for some espresso and sone 'real Austrian' cake and pastries ;-)

Corporate Semantic Web Track,
Fan Bai (Uni Duisburg/Essen): Exchanging Knowledge in Concise Bounded Descriptions. An Approach to Support Collaborative Ontology Development in an Distributed Environment
Interesting variant of versioning of ontologies (for distributed ontology development). Using simple cvs is not suitable, simply because most ontologies simply consist out of one huge file...

Usage and Case-Studies Track,
Sanja Vranes: Maturity and Applicability Assessment of Semantic Web Technologies


ok...ready for 'Guided Tour from Conference Venue to Welcome Receiption' at Kunsthaus Graz

[see you again tomorrow...]