Monday, September 14, 2009

W3C-Tag an der HU Berlin, 14.09.2009

Es ist mal wieder soweit: W3C-Tag an der HU Berlin im Rahmen der XInnovations 2009, diesmal mit Prof. Felix Sasaki als Vertreter des lokalen W3C-Büros an der Uni Potsdam....und es geht auch schon gut los. Prof. Robert Tolksdorf, der die Veranstaltung eröffnen sollte, steckt im Berliner Verkehr fest und so warten wir erst einmal 20 Minuten bis hier irgendetwas heute morgen passiert.

Atemlos kommt Herr Tolksdorf mit 20 minütiger Verspätung an, entschuldigt sich kurz (ohne dabei nicht auch einen kurzen Hinweis auf die Situation der Berliner Verkehrsbetriebe zu geben und auf seine Solidarität mit den Berliner S-Bahn-Fahrern hinzuweisen) und stellt das STI (Semantic Technology Institute) vor.

Interessanter wird es jetzt schon mit dem ersten, dem 'Semantic Web' gewidmeten Vortrag, genauer geht es dem Titel entsprechend über das 'Rule Interchange Format' (RIF) und das neue OWL 2, von Prof. Adrian Paschke von der FU Berlin. OWL 2 verwirft die übliche Dreiteilung in OWL-Light, OWL DL und OWL full und definiert verschiedene OWL DL Sprachprofile bzgl. ihrer 'worst case' Berechnungskomplexität. Dabei lässt sich OWL EL sogar in Polynomialzeit berechnen (daneben existieren noch OWL QL und OWL RL). RIF als Austauschformat für Regeldialekte bringt ebenfalls wieder eine Unmenge an neuen Syntaxvarianten. In diesem Zusammenhang wird auch auf ein Handbuch hingewiesen (Handbook of Research on Emerging Rule-Based Languages and Technologies, IGI Global), das sich allerdings nicht gerade durch seinen Preis (> 300 Euro) empfiehlt...

Prof. Felix Sasaki vom deutsch-österreichischen W3C-Office stellt als nächstes die aktuellen Entwicklungen rund um den neuen HTML5 Standard vor (hier ein Link auf die im Vortrag gezeigten Beispiele). Warum eigentlich jetzt HTML 5, nachdem bereits 2000 XHTML 1.0 veröffentlicht wurde und die Entwicklung von XHTML 2.0 auf vollen Touren lief? Nun, die Entwicklung von XHTML 2.0 wurde abgebrochen, der Anspruch ein 'sortenreines' XML im Browser einzuführen (eine 'Revolution') ist gescheitert. Nach einer von Opera durchgeführten Studie 2008, ist lediglich 4.13% des gesamten Web-Codes tatsächlich valide. Daher versucht man mit HTML 5 eine (fehlertolerante) 'Evolution' des alten Standards zu realisieren.
Eigentlich ist HTML5 genau genommen sogar ein Rückschritt, da es auf eine dezentrale Erweiterung über einzubindende Namensräume zugunsten eines eindeutig zu interpretierenden DOM-Baumes verzichtet. Dahingehend sind Probleme mit semantischen Erweiterungen, wie z.B. RDFa oder Microformats vorprogrammiert!

Mittagspause im Café Chagall mit Bliny und saurer Sahne mit anschließendem Rundgang zu Dussmanns Kulturtempel...

Thomas Caspers spricht zunächst einmal über Barrierefreiheit (Die deutsche Übersetzung der WCAG 2.0 a.k.a. Web Content Accessibility Guidelines). 'POUR' steht für die vier Grundprinzipien der Richtlinien für barrierefreie Webanwendungen: Perceivable, Operable, Understandable und Robust. Allerdings konnte ich die beschriebenen Übersetzungsprobleme ('programmatically determined' usw.) nicht nachvollziehen...vielleicht hätte man mal einen Informatiker fragen sollen....

Mit gut 20 minütiger Verspätung (dank der Ausdauer des Vorredners) beginnt der Vortrag von Joachim Neuberth über SKOS (Simple Knowledge Organization Systems). Warum müssen manche Vortragende nur immer so leise sprechen. Das Verfolgen des Vortrags gestaltet sich nicht wirklich einfach (was nicht etwa in der Komplexität des Themas begründet liegt). Zugegebenermaßen ist aber auch die Entwicklung von SKOS und das dahinter liegenden Datenmodell nicht so besonders spannend. Besser wird es erst, als unterschiedliche Ressourcen, wie z.B. die Library of Congress Headings oder die französische Nationalbibliothek aufgezeigt werden und am Ende dann doch Linked Open Data angesprochen wird.

Prof. Felix Sasaki widmet sich als nächstes dem Thema Metadaten für Multimedia und berichtet von der W3C Metadata Annotations Group. Das Ziel der Metadata Annotation Group kann als "DublinCore + X" paraphrasiert werden, also ein minimales Multimediametadatenschemas mit Mapping zu bereits existierenden Formaten. Der zweite Teil des Vortrags beschäftigt sich mit XProc (XML Pipeline Language) zur Modellierung und Beschreibung von XML-Verarbeitungsketten, die eine Pipeline-artige Verarbeitung von wechselnden Validierungs- und Transformationsschritten unter Ausnutzung einer rudimentären Programmlogik (konditionale Verarbeitung, Iterationen, Selektive Verarbeitung, Ausnahmebehandlung, u.a.) mit heterogenen XML-Daten erlaubt.

[Nach der noch folgenden Diskussion, weiter mit "Brezeln und Wein" im Foyer..... :)]

Links:

3 comments:

tcaspers said...

»Allerdings konnte ich die beschriebenen Übersetzungsprobleme ('programmatically determined' usw.) nicht nachvollziehen...vielleicht hätte man mal einen Informatiker fragen sollen....«

Das Problem ist weniger ein Mangel an Informatikern - davon hatten wir wahrlich genug in der Gruppe der Übersetzer und Unterstützer (s. einfach-fuer-alle.de/blog/id/2507).

Das Problem war und ist eher, dass sich Informatiker und Sprachwissenschaftler nicht auf eine gemeinsame Definition von »programmatically determined« und »programmatically determinable« einigen konnten.

Mal Butter bei die Fische: Wie würdest Du das denn übersetzen?

Harald Sack said...

Hallo und Danke für Deinen Kommentar!
Ich glaube, ich verstehe jetzt das eigentliche Problem, dass darin liegt, sich in einer interdisziplinären Gruppe nur schwer über die Semantik eines einheitlichen Vokabulars einigen zu können. Von meinem Standpunkt aus betrachtet, interpretiere ich den Begriff 'programmatically determined' so, dass es dabei um Informationen bzw. Modalitäten der Anzeige von Informationen geht, die via Programmlogik, d.h. algorithmisch bestimmt werden. Nach reiflicher Überlegung sehe ich ebenfalls die Schwierigkeit, diese Begrifflichkeit in einen adäquaten deutschsprachigen Term zu übersetzen.
Sorry, dass ich mich in meinem Post vielleicht etwas zu überspitzt dazu geäußert habe.

Economista diplomada B. Plattner said...

2 Dinge, Zukunft des Internet darf man da wieder einfach seine Meinung schreiben, ohne seine Mail adresse oder Namen oder mehr angeben zu muessen? Das Internet war mal frei. Die Ueberwachung wird langsam albern. Zukunft ist noch mehr Ueberwachung? Bitte nicht.
2. Thema Verstaendisprobleme. Warum benutzt Ihr nicht ISO Normen und deren Glosaries? Oder einigt Euch auf ein Glosary, wie das von SAP? Bei den Glosaries der International Standard Organisation muest Ihr aber die Normenreihe angeben, sonst bekommt Ihr wieder Probleme, da jede Branche ihr eigenen Sprache hat.