Tuesday, April 24, 2007

Marina Lewycka - Die kurze Geschichte des Traktors auf Ukrainisch


Ich bin jetzt schon zwei Bücher im Rückstand, was meine Rezensionen angeht...und bevor ich noch vergesse, was ich zu diesem Buch schreiben wollte, wird es jetzt höchste Zeit....
Wann bin ich zum ersten mal auf das Werk gestoßen? Ich glaube, es war in der S-Bahn (S7) vom Berliner Hauptbahnhof nach Potsdam im vergangenen September. Ich las meine ZEIT und mir fiel dieses Buch mit dem interessanten Cover mit dem "Kartoffeldruck-Traktor" (oder doch eher sozialistisches Propagandaplakat?) auf, das eine Frau mir gegenüber gerade interessiert las. Und dann natürlich der Titel "Kurze Geschichte des Traktors auf Ukrainisch"...Als erstes musste ich an "Eine kurze Geschichte der Zeit" und meine eigene "kurze Geschichte des Internets" (im WWW-Buch) denken, aber der Zweifel, worum es sich bei diesem Buch wohl handeln könnte, lies mir keine Ruhe mehr. Wieder zu Hause in Weimar beim nächsten Besuch der Buchhandlung (ja, auch ich nehme Bücher noch gerne in die Hand, blättere darin und lese an irgendeiner beliebigen Stelle quer....ich brauche einfach dieses 'haptische Erlebnis'...) las ich mir dann den Klappentext durch, der irgendwie alles andere versprach, als ich mir eigentlich vorgestellt hatte....

"Geschichte des Traktors auf Ukrainisch" ist eigentlich Nikolais Projekt, in das er sich flüchtet, als alles den Bach hinunterzugehen droht. Nikolai stammt aus der Ukraine und ist nach dem Krieg mit seiner Familie nach England und in ein besseres Leben ausgewandert. Jetzt ist hat sich der 84-jährige Wittwer in den Kopf gesetzt, eine gut 50 Jahre jüngere blonde ukrainische "Sexbombe" aus ihrem Elend heraus aus der postkommunistischen, von Korruption und Unsicherheit geprägten Ukraine durch Heirat zu "erretten". Klar, dass das seinen beiden Töchtern -- der "Trozkistin" Nadja und ihrem Upper-Class Ggenstück Vera -- nicht gefallen wird. Beide hatten sich über das Erbe der Mutter zerstritten und reden nun schon seit Jahren kein Wort mehr miteinander. "Valentina" heißt der gemeinsame Feind und das personifizierte Übel, das es auszutreiben gilt, ....und Nikolai macht auch noch seine letzten Ersparnisse flüssig, um seinem "Täubchen" noch eine Brustvergrößerung zu spendieren.
Soweit, so gut. Wenn es jetzt immer so weiter ginge, hätte Marina Lewycka nichts weiter geschrieben als eine seichte Einwandererkommödie. Aber in Rückblenden wird immer wieder in ein Blick in die Familiengeschichte Nikolais geworfen und damit auch in die zeitgeschichtliche Ukraine: Stalin und der stalinistische Terror, die von ihm herbeigeführte Hungersnot, mit der er sich die Ukrainer gefügsam machen wollte, der zweite Weltkrieg, die Deutschen....
Zwischendurch aber wird es dann wieder bizarr: Valentinas trashiger "Luxus-Geschmack", Nikolais "Toshiba-Äpfel" (Nein, das ist keine neue wohlschmeckende japanische Apfelsortenzucht, sondern der Name hängt mit dem Hersteller von Nikolais Mikrowelle zusammen...), Nikolais (altersbedingte) Probleme mit seiner körpereigenen "Hydraulik", der Versuch der beiden Schwestern Valentinas Einbürgerung mit allen Mitteln zu unterminieren, der an der Unzulänglichkeit der britischen Behörden scheitert. Am Ende bleibt Nikolai auf alle Fälle seine "Geschichte des Traktors auf Ukrainisch", die ebenfalls mit einigen Skurilitäten aufwarten kann und auf ungeahnte Weise ihren Weg in die Ukraine nimmt....
Insgesamt ein schönes und lesenswertes Buch. Die beschriebenen Situationen geraten mitunter reichlich bizarr (schon wieder...). Die Vorstellungen und Wünsche zweier Einwanderergenerationen könnten unterschiedlicher nicht sein. Um den Kreis wieder zu schließen, für mich ein ideales Buch um die Fahrt in der S-Bahn (S1 Zehlendorf -> S7 Potsdam) etwas kurzweiliger zu gestalten....

Tuesday, April 17, 2007

Summer semester starts at FSU Jena...

Yesterday, the summer semester started and hey....it's really summer! I can't remember any summer semester start with such high temperatures. This semester, I have to give 2 lectures: 'Einführung in die Informatik II' (introduction to computer science II), which takes place mondays and fridays, and 'Informatik der digitalen Medien' (computer science and digital media), also on mondays. The later wil be recorded and will soon be available also for offline participation :)
Intersting thing to mention, this semester I try to maintain a blog for each of the lectures for providing additional information, reading materials, bibliographic notes, etc. You will find the two new blogs at
Of course I will comment on my experiences about managing lectures and courses with a blog.

Friday, April 13, 2007

Tag search vs. keyword search......substitution or complement


As you know, collaborative tagging systems (CTS) have become rather popular Web 2.0 applications (although I don't like the term 'Web 2.0'...please use 'Social Web' instead). A CTS allows each registered user to maintain her own tags that add semantic annotation to corresponding web links. Today, 'tags' are simple unformatted text data. Tags are transporting meaning, i.e. semantics. Because the user is free to choose any text string (symbol) for a certain semantics (concept) related to a given resource (web page or object). To communicate this semantics, two or more users have to agree upon using the same symbols denoting an object (remember the semiotic triangle [1]).

First difficulty is syntax: there are several posibilities to write a word (of course not all of them are necessarely correct or not all of them belong to the same language). The problem becomes even worse, if one tries to combine several words in a single string (how to separate words?...use CamelCase, underscores, blanks, ...).
Next comes language dependent problems such as polysemy (homonyms or synonyms). For homonyms we have the same symbol but different meanings, and for synonyms vice versa.

Syntax and language dependent problems alone cause tag based search to be more difficult to handle than traditional keyword based approaches (by keyword based approach we refer to full text search or keywords assigned to the resource by the resource author or by some designated expert). For full text search, a query string given by the user (or at least its word stem) has to match some string being part of the searched resource. Keywords given to a resource by some designated expert should meet some level of objectivity and thus, a user might be able to 'guess' the keyword while thinking of a well suited query string. Keywords provided by the author refer to her specific point of view (same with tagging). These 'subjective' keywords are much harder to guess for the arbitrary user, because she does not necessarely share the same context with the (tag) author.
In CTS we distinguish several distinct categories of tags [2]. Among others, there are two fundamental different tag categories: descriptive tags and functional tags. Descriptive tags refer to more objective tags, tags that are used to describe a resource in some general maner. Functional tags on the other hand do include an intended functional use esp. for the tag author and thus, are more subjective. While descriptive tags serve better for general web search, functional tags are useful most for their authors, but not for other users.
To analyse the benefit of tagging for web search, we have to take into account that many users are providing tags for a specific resource. Depending on the distribution of the tags attached to a specific resource, one can observe a power law (see also [2]). Few tags are used very often, while most of all the tags attached to a resource do occur only scarcely. Those few tags rather often can be identified with descriptive tags, while the so called 'long tail' of the other tags often belong to the category of functional tags.
So, how can we make use f that fact?
In [3] the authors propose to use tags for search query refinement. For that reason, they distinguish between two defferent categores of tags (that do not necessarely correspondent with descriptive and functional tags). They distinguish search keywords as being the most popular tags assigned to a resource, which can help to increase the hit rate if being used for query refinement, and exploration keywords, which cannot. Because exploration keywords reflect the personalized search context and information need of an individual user they are supposed to be helpful for the exploration process.

Monday, April 09, 2007

Turn your smile on....


Finally, the video clip is there! My friend schminktante as head of makeup department did the groovy 60s style make up in a music video being the diploma thesis of two students from bauhaus university in Weimar.
You may find some backstage information and also some pictures. Anyway....the setting reminds me somehow to the movie 'Catch me if you can'...
So...enjoy and 'turn your smile on'!

Tim Berners-Lee: The Web - Looking Back, Looking Forward


Another talk given by Tim Berners-Lee on 13th March 2007 in London as keynote on the start of this year's prestigious BCS Lovelace lecture. Tim Berners-Lee was granted the Lovelace Medal (named after Ada Lovelace, the daughter of Lord Byron and founder of scientific computing) in 2006. Here is the interview entitled 'Isn't it semantic?' from 2006 with TBL on winning the Lovelace medal. Usually the winner of the Lovelace medal has to give a lecture in the following year, and thus, this years Lovelace lecture is given by Berners-Lee.

The Lovelace Medal is presented to individuals who have made a contribution which is of major significance in the advancement of Information Systems or which adds significantly to the understanding of Information Systems. Among the winners are rather famous computer scientists such as Douglass Engelbart, inventor of the computer mouse and pioneer of GUI, networking, and hypertext systems, who received the medal in 2001, or Linus Torvalds, developer of the LINUX operating system, who received the award in 2000.

(video discovered at Serge Linckels)

Saturday, April 07, 2007

re:publica - Leben im Netz, vom 11. bis 13. April in Berlin


Ich freue mich schon nächste Woche auf das Treffen mit Freunden und Bekannten auf der re:publica in Berlin. Das "Blogger"-Event findet vom 11.-13. April 2007 in der Kalkscheune in Berlin statt und verspricht mit bislang mehr als 300 Anmeldungen und interesanten eingeladenen Vorträgen recht spannend zu werden.
Nicole Simon hat bereits im Vorfeld der re:publica zahlreiche Interviews und Statements mit Teilnehmern und Veranstaltern gesammelt und veröffentlicht diese als PodCast, darunter auch ein Beitrag von Hard Blogging Scientist Jan Schmidt zum Thema Wissenschaftler in der Blogosphäre.
Die Akkreditierung (d.h. der Ticketvorverkauf) hat bereits geschlossen (ich habs mal wieder 'verschwitzt'), aber es gibt noch Tickets an der Tagskasse. Also werde ich am Mittwoch mal vorbeischauen und berichten...
Fast vergessen, die Hard Blogging Scientists richten dort am Freitag, den 13. (ausgerechnet...) um 14.30 Uhr ein Podium/Workshop/Plugin zum Thema 'Wo geht's denn hier in meinen Elfenbeinturm?' aus (also noch ein Tagesticket kaufen...).

Friday, April 06, 2007

Les Gammas sont arrives......


Tatsächlich, sie sind also mitten im Berliner Hauptbahnhof gelandet. Wer? Na die Gammas!
Erinnert sich noch jemand an diesen französischen Sprachkurs 'Les Gammas!', der quasi als Mini-Soap Ende der 70er Jahre mit der Landung dreier Außerirdischer in einer Art Weltraumei (sic!) in Frankreich (also müssen sie wohl auch französisch lernen...) in den dritten Programmen über die deutschen Bildschirme flimmerte...? Verdammt lang her, aber gestern auf dem Nachhauseweg am Berliner Hauptbahnhof fotografiert (laut Presseinformation der deutschen Bahn das größte Osterei der Welt, 8,35m hoch, aus 10.000 Primeln bestehend und noch bis zum 9. April zu bestaunen...)

Tuesday, April 03, 2007

Tim Berners-Lee: The Semantic Web of Data


Tim Berners-Lee is talking about 'The Semantic Web of Data' in a video at Technology Review. In this short presentation the inventor of the world wide web is trying to explain in short, what the Semantic Web is all about, and how it will affect our way to look at data, to understand data, and to work with data (it's all about integration of heterogeneous data...).
('video found at Semantic Bits)