Friday, May 25, 2007

Copyright and Fair Use....

I have found an amazing videoclip about copyright. In his short movie "A Fair(y) Use Tale... Professor Eric Faden from Bucknell University addresses the question of fair use and the copyright law in a humorous but informative way. Interesting thing about is that the entire movie is sampled from short Disney movie clips....and thus subject to copyright law. If the video is deleted from youtube, it can be also retrieved from Stanford Center for Internet and Society.
[found via telepolis]

Tuesday, May 15, 2007

Next Generation Search Engines revisited...

As reader of my blog for sure you know that one of the main topics is (semantically enhanced) searching the web. Recently I was rereading Andrei Broder's short paper on 'A taxonomy of web search'[1], where he was also referring to the three generations of web search engines. His article dates back to 2002. Environment and technology in the web are rapidly changing. So, what about this three generations? Do we already need a 'next generation'? And what about the discussion about 'Search 2.0'?...
But first, let's recall the three generations according to Broder:

  • First generation: search engines are useing almost only on-page data such as text and formatting information to compute result ranking (1995-1997, cf. Alta Vista, Excite, etc...).

  • Second generation: search engines are using off-page, web-related data such as link analysis, anchor-texts, and click-through data (1998-..., cf. Google).

  • Third generation: search engines try to blend data from multiple, heterogeneous sources trying to answer 'the need behind the query'. The computed results are customized according to the user's information needs, taking into account the user's personal data background, context, and intention (now? - ...).

Clearly, search engines of the third generation include social networking information, tagging, user feedback, semantic analysis, recommendations, and trustworthyness of information (according to its source).
In read/write web the topic is also addressed as comparison of traditional search technologies with what they call 'Search 2.0' [2]. As usual, I don't like the 2.0-term. What is discussed there, refers to Broder's definition of 'Third generation' and adds nothing significant new to it (besides the marketing term). But, the article is definitely worth reading, because a lot of recent search engines are referenced and discussed (and also because of the interesting discussion that follows). They distinguish between 'Finding' information and 'Discovering' information, while relating the second term to 'Search 2.0'.

Broder distinguishes different sorts of web search queries:

  1. Navigational: intented use is to reach a particular web page (similar to 'known item' search in classical information retrieval). Therefore, navigational queries usually do have only one 'right' result.

  2. Informational:
  3. intended use is to acquire information assumed to be present on one or more web pages (as in classical information retrieval).
  4. Transactional:
  5. intended use is to find a web page, where further transactions (e.g. shopping) will take place.

If we take social bookmarking services, navigational queries can be computed simply by using the user's personomy (i.e. the set of all tags used by a distinct user). If the goal is to find a web page, which has been already accessed in the past, the page might be found quickly, if the user has registered the page within the bookmarking service (which comes to 'Finding' information). But, the query might also be resolved by using other people's tags, if somebody has tagged the page (with objectively descriptive tags).
Social bookmarking services are also usefull for the other two purposes. In addition, if the page is found, the social networking information can be utilized for 'discovering' new, previously unkown, but related (similar) information (which comes to 'Discovering' information). Hotho et al. present an adaptive ranking algorithm (FolkRank) for social bookmarking systems and discuss the problems that arise for tag-based search engines [3].

But, to answer the 'need behind the query' as Broder states in his definition of 'Third generation search engines', further personalization is mandatory. Only, if the search engine is able to find out the context of a query w.r.t. a given user and a given situation (i.e. even the same user might have different information needs in different situations), then it is possible to grasp the actual context of the query, and thus, also the 'need behind the query'...
[to be continued]

References:
[1] Andrei Broder: A taxonomy of web search, SIGIR Forum 36, pp. 3-10, 2002.
[2] Ebrahim Ezzy, Richard MacManos: Search 2.0 vs. Traditional Search, read/write web, June 20th, 2006.
[3] Andreas Hotho, Robert Jäschke, Christoph Schmitz and Gerd Stumme: Information Retrieval in Folksonomies: Search and Ranking, in Proceedings of the 3rd European Semantic Web Conference, pp. 411-426, 2006.

Tuesday, May 08, 2007

J.D. Salinger - Neun Erzählungen

J.D. Salinger ist sicherlich nicht nur für mich ein ganz besonderer Erzähler. Wie viele andere auch, habe ich seinen großen Roman "Der Fänger im Roggen" bereits in der Schule gelesen. Nicht, weil wir diesen im Englischunterricht lesen mussten, sondern weil mich die Erzählungen meiner Bekannten aus dem Englisch-LK (man stelle sich vor, ich konnte Englisch als Fremdsprache abwählen und habe Latein als Abiturfach gewählt...) irgendwie neugierig darauf gemacht hatten. Natürlich habe ich mich damals mit meinen beschränkten Englischkenntnissen (sic!) nicht an die Originalausgabee gewagt, sondern hatte mit der Böll-Übersetzung Vorlieb nehmen müssen (ohne zu wissen, dass die Übersetzung von Heinrich Böll war). Trotz aller Schwächen der deutschen Übersetzung hat mich der Roman damals fasziniert, glaubte ich doch in diesem Roman erkannt zu haben, was es ausmacht, eine gute Geschichte zu schreiben (zumindest damals und in meinen Augen...). Irgendwie passiert ja auch nicht wirklich etwas in diesem Roman, der ja eigentlich auch nur eine auf Romanlänge aufgeblasene Kurzgeschichte ist.

Holden Caufield, der "zerbrechlich" wirkende und stets altklug daherredende Held dieser Geschichte aus den 50er Jahren ist aus dem Internat herausgeflogen und vorzeitig - es ist bald Weihnachten - auf dem Weg nach Hause nach New York - ohne natürlich gesteigerten Wert darauf zu legen, in die offenen Arme seiner Eltern zu laufen. Aber das ganze ist ja eigentlich nur ein Rahmen für viele kleine Erzählungen....alles Erzählungen, die von "verpassten" Gelegenheiten und Chancen erzählen. Immer wieder gerät Caufield in eine vielversprechende, entscheidende Situation und das "was-wäre-wenn" geht auf der einen Seite dem Romanhelden und auf der anderen Seite natürlich auch dem Leser durch den Kopf....ohne dass der Romanheld die ihm gebotene Gelegenheit, der Geschichte einen anderen Ausgang zu geben, jemals ergreifen würde. So ist der Leser irgendwie enttäuscht, aber auf der anderen Seite fühlt man sich gekitzelt oder vielmehr angestachelt, um zu sehen, welche Möglichkeiten die nächste Situation birgt, in der Salinger seinen Helden geraten lässt, und ob er diesmal nicht vielleicht doch etwas daraus macht....

Etwas anders ist es in diesem Band mit 9 frühen Kurzgeschichten Salingers (allesamt erschienen vor dem 'Fänger im Roggen'), in der er auch viel Biographisches verarbeitet. Wie üblich passiert in den Geschichten auch nicht wirklich etwas. Aber es ist diese Atmosphäre... Stets schafft es Salinger, eine Art Melancholie über Allem schweben zu lassen. Es kommt gar nicht darauf an, was seine Figuren tatsächlich tun und wie sie agieren. Vielmehr sind es die Dialoge bzw. die inneren Monologe, die seine Figuren führen und die sie so besonders machen. Die Nebensächlichkeiten, die in diesen kurzen Episoden zur Hauptsache werden, die fragile Verletzlichkeit der Figuren, das Sich-verlieren in Oberflächlichkeiten, die doch so vieles bedeuten....Ähnliches kennt man aus den Kurzgeschichten von Raymond Carver, der sich Salinger sicherlich auch als Vorbild genommen hatte (besonders zu empfehlen ist die Kurzgeschichtensammlung 'What We Talk about When We Talk about Love').

Die meisten Geschichten von Salinger haben etwas mit dem Erwachsenwerden zu tun. Die Spannung, die sich aus dieser Potentialdifferenz ergibt, wenn die handelnde Figur auf der Schwelle zwischen beiden Welten steht, das Erkennen, dass die Lüge einen Stellenwert in der Welt der Erwachsenen besitzt, vor der man nur als Kind gefeit zu sein scheint....

So ist erste Geschichte "A perfect day for banana-fish" des vorliegenden Buches eine besonders düstere und bizarre Geschichte. Eine der ersten Geschichte, die Salinger 1948 im "New Yorker" veröffentlicht hat und die ihn über Nacht bekannt machte. Der Protagonist der Geschichte ist ein scheinbar etwas verwirrter Kriegsveteran, freundet sich im Urlaub mit einem kleinen Mädchen an und erzählt ihr am Strand eine Geschichte von Bananenfischen. Dann geht er zurück auf sein Hotelzimmer, legt sich zu seiner schlafenden Frau ins Bett und jagt sich eine Kugel in den Kopf....

Salinger bleibt, obwohl er als einer der meistgelesenen (und meistinterpretierten) amerikanischen Autoren gilt, ein ungewöhnlicher, irgendwie nicht greifbarer Charakter. Er nahm an einigen der heftigsten Schlachten des 2. Weltkriegs teil, so etwa bei der Landung der Aliierten in der Normandie oder auch in den Ardennen. Tatsächlich war er auch selbst aufgrund eines Kriegstraumas kurzzeitig in Behandlung. Während seiner Zeit in Europa traf er auf Ernest Hemingway, der als Kriegsberichterstatter teilnahm und Salinger eine "außerordentliche Begabung" bescheinigte. 1965 veröffentlichte Salinger seine letzte Erzählung -- insgesamt hat er neben dem "Fänger Im Roggen" lediglich knapp über 30 Kurzgeschichten veröffentlicht. Seither lebt er zurückgezogen und die ganze Welt wartete immer wieder auf einen neuen "großen Wurf"....der wohl nicht mehr kommen wird.

siehe auch:
Georg Dietz: Hinaus ins Leben - Alle reden über Salingers 'Fänger im Roggen', dabei ist sein Roman 'Franny und Zooey' viel schöner..., Die ZEIT, 22.03.2007 Nr. 13.

Online Umfrage zum IT Gipfel 2006 - Teil 2


Die in diesem Blog am 27.03.2007 angekündigte Umfrage zur Einrichtung des "Gipfel-Blogs" anlässlich zur Auf- und Nachbereitung des im Dezember 2006 am HPI Potsdam ausgerichteten 1. IT-Gipfel der Bundesregierung, die mein Kollege Justus Bross initiiert hatte, ist jetzt offiziell beendet. Mehr als 350 Online-Fragebögen wurden ausgefüllt. Dafür an erster Stelle erst einmal recht herzlichen Dank für die fleissige Mitarbeit!
Die Endauswertung läuft und auf die Veröffentlichung entsprechender Ergebnisse werde ich an dieser Stelle natürlich hinweisen. Eine erste wissenschaftliche Arbeit zum Thema wurde bereits für die e-society 2007 in Lissabon akzeptiert, an der final version wird derzeit noch gearbeitet.

Thursday, May 03, 2007

A map of the Social Web


Via media-ocean I found an interesting map of the 'currently known' Social Web (a.k.a. Web 2.0). Here you might take a look at the map in full size. Interesting thing about, the sizes of the single areas (communities) on the map correspond to the approximate number of members. Also the layout has its purpose. On top, you'll find the 'practicals' (Yahoo, Windows Live...), while at the bottom there stick the 'intellectuals' (wikipedia, sourceforge,...). The left is more concerned about 'real life' (I'm missing XING...), while the right is more 'web centered' (second life, antropomorphic dragons, etc...). You can even find good old usenet ...but only as a dashed outline (maybe it is about (or has already) to vanishid and only remembered in old myths like the legendary Atlantis..)
Nice thing to notice, there's also Qwghlm....I can't remember having seen it on any map before :)

Tuesday, May 01, 2007

veni, vidi, emi ... according to Google


Two weeks ago, Google bought Double Click for an incredible amount of money. But for what reason, you might ask....well, to become the dominant internet advertiser. But that is too simple and too short-sighted, as pointed out last week by the German newspaper 'Die Zeit'. According to an article of Götz Hamann, everybody who is worrying about Google to become No. 1 internet advertiser is as short-sighted as this famous Gaulic chief 2000 years ago complaining about Julius Caesar having defeated the entire Gaul. But, Julius Caesar's primary ambition was not only to conquer Gaul, but to become the leader (cesar) of the Roman world empire. And the Google managers .... they also have something else in mind than just becoming the dominant internet advertiser.
They want to preveil their rules in the global advertising market....against the tv networks and also against the newspapers. In relation to the attention that the newspapers get, they receive way too much advertising. This is because of the brokers distributing advertising for the big corporations. These brokers are one of the reasons, why Google is not able to grow as fast as it possibly could. Thus, Google will continue to buy...and who knows, what company will be next....
Alas, and again we will hear: veni, vidi, emi....

(I came, I saw, and I bought..... freely adapted from H.C. aka Gaius Julius Caesar)