Falsches Bing

In meinen Zugriffs-Statistiken tauchen neuerdings auch Referrer von Microsofts neu aufgelegter Suchmaschine Bing auf. Der vermeintliche Google-Killer scheint ja richtig populär zu werden, könnte man denken. Aber von wegen. Ein kleiner Ausschnitt aus meiner Logdatei von heute:

/2007/08/29/offentlicher-druck-funktioniert/
Http Code: 200 Date: Jun 29 10:41:55 Http Version: HTTP/1.1 Size in Bytes: 26124
Referer: http://search.live.com/results.aspx?q=youtube
Agent: Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1; .NET CLR 1.1.4325; .NET CLR 2.0.50727; .NET CLR 3.0.30729; .NET CLR 3.5.30707; MS-RTC LM 8)

Auf den ersten Blick sieht es so aus, als habe jemand bei Microsoft Live nach „YouTube“ gesucht und sei auf mein Blog gestoßen. Doch von wegen: unter dem angegebenen Referrer ist mein Blog nicht zu finden und die IP-Adresse gehört zu MSN. In Wahrheit ist der Surfer mit dem komischen Browser ein MSN-Bot, der in meinen Statistiken falsche Referrer hinterlässt.

Besonders auffällig: der korrekt gekennzeichnete MSNBot war ein paar Sekunden vorher da:


/robots.txt
Http Code: 200 Date: Jun 29 10:41:08 Http Version: HTTP/1.1 Size in Bytes: 165
Referer: -
Agent: msnbot/1.1 (+http://search.msn.com/msnbot.htm)

/2007/08/29/offentlicher-druck-funktioniert/
Http Code: 200 Date: Jun 29 10:41:08 Http Version: HTTP/1.1 Size in Bytes: 26098
Referer: -
Agent: msnbot/1.1 (+http://search.msn.com/msnbot.htm)

Und das nicht nur bei mir. Was ist da los? Betreibt Microsoft Referrer-Spam oder sind ein paar Bots falsch programmiert?

PS: Wie in den Kommentaren angemerkt, soll es sich bei dem getarnten Bot um eine Maßnahme zur Qualitätssicherung handeln. In die offizielle Dokumentation von Bing hat es diese Information offenbar nicht geschafft.

Wie man Informationen in der Wikipedia unterdrückt

Die New York Times berichtet über einen interessanten Präzedenzfall: Als der Reporter David Rohde von den Taliban entführt wurde, bemühten sich Kollegen und Arbeitgeber, die online erhältlichen Informationen so zu manipulieren, dass er einerseits als möglichst islam-freundlich und andererseits als relativ unwichtig erscheinen sollte.

Damit die Entführung nicht an die große Öffentlichkeit dringt, wurde Wikipedia-Gründer Jimmy Wales eingeschaltet: Er sollte vermeiden dass die Entführung in der Online-Enzyklopädie auftaucht und einen von Rohdes Kollegen decken, der den Wikipedia-Artikel über Rohde unter Pseudonym editierte.

“We were really helped by the fact that it hadn’t appeared in a place we would regard as a reliable source,” he said. “I would have had a really hard time with it if it had.”

The Wikipedia page history shows that the next day, Nov. 13, someone without a user name edited the entry on Mr. Rohde for the first time to include the kidnapping. Mr. Moss deleted the addition, and the same unidentified user promptly restored it, adding a note protesting the removal. The unnamed editor cited an Afghan news agency report. In the first few days, at least two small news agencies and a handful of blogs reported the kidnapping.

Dies ist ein interessanter Präzedenzfall. Hätte es schlichtweg keine verlässlichen Quellen für die Entführung gegeben, hätte die New York Times die Mitarbeit von Jimmy Wales nicht gebraucht. Dass Verweise auf Nachrichtenagenturen unterdrückt werden, wirft die Frage auf, wie hoch der – menschliche – Preis ist, um Wikipedia zu manipulieren.

PS: Die Behauptung, dass es keine verlässliche Quellen für die Entführung gab, ist übrigens falsch. Gleich zu Beginn wurde ein Artikel der Pajhwok Afghan News verlinkt. Und diese Quelle wird in der Wikipedia ansonsten ohne Probleme akzeptiert.

PS2: Auf meine Nachfrage hat Jimmy Wales das Zitat nochmal erläutert:

I would not consider a single report of an incident of that nature, not confirmed anywhere else, to be a reliable source.

Natürlich beißt sich die Katze in den Schwanz – exceptional claims require exceptional sources. Wenn diese exceptional sources aber nicht berichten, dann ist auch die Erwähnung Wikipedia hinfällig. Schwierigkeiten hätte Wales also nur gehabt, wenn beispielsweise CNN das Embargo gebrochen hätte – aber der Damm wäre damit überall gebrochen gewesen.

Megavideo – Filter oder DNS-Snafu?

Aufregung in Twitterland und in Frankreich – Megavideo ist nicht erreichbar. Beginnt nun das große Filtern von Urheberrechtsverletzungen?

Wie damals bei RottenNeighbor sprechen die meisten Indizien für einen technischen Fehler. So ist die Auflistung der Provider kaum mit einem zentral gesteuerten Filterversuch zu vereinbaren. Auch mein Provider Netcologne ist betroffen, so konnte ich mir das Phänomen etwas näher ansehen.

Das Grundproblem ist einfach: Ruft man die Seite auf, erscheint eine DNS-Fehlermeldung – http://www.megavideo.com konnte nicht gefunden werden. Auffällig: im Gegensatz dazu kann http://megavideo.com aufgerufen werden – jedoch laden nicht alle Inhalte. Also sehen wir uns mal den die DNS-Einträge an.

~> host megavideo.com
megavideo.com has address 69.5.88.231
megavideo.com has address 69.5.88.225
megavideo.com has address 69.5.88.226
megavideo.com has address 69.5.88.227
megavideo.com has address 69.5.88.228
megavideo.com has address 69.5.88.229
megavideo.com has address 69.5.88.230
megavideo.com mail is handled by 10 mailin.megavideo.com.

Das sieht in Ordnung aus – ganz im Gegensatz zu dieser Abfrage:

:~> host www.megavideo.com
;; Truncated, retrying in TCP mode.
;; ERROR: ID mismatch: expected ID 62402, got 2063

Nutzt man jedoch einen anderen DNS – wie zum beispiel den von T-Online – zeigt sich jedoch ein anderes Bild:

:~> host www.megavideo.com
www.megavideo.com has address 69.5.88.224
www.megavideo.com has address 69.5.88.201
www.megavideo.com has address 69.5.88.202
www.megavideo.com has address 69.5.88.203
www.megavideo.com has address 69.5.88.204
www.megavideo.com has address 69.5.88.205
www.megavideo.com has address 69.5.88.206
www.megavideo.com has address 69.5.88.207
www.megavideo.com has address 69.5.88.208
www.megavideo.com has address 69.5.88.209
www.megavideo.com has address 69.5.88.210
www.megavideo.com has address 69.5.88.211
www.megavideo.com has address 69.5.88.212
www.megavideo.com has address 69.5.88.213
www.megavideo.com has address 69.5.88.214
www.megavideo.com has address 69.5.88.215
www.megavideo.com has address 69.5.88.216
www.megavideo.com has address 69.5.88.217
www.megavideo.com has address 69.5.88.218
www.megavideo.com has address 69.5.88.219
www.megavideo.com has address 69.5.88.220
www.megavideo.com has address 69.5.88.221
www.megavideo.com has address 69.5.88.223

Auch andere Subdomains scheinen betroffen zu sein, so dass die Server, die die Videodaten liefern sollen, ohne Wechsel des DNS-Servers für die Kunden der betroffenen Provider nicht erreichbar sind.

Arbeitsthese: Megavideo hat zu lange oder falsch formatierte DNS-Einträge angelegt, der bei manchen Providern zu einem Fehler führen, bei anderen jedoch nicht.

Schlussfolgerung: Webseiten, die sich nicht zu sehr um Urheberrechte kümmern, sind auch oft nicht wirklich an Kundenservice interessiert.

Von der Altersangabe bis zur Nekrophilie

Wer Lokaljournalismus lernt, erfährt recht schnell, dass einige Basisinformationen einfach dazu gehören. Zum Beispiel muss man alle möglichen Beteiligten immer nach dem Alter fragen. Das ist ein nettes persönliches Detail und erleichtert das Schreiben ungemein: Man kann zum beispiel „Die 18jährige“ statt „Die Täterin“ oder „Christiane F.“ schreiben – das sorgt für Abwechslung.

Bei wohl keiner anderen Zeitung hat sich die Altersangaben-Manie so weit fortentwickelt wie bei der BILD. Und so sehe ich grade auf der Titelseite von BILD.de diese tolle Meldung:

Neues Buch enthüllt
Jackie Onassis verführte Marlon Brando
Nach 45 Jahren kommt heraus: Jackie Onassis († 64) verführte Schauspieler Marlon Brando († 80)! Das enthüllt ein neues Buch.

Da die Online-Redaktion bei beiden Protagonisten das Todesalter in Klammern schreibt, scheint es sich um eine Liaison im Jenseits zu handeln. Oder einen besonders seltenen Fall beidseitiger Nekrophilie. In beiden Fällen gilt: das will ich nicht wirklich lesen.

Gefunden: Das schwächste Argument für Access-Sperren

In dem sehr lesenswerten Streitgespräch zwischen Ursula von der Leyen und Franziska Heine präsentiert die Bundesfamilienministerin ein neues Argument für das von ihr initiierte Zugangserschwerungsgesetz:

Die Technik der Zugangssperren führt dazu, dass wir jetzt erstmals systematisch kinderpornografische Websites identifizieren.

Schon rein logisch ist das Argument fragwürdig: Weil „wir“ bisher schlechte Arbeit geleistet haben, brauchen „wir“ neue Gesetze? Im Gegensatz zur Erfassung von Verkehrsdaten spricht nach meinen Informationen nichts dagegen, dass das BKA systematisch Kinderporno-Seiten erfasst. Alleine bei der Erstellung und dem Einsatz der Kinderporno-Such-Software Perkeo müsste eine solche Liste quasi als Abfallprodukt abfallen.

Auch faktisch ist das Argument falsch. Denn in der Antwort auf die parlamentarische Anfrage steht es eindeutig:

Das Bundeskriminalamt unterhält die nationale Bilddatenbank mit Informationen zu identifizierten sowie noch nicht identifizierten Tätern und Opfern in kinderpornografischen Schriften. Daneben erfolgte sowohl eine finanzielle (400.000 US $ im Dezember 2005) als auch eine fachlich aktive Teilnahme als Testpartner am Aufbau der internationalen Bilddatenbank beim Generalsekretariat von Interpol in Lyon. Diese Bilddatenbank befindet sich seit dem 05.03.2009 im Wirkbetrieb und ermöglicht online den weltweiten Austausch von Informationen zu bekannten und bisher unbekannten kinderpornografischen Bildserien zwischen den teilnehmenden Staaten.

Erfolgs-Quiz

Crowdsourcing ist toll. Die Masse weiß einfach alles. Nur bei der Perzeption und Selbstreflektion gibt es manchmal einige kleine Mängel.

Daher ein kleines Quiz. Ich habe heute morgen eine Pressemitteilung der „größten Website“ für Kinder zwischen 6 und 14 Jahren „in Deutschland und Europa“ erhalten. Nur welche ist das bloß? Ein paar Tipps:

  • Unaufhaltbares Wachstum – 15000 neue Mitglieder täglich!
  • Die Seite ist profitabel!!
  • Die sichere und gewaltfreie Online-Umgebungwurde vom TÜV geprüft!!!
  • Es geht nicht um Mäuse, Ponys oder Knuddelbären.
  • Na, welche Website mag das sein? Und googeln gilt nicht.

    „Erfolgs-Quiz“ weiterlesen

Über Linkkürzer

Gerade dank Twitter & Co sind Linkverkürzer grade sehr in Mode. Ein paar Fakten.

Solche Dienste sind ein Sicherheitsrisiko. Dank der Verkürzung erkennt der Internet-Surfer vorher meist nicht, wo er denn landet, und er weiß nicht ob die Daten nicht an anderer Stelle verändert wurden wie vor kurzem geschehen.

Welche Linkverkürzer in fünf Jahren noch online sind, ist höchst fraglich – gute und nachhaltige Geschäftsmodelle habe ich bisher nicht gesehen. Im besten Fall gehen die Links irgendwann ins Leere. Die Sage, dass das Internet nichts vergisst, ist bekanntlich Blödsinn – wie wir Menschen behält das Internet nur das, was ihm grade besonders interessant vorkommt – und auch davon nur die Hälfte. Wenn das große Tiny-Sterben einsetzt, helfen aber nicht einmal Google-Cache oder Archive.org, das Ergebnis wird eine rapide Internet-Demenz sein.

Auch Kurz-URLs brauchen Platz. Die Links, die TinyURL grade ausspuckt sind 25 Zeichen lang, das sind 17,8 Prozent eines Tweets. Bit.Ly kommt derzeit mit vergleichsweise schlanken 19 Zeichen aus.

Dabei lassen sich ellenlange URLs oft sehr einfach verkürzen. Zum hat zum Beispiel der oben erwähnte Link

http://www.heise.de/security/2-2-Millionen-URLs-bei-URL-Verkuerzerdienst-manipuliert–/news/meldung/140557

ganze 106 Zeichen. Ohne Zauberei wird aus der langen, sprechenden URL eine relativ kurze:

http://www.heise.de/security/news/meldung/140557

hat nur noch 48 Zeichen, führt zum gleichen Ziel und zeigt dem Nutzer auf den ersten Blick, wohin er denn klickt. Bei vielen langen URLs geht das ganz ähnlich. Session-IDs sollte man eh vor der Weitergabe an Dritte streichen.

Deshalb: Wer sinnlos Linkverkürzer einsetzt, denkt auch kürzer.

„1005 repräsentativ ausgewählte Bürger“

Wenn bei meinem Beitrag gestern der Eindruck entstanden sein könnte, dass ich von Umfragen nicht viel halte, dann liegt es daran, dass ich von Umfragen nicht viel halte.

Die inflationäre Obsession mit der Meinung von Leuten, denen das grundlegende Faktenwissen fehlt, ist mir absolut rätselhaft. Verbände und Firmen schicken mir jeden Tag Umfrageergebnisse ins Haus, die zeigen sollen, wie notwendig ein Produkt ist, wie beliebt eine Person oder Maßnahme doch ist oder wie die Deutschen so denken. Dank einer auf Aufträge angewiesenen Call-Center-Industrie ist das erstaunlich billig. Die meisten Umfragen sind jedoch keinen zweiten Blick wert.

Ein Beispiel von heute morgen – der Branchenverband BITKOM hat ein Mittel gegen Politikverdrossenheit gefunden: Online-Wahlen.

„Online-Wahlverfahren ermöglichen es jedem Bürger, seine Stimme ortsunabhängig und mit geringem Aufwand abzugeben. Die Mobilisierung der Wähler würde durch Online-Wahlen deutlich erleichtert.“ Nach den Ergebnissen der BITKOM-Umfrage hätte die sehr niedrige Wahlbeteiligung bei der letzten Europawahl durch den Einsatz der Online-Wahl signifikant gesteigert werden können. 11 Prozent der Befragten gaben an, dass sie gewählt hätten, wäre Ihnen die elektronische Stimmabgabe per Internet ermöglicht worden. Die Wahlbeteiligung bei der Europawahl 2009 hätte von 43 Prozent auf 54 Prozent steigen können.

Oho! Toll! Mehr Demokratie! – Natürlich setzt das voraus, dass die Leute bei guten Vorsätzen immer ehrlich und konsequent sind. 11 Prozent der Leute waren zu verpeilt, um ihre Stimme per Briefwahl abzugeben. Sie sind aber sehr optimistisch, dass sie mit einem anderen Wahlverfahren ganz sicher gewählt hätten. Könnte man auf solche Erklärungen nur halbwegs vertrauen, hätten wir in Deutschland keine Raucher mehr.

„Die Umfrage zeigt, dass viele Bürger online wählen wollen, es aber auch Bedenken gibt“, sagte Scheer. An erster Stelle stehen nach den Ergebnissen der BITKOM-Untersuchung Sicherheitsbedenken und die Sorge vor einer Manipulation der Wahlergebnisse. Scheer: „Wir müssen elektronische Wahlverfahren einsetzen, die für jeden Bürger verständlich und mindestens ebenso sicher sind, wie die Stimmabgabe im Wahllokal und die Briefwahl.“ Dann könnten Online-Wahlen zu einem wichtigen Instrument der Demokratie werden.

Der Haken: dieses Wahlverfahren gibt es schlichtweg nicht. In Deutschland sind zwar seit einigen Jahren Online-Wahlen für private Instititutionen und Vereine möglich, die Technik ist aber kompliziert und teuer. Selbst wenn jeder in Deutschland einen RFID-Ausweis, ein Lesegerät und die notwendige Verschlüsselungssoftware lauffähig auf seinem PC hätte – das Ergebnis wäre für den Wähler nicht wesentlich einfacher als die Briefwahl, es wäre für den einzelnen nicht nachvollziehbar und teuer.

Was bleibt übrig? 1005 repräsentativ ausgewählte Bürger wurden in ihrem Tagesablauf gestört um am Telefon Fantasie-Fragen zu beantworten, die niemand wirklich interessieren. Und dabei hatten sie Glück, dass der Anrufer ihnen nicht ein Zeitschriften-Abo oder einen neuen Telefontarif verkauft hat. Wie viele von Euch finden das toll? Ruft nicht an, hebt einfach nur die Hand. Jetzt.

Danke, dieses Ergebnis habe ich erwartet.