Das Internet besteht heute aus rund 50 Milliarden Seiten, die eine
unüberschaubare virtuelle Landschaft bilden. Jede unserer Interaktionen
liefert Daten, die nach Aufschlüsselung und Analyse eine Hilfe dabei
sind, ein breites Spektrum der Aktivitäten des Menschen aus dem
kulturellen Bereich bis hinein in die Wirtschaft zu verstehen.
Das innerhalb des RP7 der EU unter dem Programm
„Neue und künftige Technologien“ finanzierte Projekt
„New tools and Algorithms for DIrected NEtwork analysis“
(NADINE) leistet einen Beitrag zur Entwicklung neuer
Suchmaschinentypen, die Europa in diesem wichtigen Bereich in Führung
bringen sollen.
„Wir versuchen uns an einer Bestandsaufnahme des Internets, um zu
zeigen, auf welche Weise die Seiten miteinander verlinkt sind und wie
die Menschen diese Links beim Herumsurfen im Internet nutzen“, sagt
NADINE-Projektkoordinator Dima Shepelyansky, Forschungsdirektor am
Laboratoire de Physique Théorique, CNRS Toulouse.
Das Projekt verwendet neben anderen einige von Google
bereitgestellte Werkzeuge, um nachzuweisen, wie die Seiten miteinander
verknüpft sind. Auf diese Weise ergibt sich zum Beispiel die
Wahrscheinlichkeit, mit der die Leute spezielle Seiten besuchen,
Entscheidungen treffen, Dinge kaufen oder auf eine gewisse Weise
abstimmen.
Verfeinerte Wege zur Nachverfolgung von Onlineinteraktionen sind gefragt
Die Forscher betrachteten im Zuge der Entwicklung und Erprobung
ihrer Methoden biographische Einträge auf Wikipedia, um zu sehen, ob sie
die dort genannten Menschen nach ihrem Einfluss einstufen können. Sie
analysierten die 24 wichtigsten Sprachen und berücksichtigten dabei die
Anzahl der mit den Einzelpersonen verlinkten Artikel unter Einsatz des
PageRank-Algorithmus von Google, der aussagt, dass eine Seite dann wichtig ist, wenn wichtige Seiten mit ihr verknüpft sind.
Hier ergab sich allerdings ein interessantes Problem, das die
Projektforscher aus dem Weg räumen mussten. Der Wissenschaftler Carl von
Linné, auch als Linnaeus bekannt, schien der bedeutendste Mensch
überhaupt zu sein. Da er für die Einteilung der Organismen nach einer
Nomenklatur verantwortlich zeichnete, gibt es auf jeder Wikipedia-Seite,
die sich mit Pflanzen und Tiere beschäftigt, Verknüpfungen zu seiner
Seite, was letztlich die Ergebnisse verzerrte.
So kamen die Forscher zu dem Entschluss,
CheiRank
einzuführen, das die Bedeutung einer Seite im Verhältnis zur Anzahl der
ausgehenden Links beschreibt. Mit der Kombination von beiden konnten
die Forscher eine
robuste Art der Messung der Bedeutung
entwickeln. Durch die entwickelten Methoden können gleichermaßen
selbstorganisierende, verlinkte Web-Communities erfasst werden.
Onlineinformationen strömen ähnlich wie Handelsbeziehungen
Angesichts der Tatsache, das Verlinkungen auf eine und von einer
Seite zeigen können, wie Informationen ausgetauscht werden, wandte das
Projekt im Folgenden die Ergebnisse auf die Analyse von Handelsströmen
an. NADINE nutzte dazu die
Welthandelsdatenbank der Vereinten Nationen,
die Daten aus den letzten 50 Jahren enthält. „Wir haben eine neue Art
der Analyse der Handelsbeziehungen von 61 Produkten aus allen möglichen
UN-Ländern entwickelt, welche die Empfindlichkeit der Handelsbilanz
gegenüber Preisschwankungen bestimmt“, wie Shepelyansky erklärt.
NADINE vereint eine
Partnerschaft,
die aus theoretischen Physikern, Mathematikern und Informatikern aus
Frankreich, den Niederlanden, Ungarn und Italien besteht. „Eine
länderübergreifende EU-Finanzierung war unverzichtbar, als es darum
ging, ein Team von Wissenschaftlern aus einer derartigen Vielzahl von
Disziplinen zusammenzubekommen“, ergänzt der Projektleiter.
Das Projekt läuft seit drei Jahren und wird im April 2015 enden. Es
erhielt nahezu 1,223 Millionen EUR an EU-Finanzmitteln. Nun, nachdem die
Methodik klar festgelegt ist, planen die Forscher des
NADINE-Konsortiums, die Arbeit mit verschiedenen Partnern, darunter auch
die
Welthandelsorganisation, weiterzuführen.
Link zur Projektwebsite
Weitere Links
http://www.quantware.ups-tlse.fr/QWART/cheirank/cheirank.htmlhttp://www.quantware.ups-tlse.fr/QWLIB/topwikipeople/http://www.quantware.ups-tlse.fr/QWLIB/wtnmatrix/http://en.wikipedia.org/wiki/CheiRank