NADINE – Internetlinks verraten Interaktionsmuster

Wie können wir auf Basis von Internetlinks Vorhersagen über die Aktivitäten der Menschen treffen? Was können wir aus den Nutzungsmustern im Internet ablesen? Das NADINE-Projekt der EU bildet Algorithmen und Methoden zur Analyse von Online-Aktivitäten, die Licht in die Zusammenhänge zwischen Themen, Ländern und sogar den Handel mit Waren bringen werden.

Das Internet besteht heute aus rund 50 Milliarden Seiten, die eine unüberschaubare virtuelle Landschaft bilden. Jede unserer Interaktionen liefert Daten, die nach Aufschlüsselung und Analyse eine Hilfe dabei sind, ein breites Spektrum der Aktivitäten des Menschen aus dem kulturellen Bereich bis hinein in die Wirtschaft zu verstehen.

Das innerhalb des RP7 der EU unter dem Programm „Neue und künftige Technologien“ finanzierte Projekt „New tools and Algorithms for DIrected NEtwork analysis“ (NADINE) leistet einen Beitrag zur Entwicklung neuer Suchmaschinentypen, die Europa in diesem wichtigen Bereich in Führung bringen sollen.

„Wir versuchen uns an einer Bestandsaufnahme des Internets, um zu zeigen, auf welche Weise die Seiten miteinander verlinkt sind und wie die Menschen diese Links beim Herumsurfen im Internet nutzen“, sagt NADINE-Projektkoordinator Dima Shepelyansky, Forschungsdirektor am Laboratoire de Physique Théorique, CNRS Toulouse.

Das Projekt verwendet neben anderen einige von Google bereitgestellte Werkzeuge, um nachzuweisen, wie die Seiten miteinander verknüpft sind. Auf diese Weise ergibt sich zum Beispiel die Wahrscheinlichkeit, mit der die Leute spezielle Seiten besuchen, Entscheidungen treffen, Dinge kaufen oder auf eine gewisse Weise abstimmen.

Verfeinerte Wege zur Nachverfolgung von Onlineinteraktionen sind gefragt

Die Forscher betrachteten im Zuge der Entwicklung und Erprobung ihrer Methoden biographische Einträge auf Wikipedia, um zu sehen, ob sie die dort genannten Menschen nach ihrem Einfluss einstufen können. Sie analysierten die 24 wichtigsten Sprachen und berücksichtigten dabei die Anzahl der mit den Einzelpersonen verlinkten Artikel unter Einsatz des PageRank-Algorithmus von Google, der aussagt, dass eine Seite dann wichtig ist, wenn wichtige Seiten mit ihr verknüpft sind.

Hier ergab sich allerdings ein interessantes Problem, das die Projektforscher aus dem Weg räumen mussten. Der Wissenschaftler Carl von Linné, auch als Linnaeus bekannt, schien der bedeutendste Mensch überhaupt zu sein. Da er für die Einteilung der Organismen nach einer Nomenklatur verantwortlich zeichnete, gibt es auf jeder Wikipedia-Seite, die sich mit Pflanzen und Tiere beschäftigt, Verknüpfungen zu seiner Seite, was letztlich die Ergebnisse verzerrte.

So kamen die Forscher zu dem Entschluss, CheiRank einzuführen, das die Bedeutung einer Seite im Verhältnis zur Anzahl der ausgehenden Links beschreibt. Mit der Kombination von beiden konnten die Forscher eine robuste Art der Messung der Bedeutung entwickeln. Durch die entwickelten Methoden können gleichermaßen selbstorganisierende, verlinkte Web-Communities erfasst werden.

Onlineinformationen strömen ähnlich wie Handelsbeziehungen

Angesichts der Tatsache, das Verlinkungen auf eine und von einer Seite zeigen können, wie Informationen ausgetauscht werden, wandte das Projekt im Folgenden die Ergebnisse auf die Analyse von Handelsströmen an. NADINE nutzte dazu die Welthandelsdatenbank der Vereinten Nationen, die Daten aus den letzten 50 Jahren enthält. „Wir haben eine neue Art der Analyse der Handelsbeziehungen von 61 Produkten aus allen möglichen UN-Ländern entwickelt, welche die Empfindlichkeit der Handelsbilanz gegenüber Preisschwankungen bestimmt“, wie Shepelyansky erklärt.

NADINE vereint eine Partnerschaft, die aus theoretischen Physikern, Mathematikern und Informatikern aus Frankreich, den Niederlanden, Ungarn und Italien besteht. „Eine länderübergreifende EU-Finanzierung war unverzichtbar, als es darum ging, ein Team von Wissenschaftlern aus einer derartigen Vielzahl von Disziplinen zusammenzubekommen“, ergänzt der Projektleiter.

Das Projekt läuft seit drei Jahren und wird im April 2015 enden. Es erhielt nahezu 1,223 Millionen EUR an EU-Finanzmitteln. Nun, nachdem die Methodik klar festgelegt ist, planen die Forscher des NADINE-Konsortiums, die Arbeit mit verschiedenen Partnern, darunter auch die Welthandelsorganisation, weiterzuführen.

Link zur Projektwebsite

Weitere Links
http://www.quantware.ups-tlse.fr/QWART/cheirank/cheirank.html
http://www.quantware.ups-tlse.fr/QWLIB/topwikipeople/
http://www.quantware.ups-tlse.fr/QWLIB/wtnmatrix/
http://en.wikipedia.org/wiki/CheiRank

veröffentlicht: 2015-02-09
Kommentare


Privacy Policy