In einem vom Wissenschaftsfonds FWF geförderten Projekt wurde untersucht, wie sich Glaubwürdigkeit von Informationen aus dem Netz bewerten lässt, um damit effektiver Daten aus Plattformen wie Flickr und Co zu gewinnen.
Das Thema Glaubwürdigkeit von Informationen aus dem Internet hat zuletzt durch die politische Dimension von Fake News und ihrem Einfluss auf demokratische Prozesse große Brisanz erlangt. Die Schwierigkeit für Internet-Unternehmen wie Facebook, das besonders mit der Thematik konfrontiert ist, besteht in ihrer Abhängigkeit von Computermethoden zur Auswahl von Inhalten. Der Erfolg des Internet beruht wesentlich auf der automatisierten Verarbeitung von Information: Algorithmen, nicht Menschen bestimmen, welche Ergebnisse von Suchmaschinen angezeigt werden. Im Bereich von Fake News fehlt es dafür aber an geeigneten Methoden. Die Wahrheit, betont man bei Facebook, sei oft besonders schwierig zu identifizieren. Die Beurteilung von Glaubwürdigkeit hingegen scheint möglich und war das Thema eines vom Wissenschaftsfonds FWF geförderten internationalen Forschungsprojekts unter der Leitung von Allan Hanbury von der Technischen Universität (TU) Wien. „Wir haben gesehen, dass die Glaubwürdigkeit von Online-Inhalten bisher nicht klar definiert war“, sagt Hanbury. „Unser Ziel war, ein besseres Glaubwürdigkeitsmodell zu finden und Experimente damit zu machen.“
Glaubwürdigkeit lasse sich anhand verschiedener Kriterien beurteilen, erklärt Hanbury. Manche haben mit der Quelle der Information zu tun. Verfügt die Quelle über Expertise in diesem Bereich? Genießt sie Vertrauen? Andere Kriterien drehen sich um die Information selbst. Wie hoch ist die Qualität der Information? Hier geht es etwa um Tippfehler in Dokumenten. Wie hoch ist ihre Zuverlässigkeit? Gemeint ist, wie stark die Qualität der von einer bestimmten Quelle stammenden Information variiert.
Glaubwürdigkeit von Bildern und Suchmaschinen
Hanburys Team nahm die Suche nach Bildern in sozialen Medien unter die Lupe, speziell in Flickr. Die Idee war, das „Tagging“, also die Benennung oder Etikettierung von Bildern zu betrachten, und ihre Glaubwürdigkeit zu beurteilen. Solche Tags können „Wasser“, „Berg“ oder „Strand“ lauten. Ein Algorithmus bewertet die Glaubwürdigkeit der Tags nach verschiedenen Kriterien, etwa anhand der Begleittexte, aber auch daran, wie regelmäßig eine Nutzerin oder ein Nutzer postet und wie viele Bilder sie oder er online hat, ohne den Inhalt der Bilder selbst zu analysieren. Diese Informationen fließen in ein Programm, das versucht, Bilder mit den richtigen Tags zu versehen.
Dabei ließ sich zeigen, dass ein mit Glaubwürdigkeitskriterien arbeitender Algorithmus sehr verlässlich die richtigen Tags zu bestimmten Bildern findet. Mit der Berücksichtigung von Glaubwürdigkeitskriterien lässt sich so die Effektivität automatisierter Informationsgewinnung im Internet erhöhen. Das zu zeigen war eines der Ziele des Projekts. Neuland betrat das Projektteam mit dem Versuch, nicht nur die Glaubwürdigkeit von Inhalten zu analysieren, sondern auch jene von Systemen, die Informationen sammeln.
„Die Suchmaschinen und Empfehlungssysteme haben einen großen Einfluss darauf, welche Posts und Dokumente von Personen gesehen werden“, sagt Hanbury. Sie können Ergebnisse nach Relevanz ordnen, aber auch bezahlte Inhalte höher reihen. „Wir haben uns angesehen, ob es möglich ist, die Glaubwürdigkeit von Suchmaschinen zu beurteilen.“ Diese Fragestellung wurde im Rahmen des Projekts erstmals untersucht und stellte sich als sehr schwierig heraus. Denn ohne Kenntnisse über die Programmierung der Suchmaschine sei das fast nicht möglich, räumt Hanbury ein.
Gesundheit im Netz
Falschinformationen sind nicht nur bei politischen Themen besonders heikel, sondern beispielsweise auch bei medizinischen Inhalten. „Menschen, die an langwierigen Erkrankungen leiden, informieren sich oft ausführlich darüber im Internet und werden mit der Zeit selbst zu Experten“, erklärt Allan Hanbury. Manchmal seien gerade top-gereihte Inhalte Falschinformationen, wo mit der Hoffnung und Verzweiflung der Menschen Geschäfte gemacht würden, gibt der Wissenschafter zu bedenken. Die Organisation „Health On the Net“ (HON) beschäftigt sich bereits seit 1995 mit dem Phänomen und kämpft für die Qualität medizinischer Online-Information, ist allerdings mit der Menge an Information überfordert. „Eine händische Bewertung ist nicht mehr möglich.“ In einer Zusammenarbeit mit HON testeten die Forscherinnen und Forscher der TU Wien die in dem Projekt entwickelten automatisierten Methoden zur Bewertung der Glaubwürdigkeit. „Der Rahmen, den wir aufgebaut haben, kann künftig verwendet werden, um Glaubwürdigkeit zu messen“, betont Hanbury.
Zur Person
Allan Hanbury (http://allan.hanbury.eu/doku.php) forscht als Gruppenleiter für „Information and Software Engineering“ (ifs)( http://www.ifs.tuwien.ac.at) an der Technischen Universität Wien. Seine Forschungsinteressen sind Datenwissenschaft, Informationsgewinnung und die Evaluation von Informationsgewinnungssystemen und Algorithmen. Er ist Koordinator verschiedener EU-Projekte und österreichischer Forschungsprojekte.
Publikationen
Ralf Bierig, Cristina Serban, Alexandra Siriteanu, Mihai Lupu, Allan Hanbury: A System Framework for Concept- and Credibility-Based Multimedia Retrieval. ICMR 2014: 543,
http://doi.org/f3s5f8
Palotti, João, et al: How users search and what they search for in the medical domain. Information Retrieval Journal 19.1-2 (2016): 189-224. (pdf),
http://doi.org/f3s5fj
Bild und Text ab Montag, 27. Februar 2017 ab 9.00 Uhr MEZ verfügbar unter: http://scilog.fwf.ac.at
Wissenschaftlicher Kontakt
PD Dr. Allan Hanbury
TU Wien
Favoritenstraße 9-11/188
1040 Wien
T +43 / 1 / 58801-188310
E hanbury ifs.tuwien.ac.at
W http://ifs.tuwien.ac.at
Der Wissenschaftsfonds FWF
Ingrid Ladner
Haus der Forschung
Sensengasse 1
1090 Wien
T +43 / 1 / 505 67 40 – 8117
E ingrid.ladner@fwf.ac.at
W http://scilog.fwf.ac.at
W http://www.fwf.ac.at
Versand
PR&D – Public Relations für Forschung & Bildung
Mariannengasse 8
1090 Wien
T +43 / 1 / 505 70 44
E contact@prd.at
W http://www.prd.at