Allgemein

Uniprojekt: Mit Datenvisualierung die Genderbias in der Wikipedia erforschen

4. Mai 2022
WMDE allgemein
Allgemein

Frauen sind in der Wikipedia unterrepräsentiert. Sowohl in den Artikeln und Biographien, als auch bei der Community der Editierenden gibt es eine nicht zu leugnende Dysbalance zwischen Männern und Frauen*. Projekte wie Women in Red oder WomenEdit versuchen dem seit längerer Zeit entgegen zu wirken. Nun wollen Student*innen der Humboldt Universität zu Berlin mit Datenvisualisierungen über das Gendergap in der Wikipedia aufklären. 

Wer seid ihr und wie seid ihr zu dem Projekt gekommen?

Frieda Pauline Reitzer: Ich bin Organisationswissenschaftlerin und interessiere mich für Technofeminismus und Digital Humanities, der Schnittstelle von Sozialwissenschaften und Computer Science. In einem interdisziplinären Seminar zu Datenvisualisierung habe ich Wenzel, Jan und Tobias kennengelernt. 

Wenzel Sterzik: Ich studiere Informationsmanagement an der Humboldt Universität und beschäftige mich damit, wie man Informationen und Daten gut zugänglich machen kann. 

Tobias Schmidt: Ich arbeite in der empirischen Sozialforschung und wollte mehr über Datenvisualisierung erfahren. Pauline hat mich für das Thema Frauen in der Wikipedia begeistert. Außerdem ist Jan Papmeier, der einen Master in Statistik macht, Teil des Teams. 

Bitte beschreibt doch das Projekt in eigenen Worten: 

Pauline: Die Idee des Projekts basiert auf der Frage, woher unser Wissen kommt. Diese Frage sollte sich jede*r , der/die die Wikipedia als Informationsquelle nutzt stellen. Wenn man als User*in auf unsere Projektwebseite geht, und sich auf das Thema der Genderbias in der Wikipedia einlässt, kann man sich dieser Frage über interaktive Grafiken und Infomaterial stellen. Inhaltlich gliedert sich unsere Arbeit in drei Schritte.

Der erste Schritt ist das Erkennen der inhaltlichen Bias in der Wikipedia, also die Frage nach der Biograhieverteilung. Das kann man im ersten Graphen interaktiv herausfinden. 

Der zweite Teil fokussiert sich darauf, warum es eine solche Bias gibt. Liegt es an den Leuten, die die Wikipedia schreiben? Wie setzt sich die Community der Wikipedianer*innen in Bezug auf ihr Geschlecht zusammen? Daher ist die zweite Visualisierung ein Netzwerkgraph, der beschreibt, welchem Geschlecht sich die Communitymitglieder zuordnen und wie die Beziehungen innerhalb dieses Netzwerks sind.  

Im dritten Schritt wird gefragt, wie diese beiden Bereiche miteinander zusammenhängen. Also wie die Genderungleichheit in der Community und die Genderbias der Wikipedia Inhalte miteinander in Beziehung stehen. Daraus lassen sich persönliche, gesellschaftliche, aber auch technische Handlungsanweisungen ableiten. 

Wenzel: Am Anfang wussten wir nicht genau, wie wir an die Daten kommen sollten, dann wurde aber relativ schnell klar, dass wir uns bei Wikipedia alles zur Verfügung steht und wir haben uns Schritt für Schritt dem Problem der mangelnden Repräsentanz von Frauen in der Wikipedia mit den Datenvisualisierungen genähert. 

Wie seid ihr an die Daten gekommen? 

Wenzel: Für die ersten beiden Graphen haben wir die Daten mit dem Quarry tool abgerufen, mit dem man recht leicht SQL-Abfragen stellen kann. Wir haben erste Quarries geschrieben um herauszufinden, wieviel Biographien und Bearbeitende es in den jeweiligen Genderkategorien gibt. Wir sind zu dem Schluss gekommen, dass eine sogenannte Baumstruktur für die Visualisierung am meisten Sinn ergibt. Dafür haben wir pro Kategorie eine prozentuale Darstellung und eine Hierarchie dieser Kategorien erstellt, die sich in diesem Baum verbinden lassen.

Für den Netzwerkgraphen haben wir das Wikipedia Projekt persönliche Bekanntschaften verwendet. Wikipedianer*innen geben hier an, dass sie sich kennen und versichern so, dass sie echte Personen sind. Diese Daten haben wir genutzt, um den Graphen zu bauen. 

Pauline: Der Netzwerkgraph stellt erstmal nur eine Annäherung an das Problem dar, da die Geschlechtsangaben in unseren Daten höchstwahrscheinlich von der Realität etwas abweichen. Viele weibliche Autor*innen machen keine oder eine falsche Geschlechtsangabe, um sich vor Übergriffen zu schützen.

Was ist der Vorteil der Datenvisualisierung?

Tobias: Der Kurs hatte einen technischen Fokus und das wollte ich persönlich als Fähigkeit lernen. Gleichzeitig ist es natürlich so, dass so komplexe Themen wie die Geschlechterverteilung in der Wikipedia durch Visualisierung viel stärker erfahrbar wird. Durch Interaktion kann man erleben, dass Wikipedia nicht ausgeglichen ist. 

Wenzel: Mit dem Projekt wollten wir zeigen, dass Wikipedia eben nicht scheinbar objektives Wissen abbildet. Vielmehr reproduziert es bestehende Strukturen. Der Netzwerkgraph macht sichtbar, dass die historische Ungleichheit durch hierarchische Strukturen verstärkt wird. 

Nun ist Wikipedia trotz der berechtigten Kritik eine von wenigen nicht-kommerziellen Webseiten. Die Art und Weise, wie Wikipedianer*innen zu Konsens kommen, ist einzigartig. Was ist euer Vorschlag, die Diskussionen und Representation ausgeglichener zu gestalten? 

Pauline: Ich denke es ist wichtig einzusehen, dass es in der Wikipedia mittlerweile klare Machtstrukturen gibt. Diese Machtstrukturen haben sich über die letzten 20 Jahre von der basisdemokratischen Grundstruktur der Wikipedia entkoppelt. Es geht nicht darum die Grundidee der Selbstorganisation anzugreifen – die ist absolut bemerkenswert – , sondern eine Struktur zu schaffen in der jede*r sich möglichst frei und gleichberechtigt beteiligen kann. 

Hebel gibt es dafür genug; die Kommunikationskultur, die Rolle der Moderator*innen, das Anonymitätsprinzip, die Benutzeroberfläche, das generische Maskulinum, die Organisation von Hierarchien und Wahlen, Transparenz von informalen Strukturen und Netzwerken, die Relevanzkriterien. Das alles kann auch für demokratischen Umbau der Wikipedia genutzt werden. 

Bei anderen Plattformen ist das natürlich auch Thema. Aber bei einer Community Plattform wie Wikipedia ist die besondere Herausforderung, dass jetzt genau die Menschen, die die Website tragen und die Struktur mit aufgebaut haben, die dadurch gewonnene Macht abgeben und umbauen müssen. Das sollte aber schnell passieren, sonst sehe ich weder eine Nachfolge-Generation, die die Wikipedia weiter trägt, noch dass die Wikipedia mit dem immer komplexer und pluraler werdenden Wissensstand unserer Gesellschaft Schritt halten wird.

In euren Worten: Warum ist Repräsentation wichtig?

Wenzel: Ich denke es gibt viele unbewusste Annahmen über Geschlecht, die sich da formen und dann unseren Blick auf die Gesellschaft prägen. Daher sind die Biographien in Wikipedia wichtig um zu zeigen, dass es mehr interessante Frauenbiographien gibt und gab.

Pauline ): Repräsentation ist hierbei vielleicht auch das falsche Wort. Es ist sowieso unmöglich alle zu repräsentieren und das sollte am besten auch keine Plattform versuchen, weil das eh schief gehen würde. Vielmehr geht es darum transparent zu machen, dass das präsentierte Wissen aus einer bestimmten Perspektive verfasst ist und andere Perspektiven erlauben und wenn möglich fördern. r.

In der Wikipedia gibt es auch einen starken Fokus auf westliche Kulturformen und Persönlichkeiten. Warum konzentriert sich euer Projekt nur auf Frauen in der Wikipedia?

Pauline: Wir haben uns auch andere Themen angesehen, aber die Datenlage bei Frauen war um einiges besser, das ist in der Wikipedia einfach besser dokumentiert. Hier können wir konkrete Aussagen machen, auch wenn andere Themen natürlich auch sehr wichtig sind. 

Wie war es, Wikipedia für ein Uniprojekt zu verwenden? Was empfehlt ihr anderen, die ähnliches vorhaben?

Tobias: Zuerst einmal war es cool, weil Wikipedia nicht nur Akademiker*innen betrifft und alle Wikipedia verwenden. Darin liegt Macht, und sich damit auseinander zu setzen, ist immer interessant. 

Wenzel: Es ist außerdem sehr einfach, schnell an die Daten zu kommen, da bei Wikipedia ja alles offen ist. Hätten wir eine kommerzielle Plattform untersucht, wäre das viel schwieriger gewesen. 

Pauline: Ich würde auf jeden Fall empfehlen, mit der Community in Kontakt zu treten. Das haben wir vor allem am Anfang des Projekts gemacht und viel gelernt und wollen wir jetzt mit den Ergebnissen wieder stärker tun. 

Was sind nächste Schritte für das Projekt? 

Pauline: Ich persönlich will mich verstärkt auf die Verknüpfung von qualitativer und quantitativer Analyse konzentrieren. Also die Analyse der Daten noch stärker mit der Genderbias verknüpfen. 
Wenzel: Wir werden die Ergebnisse, die wir erarbeitet haben, erstmal zurückgeben um zu sehen, was aus den Projekten noch wachsen kann. Von den Daten her, gibt es noch tausend Möglichkeiten. Aber dabei ist es vor Allem auch wichtig, die richtigen Fragestellungen zu erarbeiten. Gemeinsam mit den anderen Projekten aus dem Seminar werden wir unsere Ergebnisse auf einer Website veröffentlichen. Auch unser Quellcode ist frei zugänglich. Unser Projekt kann so als Inspiration für andere Projekte herhalten und mehr Menschen motivieren in den gesellschaftlichen Diskurs zu der Wikipedia einzusteigen.

Noch keine Kommentare

Hinterlasse einen Kommentar