Lexicographische Daten

Wikidatas Potenzial für die Digitalisierung afrikanischer Sprachen

Mohammed Sadat Abdulai

Elisabeth Giesemann

7. Oktober 2021

Wikidata ist zugleich Werkzeug und Plattform, um die Welt der verknüpften Daten für alle Menschen zu öffnen. Außerdem bietet Wikidata eine einzigartige Möglichkeit, auch die Repräsentation von kleineren Sprach-Communitys im Internet zu stärken. Das Community Communication Team von Wikimedia Deutschland hat zuletzt Interviews und Recherchen durchgeführt, um ein Bewusstsein für die Vorteile von Wikidatas Lexemen zu schaffen.

Sprache und Technologie in Afrika

Sprache spielt eine zentrale Rolle bei der Speicherung und dem Austausch von Informationen, sei es in sozialen Medien, Wikis, oder bei der Verwendung von Sprachassistenten. Allerdings sind afrikanische Sprachen nicht in dem Maße im Internet vertreten, wie sie in der realen Welt gesprochen werden. Derzeit unterstützt keiner der Sprachassistenten der großen Techkonzerne eine afrikanische Sprache. Außerdem befindet sich der Großteil der Sprachdaten, die derzeit zur Speicherung von Informationen, zur Entwicklung von Algorithmen und zur Dokumentation der Vielfalt der Kulturen verwendet werden, im Besitz von wenigen westlichen Unternehmen. Dies verschärft die digitale Kluft zwischen englischsprachigen Inhalten und dem Rest der Welt.

Wikidata stärkt sprachliche Vielfalt

Wikidata kann dazu beitragen, die sprachliche Vielfalt und den Wissensaustausch auf dem afrikanischen Kontinent zu stärken. Ein wichtiger strategischer Aspekt von Wikidata besteht darin, die Beteiligung von Communitys im globalen Süden zu erhöhen. Deshalb arbeitete das Team Community Communication mit Wikimedia-Mitgliedsorganisationen in Afrika zusammen, um ihre Beteiligung an der Arbeit mit Lexemen zu stärken.

Was sind Lexeme?

Mehrsprachigkeit ist das Herzstück von Wikidata. Seit 2018 speichert Wikidata auch eine neue Art von Daten: Begriffe, die in vielen Sprachen vorkommen. Diese Wörter bzw. Informationen bezeichnet man als lexikografische Daten, und Lexeme sind die konkreten Datenpunkte in diesen lexikografischen Daten. Mit all den Sprachkombinationen, die es in Wikimedia-Projekten gibt, eröffnen sich völlig neue Möglichkeiten: Die Übersetzung von einer Sprache in eine andere wird möglich, auch wenn es für diese Sprachen kein gedrucktes Wörterbuch gibt. Dieses Wörterbuch kann mit den strukturierten Daten über Sprachen erstellt werden. Du kannst mehr über das Datenmodell auf der Dokumentationsseite erfahren und mehr über lexikographische Daten in diesem Blogbeitrag lesen.

Workshops mit sechs afrikanischen Communitys

Um mehr über die Bedürfnisse der Communitys zu erfahren, hat Wikimedia Deutschland Workshops mit sechs Communitys durchgeführt. Wir danken diesen Communitys für ihre Teilnahme und ihre wertvollen Beiträge: Wikimedians of Tamazight User Group, Hausa Wikimedians User Group, Dagbani Wikimedians User Group, Igbo Wikimedians User Group, Yoruba Wikimedians User Group, Jenga Wikipedia ya Kiswahili

Wir freuen uns, dass wir dabei unterstützen können, Lexeme für ihre spezifischen Bedürfnisse zu nutzen und bereits die ersten substanziellen Ergebnisse zu sehen.

Afrikanische Sprachen in Abstract Wikipedia

Abstract Wikipedia hat das Ziel, mithilfe von strukturierten Daten aus Wikidata eine vielsprachige, maschinell betriebene Wissensplattform zu erstellen. Das Projekt der Wikimedia Foundation wird so “kleine” Sprachen verbinden und unterstützen können. Das Arbeiten mit Lexemen spielt hier eine zentrale Rolle. Wir freuen uns, dass alle drei afrikanischen Communitys, die sich beworben haben (Hausa, Dagbani und Igbo), als Ausgangssprachen für die Entwicklung von Abstract Wikipedia ausgewählt wurden.

Wikidata dezentralisieren auf der WikidataCon

Die Infrastruktur, der Inhalt und die Community von Wikidata können auch genutzt werden, um ein besseres Verständnis und eine umfassendere Darstellung der Vielfalt des menschlichen Wissens zu erreichen. Reimagining Wikidata from the margins ist ein weiteres Projekt, das darauf hinarbeitet, das Wissen von Wikidata zu dezentralisieren. Das Projekt wird auch auf der WikidataCon 2021 im Herbst dieses Jahres vorgestellt, wo die Wikidata-Community und ihre Partner*innen die Möglichkeiten für eine nachhaltige Entwicklung der Plattform diskutieren werden.

#Community #Wikidata

Lexicographische Daten

Wikidatas Potenzial für die Digitalisierung afrikanischer Sprachen

Verwandte Artikel

Wikibase: Die Software für Open-Data-Projekte

Schreibe einen Kommentar Antwort abbrechen

DSGVO Hinweis