Mehrsprachige Suche in Social Tagging-Systemen - Semantic Scholar

01.04.2009 - Thomas Mandl , Teresa Märtl, Christa Womser-Hacker. Informationswissenschaft. Universität Hildesheim [email protected]. ISI 2009.
211KB Größe 5 Downloads 363 Ansichten
ISI 2009 Konstanz 1. April 2009

Überblick

Thomas Mandl , Teresa Märtl, Christa Womser-Hacker Informationswissenschaft Universität Hildesheim [email protected]

• Einleitung • Flickr • Fragestellung: Mehrsprachigkeit in sozialen Netzwerken • Vorgehen für Experiment • Ergebnisse • Weitere Aspekte der Internationalität

Mehrsprachige Suche in Social Tagging-Systemen Eine Untersuchung am Beispiel von Flickr

Thomas Mandl

Folie 1 von 20

Thomas Mandl

Folie 2 von 20

Sprachverteilung im Internet

Einleitung

• Social Tagging-Systeme: Nutzer versehen Ressourcen mit frei gewählten Schlagworten – Tags • Ressourcen für sich organisieren und zugleich mit anderen teilen • Delicious, Bibsonomy, Flickr, YouTube, MyBib ... http://www.internetworldstats.com Thomas Mandl

Folie 3 von 20

Thomas Mandl

Wie multilingual ist das Web?

Einleitung • Internationale Nutzerbasis vieler Web 2.0 Systeme • Ressourcen werden in unterschiedlichen Sprachen getaggt Sprachendschungel, Ressourcen nicht universell zugänglich und auffindbar • Welche Suchstrategien verwenden Benutzer angesichts der Mehrsprachigkeit? • Sind sie sich dieser bewusst? • Suchen sie mehrsprachig?

Dokumente in zahlreichen Sprachen aber ... – gibt es Links zwischen Dokumenten verschiedener Sprache? – werden diese benutzt? (Thelwall 2005) – gibt Dokumente mit mehreren Sprachen? – was sind die Gründe für Mehrsprachigkeit? (Artemenko et al. 2007)

Mehrsprachiges Retrieval (Mandl @ CLEF 2002-2009) • Web Usage Mining und Sprachidentifikation • Rolle der geographischen Herkunft und der Kompetenz (Kralisch & Mandl 2006) Thomas Mandl

Folie 4 von 20

Folie 5 von 20

Thomas Mandl

Folie 6 von 20

Flickr

Fragestellung

• Soziales Netzwerk zum Austausch von Fotos und Videos • Organisation der Bilder durch Tags • Zahlreiche Möglichkeiten zum Browsen • Bilder werden vor allem dadurch und über das soziale Netzwerk gefunden

Thomas Mandl

Folie 7 von 20

• Mehrsprachigkeit auf Flickr und Folgen für Suche nach Bildern: • Stört es die Nutzer, dass nicht alle Bilder über eine Sprache verfügbar sind? • Führen sie ihre Suche in mehreren Sprachen durch? • Welche Faktoren beeinflussen die Sprachwahl?

Thomas Mandl

Vorgehen

Vorgehen

• Untersuchung angelehnt an iCLEF (interactive CLEF-Track) • Untersuchung von sprachübergreifendem Retrieval aus Nutzerperspektive • Erstmals 2006, 2008 mit eigens erstelltem Interface Flickling • Kritik: Flickr wird als reine Suchmaschine betrachtet, ist jedoch v.a. soziales Netzwerk Thomas Mandl

Folie 8 von 20

Folie 9 von 20

• Benutzertest mit 21 Teilnehmern: • 2 Aufgaben Taggen: Taggen eines Bildes + Bewerten vorhandener Tags • 3 Aufgaben Suchen: Vorgegebenes Bild suchen, Illustrieren verschiedener Schlagzeilen + freie Suche zu bestimmtem Thema

Thomas Mandl

Beispielaufgabe

Folie 10 von 20

Ergebnisse 1/3 • Bewusster Umgang mit Mehrsprachigkeit • Englisch wird als wichtigste Sprache gesehen • Trotzdem werden Bilder auch in anderen Sprachen gesucht • Annahmen über Inhalte • Problem mangelnde aktive Kompetenz

Source: Flickr

• Verständnis, dass Bilder nicht in allen Sprachen verfügbar Thomas Mandl

Folie 11 von 20

Thomas Mandl

Folie 12 von 20

Ergebnisse 1/3

Ergebnisse 2/3

Suchsprache

Anzahl

Suchsprache

Anzahl

Nur Deutsch

13

Nur Englisch

13

Deutsch + Englisch

8

Deutsch + Englisch

8

Tabelle 1: Suchsprachen deutsche Schlagzeile

Suchsprache

Tabelle 2: Suchsprachen englische Schlagzeile

Anzahl

Suchsprache

Anzahl

Nur Französisch

7

Nur Spanisch

1

Französisch + Englisch

2

Nur Englisch

5

Französisch + Deutsch

1

Spanisch + Englisch

2

Deutsch + Englisch

1

Spanisch + Deutsch + Englisch

1

Deutsch + Englisch

1

Tabelle 3: Suchsprachen französische Schlagzeile

Tabelle 4: Suchsprachen spanische Schlagzeile

Thomas Mandl

Folie 13 von 20

• Vor allem Englisch bei Suche verwendet • Je nach Thema auch andere Sprachen • Teilnehmer würden auch in unbekannten Sprachen suchen  visuelles Feedback • Suchverhalten: Versuch, Suchergebnisse über längere Suchanfragen zu spezifizieren  gegenteiliger Effekt Thomas Mandl

Folie 14 von 20

Ergebnisse 3/3

Fazit

• Qualität der Suchergebnisse abhängig von Sprache, Suchbegriffe und Länge der Anfrage  beste Ergebnisse durch einsprachige, allgemeine und kurze Anfragen

• Teilnehmer sind sich der Problematik der Mehrsprachigkeit bewusst • Sinnhaftigkeit von integrierten Übersetzungsmöglichkeiten in weiteren Studien untersuchen  vielfältige Wege zum Browsen und Finden von Bildern auf Flickr erhalten • Integration von Übersetzungstools

• Spezifikation der Ergebnisse am besten durch Browsen in Tags, Cluster, Gruppen etc.

Thomas Mandl

Folie 15 von 20

Weitere Aspekte der Internationalität • Applikationen im Social Web – Soziale Netze für weltweite Nutzung – Einfluss der lokalen Kultur auf Nutzung sehr stark • Empirische Studie – Soziales Kapital als Hauptgrund für die Nutzung von Netzwerken – Interpretation und Konstruktion von sozialem Kapitel international sehr unterschiedlich (Mandl & Womser-Hacker @ ACM CHI WS 2008)

-> Quelle für erhebliche interkulturelle Mißverständnisse Thomas Mandl

Folie 17 von 20

Thomas Mandl

Folie 16 von 20