Kontextsensitive Visualisierung von Suchergebnissen

Kontextsensitive Visualisierung von Suchergebnissen. Kontextsensitive Visualisierung von Suchergebnissen. Bernard Bekavac & Marc Rittberger .... Betrachter bei der Kantenverfolgung als stÃ¶rend empfunden werden [Henry 91]. Bei monohierarchischen Graphen (Baumstruktur), wie sie in unserem Fall vorliegen, entfallen.

PDF Herunterladen

PNG-Bilder

115KB Größe 2 Downloads 359 Ansichten

Kommentar

Kontextsensitive Visualisierung von Suchergebnissen

Kontextsensitive Visualisierung von Suchergebnissen Bernard Bekavac & Marc Rittberger Informationswissenschaft Universität Konstanz

Zusammenfassung Im Projekt Virtuelle Informationsräume soll das Suchen in elektronischen Marktplätzen verbessert werden. Dabei soll die Informationsquellenauswahl optimiert, die eigentliche Suche unterstützt und die Präsentation der Ergebnisse verbessert werden. Im vorliegenden Beitrag wird ein Verfahren zur Visualisierung von Suchergebnissen vorgestellt, welches die Suchergebnisse eingebettet in die Struktur des elektronischen Marktplatzes zeigt.

Abstract The project ,Virtuell Information Spaces` deals with the problem of distributed, structured information spaces like electronic market places. The project will support information resource selection, the specific search process, and presentation of search results. In this paper we will introduce a specific method for visualizing search results being embedded in the hypertext structure of an electronic market place.

1 Einleitung Die Notwendigkeit effektiver Suchmethoden in Hypertexten wird durch die Attraktivität des Internet-Dienstes World Wide Web von immer mehr Nutzern gesehen. Eine Reihe Suchdienste haben darauf reagiert und bieten ihre Dienste im World Wide Web an [Bekavac 96]. Diese Dienste beruhen meistens auf den klassischen Boole`schen Retrievalverfahren, zum Teil erweitert durch die Verwendung von Trunkierungs- und Näherungsoperatoren oder durch die Suche in unterschiedlichen Feldern von Dokumenten. Einzelne Anbieter haben allerdings fortgeschrittene Verfahren des Information Retrieval eingebunden und bieten damit Erweiterungen bei der Suche an, wie sie schon lange in der wissenschaftlichen Welt gefordert wurden. Es werden dabei Frageeingabe in natürlicher Sprache, Termgewichtung, geordnete Antwortlisten und Unterstützung bei der Frageformulierung eingesetzt [Croft 95]: * Das probabilistische Retrievalsystem INQUERY[1] wird bei unterschiedlichen WWW-Anbietern eingesetzt, unter anderem bei dem bekannten Suchdienst Infoseek[2]. * Der Suchdienst Alta Vista bietet eine Hilfe bei der Suchfrageerweiterung an[3]. Nach einer erfolgreichen Suche kann der Benutzer sich die Beziehungen zwischen den Begriffen der gefundenen Dokumente mit Hilfe des Dienstes ,Visual Live Topics` visualisieren. Bspw. werden nach Eingabe des Begiffs ,Informationswissenschaft` die gefundenen Seiten analysiert. Dabei werden die Begriffe herausgesucht, die in den gefundenen Dokumenten mit einer hohen Häufigkeit identifiziert wurden. Die wichtigsten dieser Begriffe werden als Topics gehandelt und visualisiert. Die Visualisierung kann entweder über eine Tabelle oder über ein Java Applet erfolgen. Bei der Java-Variante wird ein Netz der ähnlichen Begriffe aufgebaut, in welchem der Benutzer navigieren kann und weitere für seine Suche relevante Terme identifizieren kann. * Beim Suchdienst Excite[4] kann der Benutzer die nach Relevanz geordneten Antworten auch nach WWWServern priorisieren. Bei einer Namenssuche konnten 114 Treffer identifiziert werden. 21 dieser 114 Treffer sind nur in zwei WWW-Servern zu finden. Mit diesem Wissen kann ein Benutzer, der mehr zu einer Person erfahren möchte, gezielt auf diese zwei WWW-Server zugreifen, welche die meiste Information zu einer Person versprechen. Die angesprochenen Beispiele für den Einsatz von Information-Retrieval-Techniken im WWW arbeiten mit dem klassischen Ansatz, welcher die Verbesserung der Suche in einer einzigen Informationsquelle zum Ziel hat. Diese Annahme entspricht aber nicht den Gegebenheiten im World Wide Web, da Informationseinheiten explizit miteinander verbunden sind. Im nächsten Abschnitt werden die Probleme bei der Suche in Netzwerken diskutiert.

2 Information Retrieval in Netzwerken file:///D|/WINWORD/Homepage/_HP_neu_ab_nov2003/lok...ue_HP/publikationen/volltexte/mr/Temp/rittbek.html (1 von 10) [14.08.2008 13:56:18]

Kontextsensitive Visualisierung von Suchergebnissen

Die Notwendigkeit eines effektiven und effizienten Retrieval wurde durch das Internet einer breiteren Öffentlichkeit bewußt. Allerdings bleiben aus wissenschaftlicher Sicht trotz der Fortschritte der Suchmaschnine Unzulänglichkeiten erhalten, die zeigen, daß die bisherigen Verfahren den Ansprüchen an eine optimale Suche in Netzwerken mit verteilten, heterogenen Informationsquellen nicht gerecht werden [Fox 93, Lynch 95, Janes & Rosenfeld 96]: * Suchmaschinen erhalten ihre Information dadurch, daß sie den gesamten Suchraum rekursiv abarbeiten. Sie durchlaufen alle verfügbaren World Wide Web Server oder News-Gruppen, um die dort gefundenen Daten zu indexieren. Diese Informationen werden in invertierten Listen abgelegt, in denen der Benutzer sucht. Diese Verfahren verursachen eine hohe Netzbelastung. * Suchverfahren im Internet beachten nicht die Besonderheiten einzelner Informationsquellen und verteilter Informationsräume. Das starke Wachstum im World Wide Web führt zu einer unüberschaubaren Anzahl von Informationen und Informationsquellen, welche sich auch zusätzlich durch Typ und Inhalt unterscheiden. In [Fuhr 96] wird ein theoretisches Modell zur Auswahl von Informationsquellen vorgestellt, welches auf einem probabilistischen Ansatz beruht. Hat man Kenntnisse über die Quellen und über die den Quellen zugeordneten Datensammlungen, werden Annahmen über die Wahrscheinlichkeit vorgenommen, wie relevant eine Informationsquelle bezüglich einer vorgegebenen Fragestellung ist. Eine andere Betrachtung des Problems wird in [Rittberger 94] vorgestellt. Dort wird eine Metadatenbank zu kommerziellen Datenbanken automatisch aus vorhandenen Beschreibungen aufgebaut, in der mithilfe des Konstanzer Hypertext-Systems [Hammwöhner/Rittberger 97] gesucht werden kann. * Die im World Wide Web vorhandene Netzstruktur wird bei der Suche nicht genutzt. Die angewandten Verfahren beruhen auf der Annahme voneinander unabhängiger Informationseinheiten. Weder wird die Information über die Struktur gespeichert, noch wird Strukturinformation genutzt. * Die Antwortmengen in den Suchmaschinen sind auch bei eher speziellen Fragestellungen sehr umfangreich. Die in Abschnitt 1 beschriebenen Lösungsansätze lindern diese Problematik bei einigen Suchdiensten durch Ordnen nach Relevanz oder nach Zugehörigkeit zu einem Server nur in Ansätzen. * Zu den einzelnen Ergebnissen einer Suche sind keine Strukturinformationen erhältlich. Die Ergebnisse werden präsentiert, ohne daß der sie enthaltende Kontext in irgendeiner Weise bei der Präsentation eine Rolle spielt. * Nach Abschluß der Suche in den einzelnen Informationsquellen müssen die unterschiedlichen Ergebnisse dem Benutzer in einem einheitlichen Rahmen präsentiert werden. Als Zielsetzung gilt dabei eine nach Relevanz geordnete Liste der gefundenen Treffer. Für solch eine Entscheidung müssen umfangreiche Analysen durchgeführt werden, da die Bedeutung eines Begriffs in verschiedenen Quellen eine sehr unterschiedliche Gewichtung erfahren kann und somit das Ranking einer Gesamtantwortmenge erheblich beeinflußt. * Die Präsentation und die Visualisierung von Retrievalergebnissen spielt bei heterogenen, verteilten Informationsräumen und den dabei in Hypertextstrukturen eingebundenen Informationseinheiten eine wichtige Rolle, da nur dadurch der Kontext relevanter Antworten auf eine Suchfrage leicht erkennbar wird. Als Beispiel für die Visualisierung von Retrievalergebnissen wird in [Nowell et al. 96] die Visualisierungskomponente des Systems Envision vorgestellt, welches die Suchergebnisse in einer Matrix als Symbole zeigt. [Spoerri 94, Hemmje et al. 94, Olsen et al. 93] beschreiben Systeme (InfoCrystal, LyberWorld, VIBE), mit denen komplexe Anfragen und Antwortmengen visualisiert werden. Diese Ansätze sind vorwiegend dazu geeignet, unabhängige Dokumente zu visualisieren und eventuelle Abhängigkeiten, die bspw. über das Vorhandensein gemeinsamer Suchterme erkennbar sind, anzuzeigen. Explizit vorhandene Strukturen, wie sie in Hypertexten charakteristisch sind, werden nicht berücksichtigt. Neben der eigentlichen Visualisierung von Retrievalergebnissen muß aber auch deren inhaltlicher Kontext gezeigt werden. Er gibt dem Benutzer wichtige Merkmale, so daß er die Relevanz eines Dokumentes besser beurteilen kann. Ein aus der Hypertextforschung bekanntes Mittel der Visualisierung von Kontexten sind Übersichten. Dabei erlaubt der Zugriff mittels eines Übersichtswerkzeuges nach [Hofmann 91], daß 1. die Darstellung der Information verbessert wird, 2. der Zusammenhang der Information (semantischer und temporaler Kontext) hervorgehoben wird, 3. die Filterung der Information zur Reduktion des präsentierten Informationsraumes führt. Hypertextstrukturen zu visualisieren, stellt hohe Anfoderungen an die Software, da die begrenzten file:///D|/WINWORD/Homepage/_HP_neu_ab_nov2003/lok...ue_HP/publikationen/volltexte/mr/Temp/rittbek.html (2 von 10) [14.08.2008 13:56:18]

Kontextsensitive Visualisierung von Suchergebnissen

Darstellungsmöglichkeiten auf Bildschirmen zu vielfältigen Kompromissen zwingen (zu einer Diskussion dieser Einschränkungen siehe etwa [Hofmann 91, Arens & Hammwöhner 95]). Neue Ansätze werden entwickelt [Dieberger 96, Cotoaga et al. 96, Mukherjea & Foley 95, Hasan et al. 96], welche die Strukturinformation bei der Visualisierung berücksichtigen. Im Konstanzer Projekt Virtuelle Informationsräume (VIR[5]) [Kuhlen_et al. 96] wird ein Ansatz bevorzugt, bei dem die Suche in einem regional oder inhaltlich beschränkten, elektronischen Marktplatz durchgeführt wird. Ziel des Projekts ist es, dem Benutzer eines solchen Marktplatzes nicht Treffer von einzelnen WWW-Seiten, sondern die Hypertextstruktur der relevanten Anwendung visualisiert und kontextualisiert anzuzeigen. Zentrale Leistung der im Projekt VIR aufzubauenden Lösung ist nicht, eine oder mehrere isolierte Informationseinheiten nachzuweisen, sondern die Einheiten durch Einbettung in ihren Kontext darzustellen. Dabei werden die Schwerpunkte auf die Auswahl der Informationsquellen, die dezentrale Suche, die Identifikation der Struktur, in der die relevanten Treffer eingebettet sind, sowie die Visualisierung dieser Strukturen gelegt.

3 Strukturdaten Die Strukturdaten, welche die Visualisierungsumgebung benutzt, werden von einem Roboter innerhalb des inhaltlich oder regional beschränkten, elektronischen Marktplatzes zur Verfügung gestellt. Dieser Roboter durchsucht die vorhandenen Informationsquellen systematisch, indem er von einer Startseite ausgehend den Verknüpfungen innerhalb des elektronischen Marktplatzes folgt und auf diese Weise eine Hierarchie der Informationseinheiten des Marktplatzes erstellt. Informationseinheiten, die nicht zum aktuellen Marktplatz gehören, werden von der Strukturerkennung nicht erfaßt. Ein großes Problem besteht in der Identifikation relevanter Einstiegsseiten oder ,Home-Pages`, um die Strukturdaten eines elektronischen Marktplatzes unterteilen zu können. In einem ersten Ansatz werden dabei rein syntaktische und verknüpfungsorientierte Aspekte berücksichtigt, die durch die Designprinzipien vieler Anbieter unterstützt werden. Es werden Rückverknüpfungen zu einzelnen Seiten, der Verweis auf gleiche Bilder und identische Verzeichnisstrukturen in der WWW-Adresse der Seiten zur Identifikation der Hypertextstruktur verwendet. Ein Suchergebnis besteht in unserem Suchverfahren aus Treffern innerhalb mehrerer, in sich semantisch abgeschlossener WWW-Hypertexte. Solche abgeschlossenen Hypertexte sind meist ein Merkmal kontrollierter WWW-Bereiche wie z.B. elektronischer Märkte. Die WWW-Hypertexte unterliegen dabei einer hierarchischen Struktur, beginnend mit der Home-Page. Ein Pfad, ausgehend von der Home-Page zu einer beliebigen Seite innerhalb des WWW-Hypertextes, ist nicht unbedingt eindeutig, jedoch ist eine Kategorisierung der Pfade durch die hierarchische Nähe zur Home-Page möglich. In unserem Fall wird dabei nur der hierarchisch kürzeste Weg von einer Seite zur HomePage für die Strukturbeschreibung benutzt. Aber auch alle anderen möglichen Pfade werden über sogenannte Querverweise beschrieben, haben jedoch keinen Einfluss auf die Hierarchie bzw. Struktur der Hypertexte.

Abbildung 1: Strukturdarstellung eines WWW-Hypertexts Das Kernziel der graphischen Darstellung der Suchergebnisse ist, dem Benutzer eine qualitativ bessere und schnellere Relevanzbeurteilung zu ermöglichen. Entscheidungsrelevante Informationen werden meist aus der Betrachtung der Gesamtheit und der Beziehungen (Strukturen) zwischen den einzelnen WWW-Trefferseiten bzw. deren Kontext erst ersichtlich. Der Einsatz geeigneter, graphischer Darstellungsmittel gilt als eines der besten Verfahren zur Schaffung von räumlichem Kontext [Utting & Yankelovich 89] und wird in unserem Fall zur Treffervisualisierung benutzt.

file:///D|/WINWORD/Homepage/_HP_neu_ab_nov2003/lok...ue_HP/publikationen/volltexte/mr/Temp/rittbek.html (3 von 10) [14.08.2008 13:56:18]

Kontextsensitive Visualisierung von Suchergebnissen

4 Visualisierung von Suchergebnissen Die semantisch abgeschlossenen und hierarchischen WWW-Hypertexte, wie sie bei uns definiert wurden, bilden eine monohierarchische Struktur. Für die Darstellung bzw. Beschreibung solcher Strukturen eignen sich vor allem gerichtete azyklische Graphen. Meist wird solch ein Graph als Baum (Abbildung 1) dargestellt, je nach Größe und Vernetzung eignen sich aber auch andere Darstellungsarten wie z.B. eine kreisförmige Darstellung (Abbildung 2). 4.1 Auswahl darzustellender Knoten und Kanten WWW-Hypertexte bestehen meist aus einer relativ großen und ständig wachsenden Zahl von Seiten und somit auch Verweisen. Das ,,relativ" bezieht sich dabei auf die Möglichkeit, den Hypertext sinnvoll für unsere Zwecke als Graphen abzubilden.

Abbildung 2: Kreisförmige Strukturdarstellung eines WWW-Hypertexts Aus experimentellen Analysen und der Visualisierung einiger Hypertexte, die sich in dem elektronischen Markt ,, Electronic Mall Bodensee" befinden, ist ersichtlich, daß das Abbilden von kompletten Hypertextgraphen für die Ergebnismengenvisualisierung einer Suchanfrage nicht sinnvoll ist. Mit steigender Zahl der Knoten und Kanten wächst der Platzbedarf von Graphen progressiv an und kann somit weder auf einer Ausgabefläche sinnvoll angezeigt, noch vom Benutzer auf einen Blick vollständig aufgenommen werden [Utting & Yankelovich 89]. Außerdem spielen Knoten, die nicht den Trefferdokumenten entsprechen bzw. für deren Kontext keine Bedeutung haben, für die Relevanzbeurteilung keine oder zumindest nur eine untergeordnete Rolle und sind daher eher eine kognitive Überlast. Das Problem ist also, einen für die Visualisierung der Suchergebnisse sinnvollen Graphen aus der Strukturbeschreibung des gesamten zugehörigen Hypertextes herauszufiltern. In einem ersten Ansatz werden deshalb nur die Knoten visualisiert, die den Trefferdokumenten innerhalb eines Hypertextes entsprechen, sowie zugehörige Kontexte. Als Kontext einer Trefferseite und somit eines Knotens definieren wir den Pfad von diesem Knoten aus zur Wurzel, also der Home-Page, und alle anderen mit dem Treffer verlinkten Seiten des Hypertexts und deren Pfade zur Wurzel. Die Abbildungen 3 und 4 veranschaulichen beispielhaft die Filterung eines Graphen für die Visualisierung einer Treffermenge aus der Strukturbeschreibung eines WWW-Hypertextes. Die schwarz markierten Knoten entsprechen den einzelnen Trefferseiten, die fett gezeichneten Knoten und Kanten dem zugehörigen Kontext.

file:///D|/WINWORD/Homepage/_HP_neu_ab_nov2003/lok...ue_HP/publikationen/volltexte/mr/Temp/rittbek.html (4 von 10) [14.08.2008 13:56:18]

Kontextsensitive Visualisierung von Suchergebnissen

Abbildung 3: Kontextualisierung einer Treffermenge

Abbildung 4: Extrahierter Graph für die Visualisierung 4.2 Graphen-Layout Um dem Benutzer eine für die Trefferbeurteilung optimale Wahrnehmung zu ermöglichen, sollte das Layout des Graphen kognitiv einfach erfaßbar sein. Hierzu gibt es einige Aspekte, die beim Layout berücksichtigt werden sollten: * Der Bereich, in dem der Graph gezeichnet wird, sollte minimal zu 15% und maximal zu 40% durch Knoten und Kanten gefüllt sein [Kobsa 94, S.28]. * Kantenüberschneidungen innerhalb des Graphen sind zu vermeiden, da diese vom Betrachter bei der Kantenverfolgung als störend empfunden werden [Henry 91]. Bei monohierarchischen Graphen (Baumstruktur), wie sie in unserem Fall vorliegen, entfallen Kantenüberschneidungen grundsätzlich. Eine Kantenüberschneidung kann bei der Treffervisualisierung dennoch vorkommen, wenn Querverweise der Trefferseiten angezeigt werden. Um die Übersichtlichkeit des Graphen zu wahren, werden Querverweise nur dann angezeigt, wenn der Benutzer einen entsprechenden Knoten mit der Maus fokussiert. Die hierarchische Struktur wird nur von Strukturverweisen gebildet und daher von den Querverweisen nicht beinflußt. Da die Füllung des Ausgabebereichs mit Knoten und Kanten abhängig von der Anzahl der Treffer und ihrer Kontexte dynamisch generiert wird, bedarf es hier weiterer Hilfsmittel für eine optimale Visualisierung. Auf solche wird später noch näher eingegangen. 4.3 Beschriftung von Knoten und Kanten Neben dem Layout des Graphen ist für die schnelle Wahrnehmung der Treffermenge die Bezeichnung der informellen Einheiten und der Beziehungen von großer Bedeutung. Der Prozeß der Wahrnehmung einer graphischen Darstellung erfolgt in zwei Schritten [Bertin 82, S.177]. Zuerst werden die informationellen Einheiten klassifiziert (externe Identifizierung) und anschließend die Beziehungen zwischen den Einheiten erfaßt (interne Identifizierung). Somit wird eine aussagekräftige, jedoch kurze Bezeichnung der graphischen Elemente verlangt. Die Freiheit bei der Bezeichnung ist jedoch durch die dynamische Generierung der Graphen aus den Strukturund Indexinformationen eingeschränkt. Da die Knoten den HTML-Seiten entsprechen und die gerichteten Kanten den zugehörigen Links, wurden als Knotenbezeichnung das TITLE-Element einer HTML-Seite gewählt und

file:///D|/WINWORD/Homepage/_HP_neu_ab_nov2003/lok...ue_HP/publikationen/volltexte/mr/Temp/rittbek.html (5 von 10) [14.08.2008 13:56:18]

Kontextsensitive Visualisierung von Suchergebnissen

als Kantenbeschriftung die zu den Links gehörenden Hotwords. Dabei werden längere Bezeichner auf eine für die graphische Darstellung noch sinnvolle Länge automatisch gekürzt. In einer definierten zusätzlichen Anzeige auf der Benutzerschnittstelle werden jedoch, bei der Fokussierung eines Knotens mit der Maus, die vollständigen Bezeichner und zusätzlich vorhandene Informationen (z.B. Deskriptoren) des entsprechenden Knotens ausgegeben. 4.4 Positionierungsalgorithmus Der Positionierungsalgorithmus zur Darstellung von Graphen in Form von Bäumen berechnet für alle Knoten die x-yPosition auf dem entsprechenden Ausgabebereich. Dabei spielen nicht nur ökonomische Gesichtspunkte wie z.B. die bestmögliche Ausnutzung des Ausgabebereichs eine Rolle. Auch ästhetische Merkmale wie z.B. daß alle Knoten einer Hierarchieebene auf einer Höhe sind oder Knoten über ihre direkte Nachfolger positioniert werden, sind für die Wahrnehmung des Benutzers von Bedeutung. Aus mehreren Algorithmen für die Darstellung von Bäumen [Tilford 81, Walker 90] wurde der Knotenpositionierungsalgorithmus von John Q. Walker für unseren Anwendungszweck ausgewählt und implementiert. Neben den genannten Kriterien spielten auch folgende Aspekte eine wichtige Rolle bei der Auswahl: * Erweiterbarkeit für den Aufbau der Bäume in verschiedene Ausrichtungen * Abstände der Knoten beliebig einstellbar * Erweiterbarkeit für unterschiedliche Knotengrößen * Zwischenräume werden genutzt * Modifizierung zwecks Kreisanordnung 4.5 Hilfsmittel für die optimierte Visualisierung eines Graphen Die Größe der Treffermenge innerhalb eines WWW-Hypertextes hängt natürlich von der jeweiligen Suchanfrage ab. Da der Graph abhängig von dieser Treffermenge dynamisch generiert wird, kann der Umfang und Verlauf des Graphen recht unterschiedlich ausfallen. Dabei kann der generierte Graph so groß werden, daß eine Abbildung des kompletten Graphen auf dem Ausgabebereich nicht möglich ist. Für diese Problematik wurden verschiedene Hilfsmittel entwickelt: * Für den Fall, daß der Umfang des Graphen nur marginal größer als die Ausgabefläche ist, wurden Scrollbars (Rollbalken) implementiert. Diese wurden horizontal und vertikal an den Rändern der Ausgabefläche angebracht und somit kann der Graph per Mausklick nach oben oder unten gescrollt werden. * Ist die Anzahl der Graphenelemente aber derart groß, daß eine nach den oben genannten Layout-Kriterien sinnvolle Abbildung nicht möglich ist und der Betrachter somit den Überblick schnell verlieren würde, so muß der Graph entsprechend verkleinert werden. Hierzu wurde eine Ausblendung und Extraktion von Teilbäumen eingebaut. Bei der Ausblendung von Teilgraphen wird ein Teilbaum bzw. je nach Notwendigkeit auch mehrere Teilbäume weggelassen. Die entsprechende Stelle des ausgeblendeten Teilbaumes wird durch einen besonders gekennzeichneten Knoten dargestellt (Abbildung 5). Dieser

Abbildung 5: Ausblendung eines Teilbaumes

file:///D|/WINWORD/Homepage/_HP_neu_ab_nov2003/lok...ue_HP/publikationen/volltexte/mr/Temp/rittbek.html (6 von 10) [14.08.2008 13:56:18]

Kontextsensitive Visualisierung von Suchergebnissen

Knoten ist direkt manipulierbar und veranlasst bei entsprechender Interaktion die Extraktion des ausgeblendeten Teilbaumes (Abbildung 6). Der oberste Knoten des Teilbaumes entspricht dann der neuen Wurzel. Im extremen Fall müssen beim extrahierten Teilbaum aufgrund seiner Größe wiederum eigene Teilbäume ausgeblendet werden. In diesem Fall navigiert der Anwender also über mehrere Stufen der grafischen Ausgabe. Damit der Benutzer auch im Extremfall der Extraktion die volle Kontrolle über die Ausgabe hat und den Überblick nicht verliert, ist die Benutzerschnittstelle mit einer zusätzlichen ,,Meta-Navigation" für die Extraktion von Teilbäumen ausgestattet. Dabei werden die jeweiligen Stufen der Extraktion in Form von ineinandergeschachtelten Rechtecken abstrahiert. Die jeweiligen Rechtecke sind mit der gleichen Bezeichnung beschriftet wie die entsprechenden Wurzeln der extrahierten Teilbäume. Durch die direkte Manipulierbarkeit dieser Rechtecke kann sich der Benutzer über die verschiedenen Stufen von Teilbäumen bewegen.

Abbildung 6: Extraktion eines Teilbaumes durch direkte Manipulation Abbildung 7 veranschaulicht die direkte Navigation von einem Teilbaum, der durch drei Extraktionsschritte erreicht wurde, zu dem Teilbaum, der nach der ersten Extraktion angezeigt wurde.

Abbildung 7: Navigation innerhalb von Teilbäumen 4.6 Interaktion zwischen Visualisierung und WWW-Browser Graphische Darstellungen bieten, in Verbindung mit Methoden der direkten Manipulation der dargestellten Einheiten, kognitiv unkomplizierte Navigationsmöglichkeiten [Hammwöhner 90, S.34, Simpson 89, S.253]. Auch bei der Treffer-Visualisierung ist eine sinnvolle Navigationsmöglichkeit intuitiv möglich und erlaubt den schnellen Wechsel zwischen Treffern innerhalb einer Treffermenge und deren Kontext. Zu diesem Zweck wurde eine direkte Manipulation eines WWW-Browser-Fensters über die Graphen-Knoten realisiert. Die Interaktion mit einem beliebigen Knoten veranlasst den Browser, die zugehörige WWW-Seite zu laden und in einem neuen Fenster darzustellen. So kann man mit Hilfe des Graphen z.B. direkt zu der Home-Page der Treffermenge springen, ohne mühsam von irgendeiner Trefferseite entlang des Pfades navigieren zu müssen. Der Graph als WWW-Navigationsmittel erlaubt aber auch die direkte Navigation zu den Seiten innerhalb des entsprechenden Hypertexts, die auf eine Trefferseite verzweigen (Kontext). Dies ist sonst, ohne die Visualisierung der Strukturinformationen, nicht ohne weiteres möglich.

5 Realisierung Es gibt prinzipiell zwei Möglichkeiten, die beschriebene Visualisierung der Suchergebnisse für die direkte Anwendung im WWW zu realisieren. Eine Möglichkeit ist die Verwendung eines CGI-Gateways zu einem Programm, das die entsprechende Grafik während der Laufzeit generiert und diese dann dem Benutzer in Form eines sensitiven Bildes auf einer WWW-Seite präsentiert. Dynamische Interaktionen, wie die knotenabhängige Einblendung von Querverweisen bzw. Zusatzinformationen oder die direkte Anwendung der beschriebenen Hilfsmittel auf dem jeweiligen Graphen, sind dabei jedoch nicht möglich. Ein weiterer großer Nachteil ist die Übertragungszeit, da jeder einzelne Graph einer file:///D|/WINWORD/Homepage/_HP_neu_ab_nov2003/lok...ue_HP/publikationen/volltexte/mr/Temp/rittbek.html (7 von 10) [14.08.2008 13:56:18]

Kontextsensitive Visualisierung von Suchergebnissen

Treffermenge zuerst über das Netz angefordert, auf dem Server als Bild generiert und schließlich zum Client übertragen werden muß. Die andere Möglichkeit ist die Realisierung der Treffervisualisierung in Form eines Java-Applets. Die genannten Restriktionen einer CGI-Lösung entfallen dabei, besonders in Hinblick auf die dynamischen Interaktionen. Aber auch die Übertragungszeit verringert sich, denn innerhalb des Applets werden zur Laufzeit höchstens noch Strukturdaten übertragen, da der grafische Aufbau auf dem Client-Rechner generiert wird. Die Vorteile, wie z.B. Plattformunabhängigkeit, bleiben jedoch erhalten. Inzwischen sind auch alle bekannten und verbreiteten WWW-Browser Java-fähig und Applet-Programme somit von jedem Rechner aus anwendbar. Zudem stellt Java mit dem AbstractWindow-Toolkit (Grafische Klassenbibliothek) ein Werkzeug zur komfortablen einheitlichen Grafikausgabe in einem plattformübergreifenden Windowsystem zur Verfügung. Wegen den Vorteilen und der vielversprechenden Java-Technologie wurde die Implementierung der Treffervisualisierung als Java-Applet realisiert. Abbildung 8 zeigt die Visualisierung einer Treffermenge und im Hintergrund eine Graphnavigierte Trefferseite, wie sie sich mithilfe des entwickelten Java-Applets darstellt. Im unteren Teil des im Vordergrund stehenden Browsers wird die Linkhierarchie der Anwendung gezeigt. Im rechten, oberen Fenster erscheint die in Abbildung 7 beschriebene Visualisierung der Extraktionskomponente. ,

file:///D|/WINWORD/Homepage/_HP_neu_ab_nov2003/lok...ue_HP/publikationen/volltexte/mr/Temp/rittbek.html (8 von 10) [14.08.2008 13:56:18]

Kontextsensitive Visualisierung von Suchergebnissen

Abbildung 8: Visualisierung einer Treffermenge und einer Graph-navigierten Trefferseite

Literatur [Arens & Hammwöhner 95] S. Arens, R. Hammwöhner: ,,Ein graphischer Browser für das Konstanzer HypertextSystem" Hypertext-Information Retrieval-Multimedia. Synergieeffekte elektronischer Informationssysteme. Proceedings HIM'95, Universitätsverlag Konstanz, 1995, S. 175-189 [Bekavac 96] B. Bekavac: ,,Suchverfahren und Suchdienste des WWW" NfD - Nachrichten für Dokumentation, 1996, Bd. 47, Nr. 4, S. 195-213 [Bertin 82] J. Bertin: ,,Graphische Darstellungen". De Gruyter - Berlin - New York, 1982 [Cotoaga et al. 96] K. Cotoaga, W. König, S. Markwitz, T. Rebel: ,,Web-Benchmarking: Graphbasierte Wissenserschließung im Internet und Intranets" Arbeitspapier 96-02, Universität Frankfurt, Institut für Wirtschaftsinformatik [Croft 95] W.B. Croft: ,,What do people want from information retrieval?" D-Lib Magazine, November, 1995. [Dieberger 96] A. Dieberger: ,,Browsing the WWW by interacting with a textual virtual environment - A framework for experimenting with navigational metaphors" Proceedings Hypertext`96 . The seventh ACM Conference on Hypertext, 1996, S. 170-179 [Fox 93] E. Fox: ,,From information retrieval to networked multimedia information access" Information Retrieval'93. Von der Anwendung zur Modellierung. Proceedings, Universitätsverlag Konstanz, 1993, S. 116-124 [Fuhr 96] N. Fuhr: ,,Optimum Database Selection in Networked IR" Proceedings of the SIGIR`96 Workshop on Networked Information Retrieval, 1996 [Hammwöhner 90] R. Hammwöhner: ,,Automatischer Aufbau von Hypertext-Basen aus expositorischen Texten". Dissertation, Sozialwissenschaftliche Fakultät der Universität Konstanz, 1990 [Hammwöhner & Rittberger 97] R. Hammwöhner, M. Rittberger:,,Building application dependent hypertexts" Information Processing & Management, Bd. 33, Nr.2, 1997, S. 243-254 [Hasan et al. 96] M.Z. Hasan, A.O. Mendelzon, D. Vista: ,,Applying Database Visualization on the World Wide Web" SIGMOD Record, 1996, Bd. 25, Nr. 4, S. 45-49 [Hemmje et al. 94] M. Hemmje, C. Kunkel, A. Willett: ,,LyberWorld - A Visualization User Interface Supporting Fulltext Retrieval" SIGIR'94. Proceedings of the 17th Annual International ACM SIGIR Conference on Research and Development in Information Retrieval, 1994, S. 249-259 [Henry 91] T. R. Henry, S. E. Hudson: ,,Interactive Graph Layout". ACM Symposium on User Interface Software and Technology, ACM press, 1991, S. 55-64 [Hofmann 91] M. Hofmann: Benutzerunterstützung in Hypertextsystemen durch private Kontexte, Dissertation, Naturwissenschaftliche Fakultät der Universität Carolo-Wilhelmina zu Braunschweig, 1991 [Janes & Rosenfeld 96] J.W. Janes, L.B. Rosenfeld: ,,Networked information retrieval and organization: issues and questions" Journal of the American Society for Information Science, Bd. 49, Nr. 9, 1996, S. 711-715 [Kobsa 94] A. Kobsa: ,,Entwurf von Benutzerschnittstellen". Kursunterlagen SS94, Informationswissenschaft, Universität Konstanz, 1994

file:///D|/WINWORD/Homepage/_HP_neu_ab_nov2003/lok...ue_HP/publikationen/volltexte/mr/Temp/rittbek.html (9 von 10) [14.08.2008 13:56:18]

Kontextsensitive Visualisierung von Suchergebnissen

[Kuhlen et al. 96] R. Kuhlen, M. Rittberger, B. Bekavac: ,,Complex Operations in a Distributed, Network-Like Information Space. Resource Selection, Searching, Structuring and Visualization in an Electronic Market Place" Proceedings of the SIGIR`96 Workshop on Networked Information Retrieval, 1996, [Lynch 95] C.A. Lynch: ,,Networked information resource discovery: an overview of current issues" IEEE Journal on Selected Areas in Communications, Bd. 13, Nr. 8, 1995, S. 1505-1522 [Mukherjea & Foley 95] S. Mukherjea, J.D. Foley: ,,Visualizing the World-Wide Web with the Navigational View Builder" Computer Networks and ISDN Systems, Bd. 27, Nr. 6, 1995, S. 1075-1084 [Nowell et al. 96] L.T. Nowell, R.K. France, D. Hix, L.S. Heath, E.A. Fox: ,,Visualizing search results: Some alternatives to query-document similarity" SIGIR'96. Proceedings of the 19th Annual International ACM SIGIR Conference on Research and Development in Information Retrieval, 1996, S. 67-75 [Olsen et al. 93] K.A. Olsen, R.R. Korfhage, K.M. Sochats, J.G. Williams: ,,Visualization of a document collection: the VIBE system" Information Processing & Management, Bd. 29, Nr. 1, 1993, S. 69-81 [Rittberger 94] M. Rittberger: ,,Selektion von Online-Datenbanken in einem offenen Hypertextsystem" Mehrwert von Information - Professionalisierung der Informationsarbeit. Proceedings des 4. Internationalen Symposiums für Informationswissenschaft (ISI '94), 1994, S. 227-237 [Simpson 89] A. Simpson: ,,Navigation in Hypertext: design issues". Online Information 89 Proceedings, S. 241-255, Learned Information, 1989 [Spoerri 94] A. Spoerri: ,,InfoCrystal. Integrating Exact and Partial Matching Approaches through Visualization" RIAO'94 Conference Proceedings. Intelligent Multimedia Information Retrieval Systems and Management, 1994, S. 687-696 [Tilford 81] J. S. Tilford: ,,Tree drawing algorithms" M.S. Thesis. Department of Computer Science, University of Illinois, Urbana, IL, Report UIUCDCS-R-81-1055, April 1981 [Walker 90] J. Q. Walker: ,,A Node-positioning Algorithm for General Trees". IBM Corporation, USA. Software-Practice and Experience Bd. 20, Nr. 7, 1990, S. 685-705 [Utting & Yankelovich 89] K. Utting, N. Yankelovich: ,,Context Orientation in Hypermedia Networks". ACM Transactions on Information Systems, Bdl. 7, Nr. 1, Januar 1989, S. 58-84 [1.] ciir.cs.umass.edu/inquerypage.html [2.] www.infoseek.com [3.] www.altavista.digital.com [4.] www.excite.com [5. ] www.inf-wiss.uni-konstanz.de/FG/IV/VIR/index.html

file:///D|/WINWORD/Homepage/_HP_neu_ab_nov2003/lok...ue_HP/publikationen/volltexte/mr/Temp/rittbek.html (10 von 10) [14.08.2008 13:56:18]