edoc-Server der Humboldt-Universität zu Berlin

Dissertation

Autor(en): Philipp Mayr
Titel: Re-Ranking auf Basis von Bradfordizing für die verteilte Suche in digitalen Bibliotheken
Gutachter: Walther Umstätter; Jürgen Krause
Erscheinungsdatum: 06.03.2009
Volltext: pdf (urn:nbn:de:kobv:11-10097590)
Fachgebiet(e): Bibliotheks- und Informationswissenschaft
Schlagwörter (ger): Evaluation, Bradfordizing, Crosskonkordanzen, heterogen erschlossene Fachdatenbanken, Information Retrieval, Re-Ranking, Kernzeitschriften, Relevanz, digitale Bibliotheken, bibliographischen Datenbanken, Zeitschriftenartikel, Monographien
Schlagwörter (eng): evaluation, Bradfordizing, cross-concordances, heterogeneous indexed databases, Information Retrieval, re-ranking, core journals, relevance, digital libraries, bibliographic databases, journal articles, monographs
Einrichtung: Humboldt-Universität zu Berlin, Philosophische Fakultät I
Zitationshinweis: Mayr, Philipp: Re-Ranking auf Basis von Bradfordizing für die verteilte Suche in digitalen Bibliotheken; Dissertation, Humboldt-Universität zu Berlin, Philosophische Fakultät I , publiziert am 06.03.2009, urn:nbn:de:kobv:11-10097590
Metadatenexport: Um den gesamten Metadatensatz im Endnote- oder Bibtex-Format zu speichern, klicken Sie bitte auf den entsprechenden Link. Endnote   Bibtex  
print on demand: Wenn Sie auf dieses Icon klicken, können Sie ein Druckexemplar dieser Publikation bestellen.
Diese Seite taggen: Diese Icons führen auf so genannte Social-Bookmark-Systeme, auf denen Sie Lesezeichen anlegen, persönliche Tags vergeben und Lesezeichen anderer Nutzer ansehen können.
  • connotea
  • del.icio.us
  • Furl
  • RawSugar

Abstract (ger):
Trotz großer Dokumentmengen für datenbankübergreifende Literaturrecherchen erwarten akademische Nutzer einen möglichst hohen Anteil an relevanten und qualitativen Dokumenten in den Trefferergebnissen. Insbesondere die Reihenfolge und Struktur der gelisteten Ergebnisse (Ranking) spielt, neben dem direkten Volltextzugriff auf die Dokumente, inzwischen eine entscheidende Rolle beim Design von Suchsystemen. Nutzer erwarten weiterhin flexible Informationssysteme, die es unter anderem zulassen, Einfluss auf das Ranking der Dokumente zu nehmen bzw. alternative Rankingverfahren zu verwenden. In dieser Arbeit werden zwei Mehrwertverfahren für Suchsysteme vorgestellt, die die typischen Probleme bei der Recherche nach wissenschaftlicher Literatur behandeln und damit die Recherchesituation messbar verbessern können. Die beiden Mehrwertdienste semantische Heterogenitätsbehandlung am Beispiel Crosskonkordanzen und Re-Ranking auf Basis von Bradfordizing, die in unterschiedlichen Phasen der Suche zum Einsatz kommen, werden hier ausführlich beschrieben und im empirischen Teil der Arbeit bzgl. der Effektivität für typische fachbezogene Recherchen evaluiert. Vorrangiges Ziel der Promotion ist es, zu untersuchen, ob das hier vorgestellte alternative Re-Rankingverfahren Bradfordizing im Anwendungsbereich bibliographischer Datenbanken zum einen operabel ist und zum anderen voraussichtlich gewinnbringend in Informationssystemen eingesetzt und dem Nutzer angeboten werden kann. Für die Tests wurden Fragestellungen und Daten aus zwei Evaluationsprojekten (CLEF und KoMoHe) verwendet. Die intellektuell bewerteten Dokumente stammen aus insgesamt sieben wissenschaftlichen Fachdatenbanken der Fächer Sozialwissenschaften, Politikwissenschaft, Wirtschaftswissenschaften, Psychologie und Medizin. Die Evaluation der Crosskonkordanzen (insgesamt 82 Fragestellungen) zeigt, dass sich die Retrievalergebnisse signifikant für alle Crosskonkordanzen verbessern; es zeigt sich zudem, dass interdisziplinäre Crosskonkordanzen den stärksten (positiven) Effekt auf die Suchergebnisse haben. Die Evaluation des Re-Ranking nach Bradfordizing (insgesamt 164 Fragestellungen) zeigt, dass die Dokumente der Kernzone (Kernzeitschriften) für die meisten Testreihen eine signifikant höhere Precision als Dokumente der Zone 2 und Zone 3 (Peripheriezeitschriften) ergeben. Sowohl für Zeitschriften als auch für Monographien kann dieser Relevanzvorteil nach Bradfordizing auf einer sehr breiten Basis von Themen und Fragestellungen an zwei unabhängigen Dokumentkorpora empirisch nachgewiesen werden.
Abstract (eng):
In spite of huge document sets for cross-database literature searches, academic users expect a high ratio of relevant and qualitative documents in result sets. It is particularly the order and structure of the listed results (ranking) that play an important role when designing search systems alongside the direct full text access for documents. Users also expect flexible information systems which allow influencing the ranking of documents and application of alternative ranking techniques. This thesis proposes two value-added approaches for search systems which treat typical problems in searching scientific literature and seek to improve the retrieval situation on a measurable level. The two value-added services, semantic treatment of heterogeneity (the example of cross-concordances) and re-ranking on Bradfordizing, which are applied in different search phases, are described in detail and their effectiveness in typical subject-specific searches is evaluated in the empirical part of the thesis. The preeminent goal of the thesis is to study if the proposed, alternative re-ranking approach Bradfordizing is operable in the domain of bibliographic databases, and if the approach is profitable, i.e. serves as a value added, for users in information systems. We used topics and data from two evaluation projects (CLEF and KoMoHe) for the tests. The intellectually assessed documents come from seven academic abstracting and indexing databases representing social science, political science, economics, psychology and medicine. The evaluation of the cross-concordances (82 topics altogether) shows that the retrieval results improve significantly for all cross-concordances, indicating that interdisciplinary cross-concordances have the strongest (positive) effect on the search results. The evaluation of Bradfordizing re-ranking (164 topics altogether) shows that core zone (core journals) documents display significantly higher precision than was seen for documents in zone 2 and zone 3 (periphery journals) for most test series. This post-Bradfordizing relevance advantage can be demonstrated empirically across a very broad basis of topics and two independent document corpora as well for journals and monographs.
Zugriffsstatistik: Die Daten für die Zugriffsstatistik der einzelnen Dokumente wurden aus den durch AWStats aggregierten Webserver-Logs erstellt. Sie beziehen sich auf den monatlichen Zugriff auf den Volltext sowie auf die Startseite. Die Zugriffsstatistik wird nicht standardisiert erfasst und kann maschinelle Zugriffe enthalten.
 
Bei Formatversionen eines Dokuments, die aus mehreren Dateien bestehen (insbesondere HTML), wird jeweils der monatlich höchste Zugriffswert auf eine der Dateien (Kapitel) des Dokuments angezeigt.
 
Um die detaillierten Zugriffszahlen zu sehen, fahren Sie bitte mit dem Mauszeiger über die einzelnen Balken des Diagramms.
Startseite: 6 Zugriffe PDF: 23 Zugriffe Startseite: 2 Zugriffe PDF: 14 Zugriffe Startseite: 9 Zugriffe PDF: 33 Zugriffe Startseite: 4 Zugriffe PDF: 29 Zugriffe Startseite: 4 Zugriffe PDF: 31 Zugriffe Startseite: 5 Zugriffe PDF: 47 Zugriffe Startseite: 3 Zugriffe PDF: 48 Zugriffe PDF: 28 Zugriffe PDF: 29 Zugriffe Startseite: 2 Zugriffe PDF: 30 Zugriffe Startseite: 4 Zugriffe PDF: 50 Zugriffe Startseite: 7 Zugriffe PDF: 46 Zugriffe PDF: 39 Zugriffe PDF: 49 Zugriffe PDF: 56 Zugriffe PDF: 47 Zugriffe Startseite: 2 Zugriffe PDF: 84 Zugriffe Startseite: 4 Zugriffe PDF: 74 Zugriffe Startseite: 1 Zugriffe PDF: 78 Zugriffe Startseite: 6 Zugriffe PDF: 67 Zugriffe Startseite: 13 Zugriffe PDF: 111 Zugriffe Startseite: 11 Zugriffe PDF: 90 Zugriffe Startseite: 4 Zugriffe PDF: 107 Zugriffe Startseite: 6 Zugriffe PDF: 77 Zugriffe Startseite: 4 Zugriffe PDF: 73 Zugriffe Startseite: 4 Zugriffe PDF: 83 Zugriffe Startseite: 1 Zugriffe PDF: 70 Zugriffe Startseite: 2 Zugriffe PDF: 76 Zugriffe Startseite: 14 Zugriffe PDF: 98 Zugriffe Startseite: 17 Zugriffe PDF: 110 Zugriffe Startseite: 14 Zugriffe PDF: 139 Zugriffe Startseite: 22 Zugriffe PDF: 143 Zugriffe Startseite: 17 Zugriffe PDF: 143 Zugriffe Startseite: 11 Zugriffe PDF: 117 Zugriffe Startseite: 7 Zugriffe PDF: 82 Zugriffe Startseite: 5 Zugriffe PDF: 88 Zugriffe Startseite: 3 Zugriffe PDF: 72 Zugriffe
Jul
11
Aug
11
Sep
11
Oct
11
Nov
11
Dec
11
Feb
12
Apr
12
May
12
Jun
12
Jul
12
Aug
12
Sep
12
Oct
12
Nov
12
Dec
12
Jan
13
Feb
13
Mar
13
Apr
13
May
13
Jun
13
Jul
13
Aug
13
Sep
13
Oct
13
Nov
13
Dec
13
Jan
14
Feb
14
Mar
14
Apr
14
May
14
Jun
14
Jul
14
Aug
14
Sep
14
Monat Jul
11
Aug
11
Sep
11
Oct
11
Nov
11
Dec
11
Feb
12
Apr
12
May
12
Jun
12
Jul
12
Aug
12
Sep
12
Oct
12
Nov
12
Dec
12
Jan
13
Feb
13
Mar
13
Apr
13
May
13
Jun
13
Jul
13
Aug
13
Sep
13
Oct
13
Nov
13
Dec
13
Jan
14
Feb
14
Mar
14
Apr
14
May
14
Jun
14
Jul
14
Aug
14
Sep
14
Startseite 6 2 9 4 4 5 3     2 4 7         2 4 1 6 13 11 4 6 4 4 1 2 14 17 14 22 17 11 7 5 3
PDF 23 14 33 29 31 47 48 28 29 30 50 46 39 49 56 47 84 74 78 67 111 90 107 77 73 83 70 76 98 110 139 143 143 117 82 88 72

Gesamtzahl der Zugriffe seit Jul 2011:

  • Startseite – 214 (5.78 pro Monat)
  • PDF – 2581 (69.76 pro Monat)
 
 
Generiert am 22.10.2014, 05:36:48