edoc-Server der Humboldt-Universität zu Berlin

Dissertation

Autor(en): Marlies Olensky
Titel: Data accuracy in bibliometric data sources and its impact on citation matching
Gutachter: Vivien Petras; Birger Larsen
Erscheinungsdatum: 12.01.2015
Volltext: pdf (urn:nbn:de:kobv:11-100226042)
Fachgebiet(e): Bibliotheks- und Informationswissenschaft
Schlagwörter (ger): Google Scholar, Taxonomie, bibliographische Ungenauigkeiten, Zitationsdaten, Zuordnungsprozess von Zitationen, bibliometrische Forschungsgruppen, Web of Science, Scopus
Schlagwörter (eng): Google Scholar, taxonomy, bibliographic inaccuracies, citation data, citation matching process, bibliometric research groups, Web of Science, Scopus
Einrichtung: Humboldt-Universität zu Berlin, Philosophische Fakultät I
Lizenz: Namensnennung - Keine kommerzielle Nutzung - Keine Bearbeitung (CC BY NC ND)
Zitationshinweis: Olensky, Marlies: Data accuracy in bibliometric data sources and its impact on citation matching; Dissertation, Humboldt-Universität zu Berlin, Philosophische Fakultät I , publiziert am 12.01.2015, urn:nbn:de:kobv:11-100226042
Metadatenexport: Um den gesamten Metadatensatz im Endnote- oder Bibtex-Format zu speichern, klicken Sie bitte auf den entsprechenden Link. Endnote   Bibtex  
print on demand: Wenn Sie auf dieses Icon klicken, können Sie ein Druckexemplar dieser Publikation bestellen.

Abstract (ger):
Ist die Zitationsanalyse ein geeignetes Instrument zur Forschungsevaluation? Diese Dissertation untersucht, ob die zugrunde liegenden Zitationsdaten ausreichend fehlerfrei sind, um aussagekräftige Ergebnisse der Analysen zu erzielen, beziehungsweise sollte dies nicht der Fall sein, ob der Prozess, der die zitierenden und zitierten Artikel einander zurordnet, ausreichend robust gegenüber Ungenauigkeiten in den Daten ist. Ungenauigkeiten wurden als Unterschiede in den Datenwerten der bibliographischen Angaben definiert. Die untersuchten Daten setzen sich aus gezielt ausgewählten Publikationen des Web of Science (WoS) zusammen, welche eine geschichtete Stichprobe ergeben. Die bibliographischen Daten von 3.929 Referenzen wurden in einer qualitativen Inhaltsanalyse bewertet und die bibliographischen Ungenauigkeiten in einer Taxonomie zusammengefasst. Um genau festzulegen, welche von diesen tatsächlich den Zuordnungsprozess von Zitationen beeinflussen, wurde eine spezifische Untergruppe von Zitationen, d.h. Zitationen die von WoS nicht erfolgreich dem jeweilig zitierten Artikel zugeordnet wurden, untersucht. Die Ergebnisse wurden mit den Daten zweier weiterer bibliographischen Datenbanken, Scopus und Google Scholar, sowie den Daten dreier angewandter bibliometrischer Forschungsgruppen, CWTS, iFQ und Science-Metrix, trianguliert. Die Zuordnungsalgorithmen von CWTS und iFQ konnten rund zwei Drittel dieser Zitierungen erfolgreich zuordnen. Scopus und Google Scholar konnten ebenso über 60% der fehlenden Zitierungen erfolgreich mit dem entsprechenden zitierten Artikel verbinden, während Science-Metrix nur eine geringe Anzahl an Referenzen (5%) schaffte. Vollkommen falsche erste Seitenzahlen sowie Zahlendreher in Publikationsjahren können in allen Datenquellen nicht richtig zugeordnete Zitierungen verursachen. Basierend auf den Ergebnissen wurden Lösungsvorschläge formuliert, die im Stande sind den Zuordnungsprozess von Zitationen in bibliometrischen Datenquellen zu verbessern.
Abstract (eng):
Is citation analysis an adequate tool for research evaluation? This doctoral research investigates whether the underlying citation data is sufficiently accurate to provide meaningful results of the analyses and if not, whether the citation matching process can rectify inaccurate citation data. Inaccuracies are defined as discrepancies in the data values of bibliographic references, since they are the essential part in the citation matching process. A stratified, purposeful data sample was selected to examine typical cases of publications in Web of Science (WoS). The bibliographic data of 3,929 references was assessed in a qualitative content analysis to identify prevailing inaccuracies in bibliographic references that can interfere with the citation matching process. The inaccuracies were categorized into a taxonomy. Their frequency was studied to determine any strata-specific patterns. To pinpoint the types of inaccuracies that influence the citation matching process, a specific subset of citations, i.e. citations not successfully matched by WoS, was investigated. The results were triangulated with five other data sources: with data from two bibliographic databases in their role as citation indexes (Scopus and Google Scholar) and with data from three applied bibliometric research groups (CWTS, iFQ and Science-Metrix). The matching algorithms of CWTS and iFQ were able to match around two thirds of these citations correctly. Scopus and Google Scholar also handled more than 60% successfully in their matching. Science-Metrix only matched a small number of references (5%). Completely incorrect starting page numbers and transposed publication years can cause a citation to be missed in all data sources. However, more often it is a combination of more than one kind of inaccuracy in more than one field that leads to a non-match. Based on these results, proposals are formulated that could improve the citation matching processes of the different data sources.
Zugriffsstatistik: Die Daten für die Zugriffsstatistik der einzelnen Dokumente wurden aus den durch AWStats aggregierten Webserver-Logs erstellt. Sie beziehen sich auf den monatlichen Zugriff auf den Volltext sowie auf die Startseite. Die Zugriffsstatistik wird nicht standardisiert erfasst und kann maschinelle Zugriffe enthalten.
 
Bei Formatversionen eines Dokuments, die aus mehreren Dateien bestehen (insbesondere HTML), wird jeweils der monatlich höchste Zugriffswert auf eine der Dateien (Kapitel) des Dokuments angezeigt.
 
Um die detaillierten Zugriffszahlen zu sehen, fahren Sie bitte mit dem Mauszeiger über die einzelnen Balken des Diagramms.
Startseite: 35 Zugriffe PDF: 88 Zugriffe Startseite: 30 Zugriffe PDF: 49 Zugriffe Startseite: 16 Zugriffe PDF: 63 Zugriffe Startseite: 6 Zugriffe PDF: 44 Zugriffe Startseite: 4 Zugriffe PDF: 88 Zugriffe Startseite: 1 Zugriffe PDF: 41 Zugriffe Startseite: 2 Zugriffe PDF: 71 Zugriffe Startseite: 5 Zugriffe PDF: 54 Zugriffe Startseite: 7 Zugriffe PDF: 88 Zugriffe Startseite: 9 Zugriffe PDF: 33 Zugriffe Startseite: 13 Zugriffe PDF: 45 Zugriffe Startseite: 1 Zugriffe PDF: 62 Zugriffe Startseite: 7 Zugriffe PDF: 42 Zugriffe Startseite: 2 Zugriffe PDF: 51 Zugriffe Startseite: 8 Zugriffe PDF: 59 Zugriffe Startseite: 7 Zugriffe PDF: 44 Zugriffe Startseite: 1 Zugriffe PDF: 1 Zugriffe Startseite: 10 Zugriffe PDF: 40 Zugriffe Startseite: 5 Zugriffe PDF: 63 Zugriffe Startseite: 4 Zugriffe PDF: 46 Zugriffe Startseite: 2 Zugriffe PDF: 71 Zugriffe Startseite: 13 Zugriffe PDF: 47 Zugriffe Startseite: 6 Zugriffe PDF: 27 Zugriffe Startseite: 10 Zugriffe PDF: 83 Zugriffe Startseite: 5 Zugriffe PDF: 49 Zugriffe
Mar
15
Apr
15
May
15
Jun
15
Jul
15
Aug
15
Sep
15
Oct
15
Nov
15
Dec
15
Jan
16
Feb
16
Mar
16
Apr
16
May
16
Jun
16
Jul
16
Aug
16
Sep
16
Oct
16
Nov
16
Dec
16
Jan
17
Feb
17
Mar
17
Apr
17
Monat Mar
15
Apr
15
May
15
Jun
15
Jul
15
Sep
15
Oct
15
Nov
15
Dec
15
Jan
16
Feb
16
Mar
16
Apr
16
May
16
Jun
16
Jul
16
Aug
16
Sep
16
Oct
16
Nov
16
Dec
16
Jan
17
Feb
17
Mar
17
Apr
17
Startseite 35 30 16 6 4 1 2 5 7 9 13 1 7 2 8 7 1 10 5 4 2 13 6 10 5
PDF 88 49 63 44 88 41 71 54 88 33 45 62 42 51 59 44 1 40 63 46 71 47 27 83 49

Gesamtzahl der Zugriffe seit Mar 2015:

  • Startseite – 209 (8.04 pro Monat)
  • PDF – 1349 (51.88 pro Monat)
 
 
Generiert am 23.05.2017, 12:47:53