Show simple item record

2015-01-12Dissertation DOI: 10.18452/17122
Data accuracy in bibliometric data sources and its impact on citation matching
dc.contributor.authorOlensky, Marlies
dc.date.accessioned2017-06-18T13:39:44Z
dc.date.available2017-06-18T13:39:44Z
dc.date.created2015-02-03
dc.date.issued2015-01-12
dc.identifier.urihttp://edoc.hu-berlin.de/18452/17774
dc.description.abstractIst die Zitationsanalyse ein geeignetes Instrument zur Forschungsevaluation? Diese Dissertation untersucht, ob die zugrunde liegenden Zitationsdaten ausreichend fehlerfrei sind, um aussagekräftige Ergebnisse der Analysen zu erzielen, beziehungsweise sollte dies nicht der Fall sein, ob der Prozess, der die zitierenden und zitierten Artikel einander zurordnet, ausreichend robust gegenüber Ungenauigkeiten in den Daten ist. Ungenauigkeiten wurden als Unterschiede in den Datenwerten der bibliographischen Angaben definiert. Die untersuchten Daten setzen sich aus gezielt ausgewählten Publikationen des Web of Science (WoS) zusammen, welche eine geschichtete Stichprobe ergeben. Die bibliographischen Daten von 3.929 Referenzen wurden in einer qualitativen Inhaltsanalyse bewertet und die bibliographischen Ungenauigkeiten in einer Taxonomie zusammengefasst. Um genau festzulegen, welche von diesen tatsächlich den Zuordnungsprozess von Zitationen beeinflussen, wurde eine spezifische Untergruppe von Zitationen, d.h. Zitationen die von WoS nicht erfolgreich dem jeweilig zitierten Artikel zugeordnet wurden, untersucht. Die Ergebnisse wurden mit den Daten zweier weiterer bibliographischen Datenbanken, Scopus und Google Scholar, sowie den Daten dreier angewandter bibliometrischer Forschungsgruppen, CWTS, iFQ und Science-Metrix, trianguliert. Die Zuordnungsalgorithmen von CWTS und iFQ konnten rund zwei Drittel dieser Zitierungen erfolgreich zuordnen. Scopus und Google Scholar konnten ebenso über 60% der fehlenden Zitierungen erfolgreich mit dem entsprechenden zitierten Artikel verbinden, während Science-Metrix nur eine geringe Anzahl an Referenzen (5%) schaffte. Vollkommen falsche erste Seitenzahlen sowie Zahlendreher in Publikationsjahren können in allen Datenquellen nicht richtig zugeordnete Zitierungen verursachen. Basierend auf den Ergebnissen wurden Lösungsvorschläge formuliert, die im Stande sind den Zuordnungsprozess von Zitationen in bibliometrischen Datenquellen zu verbessern.ger
dc.description.abstractIs citation analysis an adequate tool for research evaluation? This doctoral research investigates whether the underlying citation data is sufficiently accurate to provide meaningful results of the analyses and if not, whether the citation matching process can rectify inaccurate citation data. Inaccuracies are defined as discrepancies in the data values of bibliographic references, since they are the essential part in the citation matching process. A stratified, purposeful data sample was selected to examine typical cases of publications in Web of Science (WoS). The bibliographic data of 3,929 references was assessed in a qualitative content analysis to identify prevailing inaccuracies in bibliographic references that can interfere with the citation matching process. The inaccuracies were categorized into a taxonomy. Their frequency was studied to determine any strata-specific patterns. To pinpoint the types of inaccuracies that influence the citation matching process, a specific subset of citations, i.e. citations not successfully matched by WoS, was investigated. The results were triangulated with five other data sources: with data from two bibliographic databases in their role as citation indexes (Scopus and Google Scholar) and with data from three applied bibliometric research groups (CWTS, iFQ and Science-Metrix). The matching algorithms of CWTS and iFQ were able to match around two thirds of these citations correctly. Scopus and Google Scholar also handled more than 60% successfully in their matching. Science-Metrix only matched a small number of references (5%). Completely incorrect starting page numbers and transposed publication years can cause a citation to be missed in all data sources. However, more often it is a combination of more than one kind of inaccuracy in more than one field that leads to a non-match. Based on these results, proposals are formulated that could improve the citation matching processes of the different data sources.eng
dc.language.isoeng
dc.publisherHumboldt-Universität zu Berlin, Philosophische Fakultät I
dc.rightsNamensnennung - Keine kommerzielle Nutzung - Keine Bearbeitung
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/de/
dc.subjectGoogle Scholarger
dc.subjectTaxonomieger
dc.subjectbibliographische Ungenauigkeitenger
dc.subjectZitationsdatenger
dc.subjectZuordnungsprozess von Zitationenger
dc.subjectbibliometrische Forschungsgruppenger
dc.subjectWeb of Scienceger
dc.subjectScopusger
dc.subjectGoogle Scholareng
dc.subjecttaxonomyeng
dc.subjectbibliographic inaccuracieseng
dc.subjectcitation dataeng
dc.subjectcitation matching processeng
dc.subjectbibliometric research groupseng
dc.subjectWeb of Scienceeng
dc.subjectScopuseng
dc.subject.ddc020 Bibliotheks- und Informationswissenschaften
dc.titleData accuracy in bibliometric data sources and its impact on citation matching
dc.typedoctoralThesis
dc.identifier.urnurn:nbn:de:kobv:11-100226042
dc.identifier.doihttp://dx.doi.org/10.18452/17122
dc.identifier.alephidBV042324783
dc.date.accepted2014-12-17
dc.contributor.refereePetras, Vivien
dc.contributor.refereeLarsen, Birger
dc.subject.dnb02 Schrift, Buch, Bibliothek, Information und Dokumentation
dc.subject.rvkAN 74000
local.edoc.pages280
local.edoc.type-nameDissertation
local.edoc.institutionPhilosophische Fakultät I

Show simple item record