3 Analyse von wissenschaftlicher Literatur

↓6

Nachfolgend werden die Vorgehensweise bei der Durchführung einer bibliometrischen Analyse sowie ein entsprechendes Software Tool vorgestellt. Beispielhaft wird jene wissenschaftliche Literatur ausgewertet, die bei der Entschlüsselung der DNS-Struktur von den Nobelpreisträgern J. Watson und M. Wilkins herangezogen wurde. Ein Netz aus zitierten und zitierenden Quellen, ein sogenanntes Zitatennetz, wird darauf aufbauend generiert.

3.1 Die Entschlüsselung der DNS-Struktur

↓7

Die Struktur der Desoxyribonukleinsäure12 (DNS) wurde von James Watson und Francis Crick aufgeklärt, die im Jahre 1962 zusammen mit Maurice Wilkins den Nobelpreis für Medizin erhielten.13 Als weitere Personen, die einen wesentlichen Beitrag zur Entschlüsselung der DNS leisteten, sind Oswald Theodore Avery, Colin McLeod und Maclyn McCarty zu nennen. Diese konnten zeigen, dass die DNS Träger der Erbinformation ist. Für die Entschlüsselung der DNS-Struktur mussten entsprechende Analysetechniken vorhanden sein. In diesem Zusammenhang sind u. a. die Röntgenbeugungsdiagramme von Rosalind Franklin zu nennen. Die Zusammenarbeit von mehreren Wissenschaftlern in Teams und die Kooperation zwischen unterschiedlichen Forschungsdisziplinen sind Kennzeichen einer entstandenen Großforschung.14

3.2 Bibliometrische Analyse und Zitatenanalyse

Mit Hilfe von bibliometrischen Analysen können Aussagen über die Wirkung von Veröffentlichungen gemacht werden, die von einzelnen Forschern, einer Forschergruppe oder einem Institut erstellt wurden. Es können damit Rückschlüsse auf die Publikationsleistung und Sichtbarkeit von Forschungsergebnissen gezogen werden [2, S. 15f.; 15; 16].

Die Zitatenanalyse ist ein Teilgebiet der Bibliometrie; in ihr werden die Beziehungen zwischen Veröffentlichungen und den darin zitierten Quellen untersucht. Ausgangspunkt ist die Vorstellung, dass zitierte Quellen sichtbare Verknüpfung zwischen Veröffentlichungen sind. Zwei Zeitschriftenartikel werden beispielsweise als ähnlich erachtet, wenn sie auf ähnliche Quellen zurückgreifen.15 Grundlegende Arbeiten in diesem Bereich wurden u. a. von Garfield und Price geleistet [9]. Elektronische Systeme (z. B. Web of Science, Scopus oder IEL) bieten gegenwärtig komfortable Möglichkeiten zur Auswertung derartiger Beziehungen.16

3.3 Analyse und ihre Instrumente

↓8

Die Software HistCiteTM ist ein Instrument, mit dessen Hilfe besonders häufig zitierte Quellen auf der Grundlage der Daten des Science Citation Index identifiziert werden können.17 HistCiteTM generiert Tabellen und Matrizen sowie Historiographen. Ausgangspunkt für diese Form der bibliometrischen Analyse ist die Vorstellung, dass die Geschichte der Wissenschaft als eine chronologische Abfolge von Ereignissen betrachtet werden kann, in der jede Entdeckung von früheren Entdeckungen abhängt. Um eine graphische Datenanalyse erzeugen zu können, müssen zunächst die Daten ausgewählt und in geordneter Form dargestellt werden.18

3.3.1 Vom Datensatz zur Zitatenmatrix

Ausgangspunkt für eine Analyse und die sich daran anschließende Visualisierung in Form eines Historiographen sind bibliographische Daten. In der nachfolgenden Abbildung 7 ist der Aufbau eines einzelnen Datensatzes aufgeführt. Als Autor erscheint der Nobelpreisträger M. Wilkins, der im Jahre 1953 in der Zeitschrift Nature diesen grundlegenden Artikel veröffentlicht hat. Die zitierten Quellen sind durch CR (cited references) gekennzeichnet.

Author(s)

WILKINS MHF; SEEDS WE; STOKES AR; WILSON HR

Title

HELICAL STRUCTURE OF CRYSTALLINE DEOXYPENTOSE NUCLEIC ACID

Journal

NATURE 172(4382):759-762

...

...

CR

ASTBURY WT, 1947, S SOC EXP BIOL, V1, P66
DONOHUE J, 1953, P NATL ACAD SCI USA, V39, P470
...

WATSON JD, 1953, NATURE, V171, P737
WILKINS MHF, 1953, NATURE, V171, P737
WILKINS MHF, 1951, NATURE, V167, P759
ZAMENHOF S, 1950, J BIOL CHEM, V187, P1

↓9

In einer Matrix werden alle bibliographischen Daten zusammengefasst, zitierte Publikationen (cited nodes) werden zitierenden Publikationen (citing nodes) gegenübergestellt (vgl. Abb. 8). Ein Dokument wird in der Matrix als node bezeichnet, da es als Knoten innerhalb eines Zitatennetzes erscheint.

cited nodes

nodes

citing nodes

1 1944 AVERY OT

4, 6 ... 100, 102 ... 331

...

33, 36

38 1953 WILKINS MHF

47, 71 ... 224, 230 ... 262

...

1, 2, 33, 34, 36, 38, 85

136 1955 FEUGHELMAN M

131, 142 ... 224, 225 ... 327

...

Da eine Analyse häufig mehrere hundert Dokumente einschließt, wird die generierte Matrix entsprechend unübersichtlich. Eine Datenreduktion und eine einheitliche Strukturierung der Ergebnisse wird erforderlich und kann mit Hilfe der Datenverarbeitung erreicht werden.

3.3.2 Von der Matrix zum Zitatennetz

↓10

In Historiographen werden die Dokumente als Knoten darstellt und die Beziehungen zwischen den Dokumenten durch Pfeile angezeigt. Die Dokumente sind in eine zeitliche Reihung gebracht, indem sie nach Publikationsjahren absteigend angeordnet sind. In Historiographen liegen auf einer horizontalen Ebene also Publikationen eines Jahrganges. Die zitierenden Quellen zeigen auf die zitierten Quellen. Die herausragende Stellung eines Dokumentes – und damit der Durchmesser des Knotens innerhalb des Netzes – ergibt sich durch die Anzahl der Verweisungen (vgl. Abb. 9). Für den Knoten 1 können sieben Pfeilspitzen, für den Knoten 33 ebenfalls sieben Pfeilspitzen gezählt werden. Die eigentliche Anzahl der Verweisungen ist jedoch ungleich höher, da durch geeignete Datenreduktion überflüssige Verweisungen ausgeblendet wurden.19

Abb. 9: Historiograph

Die in der Zitatenmatrix festgelegten Beziehungen wurden in den Historiographen übertragen, dabei wurden nicht alle Daten der Matrix in vollem Umfang umgesetzt. Durch Zusammenführen von mehreren Verweisungen zu einem Pfeil wurde die Gesamtzahl der Pfeile reduziert und damit eine vereinfachte, aber anschauliche Graphik erstellt. Ebenfalls zur Steigerung der Übersichtlichkeit wurden bestimmte Knoten nicht mehr nummeriert.20

3.4 Zusammenhalt in Zitatennetzen

↓11

Das chronologische Ausrollen von Publikationen und das Verbinden aufgrund der zitierten Quellen ist eine Methode, um eine Strukturierung von Dokumenten vorzunehmen. Stellt man nicht die zeitliche Abfolge, sondern die Stärke der inhaltlichen Beziehung in den Mittelpunkt der Betrachtung, so entsteht zwangsläufig ein anderer Graph. Über Gewichtungsfaktoren werden Hauptströme lokalisiert, dabei werden Verbindungen (Kanten) zwischen Dokumenten (Knoten) stark hervorgehoben.21 Auf der Grundlage von mathematischen Algorithmen können dann aus einem umfangreichen Gesamtsystem Subnetze generiert werden. Anwendung findet dieses Verfahren u. a. bei der Auswertung von Patentliteratur.22


Fußnoten und Endnoten

12  Die Desoxyribonukleinsäure (DNS), meist nach der englischen Bezeichnung deoxyribonucleic acid mit DNA abgekürzt, ist ein Makromolekül, das bei der Vererbung als Träger der Information dient. Die Desoxyribonukleinsäure ist ein langkettiges Polymer, das aus vielen Einzelbausteinen besteht, die man Desoxyribonukleotide nennt.

13  Die DNS wurde allerdings bereits 1869 von Friedrich Miescher entdeckt, der in Zellkernen das Nuklein vorfand, jedoch die Funktion dieser Substanz noch nicht sicher bestimmen konnte.

14  Weiteres Kennzeichen ist der Aufwand an Finanz- und Personalmitteln, der die Großforschung (Big Science) zu einem wichtigen Element der nationalen Wirtschaft werden läßt. Zur Beziehung von Little Science und Big Science vgl. [24]. Zur Bedeutung des „information ressources management“ in Bibliotheken und zur Rolle der digitalen Bibliotheken für die Big Science vgl. [22].

15  Anmerkung: Damit verbunden sind Probleme der Selbst-Zitation oder Negativ-Zitation.

16 

Basis für das Web of Science ist der Science Citation Index und der Social Science Citation Index. Scopus ist eine Literaturdatenbank, die die weltweit größte Sammlung an Abstracts und Quellenverweisungen enthält. In der IEEE/IEE Electronic Library (IEL) werden unter „Abstract Plus“ die Rubriken References und Citing Documents angeboten,

URL: http://www.thomsonisi.com, http://<www.scopus.com,

http://www.ieee.org/ieeexplore.

17  HISTCITE™ – Bibliographic Analysis and Visualization Software, URL: http://www.histcite.com/.

18  Zum methodischen Problem bei der Auswahl der Dokumente, die für eine Auswertung herangezogen werden, vgl. [12].

19  Vom Dokument 136 gehen 5 Pfeile aus, die sich dann weiter verzweigen. Das Dokument 136 verweist letztlich auf sieben Dokumente (1, 33, 43, 85, 36, 38, 2).

20 

Detaillierte Angaben zur Graphik sind im Folder Avery_Watson-Crick/ zu finden, URL:

http://garfield.library.upenn.edu/histcomp/index-watson-crick.html.

21  Vgl. die Darstellung über sogenannte Suchpfade (search path) bei [12].

22  Eine anschauliche graphische Datenanalyse für Patente findet man bei [3].



© Die inhaltliche Zusammenstellung und Aufmachung dieser Publikation sowie die elektronische Verarbeitung sind urheberrechtlich geschützt. Jede Verwertung, die nicht ausdrücklich vom Urheberrechtsgesetz zugelassen ist, bedarf der vorherigen Zustimmung. Das gilt insbesondere für die Vervielfältigung, die Bearbeitung und Einspeicherung und Verarbeitung in elektronische Systeme.
DiML DTD Version 4.0Zertifizierter Dokumentenserver
der Humboldt-Universität zu Berlin
HTML-Version erstellt am:
04.04.2007