Entwicklung und Test einer logfilebasierten Metrik zur Analyse von Website Entries am Beispiel einer akademischen Universitäts-Website
Web Logfiles protokollieren Benutzertransaktionen auf Webservern und bieten aufgrund ihres Umfangs, ihrer Eigenschaften und Potenziale ein ausgezeichnetes Untersuchungsfeld für heutige Informations- und Onlineverhaltensstudien. Die empirische, explorative Untersuchung aus den Bereichen Web Mining, Webometrics und Logfileanalyse stellt neue Gesichtspunkte und Analysemöglichkeiten für Logdaten vor. Zu diesem Zweck entwickelt und testet die Arbeit ein quantitatives, nicht-reaktives Messverfahren (Logmetrik „Web Entry Faktoren“), das anhand von einfachen Web Logdaten, Aussagen über die Zugänglichkeit und Sichtbarkeit von hochfrequentierten Einstiegspunkten einer Website ermöglicht. Im Mittelpunkt stehen die drei unterscheidbaren Navigationsarten im Web „Navigation über Suchmaschinen“, „Navigation über Backlinks“ und „direkte Navigation“. Die Untersuchung integriert ein Klassifikationsschema für Webseiten sowie den prominenten externen Parameter PageRank der heute wichtigsten Suchmaschine Google. Untersuchungsgegenstand sind Web Logfiles zweier kompletter Jahrgänge (2000 und 2002) des Webservers des Instituts für Bibliothekswissenschaft an der Humboldt-Universität zu Berlin (http://www.ib.hu-berlin.de/), sowie die 100 am häufigsten genutzten Einstiegsseiten dieser akademischen Universitäts-Website. Web log files record user transactions on web servers and offer due to their extent, their properties and potential an excellent investigation field for contemporary information and online behaviour studies. The empirical, explorative investigation from the fields Web Mining, Webometrics and Logfile Analysis introduces new aspects and analysis possibilities for web log data. The study develops and tests a quantitative, non-reactive measure method (log metric "Web Entry Factors"), that allows statements about the accessibility and visibility of highly frequented entry points of a web site. The three distinguishable web navigation types "navigation about search engines", "navigation about backlinks" and "direct navigation" are focused. The study integrates a classification scheme for web pages as well as the prominent external parameter PageRank from the today most important search engine Google. Investigation subject are Web log files of two complete age-groups (in 2000 and 2002) of the web server of the Institute for Library Science at the Humboldt University to Berlin (http://www.ib.hu-berlin.de/), as well as the 100 most frequently used entry pages of this academic university web site.
Files in this item