| Maximilian Teltzrow: A Quantitative Analysis of E-Commerce: Channel Conflicts, Data Mining, and Consumer Privacy |
|
|
Humboldt-Universität zu Berlin
Dissertation
A Quantitative Analysis of E-Commerce:
Channel Conflicts, Data Mining, and Consumer Privacy
Zur Erlangung des akademischen Grades
doctor rerum politicarum
(Doktor der Wirtschaftswissenschaft)
eingereicht an der
Wirtschafswissenschaftlichen Fakultät
der Humboldt-Universität zu Berlin
von
Herrn Diplom-Ingenieur Maximilian
Teltzrow
geboren am 26.03.1975 in Berlin
Präsident der Humboldt-Universität zu Berlin:
Prof. Dr. Jürgen Mlynek
Dean: Dekan der Wirtschaftswissenschaftlichen Fakultät:
Prof. Dr. Joachim Schwalbach
Gutachter:
1. Prof. Oliver Günther, Ph.D.
2. Prof. Alfred Kobsa, Ph.D.
Einreichung der Dissertation: 2. Mai 2005
Datum der Promotion: 17. Mai 2005
Abstract
The role and perception of the Web in its various usage contexts is rapidly changing – from an early focus on “Web-only” interaction with customers, information seekers, and other users, to the Web becoming one central component in a multi-channel information and communication strategy. This development gives companies the opportunity to collect, analyze and use an increasing amount of digital consumer information.
While yielding benefits to the companies (e.g. marketing, usability), the analysis and use of online data has significantly raised consumer privacy concerns, which in turn has become a primary impediment for successful e-commerce. The implications for a company are that it must respect privacy requirements in data analysis and data usage and it must communicate these privacy practices efficiently towards its online visitors.
The aim of this thesis is to explore the border between the competing interests of online consumers and companies. Privacy on the Internet is investigated from a consumer perspective and privacy requirements are specified. A set of business analyses for Web sites is proposed and it is indicated how privacy requirements can be included in the analysis. Moreover, a privacy communication design is presented, which allows more efficient communication of a Web site’s privacy practices directed towards the users. The proposed solutions allow the resolution of conflicting goals between companies’ data usage and consumers’ privacy concerns.
The research is carried out with special emphasis on retailers operating multiple distribution channels. These retailers have become the dominant player in e-commerce. The specific contributions of this thesis are the following:
-
Measuring antecedents of trust in multi-channel retailing (Chapter 2)
The success of multi-channel retailing and the importance of privacy is discussed from a consumer’s point of view. We present a structural equation model of consumer trust in a multi-channel retailer. Trust is a well-known predictor of willingness to buy.
A significant influence of perceived store reputation and perceived store size on trust in an e-shop has been identified, which supports our hypothesis that cross-channel effects exist between a retailer’s physical store network and its e-shop. We found that consumers’ perceived privacy had the strongest influence on trust. The results suggest to further integrate distribution channels and to improve the communication of privacy online.
-
Design and testing of a Web analysis framework
(Chapter 3)
Our research on consumer perceptions in multi-channel retailing motivates to further investigate the notion of success measurement on the Internet. We propose an analysis framework consisting of 82 analyses for measuring the online success of Web sites. New conversion success metrics and customer segmentation approaches have been introduced. A particular emphasis has been placed on metrics and analytics for multi-channel retailers. The framework has been tested on Web site data from a large multi-channel retailer and an information site.
-
Prototypical development of a privacy-preserving Web analysis service
(Chapter 4)
The analysis of Web data requires that privacy restrictions must be adhered to. The impact of privacy requirements on our analysis framework is discussed. We propose a privacy-preserving Web analysis service that calculates the set of 82 business analyses and indicates when an analysis is not compliant with privacy requirements or when data is not available. A syntactical extension of a privacy standard is proposed.
-
Extension of user privacy requirements
(Chapter 5)
An important application that uses results from the described Web analysis service are personalization systems. These systems become more efficient with an increasing amount of user information. Thus, the impact of privacy concerns is particularly high for personalization applications. An overview of consumer privacy concerns and their particular impact on personalization systems is provided that is summarized in a meta-study of 30 privacy surveys. Approaches to privacy-preserving personalization have been discussed.
-
Development of a privacy communication design
(Chapter 6)
A company must not only respect privacy requirements in its Web analysis and usage purposes but it must also effectively communicate these privacy practices to its site visitors. A new user interface design approach is proposed, in which the privacy practices of a Web site are explicated in a contextualized manner, and users’ benefits in providing personal data clearly explained. A user experiment has been conducted that compared two versions of a personalized store. Subjects who interacted with our new interface design were significantly more willing to share personal data with the Web site. They rated its privacy practices and the perceived benefit significantly higher and made considerably more purchases.
Keywords:
Electronic Commerce,
Data Mining,
Multi-Channel Retailing,
Privacy,
Communication Design
Zusammenfassung
Die Rolle und Wahrnehmung des World Wide Web in seinen unterschiedlichen Nutzungskontexten ändert sich zunehmend – von einem frühen Fokus auf reine Web-Interaktion mit Kunden, Informationssuchern und anderen Nutzern hin zum Web als eine Komponente in einer mehrkanaligen Informations- und Kommunikationsstrategie. Diese zentrale Entwicklung ermöglicht Firmen, eine wachsende Menge digitaler Konsumenteninformationen zu sammeln, zu analysieren und zu verwerten.
Während Firmen von diesen Daten profitieren (z.B. für Marketingzwecke und zur Verbesserung der Bedienungsfreundlichkeit), hat die Analyse und Nutzung von Onlinedaten zu einem signifikanten Anstieg der Datenschutzbedenken bei Konsumenten geführt, was wiederum ein Haupthindernis für erfolgreichen E-Commerce ist. Die Implikationen für eine Firma sind, dass Datenschutzanforderungen bei der Datenanalyse und -nutzung berücksichtigt und Datenschutzpraktiken effizient nach außen kommuniziert werden müssen.
Diese Dissertation erforscht den Grenzbereich zwischen den scheinbar konkurrierenden Interessen von Onlinekonsumenten und Firmen. Datenschutz im Internet wird aus einer Konsumentenperspektive untersucht und Datenschutzanforderungen werden spezifiziert. Eine Gruppe von Geschäftsanalytiken für Webseiten wird präsentiert und es wird verdeutlicht, wie Datenschutzanforderungen in den Analyseprozess integriert werden können. Darüber hinaus wird ein Design zur effektiven Kommunikation von Datenschutzpraktiken einer Firma gegenüber Konsumenten vorgestellt. Die vorgeschlagenen Lösungsansätze gestatten den beiden Gegenparteien, widerstreitende Interessen zwischen Datennutzung und Datenschutz auszugleichen.
Ein besonderer Fokus dieser Forschungsarbeit liegt auf Mehrkanalhändlern, die den
E-Commerce-Markt mittlerweile dominieren. Die Beiträge dieser Arbeit sind im Einzelnen:
-
Messung von Vorbedingungen für Vertrauen im Mehrkanalhandel (Kapitel 2)
Der Erfolg des Mehrkanalhandels und die Bedeutung von Datenschutz werden aus einer Konsumentenperspektive dargestellt. Ein Strukturgleichungsmodell zur Erklärung von Konsumentenvertrauen in einen Mehrkanalhändler wird präsentiert. Vertrauen ist wiederum eine zentrale Vorbedingung für die Kaufbereitschaft.
Ein signifikanter Einfluss der wahrgenommenen Reputation und Größe physischer Filialen auf das Vertrauen in einen Onlineshop wurde festgestellt. Dieses Resultat bestätigt unsere Hypothese, dass kanalübergreifende Effekte zwischen dem physischen Filialnetzwerk und einem Onlineshop existieren. Der wahrgenommene
Datenschutz hat im Vergleich den stärksten Einfluss auf das Vertrauen. Die Resultate legen nahe, Distributionskanäle weiter zu integrieren und die Kommunikation des Datenschutzes zu verbessern.
-
Design und Test eines Web-Analyse-Systems (Kapitel 3
Der Forschungsbeitrag zu Konsumentenwahrnehmungen im Mehrkanalhandel motiviert die Untersuchung, wie Erfolg im Internet gemessen werden kann. Wir präsentieren ein Kennzahlensystem mit 82 Kennzahlen zur Messung des Onlineerfolges von Webseiten. Neue Konversionsmetriken und Kundensegmentierungsansätze werden vorgestellt. Ein Schwerpunkt liegt auf der Entwicklung von Kennzahlen für Mehrkanalhändler. Das Kennzahlensystem wird auf Daten der Website eines Mehrkanalhändlers und einer Informationswebseite geprüft.
-
Prototypische Entwicklung eines datenschutzwahrenden Web Analyse Services (Kapitel 4)
Die Analyse von Webdaten erfordert die Beachtung von Datenschutzrestriktionen. Daher wird der Einfluss von Datenschutzbestimmungen auf das Kennzahlensystem diskutiert. Wir präsentieren einen datenschutzwahrenden Web Analyse Service, der die Kennzahlen unseres Web-Analyse-Systems berechnet und zudem anzeigt, wenn eine Kennzahl im Konflikt mit Datenschutzbestimmungen steht. Eine syntaktische Erweiterung eines etablierten Datenschutzstandards wird vorgeschlagen.
-
Erweiterung der Analyse von Datenschutzbedürfnissen aus Kundensicht (Kapitel 5)
Eine wichtige Anwendung, die Resultate des beschriebenen Web Analyse Services nutzt, sind Personalisierungssysteme. Diese Systeme verbessern ihre Effizienz mit zunehmenden Informationen über die Nutzer. Daher sind die Datenschutzbedenken von Webnutzern besonders hoch bei Einsatz dieser Systeme. Datenschutzbedenken aus Konsumentensicht werden in einer Meta-Studie von 30 Datenschutzumfragen kategorisiert, und mögliche Konsequenzen für die Nutzung von Personalisierungssystemen werden beschrieben. Lösungsansätze zur datenschutzwahrenden Personalisierung werden diskutiert.
-
Entwicklung eines Datenschutz-Kommunikationsdesigns (Kapitel 6)
Eine Firma muss nicht nur Datenschutzanforderungen bei Web-Analyse- und Datennutzungspraktiken berücksichtigen. Sie muss diese Datenschutzvorkehrungen auch effektiv gegenüber den Seitenbesuchern kommunizieren. Wir präsentieren ein neuartiges Nutzer-Interface-Design, bei dem der Datenschutz und der Kundennutzen der Datenübermittlung auf einer Website klar erläutert wird. Ein Nutzerexperiment wurde durchgeführt, das zwei Versionen eines personalisierten Web-Shops vergleicht. Teilnehmer, die mit unserem Interface-Design interagierten, waren signifikant häufiger bereit, persönliche Daten mitzuteilen, bewerteten die Datenschutzpraktiken und den Nutzen der Datenpreisgabe höher und kauften wesentlich häufiger.
Eigene Schlagworte:
Electronic Commerce,
Data Mining,
Mehrkanalhandel,
Datenschutz,
Kommunikationsdesign
Table of contents
-
Declaration
-
1
Overview
-
1.1 Contribution
-
1.2 Methodology of the thesis
-
2
Multi-channel consumer perceptions
-
2.1
Related work
-
2.2
Hypotheses
-
2.3
Methodology
-
2.3.1
The retailer
-
2.3.2 Questionnaire
-
2.3.3 Pre-processing and respondents’ demographics
-
2.3.4 Factor analysis and structural modeling
-
2.4
Results
-
2.4.1 Factor analysis
-
2.4.2 Linear structural models
-
2.5
Discussion and implications
-
2.6
Limitations
-
3
Web analysis framework
-
3.1
Data
-
3.2
Framework categories
-
3.3
Multi-channel service analyses
-
3.3.1
The multi-channel service mix
-
3.3.2
Site services in multi-channel retailing
-
3.3.3
Service analytics
-
3.3.3.1 Payment and delivery preferences
-
3.3.3.2
Return preferences
-
3.3.3.3 Repeat customers’ service preferences
-
3.3.4
Service metrics
-
3.3.5
Survey results
-
3.3.6 Summary and implications
-
3.4
Conversion analyses
-
3.4.1
Conversion success metrics
-
3.4.2 An integrated framework for conversion success
-
3.4.3
New conversion metrics
-
3.4.3.1
Multi-channel site taxonomy
-
3.4.3.2
Conversion rates and visit rates
-
3.4.4
Conversion metrics results
-
3.4.5 Summary and implications
-
3.5
Session cluster analyses
-
3.5.1
Transaction clusters
-
3.5.2 Summary and implications
-
3.6
Demographic and order analyses
-
3.6.1
Distance-to-store distribution
-
3.6.2
Concentration indices
-
3.6.3
Recency, frequency, monetary value
-
3.6.4 Summary and implications
-
3.7
User typology analyses
-
3.7.1
Success for an information site
-
3.7.2
Modeling strategies as sequences of tasks
-
3.7.3
Expressing strategies in a mining language
-
3.7.4
An informational Web site
-
3.7.5
Task-based site taxonomy
-
3.7.6
Mining queries for template matching
-
3.7.7
Results and analysis of the discovered patterns
-
3.7.8 Summary and implications
-
3.8 Conclusion
-
3.9
Limitations
-
4
Prototypical development of a privacy-preserving Web analysis service
-
4.1
Business model
-
4.2
Privacy requirements
-
4.3
Design
-
4.3.1
Data types and relations
-
4.3.2
Functions and work processes
-
4.3.2.1
Impact of data inference on decision making
-
4.3.2.2 Coding legal restrictions in a P3P policy
-
4.3.2.3 Workflow
-
4.4
User interface
-
4.5
Implementation
-
4.6
Modification of analyses
-
4.7 Conclusion
-
5
Extension of user privacy requirements
-
5.1
User-adaptable vs. user-adaptive systems
-
5.2
Input data for personalization
-
5.3
Results from privacy surveys
-
5.3.1 Impacts on user-adaptive systems
-
5.3.2 Differences in consumer statements and actual privacy practices
-
5.3.3 Differences in the privacy views of consumers and industry
-
5.3.4 Discussion of the methodology
-
5.4
Conclusion
-
6
Contextualized communication of privacy practices and personalization benefits
-
6.1
Existing approaches and their shortcomings
-
6.2
A communication design pattern
-
6.2.1
Global communication
-
6.2.2
Local communication
-
6.3
Interface design pattern of an example Web site
-
6.4
Impacts on users’ data sharing behavior
-
6.5
Discussion and open research questions
-
7
Conclusion and future research
-
Acknowledgement
-
Abbreviations
-
References
-
Appendix
-
Empfangene Unterstützung und Hilfe durch Kollegen
-
Declaration
-
Eidesstattliche Erklärung
Tables
Images
-
Figure 1-1: Thesis structure
-
Figure 2-1: Age distribution in respondent sample
-
Figure 2-2: Internet experience in respondent sample
-
Figure 2-3: Linear structural model for the influence of perceived size (PS), perceived reputation (PR), privacy (PRI) on trust (TR) for sample 1 (N=524)
-
Figure 2‑2.4: Linear structural model for the influence of perceived size (PS), perceived reputation (PR), privacy (PRI) on trust (TR) for sample 2 (N=524)
-
Figure 3-1: Simplified log entry from the cooperation partner
-
Figure 3-2: Entity relationship model of the multi-channel retailer
-
Figure 3-3: Framework categories
-
Figure 3-4: The purchase decision process at multi-channel and pure Internet retail sites
-
Figure 3-5: (a), (b): Stages and transitions in the customer life cycle, and (c) in the customer buying cycle
-
Figure 3-6: Site taxonomy
-
Figure 3-7: (a) all sessions and (b) purchase sessions: normalized numbers of weighted and dichotomized concept visits per session
-
Figure 3-8: (a) Direct delivery purchase sessions and (b) pick up purchase sessions: normalized numbers of weighted and dichotomized concept visits per session
-
Figure 3-9: Histogram displaying the number of online customers and distance to store
-
Figure 3-10: Recency, frequency, monetary value distribution for 13,653 customers
-
Figure 3-11: Task-oriented taxonomy of the information site
-
Figure 3-12: Knowledge-Building Strategy until the first invocation of “Detail Info”
-
Figure 3-13: Knowledge-Building Strategy until contact establishment
-
Figure 4-1: The Web Service business model
-
Figure 4-2: Problem specification
-
Figure 4-3: Workflow
-
Figure 4-4: Main interface design with analyses choice list, privacy indication and time frame selection
-
Figure 6-1: Global and contextual communication of privacy practices and personalization benefits
-
Figure 7-1: Screenshots of the banner leading to the survey
-
Figure 7-2: Frequency of answers to the question “if you have decided to pick up an online order at the retailer, what were the reasons?” (translated from German)
-
Figure 7-3: Shop and customer distribution of the multi-channel retailer
-
Figure 7-4: Workflow of the experimental procedure
| © Die inhaltliche Zusammenstellung und Aufmachung dieser Publikation sowie die
elektronische
Verarbeitung sind urheberrechtlich geschützt. Jede Verwertung, die nicht ausdrücklich
vom Urheberrechtsgesetz zugelassen ist, bedarf der vorherigen Zustimmung. Das gilt insbesondere für
die Vervielfältigung, die Bearbeitung und Einspeicherung und Verarbeitung in elektronische Systeme.
|
| DiML DTD Version 4.0 | Zertifizierter Dokumentenserver der Humboldt-Universität zu Berlin | HTML generated: 14.08.2006 |