Spiekermann, Sarah: Online Information Search with Electronic Agents: Drivers, Impediments, and Privacy Issues

176

Appendix B. ONLINE MATERIAL

B.1 Sreenshots of the Experimental Store


180


181


183


184


185

B.2 Description of Algorithm behind Luci

(documented by Martin Strobel; International Institute of Infonomics; 10. Mai 2001)

Kodierung der Produkte

Produkte sind in allen relevanten Eigenschaften in einer Datenbank kodiert. Eine numerische Kodierung kann vorteilhaft sein ist aber nicht unbedingt notwendig.

Beispiel Kompaktkamera

Prod

Name

Preis

Farbe

Groesse

Zoom-Max

Zoom-Min

Mindest

abstand

Blitz eingeb

Bild

formate

Canon

Prima Super 120

479,-

silber

50

120

35

0,8 m

100

Normal

Anmerkungen:

Farbe wurde nicht numerisch kodiert.

Groesse wurde nicht exakt gemessen, sondern nur grob klassifiziert in sehr groß (100), groß (75), mittel (50), klein (25), sehr klein (0). Analog wurde mit Gewicht verfahren. Eine komplexere Kodierung in Laenge, Hoehe, und Breite bzw. eine exakte Gewichtsangabe wären aber auch denkbar.

Binäre Eigenschaften (wie z.B. Blitz eingebaut?) wurden mit 100 für Ja oder 0 für Nein kodiert.

Einige Eigenschaften wurden direkt mit ihrem numerischen Wert kodiert, z.B. Zoombereich (ZoomMax, ZoomMin), Preis und Mindestabstand.

Kodierung der Antwort

Beispiele von verschiedenen Fragentypen

Frage

Fragentyp

mögliche Antworten

Kodierung

1. Wie wichtig ist Ihnen ein eingebauter Blitz?

Gewichtungsfrage für binäre Eigenschaft

Extrem wichtig

100

Wichtig

66

Relativ unwichtig

33

Egal

0

2. Wie wichtig ist Ihnen ein großes Teleobjektiv?

Gewichtungsfrage für ordinale Eigenschaft

Extrem wichtig

100

Wichtig

66

Relativ unwichtig

33

Egal

0

3. Hätten Sie Lust, an einem Fotowettbewerb teilzunehmen?

Füllfrage, hat keine Auswirkungen auf die Produktempfehlung

Ja, auf jeden Fall

(100)

Ja, vielleicht

(66)

Eher nicht

(33)

Nein, überhaupt nicht

(0)

4. Möchten Sie unterschiedliche Bildformate haben?

Komplexe Frage

Ja, auf jeden Fall (mindestens 3)

100

Ja, wenn möglich (midestens 2)

66

Nicht unbedingt nötig

33

Egal

0

Anmerkungen zur Kodierung der Antworten:

Frage 1, 2 und 4 gehören zu den relevanten Fragen. Die Beantwortung dieser Fragen hat Auswirkungen auf die Empfehlung. Frage 3 ist dafür irrelevant. Die Kodierung wurde daher in Klammern gesetzt.

Die Fragen 1, 2 und 4 unterscheiden sich in der Berechnung der Punkte (siehe weiter unten).


186

Frage 4 ist eine komplexe Frage. Die Antworten zeichnen bereits gewisse Muster vor. Nachteil von komplexen Fragen ist es, dass gewisse Antworten nicht mehr gegeben werden können (z.B. "Ja , ich möchte auf jeden Fall verschiedene Bildformate haben. Zwei unterschiedliche reichen aber aus.").

Tabellen

Im wesentlichen zielt eine relevante Frage auf eine bestimmte Produkteigenschaft ab. Für jede Frage kann demnach für jedes Produkt bzw. für jede Produkteigenschaft ein Punktwert bestimmt werden. Dies geschieht in Form von Tabellen. Sie sind im System nach Ermessen des Programmierers definiert und hart kodiert worden. Für einen generellen Ansatz ist aber das Ablegen in einer Datenbank mit den geeigneten Werkzeugen für die Wartung notwendig. Sinnvollerweise werden die Tabellen den Fragen zugeordnet.

Beispiel

Die Tabellen für Fragen 2 und 4 können z.B. so aussehen:


187

Formeln

Einige Punkttabellen lassen sich in Form von Formeln kürzer darstellen. So wären

Punkte(Frage 2)

=

Min (Antwort*100, Eigenschaft*100)

Punkte(Frage 1)

=

Antwort * Eigenschaft.

Der Vorteil von Formeln liegt im geringeren Kodierungsaufwand. Im Hinblick auf eine generelle Implementierung verliert man dabei aber an Flexibilität und Allgemeinheit.

Punktsummen

Sobald die Empfehlungsmaschine angestossen wird, wird für jede relevante Frage zu jedem Produkt der entsprechende Punktwert ermittelt. Die ermittelten Punktwerte werden gewichtet und addiert. Am Ende resultiert für jedes Produkt i eine Punktesumme.

Punkte(Prod.i)

=

Punkte(Frage1, Prod.i) * Gewicht (Frage1) * Experimentatorgewichtung (Frage1) + Punkte(Frage2, Prod.i) * Gewicht (Frage2) * Experimentatorgewichtung (Frage2) + Punkte(Frage3, Prod.i) * Gewicht (Frage3) * Experimentatorgewichtung (Frage3) + ...

Je höher sie ist (im Vergleich zu den Punktsummen der anderen Produkte), desto passender ist das Produkt. Die Gewichte entstammen den Ergebnissen der Vorstudie, in der 39 Personen die Wichtigkeit der einzelnen Fragen beurteilten. Die Experimentatorgewichte wurden hinzugefügt um sogenannten KO-Fragen gerecht zu werden. Bei einer herkömmlichen Gewichtung würde der Kunde, der z.B. eine sehr billige Kamera mit sehr vielen teuren Eigenschaften haben will, die teueren Kameras angeboten bekommen, da die Punkte der speziellen Eigenschaften, die Punkte des Preises überwiegen würden. Durch Einführung einer hohen Experimentatorgewichtung für die Preisfrage wird das Problem vehindert. Der dafür entstehende Nachteil, dass die Gewichtung nicht mehr ausschliesslich auf der in der Vorstudie gemessenen Daten beruht, wurde im Gegenzug in Kauf genommen.

Zufallszahlengenerator

Zur Summe der Punkte, die ein Produkt erreichte, wurde noch ein Zufallswert addiert. Dieser war hinreichend klein, so daß dadurch Produkte mit gleicher Punktsumme separiert wurden, die Reihenfolge im wesentlichen aber unbeeinträchtigt blieb. Dieser Zufallswert sollte außerdem


188

verhindern, daß für den Fall von nur wenigen oder keinen Antworten immer die gleichen Produkte in der Empfehlung präsentiert werden.

Empfehlung

Für die Empfehlung wurden die Produkte der Höhe der erreichten Punkte nach geordnet. Absolute Werte sowie relative Werte wurden dabei nicht angegeben.

Akzeptanz

Insgesamt wurden die Empfehlungen als sehr treffend erachtet. Der Hauptkritikpunkt der Versuchspersonen war, dass sie die Gewichtung nicht selbst wählen konnten. Für eine kommerzielle Implementierung wäre eine Änderung in dieser Hinsicht unbedingt notwendig. Fragen bekämen dann grundsätzlich zwei Antwortdimensionen, zum einen die Antwort selbst, zum anderen die Gewichtung, welche die Antwort bei der Ermittlung der Empfehlung spielen soll.

Ein weiterer Kritikpunkt war, dass man keine absoluten oder relativen Werte zur Empfehlung erhält. Man kann also nicht beurteilen, wie sich die Abstände der Produkte zueinander verhalten.


190

B.3 Agent Questions, Perception and Classification


191


192


193


194


195


196


198

B.4 Rules to formulate Agent Questions

Amount of questions:

There is about the same amount of questions for each product (45 to 50) rarr the user does not have the impression that he needs to interact less, already because the interface indicates that for one product there is less interaction potential than for another

Structure of questions:

There is an equal amount of 7 question - ’rubriques‘ the user can search from for each product rarr again the user does not have the impression that he needs to interact less, already because the interface indicates that for one product there is less interaction potential than for another

The order of questions for all products is determined by the mean-importance of questions tested in advance of the experiment; question importance decreases the ’deeper‘ a user enters into a search-rubrique rarr this order is the most realistic, because interface designers/marketers will always seek to minimize user time cost

Rules for the formulation of questions and answers

Questions:

All questions are formulated in such a way that they directly address the user

Products are never expressed as the future product of the user (e.g. ’what do you want your jeans to look like?‘)

There are two types of questions: 1) where the user is asked to comment specific product traits and 2) where he is asked to reveal something about himself as a person

Answers:

All answers are multiple-choice

The user has the possibility to answer one or more questions

All answers are formulated in such a way that they are comprehensive/intuitive for the user; thus, technical data are only in brackets while easy-to-understand descriptive answers are used

Answers are not limited to yes/no, but are more specific

Eventually answers include the expression of financial sensitivity


199

B.5 Rules to assign Agent Questions to Privacy Classes

We distinguished 4 types of questions related to privacy classes:

pd- questions: non-private

These questions refer directly to the product sought. This is underlined by the article ’the‘, often used in the formulation of the question. For example, one could ask: “Do you want the jacket to be trendy?“ or “How important is a trendy jacket to you?“. Only the former question is a ’pd‘-question.

pepr - questions : marginally private

These questions refer indirectly to the product, but target more on the consumer. The formulation of the question is vital for this characterization: i.e. one could ask. “What size do you need?“ or “What size to you want the jacket to be?“. The former question targets the buyer in person, while the latter relates to the specific product sought. Still, the first question, even though personal, is perceived to relate to the product sought. It is therefore a pepr-question (pe=person, pr=product).

u-questions : relatively private

These questions are related to the person and the usage that is envisioned for the product.

peip-questions : purely private

These questions are of purely personal nature and independent of product selection; thus, they do not allow to select a better product if answered.


201

B.6 Screenshot of Pre-Study Rating Tool


© Die inhaltliche Zusammenstellung und Aufmachung dieser Publikation sowie die elektronische Verarbeitung sind urheberrechtlich geschützt. Jede Verwertung, die nicht ausdrücklich vom Urheberrechtsgesetz zugelassen ist, bedarf der vorherigen Zustimmung. Das gilt insbesondere für die Vervielfältigung, die Bearbeitung und Einspeicherung und Verarbeitung in elektronische Systeme.

DiML DTD Version 2.0
Zertifizierter Dokumentenserver
der Humboldt-Universität zu Berlin
HTML - Version erstellt am:
Mon Dec 23 13:23:15 2002