Domain-Based Indexes
Indexing for Communities of Users
La formation d'un vocabulaire évolue à la foi au sein d'une communauté et d'un domaine discursif. Cependant, les bases de données bibliographiques ont souvent un seul index créé pour la base entière, et ceci bien qu'elles couvrent fréquemment plusieurs domaines discursifs. A des fins expérimentales, des indexes furent dérivés du langage utilisé au sein d'un domaine discursif specialisé, sous-ensemble d'une base de données. Ce radical éloignement des pratiques traditionelles produit une amélioration significative des performances de recherche. La conclusion que les performances sont meilleures au sein d'un domaine spécifique, et qu'elles se détériorent au fur et à mesure que la portée du système s'étend a des domaines additionnels, est conforme aux expériences conduites en intelligence artificielle et traduction par machine. Cette analyse a également nécessité le développement d'une mesure opérationnelle de la performance des intermédiaires. Ceci résulte en plusieurs questions théoriques et pratiques. The formation of vocabulary evolves within communities, within domains of discourse. However, bibliographic databases have traditionally had one single index created for the entire database, even though bibliographic databases usually cover an arbitrary group of domains of discourse. As an experiment, indexes derived from the language used within one single specialized domain of discourse, a subset of a database. This radical departure from traditional practice shows ignificant improvements in retrieval performance. The conclusion that performance is best within specific domains and deteriorates as the scope of the system expands to include additional domains is consistent with experience in artificial intelligence and in machine translation. Analysis has required the development of an operational measure of the performance of intermediaries. Several theoretical and practical questions arise.
Files in this item