H2PTM (1999) Charron
De H2PTM
BeFor (Beyond Forms)
|
- Résumé
- La quantité d'information disponible sur le World Wide Web ne cesse de croître chaque jour un peu plus. Aujourd'hui, un nombre de plus en plus grand de ces informations est stockée dans des bases de données accessibles à partir de formulaires d’interrogation. Les réponses fournies par tels systèmes sont des documents générés "à la volée" qui n'ont aucune réelle existence physique sur le serveur. Ils forment ce que nous appelons le "web invisible". Dans cet article, nous présentons une modélisation du processus de recherche d'information à travers de telles bases de données. Nous implémentons ce modèle grâce à un ensemble de descriptions XML du processus de recherche. Associé à une notre applications BeFor, ce modèle permet d'explorer le "web invisible" et de construire automatiquement des bases de données thématiques à partir de différents profils de recherche.
- Mots-clés
- World Wide Web, Internet, moteur de recherche, base de donnée, XML, interrogation automatique, extraction d'information, identification de la langue.
English description
- Abstract
- Access to on-line information via the Web is currently exploding. More and more of this information is stored in server's databases and is accessible via on-line forms. the whole set of this "on the fly" documents which doesn't have any physical existence on the server, forms the now well-known "invisible web". In this paper, we focus on HTML-based search and results presentations. we discuss the problem of automatically extracting information form on-line Web databses. we present a model and software architecture to describe and then easily exploit Web databases. We present also our researches on how to automatically extract knoledge about the so heterogeneous search engine querying working and results presentation.
- Key-words
- World Wide Web, Internet, search engine, on-line database, XML, automatic querying, information extraction, language identification.
… davantage au sujet de « H2PTM (1999) Charron »
BeFor (Beyond Forms) : Un modèle de représentation du Web invisible +