1 19e journée RNDH - 21/09/2006 Panorama des outils de veille Joumana Boustany

1 19e journée RNDH - 21/09/2006 Panorama des outils de veille Joumana Boustany Maître de conférences Université Paris 5 – René Descartes Institut Universitaire de Technologie 19e journée RNDH - 21/09/2006 Aujourd’hui z Information abondante et diversifiée z Le domaine médical z vocabulaire spécifique z sources informelles limitées malgré un développement des sources purement Web : portails, newsletters, fils RSS… z Le Web invisible (bases de données structurées : articles de presse, brevets, thèses…) reste incontournable z Le domaine administratif français et européen z Administration très présente sur le Web z Chaque domaine ses spécificités 19e journée RNDH - 21/09/2006 Les agents intelligents z Automatisation des requêtes récurrentes z Autonomie z Auto-apprentissage Actuellement peu d’agents intelligents répondent à ces différents critères 19e journée RNDH - 21/09/2006 Panorama des outils (1) z Outils d’aide au sourcing (social bookmarking) z http://del.icio.us/ z Outils de collecte : z Agents de recherche (Copernic Agent) z Agents de surveillance (KB-Crawl, Website watcher, Copernic Tracker…) z Aspirateurs de sites (MemoWeb) 19e journée RNDH - 21/09/2006 Panorama des outils (2) z Outils d’analyse et de traitement de l’information z Techniques linguistiques (calcul des occurrences) z Syntaxiques et morphosyntaxiques (décomposition du texte et lemmatisation) z Sémantiques (associations de sens) z Outils de résumé de l’information z Copernic summerizer z Pertinence summarizer 19e journée RNDH - 21/09/2006 Panorama des outils (3) z Outils de classification et catégorisation z Reconnaissance et identification de concepts z Génération automatique de plans de classement (a posteriori) z Catégorisation selon un plan préétabli (a priori) z Outils d’extraction de connaissances (data ou text mining) z Permettent d’identifier les concepts et d’établir des relations entre ces éléments 2 19e journée RNDH - 21/09/2006 Panorama des outils (4) z Outils de cartographie z Pour visualiser les résultats d’un corpus et faire émerger des liens, des réseaux z Solutions intégrées qui traitent de tous les processus de veille : z collecte multi-sources et multi-bases z surveillance z catégorisation automatique z publication Les frontières entre ces différents types d’outils ne sont pas bien délimitées 19e journée RNDH - 21/09/2006 Quelques solutions z Arisem, Autonomy, Intuition, Go Albert z LexiQuest, Lingway, Temis z etc. Ces outils sont payants Pour choisir : Faire une analyse approfondie des besoins 19e journée RNDH - 21/09/2006 Faire de la veille à moindre coût z Les moteurs de recherche (Exalead, Google, Windows Live Search, Yahoo, etc.) z Les métachercheurs (Copernic, Vivisimo, etc.) z Les agents d’alerte z Les desktops z Les outils spécialisés z Les blogs et les fils RSS 19e journée RNDH - 21/09/2006 Pratiques et usages z En novembre 2002, 48% des internautes s'arrêtaient à la première page de résultats z En avril 2006, ils seraient 62%, soit une augmentation de 14% ! z Seuls 10% des internautes vont au-delà de la 3e page alors qu'ils étaient 19% il y a quatre ans... Source : Jupiter Research / iProspect 19e journée RNDH - 21/09/2006 Google (1) z Or blanc => Google ne verra que du blanc z Livret A => où est le A ? z Jeux de dés => mais où sont les dés ??? z evenement = événement = évènement ? z publicité ≠ publicités ? 19e journée RNDH - 21/09/2006 Google (2) z Le titre z intitle:drogue z intitle:drogue jeunes z allintitle: drogue jeunes z L’URL z inurl:drogue z inurl:drogue jeunes z allinurl: drogue jeunes 3 19e journée RNDH - 21/09/2006 Google (3) z Un diaporama z filetype:ppt dépenses santé France z Un document Word z drogue jeunes filetype:doc z z Un domaine et ou nom de domaine Un domaine et ou nom de domaine z z site: site:gouv.fr gouv.fr "santé publique" "santé publique" z z site: site:europa.eu europa.eu santé santé 19e journée RNDH - 21/09/2006 Exalead z Moteur de recherche francophone z Pas la même puissance que Google, mais des fonctionnalités spécifiques z Approximation phonétique z Lemmatisation z Troncature z Clustering : se fait par analyse statistique des termes les plus fréquemment associés à la requête z Phase de transition => nouvelle version 19e journée RNDH - 21/09/2006 Les métachercheurs clients z Recherche simultanée sur plusieurs outils de recherche (annuaires, moteurs, portails, bases de données…) z Paramétrage plus avancé que sur les métachercheurs en ligne z Copernic Agent : z vérification des liens, z téléchargement des résultats, z la version payante propose : z des fonctions de veille sur les pages et sur les mots-clés z des résumés automatiques 19e journée RNDH - 21/09/2006 Les agents d’alerte z Signalent les modifications à l’intérieur d’une page z Agents d’alerte en ligne Infominder http://www.infominder.com z Agents d’alerte « clients » z Website Watcher http://aignes.com z Kbcrawl http://www.beaconseil.com z Certains « aspirateurs de sites » font office d’agents d’alerte z Wysigot http://www.wysigot.com 19e journée RNDH - 21/09/2006 Les agents d’alerte : fonctions avancées z Limitation des alertes non pertinentes z Critères de modification avancés z nombre de phrases modifiées, z lien(s) modifié(s), z pourcentage de contenu modifié, z images, z page disparue z Extraction des modifications de données 19e journée RNDH - 21/09/2006 Alertes récurrentes z Google alertes z Service du moteur de recherche Google (bêta) z Permet d’effectuer une veille sur 4 critères: z Actualités z Web z Actualités & Web z Groupes z Envoie un mail à chaque fois qu’il y a une nouveauté z Nécessite la création d’un compte et d’une identification z Googlealert (indépendant de Google) z Yahoo alerts z etc. 4 19e journée RNDH - 21/09/2006 Les desktops z L’information produite en interne n’est pas à négliger dans un processus de veille z Les desktops sont des moteurs de recherche qui indexent le contenu de votre ordinateur z Exalead one desktop z Google desktop z Windows Desktop Search z Yahoo desktop z etc. z Pour des applications professionnelles (réseau) => Solutions payantes 19e journée RNDH - 21/09/2006 Les outils spécialisés z ChemFinder : chimie z Interroge des bases de données gratuites et payantes z Medhunt de Health on the net : permet de trouver des sites Web médicaux z Scirus : moteur de recherche scientifique z Sciseek : moteur de recherche scientifique z Google scholar : articles, conférences, etc. z Yahoo! Education : ouvrages de références 19e journée RNDH - 21/09/2006 Les blogs : un outil pour la veille ? z « Journal en ligne » sur Internet ou Intranet tenu par une ou plusieurs personnes z Possibilité d’insérer des liens, d’ajouter ses commentaires, ses points de vue, ses activités… z Suivi de l'évolution d'une idée, d'un thème de projet z Estimation : 40 à 60 millions de blogs dans le monde 19e journée RNDH - 21/09/2006 Intérêt des blogs z Collecte d’information sur des sujets émergents : R&D… z Identification d’experts, de passionnés d’un sujet z Exploitation des commentaires z Trackbacks (permet de relier des articles sur le même sujet postés dans des blogs différents) et permaliens (url permanente d’un billet sur le site) z Exploitation des blogrolls z Information catégorisée z Information datée z Accès aux archives 19e journée RNDH - 21/09/2006 Outils de recherche de blogs z Annuaire z 1001rss.com z RSS Network z Moteurs z Les moteurs généralistes : Google, Live.com, etc. z Les moteurs spécialisés : Icerocket, Technorati, etc. 19e journée RNDH - 21/09/2006 Syndication de contenu : les fils RSS z RSS : Really Simple Syndication ou Rich Site Summary z Format d’échange (XML) z Mode de diffusion z permet de publier des titres de nouvelles ou d'articles, exploitables dynamiquement par d'autres sites ou par des agrégateurs z Agent d’alerte z permet d’être alerté en permanence sur un domaine d’actualité ou sur les nouveautés apparaissant sur un site précis z nécessite un lecteur de fils RSS 5 19e journée RNDH - 21/09/2006 Les lecteurs de fils RSS z Lecteurs en ligne z Bloglines z Netvibes z etc. z Lecteurs clients z Feedreader z RSS bandit z Thunderbird z etc. Dans les deux cas, nécessité de s’abonner 19e journée RNDH - 21/09/2006 Fils RSS z Actualités z Le Figaro z Le monde z Libération z Administration (concours, etc.) z Service-public.fr z etc. z Europe z Europa z Législation z Assemblée nationale z Senat z Veille juridique z Droit Zoom 19e journée RNDH - 21/09/2006 Fils RSS z Brevets z Fresh Patents (catégorie médecine) z Revues scientifiques (anglais) z Electronic Journals z Médecine z Environmental Health Perspectives z PubMed => hubmed 19e journée RNDH - 21/09/2006 Avantages et inconvénients des fils RSS z Avantages z Gain de temps z Segmentation : possibilité de s’abonner à une rubrique spécifique d’un journal z Anonymat : contrairement à une liste de diffusion, il n’est pas nécessaire de s’identifier z Consultation aisée : identique aux mails z Inconvénients z Perte de temps si on ne sélectionne pas correctement nos sources z Redondance de l’information : cherchez la source z Validité de l’information : publication plus aisée, n’importe qui peut publier n’importe quoi 19e journée RNDH - 21/09/2006 Et demain ? z L’avenir des agents d’alerte : leur intégration dans des solutions logicielles z Les choix : agent logiciel ou plate-forme Web ? z L’évolution des normes uploads/Science et Technologie/ outils-veille.pdf

  • 25
  • 0
  • 0
Afficher les détails des licences
Licence et utilisation
Gratuit pour un usage personnel Attribution requise
Partager