31 1 2MB
Ecole des Sciences de Gestion & d’Informatique privée Ouarzazate Autorisation N°……1/05/1/95……… Du... ..08/11/95………… Décision d’Accréditation... N°12/DFPP/D0602/23
Recherche et veille technologique.
ESGI cité de la résistance prés du lycée technique - Ouarzazate
Tel : 05 24 88 28 19
E-mail : [email protected]
Table des matières
I.
Qu’appelle-t-on objet de recherche ou objet de la recherche ?....................................3
Recherche et veille technologique. A.
Objet, problématique, question de recherche :.........................................................3
II.
Les objectifs :............................................................................................................... 3
III.
Les différents aspects à considérer dans la recherche.............................................3
A.
ASPECT 1 : Je cerne le sujet......................................................................................3
B.
ASPECT 2 : J’interroge des sources d’information :...................................................4
C.
ASPECT 3 : Je sélectionne des documents :..............................................................4
D.
ASPECT 4 : J’extrais des informations :.....................................................................4
E.
ASPECT 5 : Je traite les informations :......................................................................4
F.
ASPECT 6 : Je produis un travail :.............................................................................4
IV.
Sélectionner et consulter les sources de référence :................................................4
A.
Sélection des sources appropriées à la recherche :..................................................4 1.
Catalogues de bibliothèques :...............................................................................5
2.
Bases de données :............................................................................................... 5
3.
Index imprimés :................................................................................................... 5
4.
Web et Internet :................................................................................................... 6
B.
V.
Repérage rapide de l'information pertinente :..........................................................6 1.
Repérer les termes significatifs :...........................................................................6
2.
Repérer les mots clés............................................................................................ 6
Extraire l'information :................................................................................................. 6 A.
Interprétation juste de l'information :.......................................................................6
B.
Pertinence de l'information extraite :.......................................................................6
C.
La méthode de prise de note....................................................................................7
VI.
Définition de : « la veille »........................................................................................8
VII.
Différents types de « veille »....................................................................................8
VIII.
Définition de « la veille technologique »...................................................................9
IX.
Les objets de la veille technologique........................................................................9
X.
La veille : objectifs....................................................................................................... 9
XI.
Les produits de la veille :.......................................................................................... 9
A.
Livrables d’alerte :.................................................................................................... 9
B.
Livrables ponctuels :................................................................................................ 9 1.
La note d'information ou le compte rendu :..........................................................9
2.
L'étude, le dossier, le rapport de veille :...............................................................9
3.
Cartographie d'acteurs (mindmapping) :..............................................................9
4.
Sourcing book :..................................................................................................... 9
5.
Le rapport ou la note d'étonnement :.................................................................10
C.
Livrables réguliers :................................................................................................10 1.
Le bulletin de veille :........................................................................................... 10
2.
La lettre d'information :......................................................................................10
Réalisé par : M.BISBIS Mustapha.Page 2
Recherche et veille technologique. XII.
Les étapes de la veille :..........................................................................................10
A.
Pour une approche stratégique :............................................................................10 1.
● Le ciblage :....................................................................................................... 10
2.
● La récolte des informations :............................................................................10 a)
Les sources d’information :..............................................................................10
b)
b. Agents intelligents.......................................................................................11 (1)
i. Recherche d’informations......................................................................11
(2)
ii. Aspiration de sites................................................................................12
(3)
iii. Traitement des informations recueillies................................................12
(4)
iv. Veille.................................................................................................... 13
3.
● L’analyse des données :...................................................................................13
4.
● La diffusion des résultats :...............................................................................13
5.
●La capitalisation des informations :...................................................................13
XIII.
L'Information Scientifique et Technique ?...............................................................13
A.
Donc, le livrable de la veille....................................................................................14
B.
La veille à l'heure du 2.0........................................................................................14
C.
La veille à l'heure du 2.0...et du web social............................................................14
XIV.
La veille : accès à l’information :............................................................................14
A.
La méthode PUSH :................................................................................................. 14
B.
Veiller et surveiller : une typologie d'outils.............................................................15
C.
Un point sur : les flux RSS......................................................................................15
D.
RSS en « quelques » concepts................................................................................16
E.
STOP !!! Un point sur : « Je prends le temps d'analyser mon sujet »......................16
F.
« Définir », « défricher ».........................................................................................17
G.
Sourcing, veille et microblogging : monitoring.......................................................18
H.
Sourcing, veille et microblogging : les experts.......................................................18
XV.
Moteurs de recherche et IST (Information Scientifique et Technique).....................19
XVI.
Votre veille sous Scopus : 4 méthodes...................................................................19
XVII.
Capitaliser : base de connaissance et bibliographique...........................................19
Réalisé par : M.BISBIS Mustapha.Page 3
Recherche et veille technologique. I
Qu’appelle-t-on objet de recherche ou objet de la recherche ? Un processus de recherche se définit comme une construction plus ou moins itérative (habituelle) (par exemple des allers et retours entre terrains et théories) orientée vers des objectifs à définir clairement. De manière très générale, tout processus de recherche est constitué d’un certain nombre de composantes et d’étapes et qui s'étale de la formulation d'une première intuition à la rédaction/publication d'un document soumis à la critique. A. Objet, problématique, question de recherche : Un projet de recherche constitue un système permettant de passer d’une intention générale à des éléments de réponse. L’objet de la recherche ou encore « research topic » est la question générale « qu’est-ce que je cherche ? ». S’expriment aussi plus classiquement, sous le terme de problématique. L’objet de la recherche est donc un élément clef du processus de recherche qui va réaliser le projet du chercheur. Naturellement, il orientera sa recherche de littérature, son plan de recherche et la méthodologie suivie. L’objet de recherche est donc souvent le fruit d’allers et retours, soit entre terrain et théories, soit entre théories et terrain de telle manière que la définition de l’objet évolue jusqu’à se fixer plus définitivement. II. Les objectifs : L’objectif d’une recherche se divise en deux parties: l’objectif général concerne la contribution que les chercheurs espèrent apporter en étudiant un problème donné; les objectifs opérationnels concernent les activités que les chercheurs comptent mener en vue d’atteindre l’objectif général. Les exemples donnés plus loin vous aideront à bien distinguer les deux types d’objectifs. Marche à suivre : 1. Définissez votre problème de recherche. 2. Énoncez la question de recherche (objet ; problématique). 3. Décidez du type de recherche à entreprendre. 4. Définissez les objectifs de la recherche. 5. Formulez l’hypothèse de recherche en fonction du type retenu. 6. Déterminez les moyens de vérification (confirmation, invalidation) de l’hypothèse. Exemple : Il ne faut pas confondre l’hypothèse de recherche et les objectifs de recherche. Voici deux exemples de description des objectifs et de l’hypothèse d’une recherche. 1) Recherche empirique quantitative Objectif général Trouver le rapport qui existe entre la scolarisation et la capacité d’assimiler de nouvelles connaissances en informatique. Objectifs opérationnels 1. Constituer des groupes expérimentaux selon les années de scolarité. 2. Soumettre les sujets à un apprentissage d’une durée de cinq heures des caractéristiques d’un nouveau logiciel dans des conditions identiques pour tous les groupes. 3. Mesurer objectivement les apprentissages accomplis à l’aide d’un examen pratique et d’un examen théorique. 4. Comparer les performances des groupes. Hypothèse Toutes les autres choses étant égales par ailleurs, les personnes ayant le taux de scolarisation le plus élevé devraient apprendre d’une manière significativement plus rapide et plus approfondie les caractéristiques du nouveau logiciel. 2) Recherche empirique qualitative Objectif général Établir la cause du conflit dans le service X de l’entreprise Y. Objectifs opérationnels
Réalisé par : M.BISBIS Mustapha.Page 4
Recherche et veille technologique. 1. Rencontrer le directeur des ressources humaines de l’entreprise en vue d’obtenir une description du problème. 2. Faire des entrevues individuelles en profondeur avec les personnes du service concerné. 3. Rencontrer les responsables des autres services qui ont à travailler avec les personnes du service étudié. 4. Rencontrer le représentant du syndicat des salariés. Hypothèse L’entreprise Y a des problèmes de fonctionnement au sein du service X en raison du faible sentiment d’appartenance des salariés à leur entreprise. III. Les différents aspects à considérer dans la recherche : A. ASPECT 1 : Je cerne le sujet : • Je comprends la nature, les objectifs et l'étendue du travail à exécuter. • Je précise la question de recherche. • Je dégage les idées importantes et les mots-clés. • Je détermine l'angle sous lequel je vais aborder mon sujet. • Je formule mon idée directrice. • J'esquisse un plan provisoire. • Je réfléchis aux ressources dont j'aurai besoin. • Je planifie mon travail. B. ASPECT 2 : J’interroge des sources d’information : • Je choisis les ressources dans lesquelles faire ma recherche. • Je construis des équations de recherche à partir de mes mots-clés. • Je commence la recherche à l'aide de mes mots-clés à la bibliothèque, sur Internet. • Je juge de l'efficacité de mes équations de recherche et je les ajuste au besoin. • Je repère les documents et les ressources qui me semblent pertinents. • J'échange et je partage des idées avec différents interlocuteurs. C. ASPECT 3 : Je sélectionne des documents : • J'organise les documents que j'ai retenus. • J'évalue la qualité de l'information selon des critères posés. • J'examine différents points de vue. • J'identifie les éléments d'information nécessaires à mon travail. • Je note la référence et les caractéristiques des documents retenus. D. ASPECT 4 : J’extrais des informations : • Je lis, j'écoute, je visionne attentivement et je prends des notes. • J'indique mes sources d'information et je respecte les règles de la vie privée. • J'organise mes notes de manière cohérente et j'ajuste mon plan provisoire. • Je fais le point sur ma progression et je reprends une étape au besoin. E. ASPECT 5 : Je traite les informations : • J'analyse les informations prélevées au regard de la question de recherche. • J'envisage différentes solutions permettant de traiter mon sujet. • Je synthétise les idées et les informations provenant de sources variées. • Je confronte des opinions et je construis la mienne selon l'objectif du travail. • Je confirme ou je reformule mon idée directrice. • Je réfléchis à l'organisation de l'ensemble de ma production. F. ASPECT 6 : Je produis un travail : • Je construis mon travail en fonction de mes objectifs et du public-cible. • J'exprime mon opinion si l'objectif du travail le demande. • Je m'assure que le contenu de ma production est cohérent. • Je révise la qualité de la langue. • Je vérifie si j'ai respecté les consignes. • Je gère le matériel et les appareils dont je peux avoir besoin.
Réalisé par : M.BISBIS Mustapha.Page 5
Recherche et veille technologique. IV. Sélectionner et consulter les sources de référence : A. Sélection des sources appropriées à la recherche : On peut avoir besoin, pour effectuer sa recherche, de monographies (études), d'articles de périodiques ou de journaux, de thèses, de statistiques, de publications gouvernementales, d'images, etc. Il faudra alors consulter différents outils de repérage qui permettront de trouver les sources disponibles les plus appropriées (justes).
En fonction du sujet de ma recherche, je décide vers quels outils et quelles sources d'information récentes dois-je me diriger. 1. Catalogues de bibliothèques : Un catalogue de bibliothèque est la liste descriptive des documents que possède cette bibliothèque : livres, périodiques, publications gouvernementales, documentation audiovisuelle, mémoires, thèses, rapports, etc. Il permet de : • Vérifier la disponibilité des documents. • De repérer des documents par auteur, titre, sujet, etc. Les catalogues de bibliothèques sont généralement automatisés et accessibles par Internet. Ils sont alors considérés comme des bases de données. Ils présentent plusieurs avantages qui les rendent indispensables à consulter : • La disponibilité de la documentation : Toutes les ressources locales quel qu'en soit le format (imprimé, électronique ou autre) ou le moment de parution (documentation ancienne et récente) peuvent être repérables dans le catalogue. • La qualité des ressources : Les professionnels en choisissant la documentation s'assurent que le choix soit fait en fonction de sa valeur, de sa pertinence et de son utilité. • La facilité du repérage : Les ressources de la bibliothèque sont classées par sujet sur les rayons. Le fait de retrouver un document pertinent sur les rayons permet donc d'en repérer d'autres classés à côté sur le même sujet. 2. Bases de données : Les bases de données organisent et structurent l'information dans le but d'en faciliter le repérage. On note différents types de bases de données : •Bases de données bibliographiques. • Bases de données numériques. • Banques d'images. • etc. 1. Bases de données bibliographiques : Les articles de périodiques ou de journaux, les textes de conférences, les comptes rendus de livres, les chapitres de livres, etc. ne sont pas repérables dans les catalogues de bibliothèques. Ils sont signalés dans des outils spécifiques appelés index et abstracts (répertoires de résumés) qui se présentent sous forme de bases de données, d'index imprimés ou parfois sous les deux formes. • Elles permettent de repérer des références à des documents, souvent à des articles de périodiques. • Elles donnent souvent un résumé des documents. Ce sont, dans bien des cas, les équivalents des index et «abstracts» imprimés. • Dans certains cas, on y retrouve, en plus de leur signalement, le texte des documents. 2. Bases de données numériques : Les bases de données numériques donnent accès à des informations numériques telles que : • Des données de recensement (statistiques), • Des données démographiques. • Des données d'enquête (recherche). • Des données financières. • Des ratios (pourcentages) et des indicateurs économiques. Etc. 3. Banques d'images :
Réalisé par : M.BISBIS Mustapha.Page 6
Recherche et veille technologique. On peut repérer dans ces banques : • Des images. • Des illustrations. • Des icônes. • Des représentations graphiques. • Des reproductions d'œuvres d'art et d'architecture. • Des collections muséologiques. • Etc. 3. Index imprimés : Les index imprimés permettent de repérer, en général par auteur ou par sujet, différents documents dont des articles de périodiques. Ils fournissent : • Soit la référence aux documents. • Soit la référence et un résumé des documents. On parle alors de répertoires de résumés (ou «abstracts»). Les bibliothèques remplacent de plus en plus leurs abonnements aux index imprimés par des abonnements à des versions électroniques. 4. Web et Internet : Internet, créé en 1969, a d'abord été un système de transmission de données militaires aux Etats-Unis qui a ensuite été utilisé par des universités et des établissements de recherche en Amérique du Nord, puis dans le monde entier. Internet est un réseau informatique mondial constitué d'un ensemble de réseaux nationaux, régionaux et privés, qui coopèrent pour offrir une interface unique à leurs utilisateurs. C'est un moyen d'accès à des ressources de toutes sortes, un moyen de communication et un lieu d'échange. Internet est devenu beaucoup plus accessible et convivial grâce à l'invention du Web, en 1989. Le Web est l'un des services d'Internet. B. Repérage rapide de l'information pertinente : 1. Repérer les termes significatifs : Il existe plusieurs outils documentaires pour choisir les termes significatifs. L’index ou le lexique de descripteurs (on parle également de mots-clefs) : ce sont des listes alphabétiques de termes contrôlés. Le documentaliste-indexeur tirera de cette liste les descripteurs qui reflètent (représentent) le mieux les concepts de l'article. Si les descripteurs sont organisés de manière hiérarchique (terme générique décliné en plusieurs termes spécifiques) avec des renvois d'équivalence -synonyme de-et d’association, on parle de thésaurus.
On parle alors de recherche en langage contrôlé, en opposition à la notion de recherche en langage libre ou mot libre ou texte libre. La recherche en langage libre utilise les mots du langage courant et sert à interroger les champs Titre et Résumé. Et cela grâce à des logiciels d'indexation automatique de type plein texte (full text) qui travaillent principalement au niveau de la forme en retenant les chaînes de caractères séparées par des espaces à l'exception des mots vides (c'est-à-dire des mots sans signification propre comme les articles définis et indéfinis) qui constituent ainsi des index de termes non contrôlés. On peut donc effectuer une recherche bibliographique en utilisant les descripteurs d'un langage contrôlé et en complétant la recherche par une requête en mot libre.
Réalisé par : M.BISBIS Mustapha.Page 7
Recherche et veille technologique. 2. Repérer les mots clés : Le repérage de mots-clefs consiste à détecter des mots qui apportent de l’information pertinente relativement à un domaine particulier. Cette tâche est une étape charnière pour beaucoup d’applications du Traitement Automatique de la Langue (TAL) telles que l’extraction d’information et la génération automatique de résumé. V. Extraire l'information : A. Interprétation juste de l'information : L'information est d'un usage très personnel : il doit y avoir un intérêt pour le récepteur du message, interprétation de la donnée à travers un modèle : Information = Donnée(s) + Modèle d'interprétation. L'information est comprise comme une donnée signifiante pour un individu et ne peut plus être définie indépendamment de son utilisateur. La pertinence (ou niveau d'intérêt de l'information) dépend du sens qui émerge (présente) des relations entre les données et le modèle de l'utilisateur, au regard d'une discipline particulière. Une même donnée peut conduire à plusieurs informations selon le sujet, le contexte. B. Pertinence de l'information extraite : La nécessité d’identifier, d’évaluer la qualité et la pertinence de l’information n'est pas nouvelle : elle est au fondement de la recherche documentaire. Le choix des documents à lire doit se faire non seulement en fonction de leur qualité mais aussi en fonction de leur pertinence par rapport au travail à réaliser. On peut se faire une idée du contenu du document et en évaluer l'information de plusieurs manières : 1. Exploration rapide : Pour évaluer la pertinence du document, il n'est pas nécessaire de lire tout le document. Une exploration rapide suffit. Se faire une idée du contenu du document. 2. Titre du document : Le titre est un élément important dont il faut tenir compte. 3. Résumé (abstract). 4. Information bien structurée : La table des matières permet de mieux apprécier le contenu (plan et logique de l'argumentation) et de bien repérer les chapitres qui peuvent être pertinents. L'index donne un aperçu des notions abordées et de leur importance relative dans le document. 5. Tableaux, graphiques, etc : Ils peuvent aider à la compréhension du sujet et être utiles pour le travail. C. La méthode de prise de note : Prendre des notes, c'est «économiser», c'est «inventer», ça consiste à écrire l'essentiel avec un maximum de rapidité. Donc, la recherche de l'efficacité, c'est à dire de l'économie, est primordiale ! Les exemples qu'on trouvera ci-après ne sont là que pour suggérer des pistes... d'invention. On recourt à divers procédés, parmi lesquels : • des signes.
Réalisé par : M.BISBIS Mustapha.Page 8
Recherche et veille technologique.
• Des abréviations.
• La suppression de mots. Supprimer tout ce qui n'est pas indispensable à la compréhension. Ce qu'on peut supprimer : • Tous les articles. • Tous les verbes dont la disparition ne gêne pas la compréhension (ex. : "être"). • Tous les éléments de commentaire, de digression (parenthèses), non indispensables à la compréhension de l'ensemble. • Etc. • la nominalisation. La nominalisation est un procédé lexical qui consiste à tirer d'un verbe un nom de même famille (ou, quand le nom de même famille n'existe pas, un nom correspondant par son sens à ce verbe) Ex : réparer réparation VI. Définition de : « la veille » « Activité continue et en grande partie itérative visant à une surveillance active de l'environnement technologique, commercial, etc., pour en anticiper (prévoir) les évolutions ». « Il s’agit donc d’un outil de recherche et de développement. »
Réalisé par : M.BISBIS Mustapha.Page 9
Recherche et veille technologique. VII.
Différents types de « veille »
VIII. Définition de « la veille technologique » : « L'activité mise en œuvre par l'entreprise pour suivre les évolutions technologiques susceptibles d'influer sur le devenir de son métier». «La veille technologique consiste à mettre en œuvre de façon systématique les moyens nécessaires au sein de l’entreprise pour collecter, analyser et transmettre l'information technologique afin de décider d’anticiper les évolutions et d’en déduire des opportunités (conditions) de développement.» « La veille technologique s’appuie sur l’observation et l’analyse de l’information scientifique, technique et technologi-que et de son impact sur l’environnement économique, commercial et financier dans le but de détecter les menaces et saisir les opportunités de développement ». «Elle consiste à collecter les informations permettant d’anticiper les innovations technologiques, à repérer la ou les technique(s) ou technologie(s) mise(s) en œuvre par ses clients, fournisseurs, partenaires et concurrents et à surveiller les menaces technologiques émergentes».
Réalisé par : M.BISBIS Mustapha.Page 10
Recherche et veille technologique. IX. Les objets de la veille technologique : ● Acquis scientifiques et techniques, issus de la recherche fondamentale + appliquée. ● Produits, design et procédés de fabrication. ●Matériaux, filières. ●Système d'information, prestations (soutiens) de service. X. La veille : objectifs ● Faciliter l'identification des ressources pertinentes (justes). ● Maintenir un flux régulier d’informations dans son domaine / actualiser ses informations. ● Déceler (repérer) les évolutions du domaine étudié. ● Continuer à être informé de nouvelles parutions (publications) pertinentes après une recherche documentaire. ● Gagner du temps. XI. Les produits de la veille : Les produits de veille sont des documents émis périodiquement ou à la demande qui font la synthèse des recherches ponctuelles ou régulières sur des thèmes selon les besoins d’un groupe d’utilisateurs. Il est proposé de distinguer les produits de veille en trois types de livrables : les livrables d’alerte, les livrables ponctuels et enfin les livrables réguliers. A. Livrables d’alerte : Les livrables d’alerte sont réalisés au coup par coup, en fonction de l’urgence de l’information à transmettre, ils ne sont efficaces que bien ciblés et correspondent réellement à un besoin stratégique. Dans le cadre d’une veille sur Internet, la forme la plus élémentaire du livrable d’alerte est le message électronique comportant un lien vers l’information sur laquelle porte l’alerte (page internet, document source, etc.) B. Livrables ponctuels : Les livrables ponctuels correspondent à des besoins d'informations qui ne sont pas réguliers et sont le plus souvent Réalisés sur demande, ou en amont d'un besoin spécifique : 1. La note d'information ou le compte rendu : La note d’information ou le compte rendu sont réalisés après un voyage d'étude, une visite d'entreprise, une rencontre. Il s'agit là de formaliser rapidement des informations qui seraient potentiellement stratégiques afin qu'elles puissent être diffusées. 2. L'étude, le dossier, le rapport de veille : L’étude, le dossier et le rapport de veille correspondant à un besoin d'information précis. Il s'agit le plus souvent d'une synthèse d'informations spécifiques recherchées en fonction d'un but précis. A l'inverse de la recherche documentaire classique, il s'agit moins d'un état de l'art que d'un focus sur quelques angles particuliers. 3. Cartographie d'acteurs (mind mapping) : Une cartographie d’acteurs permet de visualiser rapidement l’environnement d’une entreprise ou d’un sujet traité et de situer des sources les unes par rapport aux autres. 4. Sourcing book : Le sourcing book répertorie les sources de référence qualifiées et partagées par une communauté œuvrant dans le même domaine ou concerné par le même métier. Il peut venir en complément d’une cartographie.
Réalisé par : M.BISBIS Mustapha.Page 11
Recherche et veille technologique. 5. Le rapport ou la note d'étonnement : Après un salon, une visite, un voyage il peut être utile de consigner tout ce qui a pu sembler "étonnant", ce qui pose question. L'objectif de ce type de produits est d'être ensuite diffusé puis discuté en réunions afin de faire émerger des signaux intéressants. Les notes d’étonnement sont source de confrontation des points de vue sur les prochains enjeux de l’entreprise. Les échanges doivent déboucher sur des actions à entreprendre (contacts à prendre, études à lancer…). Les notes peuvent être enrichies progressivement par les commentaires de chacun des acteurs. L’existence d’un Intranet peut jouer un rôle utile en diffusant automatiquement l’information vers les personnes associées aux projets. C. Livrables réguliers : Ils ressemblent plus aux produits documentaires classiques de diffusion régulière d'information. Il s'agit-là plutôt de veille documentaire : 1. Le bulletin de veille : Un bulletin de veille est un document émis régulièrement, en général tous les mois, qui fait la synthèse des recherches ponctuelles ou suivies sur des thèmes. 2. La lettre d'information : Une lettre d'information permet, par exemple, de recevoir directement dans sa boîte de messagerie électronique des informations sur des dossiers d'actualité, sur les activités de l’entreprise, etc. Le format des informations présentées doit être court (brèves) le destinataire étant dirigé vers des pages plus complètes sur Internet (ou Intranet de l’entreprise). La fréquence de diffusion d'une lettre d'information est variable (quotidienne, hebdomadaire, mensuelle, etc.) selon la nature de l'information. XII. Les étapes de la veille :
A. Pour une approche stratégique : 1. ● Le ciblage : Définir les thèmes étudiés et les sources à utiliser. 2. ● La récolte des informations : Utiliser les bons outils. a) Les sources d’information : Face à l’énormité exponentielle du web devenu la première source d’information mondiale, ’internaute qui désire obtenir la réponse à une question peut recourir à différents outils ; on distingue entre annuaires, moteurs de recherche, méta moteurs et agents « intelligents ». Définition des outils de recherche à utiliser : 4
Réalisé par : M.BISBIS Mustapha.Page 12
Recherche et veille technologique. 1) Les annuaires : Recensent selon une arborescence souvent complexe de catégories et de sous-catégories les sites Internet qui leur sont soumis (par leur auteur ou leur propriétaire, le plus souvent) ; leur fonctionnement repose sur une déclaration préalable, associée le plus souvent à une validation qui peut faire intervenir de façon aléatoire ou systématique un agent humain. On peut citer Yahoo!, Voilà, Nomade ou encore Lycos. Nomade www.nomade.tiscali.fr parmi les résultats "catégories de l'annuaire" Yahoo fr.yahoo.com parmi les résultats, onglet "guide web" Lycos www.recherche.lycos.fr/annuaire/ rechercher des rubriques dans l'annuaire 2) Les moteurs de recherche : Fonctionnent différemment : ils commencent par constituer un index de pages Internet (et non de sites) ; les auteurs peuvent soumettre leurs pages pour inscription dans cet index, mais la grande masse en est récupérée de façon automatique, à l’aide d’un robot (un logiciel) qui suit et analyse les liens rencontrés dans les pages et navigue ainsi de l’une à l’autre. Une copie de ces pages est stockée sur des serveurs dédiés (le chiffre exact est tenu secret, mais on estime dans le cas de Google à plus de 15 000 le nombre de PC permettant de faire tourner ce « cache »). Lorsque l’internaute tape ensuite un mot dans la zone de saisie, un programme l’analyse sommairement (reconnaissance de la langue d’origine, filtre orthographique), puis parcourt les pages ainsi stockées à sa recherche. Ce sont les résultats de cette recherche, classés selon une méthode que nous verrons plus loin, qui sont présentés à l’internaute, avec l’adresse de la page correspondante ainsi qu’un extrait du contexte dans lequel le mot apparaît au sein de la page. La quantité de pages examinées est beaucoup plus importante que dans le cas des annuaires. � La recherche se fonde pour l’essentiel sur le contenu des pages, et non sur le résumé d’un site fourni par son auteur. Trier les résultats : �� Chaque requête via un moteur de recherche pouvant produire une quantité énorme de résultats, il est bien entendu nécessaire de les trier avant de les présenter à l’internaute. C’est précisément sur la pertinence de ce tri que Google a assuré son succès rapide au début des années 2000. Trier les résultats : � Pour étudier la pertinence d’une page rapportée au mot-clé recherché, les moteurs se fondent d’abord sur le contenu de la page et sa structure : � le mot est-il présent dans le titre de la page ? � Dans la page elle-même ? À quelle fréquence ? � Apparaît-il rapidement ou plus loin au sein du document ? � Apparaît-il dans les balises (ces zones dont le contenu n’est pas affiché lors de la consultation par l’internaute mais qui permettent de renseigner les moteurs : description de la page, motsclés de la page, etc.) ? � Apparaît-il dans l’adresse da la page ? � Dans les liens conduisant vers cette page ? b) Agents intelligents Comme nous l’avons vu précédemment (cf. II. p.11), il n’existe pas de définition universelle de ce qu’est un agent intelligent. Le problème se retrouve avec les agents eux-mêmes. En effet, aucune source
Réalisé par : M.BISBIS Mustapha.Page 13
Recherche et veille technologique. d’information ne s’accorde sur les différents types d’agents intelligents qui existent. Par exemple, Sandrine Royer [50], étudiante du DESS l’an passé, et qui a approfondi le sujet, regroupe les agents intelligents de recherche d’information et de cartographie sur Internet en cinq catégories : · les aspirateurs de sites · les méta-moteurs "évolués" · les "Super" méta-moteurs · les logiciels de cartographie des résultats · les logiciels de Veille économique et de partage des connaissances. Carlo Revelli [49] définit quant à lui deux types d’agents : · les agents pour la recherche d’informations (qui semblent regrouper les aspirateurs, les méta-moteurs, les logiciels de cartographie et les logiciels de partage des connaissances de Sandrine Royer) · les agents pour la veille (qui sont en fait les logiciels de Veille économique évoqués par Sandrine Royer). Afin de pouvoir classer les différents agents intelligents commercialisés, j’ai donc choisi de définir quatre catégories, correspondant aux quatre fonctionnalités que l’on retrouve chez les agents. (1) i. Recherche d’informations Cette première fonctionnalité se décompose en deux parties : · Les sources interrogées. Un agent peut, tel un métamoteur de recherche (cf. II.2.a.iii. p.13), interroger des annuaires, des moteurs de recherche, des bases de données, généralistes ou sectoriels. Il est parfois possible de rajouter des sources, en libre accès ou payantes. Dans ce dernier cas, l’agent utilise le login et mot de passe donnés par l’utilisateur, ou permet à la source de reconnaître l’adresse IP [*]. Le nombre de sources interrogées simultanément peut largement dépasser 500. · La requête. Pour aider l’utilisateur dans sa requête, ou augmenter la pertinence des informations recueillies, un agent peut posséder des fonctionnalités particulières : - un correcteur d’orthographe - un thésaurus (afin de définir des mots associés aux termes de la requête) - la possibilité de choisir la bonne signification d’un mot (ex : avocat (juriste ou fruit)) - la possibilité d’affiner la requête - le multilinguisme (traduction automatique de la requête en plusieurs langues) Choix d’un agent intelligent et mise en place d’une application push. La plupart des agents permettent une recherche en utilisant des opérateurs booléens (ET, OU), de proximité (NEAR), ou d’exclusion (SAUF). L’utilisation des parenthèses, guillemets, troncatures, … est variable. A ces deux groupes d’options s’en ajoutent d’autres, plus ou moins intéressantes : · Exploration des liens à partir d’une URL [*] donnée (dans le but de trouver des pages ignorées par les moteurs) · historique des recherches avec leurs paramètres · création de divers agents de recherche personnalisés · mémorisation des habitudes de l’utilisateur
Réalisé par : M.BISBIS Mustapha.Page 14
Recherche et veille technologique. · lancement de plusieurs requêtes simultanément · arrêt de la recherche avant qu’elle ne soit terminée. (2) ii. Aspiration de sites L’aspiration correspond à une copie de pages web sur un ordinateur en local. Elle permet ainsi une consultation off-line de ces pages (d’où une diminution du temps de connexion, et une augmentation de la vitesse de navigation). Ce "téléchargement" peut proposer plusieurs options : · choix de la profondeur On appelle "profondeur" le niveau d’une page web sur un site : le niveau 0 correspond à la page à partir de laquelle on commence le téléchargement. Par exemple, en choisissant une profondeur de 1 et en commençant l’aspiration à partir de la page http://www.pharmalicensing.com/, on récupérera les pages : - http://www.pharmalicensing.com/news - http://www.pharmalicensing.com/events - etc… Il faut choisir une profondeur suffisamment importante si on souhaite copier un site en entier. · limitation de l’espace-disque utilisé En effet, un site copié occupe beaucoup de place sur le disque dur. Il est donc conseillé de demander à interrompre l’aspiration quand un certain espace est utilisé. · respect ou non de la présence des frames [*] · importation de fichiers bookmarks [*] · lancement de plusieurs aspirations simultanément. Que l’utilisateur automatise les téléchargements, ou qu’il les lance manuellement, il possède toujours en local la dernière version de chaque page web. (3) iii. Traitement des informations recueillies Après avoir effectué une recherche, ou aspiré des pages web, l’utilisateur se retrouve avec un corpus d’informations brutes, qu’il est possible de remanier. J’ai choisi de décomposer le "traitement" en cinq parties. · Filtrage des résultats. Cette opération permet d’éliminer une partie des informations recueillies mais indésirables, c’est-à-dire d’augmenter la pertinence des résultats. Il y a plusieurs possibilités : - élimination des doublons - élimination des liens non valides - élimination de certaines URL, de certains noms de domaines [*] - élimination de certains formats (image, son, vidéo, …) - élimination des documents ne contenant pas un mot-clé prédéfini. Choix d’un agent intelligent et mise en place d’une application push. · Présentation des résultats. L’utilisateur peut souvent la personnaliser en choisissant les indications qu’il souhaite connaître pour chacun des résultats : - titre - description (souvent la première phrase) - URL - moteur de recherche utilisé
Réalisé par : M.BISBIS Mustapha.Page 15
Recherche et veille technologique. - taux de pertinence, etc… · Gestion des résultats. Cet aspect est classique mais néanmoins indispensable. Pour pouvoir réutiliser ultérieurement les informations recueillies, il est pratique de pouvoir les sauvegarder, sous forme de bases de données (en format HTML, PDF, …) ou de fichiers HTML de bookmarks. · Consultation des résultats et recherche. L’utilisateur peut souvent consulter les premiers résultats alors que la recherche n’est pas terminée. Une recherche parmi les résultats (ou dans une base de données construite à partir des ces résultats) permet d’accéder directement à une information précise. Les options sont généralement les mêmes que pour la requête initiale. · Analyse des résultats. Afin de donner de la valeur ajoutée aux informations recueillies, l’agent permet parfois d’en faire une analyse. Elle peut être de deux types : - sémantique et statistique L’agent, par exemple, indexe chaque résultat dans le but de pouvoir le retrouver plus facilement ensuite. Il peut aussi générer des résumés, par extraction de passages pertinents, ou en analysant statistiquement le contenu du document. Une autre option intéressante est la clustérisation, qui permet par exemple de mettre en évidence des associations de motsclés. - cartographique Dans ce cas, l’agent construit des "cartes" de relation entre les différents sites, ou entre les termes présents dans les documents. (4) iv. Veille Par le terme de "veille", on parle de "surveillance". L’AFNOR (Association Française de NORmalisation), par exemple, la définit en 1998 comme une : "activité continue et en grande partie itérative visant à une surveillance active de l'environnement technologique, commercial, etc., pour en anticiper les évolutions." Ainsi, la fonction de veille des agents correspond en fait à une automatisation de tâches répétitives : · Recherches. · Mise à jour des sources utilisées. · Mise à jour des résultats. · La veille de sites : - Téléchargement régulier ou surveillance des modifications. - Alerte (e-mail ou autre) dès que le site a changé, qu’un nouveau mot est apparu, etc… - Mise en évidence des modifications. Bien que l’on parle ici de téléchargement, c’est-à-dire d’aspiration, j’ai choisi de séparer cette fonctionnalité de celle de veille. En effet, certains aspirateurs n’offrent aucune autre option que celle d’avoir une copie d’un site en local. Choix d’un agent intelligent et mise en place d’une application push. Cette fonction induit de pouvoir choisir la périodicité à laquelle la veille sera effectuée. Les options de push entrent aussi dans cette catégorie.
Réalisé par : M.BISBIS Mustapha.Page 16
Recherche et veille technologique. 3. ● L’analyse des données : Collecter uniquement ce qui est utile en excluant les données non fiables (confiantes) et non pertinentes. 4. ● La diffusion des résultats : De la veille pour valoriser (on la gestion / conservation / partage). Une fois l’information collectée et traitée, elle doit circuler et être diffusée aux utilisateurs potentiels. A ce stade du processus de veille quatre questions se posent aux responsables de la surveillance : à qui diffuser ?, à quel moment ? , comment ?, au moyen de quels canaux de communication ? Comment éviter les freins à la circulation et à la diffusion de l’information ? 5. ●La capitalisation des informations : Sous le terme « capitalisation », il est souvent question du stockage des informations issues de la veille. Le stockage consiste à conserver les informations brutes récoltées dans la phase de recherche et de collecte et les connaissances issues du traitement de l’information. Le stock ainsi construit permet aux utilisateurs d’accéder à l’information dont ils ont besoin à un instant donné. Humbert Lesca aborde la question du stockage sous trois angles d’approche : la localisation du stockage (au sein de la cellule de veille), l’accès aux informations stockées, les supports de stockage (de plus en plus souvent support électronique), et l’importance du facteur temps dans le stockage de l’information. XIII. L'Information Scientifique et Technique ? « L'information scientifique et technique (IST) regroupe l'ensemble des informations produites par la recherche et nécessaires à l'activité scientifique comme à l'industrie » Et donc, l'IST...
A. Donc, le livrable de la veille... ● Contextualisation du rapport, c'est-à-dire tenir compte du contexte (pour qui veiller vous et analyser vous). ● Clarté et concision. ● Neutralité et distanciation. ● Données chiffrées, noms des acteurs clés et affiliations,dates et périodes, etc., à mettre en avant ● Citer ses sources (section « Références », « Bibliographie », etc.)
Réalisé par : M.BISBIS Mustapha.Page 17
Recherche et veille technologique. B.
La veille à l'heure du 2.0
C.
La veille à l'heure du 2.0...et du web social
XIV. La veille : accès à l’information : Deux « méthodes » : ● PULL : l’usager va chercher l’information (recherche précise mais qui demande du temps). → Historiques de recherche, signets web, consultation de sommaires de revues, personnes ressources... ● PUSH : l’information vient à l’usager (gain de temps mais risque de surabondance (excès) de l'information) → Profils et alertes par e-mail, fils rss... A. La méthode PUSH : Elle apporte de manière directe et automatique des informations en fonction de critères préétablis. Différents outils peuvent être utilisés : ● Bulletins d’informations, newsletters électroniques. ● Listes de discussion. ● Fils d’informations grâce aux flux RSS rassemblés dans des agrégateurs (Netvibes, Google Reader…) ● Services d’alertes par envoi de courriels (Google Alerts) ● Outils de monitoring qui scrutent (examine), à intervalles définis, les sites web sélectionnés et signalent les changements intervenus (Wysigot Light,WebSite-Watcher, Update Scanner....) Veiller et surveiller : « RSS's alive, ALIVE ! » :
Réalisé par : M.BISBIS Mustapha.Page 18
Recherche et veille technologique.
B.
Veiller et surveiller : une typologie d'outils
C. Un point sur : les flux RSS Atouts (1) : Agréger (integrer) votre information
Atouts (2) : Consulter rapidement :
Réalisé par : M.BISBIS Mustapha.Page 19
Recherche et veille technologique.
D. RSS en « quelques » concepts Push. Abonnement. Flux. Mises à jour. Contenu (...déconnecté de la forme) Syndication (...de contenus) Agrégation (...de contenus) Un acronyme, plusieurs formats : « Realy Simply Syndiction » « RDF (Ressources Discovery Framework) Site Summary » « Rich Site Summary » => Un format de flux de syndication (autre : Atom). E. STOP !!! Un point sur : « Je prends le temps d'analyser mon sujet » ● Définir les termes. ● Défricher(éclaircir) le sujet. ● Trouver des termes associés. ● Traduire mes termes ? ● Construire une requête. F. « Définir », « défricher »...
Réalisé par : M.BISBIS Mustapha.Page 20
Recherche et veille technologique. « Traduire » (des termes techniques)...
« Construire une requête »... Exemple : Par 104 (2011) « Étude du descellement des prothèses de cheville » ->
Brevets : 80 % de l'information technique
Réalisé par : M.BISBIS Mustapha.Page 21
Recherche et veille technologique. G.
Sourcing, veille et microblogging : monitoring
H.
Sourcing, veille et microblogging : les experts
XV.
Moteurs de recherche et IST (Information Scientifique et Technique).
Réalisé par : M.BISBIS Mustapha.Page 22
Recherche et veille technologique. XVI.
Votre veille sous Scopus : 4 méthodes
XVII.
Capitaliser : base de connaissance et bibliographique
Le repérage de mots-clefs consiste à détecter des mots qui apportent de l’information Pertinente relativement à un domaine particulier. Définissons tout d’abord ce qu’est un mot-clé pour un internaute : Mot caractérisant le contenu d'un document ou d'un fichier, servant de principal critère de recherche dans un fichier ou dans un système de gestion de base de données. Le choix des mots-clés est un élément crucial de la recherche, ce sont eux qui permettent de trouver les pages qui vous intéressent rapidement, sans qu'elles soient noyées parmi des milliers d'autres. On recommande généralement de définir 4 à 5 mots-clés, qui seront modifiés, affinés ou complétés au fur et à mesure de la progression de la recherche. Il est évident que si un mot-clé comporte des fautes d’orthographe, l’outil de recherche ne le comprendra pas ; certains sont même sensibles aux accentuations, alors en cas de doute mieux vaut vérifier dans un dictionnaire ! Il ne suffit pas de définir des mots-clés, il faut également les articuler entre eux. Pour cela 2 solutions possibles : soit connaître les outils de syntaxe, soit utiliser l’option recherche avancée (ou approfondie) du moteur. Par exemple, si je cherche des explications sur la formation des typhons, la recherche {typhon} donne 15500 pages… Tandis que {+typhon +formation +explication +météo} donne 21 pages pertinentes ! Quelques éléments de syntaxe – le signe + permet de demander que plusieurs mots soient présents (ex : +distillation +cidre +pommes)
Réalisé par : M.BISBIS Mustapha.Page 23
Recherche et veille technologique.
le signe – élimine les mots que vous ne voulez pas voir apparaître (ex : golf –voiture) le mot de liaison OR permet de proposer plusieurs mots-clés au choix (ex : impressionniste OR impressionnisme) – les guillemets " " encadrent une expression que vous voulez voir apparaître en entier ( ex : "festival d'Avignon") Dans la boîte de saisie vous pouvez spécifier des mots-clés (par exemple "linux", "régression", ...), des opérateurs booléens ("and", "or", "not") et des parenthèses ("(" et ")"). Les mots-clés séparés par des espaces sont équivalents à des mots-clés séparés par "and". Le moteur de recherche renvoie les fichiers contenant les mots qui correspondent à votre requête et non pas les fichiers contenant l'expression de la requête. Par exemple, "linux PC" ou "linux and PC"
donne les fichiers contenant "linux" et "PC"
"linux and not PC"
donne les fichiers qui contiennent "linux", mais pas "PC".
"windows or (linux and PC)"
donne les fichiers qui contiennent "windows" ou à la fois "linux" et "PC"
Les mots accentués sont équivalents à ceux sans accents. Une recherche sur "résumé" donne le même résultat que sur "resume". Règles fréquentes : o Attention à la casse, saisir les mots clés en minuscule permet, en général, d'obtenir toutes les occurrences (exemple pour "cathédrale" seront recherchés :"cathédrale" "Cathédrale" / "CATHEDRALE") Attention s'il existe une majuscule, l'occurrence exacte sera recherchée ex : pour "Cathédrale" sera recherché uniquement "Cathédrale". o Attention aux accents ! Vérifier la réaction de chaque moteur! Supprimer les accents avec les moteurs anglais. o les expressions sont toujours indiquées avec "..... " o Troncature avec le joker * est fréquemment utilisée o les opérateurs les plus fréquents sont : OU est implicite pour des mots clés qui se suivent (le plus souvent...avec des exceptions : "Google") ET SAUF OU ou AND NOT OR (à taper en majuscules, suivis et précédés d'un espace) ex : pyramide AND louvre les signes + -(attention à séparer par un espace le signe du mot précédent, et à accoler le signe au mot qui suit ex : +pyramide –louvre penser à utiliser l'adjacence NEAR • Approfondir la recherche avec toutes les options possibles à condition de maîtriser les opérateurs logiques (booléens et adjacence). Affiner avec les options de restriction (titres, domaines de recherche, restriction géographique). Moins de 10 % des internautes utilisent la recherche avancée des moteurs...
Réalisé par : M.BISBIS Mustapha.Page 24