Upload
others
View
1
Download
1
Embed Size (px)
Citation preview
Tutoriel TaDaweb
Auteurs P.Degoul - A.Poinsel - F.Gaspard Version V1.1.2 Date 17/06/2013
Les versions majeures sont notées par le premier nombre (Vx) ; les versions mineures correspondant à des évolutions fonctionnelles
sont notées par le deuxième nombre (Vx.y) ; le dernier chiffre indique des mises à jour correspondant à de petites évolutions (Vx.y.z)
PPaaggee 11 ssuurr 7711
Réalisation d’un dispositif de veille automatisée
basé sur une plateforme de veille innovante
Une technologie qui pense "utilisateur"
pour rendre la Veille plus attractive pour l’usager
et plus simple et productive pour le veilleur
Guide de l’utilisateur
[email protected] PPaaggee
22 ssuurr 7711
Sommaire
Introduction générale ................................................................................................. 4
Logique de mise en place d’un dispositif de Veille ....................................... 4
Plateforme de Veille TaDaweb ........................................................................ 5
Organisation de l’information : TaDaweb Creator ................................................... 8
Introduction à TaDaweb Creator .................................................................................... 8
I. Surveillance des sources : onglet Source ................................................... 10
Outil "URL" et fonction "Webclip" ............................................................................... 10
Outil "RSS Feed" ................................................................................................................ 13
Outil « Google Search » .................................................................................................. 14
Outil « Google+ Search » ................................................................................................ 15
Outil « Yahoo! Search » .................................................................................................. 16
Outil « Facebook Search » ............................................................................................. 17
Outil « Twitter Search » ................................................................................................... 18
Création de TaDas directement depuis le navigateur « Bookmarklet: Web
Clipper » ...................................................................................................................................... 19
II. Extraction de l’information : onglet Extract ................................................. 21
Outil « Extract Webclip » ................................................................................................ 21
Outil « Extract Form » ..................................................................................................... 22
Outil « Extract Link » ....................................................................................................... 25
Outil « Extract Table » ..................................................................................................... 26
Outil « Extract RSS » ....................................................................................................... 28
Outil « Extract Image » .................................................................................................... 29
III. Exploitation et structuration de l’information : onglet « Transform » ........ 30
Outil « Tansform » ............................................................................................................ 30
Outil « Filter » .................................................................................................................... 32
Outil « Merge » .................................................................................................................. 34
Outil « Split » ..................................................................................................................... 36
Outil « Compare » ............................................................................................................. 37
Outil « Navigate » ............................................................................................................. 39
Outil « Loop » .................................................................................................................... 42
Outil « Custom Text » ...................................................................................................... 44
[email protected] PPaaggee
33 ssuurr 7711
Outil « Custom List » ....................................................................................................... 48
Modalités d’utilisation d’un TaDa ............................................................................ 50
Synthèse des fonctionnalités (outils) associables de TaDaweb ......................... 50
Points communs aux diverses fonctionnalités ........................................................ 52
Utiliser un même TaDa pour exploiter une nouvelle source ................................. 53
Utiliser un nouveau White Board pour créer un TaDa ............................................ 54
Utiliser le TaDa d’un autre utilisateur.......................................................................... 54
Sauvegarde un TaDa ....................................................................................................... 55
Consulter, modifier, réutiliser la structure d’un TaDa ............................................ 58
Mise en mémoire et enrichissement des informations d’un TaDa ...................... 61
Partage et diffusion de l’information : TaDaweb Dashboard ................................ 63
Introduction au Dasboard .............................................................................................. 63
Public TaDas ...................................................................................................................... 63
TaDas privés ...................................................................................................................... 65
Journals privés ................................................................................................................. 67
Web Clipper ........................................................................................................................ 69
Signalement des ajouts ou modifications des pages Web surveillées.............. 71
Rechercher un mot ........................................................................................................... 71
[email protected] PPaaggee
44 ssuurr 7711
Introduction générale
Logique de mise en place d’un dispositif de Veille
La logique de fonctionnement du processus de Veille est en général calquée sur le cycle proposé par
la CIA comportant les 4 étapes clés bien connues.
Cependant si cette forme cyclique s’explique pour un
grand organisme qui sépare les fonctions
opérationnelles des fonctions de recherche-
sélection-analyse-diffusion de l’information, pour les
petites structures où ces fonctions sont souvent
intimement associées, cette forme apparaît souvent
théorique puisque l’usage de l’information n’est pas
clairement indiqué.
Nous préférons donc un schéma plus ouvert, reliant en 4 étapes itératives la spécification des
objectifs à l’action qui constitue la finalité même de la Veille. La formulation de ces 4 étapes met en
exergue les 4 points clés qui selon nous conditionnent la réussite du processus.
[email protected] PPaaggee
55 ssuurr 7711
Plateforme de Veille TaDaweb
Pour la séquence d’implémentation, nous avons sélectionné TaDaweb (www.tadaweb.com), une
plateforme de Veille « dans le cloud », permettant l’extraction, l’organisation et la publication
d’informations à partir de sources Web et de remontées d’informations terrain. Ce nouvel outil, encore
en version Beta, a été créé par la compagnie TaDaweb en juillet 2012 et salué à la mi-février 2013 par
Christophe Deschamps, comme une « solution innovante », aux « fonctionnalités étonnantes ».
Elle propose en natif la plus part des fonctions attachées à une plateforme et ce de façon
ergonomique et intuitive. Basé sur une logique simple et agréable, cet outil est composé de deux
parties qui seront étudiés plus loin :
1. TaDaweb Creator, module qui comprend trois groupes de fonctionnalités : collecte, extraction
et transformation permettant d’aboutir à une présentation structurée et communicante de
l’information.
[email protected] PPaaggee
66 ssuurr 7711
2. Dashboard en ligne destiné à la consultation et au partage des informations, véritable
tableau de bord du travail effectué sur le "TaDaweb Creator".
Ce logiciel peut être comparé à l’outil Yahoo Pipes, déjà présenté sur notre site, au niveau de ses
fonctionnalités, mais en moins rébarbatif. A l’usage il apparaît beaucoup plus facile à mettre en œuvre
et à utiliser et permet à tout veilleur de se familiariser de façon aisée aux fonctionnalités d’une
plateforme de Veille.
La richesse de ses fonctionnalités peut être synthétisée de la façon suivante :
Présentation en natif des résultats de Veille sous forme structurée et agréable à consulter
pour l’usager (le TaDa, un homologue de la Newsletter, mais cliquable),
Intégration d’un mode de communication, d’échange et de diffusion des informations des
TaDas sous forme de Journal, accessible de façon publique ou privés (DSI),
Prise en compte des remontées d’information terrain (rapport d’étonnement),
Productivité améliorée et utilisation facilitée pour le veilleur :
◦ Autoréalisation des fonctions (de l’action au résultat) après glissé-déposé des icônes,
[email protected] PPaaggee
77 ssuurr 7711
◦ Chemin de sélection clair et aisément compréhensible,
◦ Réutilisation d’un chemin de sélection d’une thématique (ou source) à l’autre,
◦ Fonctionnalités pensées utilisateur rendant plus simple la mise en œuvre de la Veille,
◦ Plateforme intégrant la recherche de sources par elle-même, les alertes, etc.
Si cette plateforme permet d’apporter une réponse positive à la complexité habituellement rencontrée
dans ce type d’outil, nous devons reconnaître néanmoins quelques points faibles.
Outre les inévitables bugs liés à toute préversion commerciale, nous devons signaler certaines
absences de fonctionnalités constituant des points de faiblesse :
Absence d’un véritable outil de dédoublonnage,
Pas de sauvegarde lorsqu’une nouvelle information vient renouveler/actualiser une information
déjà présente dans le Tada,
Absence de format de sortie adapté à la mise en mémoire (formats traditionnels tels que : PDF, e-
book, ...)
Cependant nous devons noter que ces divers points sont en cours d’intégration dans TaDaweb par
l’équipe de développement menée par son Dirigeant : M. François Gaspard.
[email protected] PPaaggee
88 ssuurr 7711
Organisation de l’information : TaDaweb Creator
Introduction à TaDaweb Creator
Cette première partie de l’outil, se présente comme un logiciel à installer qui permet d’organiser la
Veille grâce aux différentes fonctions proposées, débouchant sur une présentation structurée,
actualisée, de l’information collectée, appelée « TaDa ».
TaDaweb Creator est composé de trois parties : un navigateur, un espace de travail ou Whiteboard et
une barre latérale d’outils.
Navigateur. Situé dans la partie droite de la fenêtre de TaDaweb Creator, il comprend une
barre d’adresse et un espace de présentation de l’URL demandé.
Whiteboard. Situé au milieu, il s’agit d’un espace qui permet d’installer l’environnement de
travail : collecte et sélection de l’information.
Barre latérale. Située sur la gauche, elle regroupe les fonctions et outils permettant de
configurer la Veille. Trois onglets permettent de collecter (Onglet « Source »), et de
sélectionner, trier, combiner, comparer les informations (Onglets « Extract et Transform »). Un
quatrième onglet « TaDa » permet de retrouver les TaDas créés et enregistrés.
Ce logiciel installé constitue le module de travail destiné à la « création » du chemin de veille, comme
l’indique son nom « Creator ». L’ordre de présentation des trois onglets « Source », « Extract » et
« Transform » suit les trois étapes de manipulation des données. Chacun d’eux regroupent différents
outils permettant le sourcing, l’extraction et la pré-exploitation de l’information.
Ces outils peuvent être interconnectés sur le White Board comme nous le verrons plus loin,
afin de combiner et compléter les fonctionnalités (sous certaines réserves).
[email protected] PPaaggee
99 ssuurr 7711
Pour créer une veille, il est nécessaire de définir une source : il peut s’agir d’une page Web (URL),
d’un flux RSS (RSS Feed) ou de résultats de recherche issus de Google, Yahoo!, Google+, Twitter ou
Facebook.
L’onglet Source du logiciel TaDaweb Creator propose ainsi six types de sources à utiliser pour
commencer sa veille (voir barre latérale gauche).
Pour accéder aux fonctionnalités de chacune d’elle, il suffit de "Glisser-Déposer"
l’icône désirée sur l’espace de travail.
[email protected] PPaaggee
1100 ssuurr 7711
I. Surveillance des sources : onglet Source
Outil "URL" et fonction "Webclip"
En déplaçant cette icône dans l’espace de travail, l’adresse de la page apparaît automatiquement
sous celle-ci.
En passant le curseur sur cette icône une main apparaît (permettant son
déplacement dans l’espace de travail) avec deux symboles.
Le premier (triangle noir vers le bas) permet de décrire la page du site. Dans le cas illustré ici,
nous pouvons indiquer que nous avons demandé la page « Intelligence économique » du site
Les Echos. Il permet également de réafficher la page correspondant à l’URL.
Le second (croix rouge) permet de supprimer l’icône URL du Whiteboard. A noter qu’on peut
également supprimer un icône ou un groupe d’icônes à l’aide du bouton « supprimer »
(schématisé par une poubelle) en haut du WhiteBoard.
Pour sélectionner une partie que l’on souhaite collecter ou dont on souhaite surveiller les
mouvements dans la page Web affichée, cliquer sur l’icône URL (située dans le Whiteboard)
pour rendre actif le pictogramme « cible » : fonction Webclip, situé en haut de cet espace. Sa
couleur passe alors du rose au vert.
En cliquant sur ce pictogramme, la page surveillée devient ombrée. Il suffit alors de déplacer le
curseur sur la zone ombrée pour mettre en clair (blanc) la partie présentant un intérêt (voir copie
d’écran ci-dessous).
Pour finaliser la sélection, un bouton "Agrandissement" permet d’élargir la zone à surveiller.
◦ Un premier clic sur cette icône élargit la sélection du paragraphe sélectionné :
permet d’englober le contenu du paragraphe lorsqu’on a désigné le titre par exemple (ou
inversement), ou encore la mention « ... lire la suite ».
◦ Un deuxième clic élargit la sélection à l’ensemble des paragraphes ou articles de la page,
◦ Un troisième clic permet de prendre en compte l’entête de la page,
◦ Un quatrième et dernier clic permet de prendre en compte la page (y compris les
publicités ou informations annexes situées en général dans une colonne à droite des
articles).
[email protected] PPaaggee
1111 ssuurr 7711
Dans l’exemple ci-dessous:
- dans le site EASI nous avons sélectionné la catégorie (la page) « Utilitaires-Outils » (texte en
bleu sous l’icône URL de EASI du Whiteboard)
- Puis sélectionné l’article « Comment récupérer ses flux RSS de Google Reader ».
Une fois la zone choisie par la mise en surlignage clair, il suffit de cliquer sur le
bouton pour extraire les informations sélectionnées vers le Whiteboard (ou
de double cliquer sur le bloc à extraire).
Le chemin de sélection est alors automatiquement représenté par deux
nouvelles icônes, la première présentant l’action créée « Extract Webclip » et
la deuxième le résultat de la sélection, l’extrait ou « Webclip ».
A chacun des niveaux représentés, il est possible comme précédemment
d’affecter une description (cf. texte en bleu sous-titrant le texte proposé par
TaDaweb Creator).
Pour l’extrait en soi, le Webclip propose en plus de la description, une option supplémentaire qui
permet de visualiser l’extrait choisi (voir ci-dessous) qui sera consultable en ligne via le Dashboard.
[email protected] PPaaggee
1122 ssuurr 7711
Il est possible de sélectionner un autre article de la même page, de façon indépendante à la première
sélection en cliquant une nouvelle fois sur l’icône URL pour rendre actif le pictogramme « cible ».
Dans l’exemple ci-dessous nous avons ainsi sélectionné l’article (« Du nouveau dans Drive : créez,
partagez et éditez des cartes mentales ») et même l’ensemble des 10 articles les plus récents (ici au 7
avril 2013) présentés sur la page Web. Comme précédemment, il est possible d’affecter des
descriptions aux nœuds du processus. A chaque fois, il est possible d’accéder aux extraits
sélectionnés en cliquant sur le bouton « show » visible lorsque le curseur passe sur le triangle noir
associé au Webclip.
Certaines des informations extraites concernent des
données ou un texte « figé » (peu susceptible de
modifications ultérieures) qui seront ensuite
regroupées dans un « journal » créé sur le Dashboard
en ligne, en vue d’en diffuser le contenu à d’autres
utilisateurs. Dans le schéma ci-contre, ce type
d’information correspond aux Webclip A et B.
D’autres informations extraites, fréquemment
modifiées, doivent faire l’objet d’une surveillance : ce
type d’information correspond au Webclip puisqu’il
s’agit d’une page qui est amenée à évoluer selon
l’actualité des articles. L’organisation de la surveillance sera présentée plus loin.
Nota : la fonction Webclip peut aussi être mise en puevre à la volée, sur une page Web avec le Web
Clipper
[email protected] PPaaggee
1133 ssuurr 7711
Outil "RSS Feed"
Cet outil a pour but de faciliter l’extraction d’informations via l’utilisation d’un flux RSS. A la différence
de l’outil URL qui permet d’extraire des informations à partir d’une URL quelconque, l’outil « RSS
Feed » permet de suivre spécifiquement les fils d’information proposés par un site.
Pour utiliser cet outil, il suffit d’un glissé-déposé sur le Whiteboard.
Ce faisant, le logiciel ouvre une fenêtre dans laquelle l’utilisateur entre
les adresses des flux RSS à surveiller.
Soit la page
dispose d’un flux
RSS. C’est le cas de
l’exemple de la
newsletter du site
Easi-ie. Il suffit de
cliquer sur l’icône
(voir ci-contre).
En cliquant sur cette icône, il suffit de copier
l’adresse qui apparaît dans la barre d’adresse du
Navigateur puis de la coller dans l’interface
d’entrée de l’outil « RSS Feed » comme ci-dessus.
Après avoir finalisé l’extraction des données liées
au flux RSS, l’utilisateur obtient alors une liste de
données, consultable par clic. Notons que les résultats de sortie de plusieurs flux sont triés
automatiquement.
Nota : pour repérer plus aisément la présence de flux RSS sur une page présentant un intérêt,
utiliser l’outil « Extract RSS » présenté plus loin.
Soit le site ne contient pas de flux RSS. Pour créer le flux RSS d’une page spécifique, utiliser
l’outil « Diphur », présenté ici sur notre site.
Mentionnons que l’on peut aussi utiliser l’outil « Extract list » de TaDaweb (voir-ci après) qui
permet de traiter l’information d’une page, « presque » comme un flux RSS.
[email protected] PPaaggee
1144 ssuurr 7711
Outil « Google Search »
A la différence des précédents outils qui pointent vers une URL
spécifique, cet outil permet de surveiller les résultats obtenus sur une
thématique donnée grâce à un groupe de mots-clés pouvant mettre
en œuvre l’algèbre booléenne ainsi que les autres opérateurs
traditionnels de Google (guillemets, recherche par formats, etc). Comme les précédents outils, il
s’utilise en le déposant sur le Whiteboard.
S’ouvre une interface d’entrée libre permettant à l’utilisateur de définir les mots-clés avec lequel il
souhaite surveiller les sources et documents correspondants.
L’utilisateur pourra restreindre les résultats de sa recherche à un format de document
donné (tous, PDF, documents, ou xls). Le bouton « Search », permet d’accéder aux 10
premiers résultats de la recherche. (10 étant une entrée par défaut non modifiable).
Le logiciel créé le résultat sous forme de liste se composant des titres des 10 premiers
résultats de la recherche. Cette liste est consultable par double clic ou en choisissant
l’option « Show List » par clic droit sur l’icône « List ». Pour une recherche sur les mots-clés « E-
réputation AND RSS», l’outil prend en compte la demande formulée par les opérateurs booléens et
donne alors un résultat précis comme ci-dessous :
Remarque : Une requête directement sur
Google ou Yahoo (voir ci-dessous)
donnera toujours des résultats différents
ce ceux obtenus ici, en fonction de la
langue, du pays d’origine de la requête, de
l’historique de consultation de l’utilisateur
etc. De ce fait, les résultats obtenus par
les outils Google et Yahoo Search de
TaDaweb peuvent présenter des
différences par rapport à ceux présentés
par la même requête posée directement
dans ces moteurs.
Note importante : L’avantage des résultats retournés par Google Search est qu’ils ne sont pas
biaisés par l’historique de navigation de l’utilisateur, et donc que les résultats présentés
ici par TaDaweb montrent exactement les sites qui ont le meilleur ranking dans
Google, contrairement à une recherche via un navigateur.
[email protected] PPaaggee
1155 ssuurr 7711
Outil « Google+ Search »
Cet outil permet de surveiller à l’aide de mots-clés, différents types d’informations à travers le réseau
social de Google, « Google + ».
Dans un premier temps, glisser l’icône de l’outil « Google +
Search » sur le Whiteboard. Le logiciel ouvre alors
automatiquement une fenêtre de saisie libre.
Les utilisateurs pourront alors choisir le type de ressources à
rechercher : « Service » où « Post », recherche les Posts
publics, tandis que « User » (page) ou « Community »
permettent de surveiller une page en particulier, par exemple celle qui concerne les compétiteurs.
Le nombre d’informations à extraire est donné par « #Results » ainsi que le type de résultat (voir ci-
contre).
Prenons l’exemple d’une recherche sur le sujet des plateformes de curation. Les informations
recherchées étant, comme ci-contre, une dizaine de posts
des différents utilisateurs, contenant les mots « plateforme
curation » et étant catégorisé comme
« Recent ».
Le logiciel obtient alors les données demandées
et les restituent sous forme de liste (image ci-
contre). Ici, le nombre de résultat demandé est de 10, mais la liste finale ne contient que
7 résultats, le nombre d’informations trouvées étant inférieur à celui voulu. En double-
cliquant sur la « List », l’utilisateur peut avoir un aperçu des informations extraites, comme ci-dessous.
[email protected] PPaaggee
1166 ssuurr 7711
Outil « Yahoo! Search »
Ce module s’utilise de la même façon que l’outil Google Search. Il contient plus d’options (restriction,
précision). Après avoir glissé-déposé l’icône sur le
Whiteboard, le logiciel ouvre l’interface d’entrée de mots-
clés.
Il est possible ici d’affiner sa recherche en précisant le
format du document (tous, PDF, office), mais il se
différencie de son concurrent en permettant de préciser le
type de ressource à trouver (« service ») ou encore en
modifiant le nombre de résultats à obtenir.
En choisissant les services « News » ou « Blog », l’outil propose également d’affiner la recherche par
un critère d’actualité.
En prenant l’exemple d’une recherche sur « Outils AND agrégateurs», l’utilisateur obtient une liste des
résultats les plus pertinents.
Cette liste est consultable par les mêmes moyens que ceux employés plus haut pour l’outil « Google
Search » (voir ci-dessous).
Dans un travail de veille, ces outils peuvent être utilisés pour comparer les premiers résultats de
recherche des différents moteurs Google et Yahoo. Dans l’exemple utilisé ci-dessus, les résultats
trouvés par les différents moteurs sont totalement différents. Pour une comparaison optimale des
résultats, utiliser l’outil « Compare » présenté plus loin.
Remarque : Voir ci-dessus à propos de Google, les écarts qui peuvent être constatés entre les
résultats d’une même requête posée dans l’outil Yahoo de TaDaweb et sur le moteur
Yahoo!
[email protected] PPaaggee
1177 ssuurr 7711
Outil « Facebook Search »
Cet outil permet de surveiller les résultats obtenus sur un mot ou groupe de mots-clés publié(s) dans
le réseau social Facebook. Les mots-clés entrés via cet outil peuvent être recherchés
en choisissant « Post », lorsque le mot-clé est présent dans les posts publics (recherche
similaire à la recherche de posts publics depuis facebook),
en choisissant « Page », pour rechercher une page précise sur Facebook (page publique
d’une marque comme par exemple https://www.facebook.com/nespresso ou d’un utilisateur
par exemple).
Comme les précédents outils, il s’utilise en le déposant
sur le Whiteboard.
S’ouvre alors une interface d’entrée libre permettant à
l’utilisateur de définir les mots-clés qu’il souhaite surveiller.
Le logiciel présente les données
correspondant à la requête sous forme d’une icône « List ». Cette liste,
consultable par clic, donne le résultat ci-dessous côté droit (Résultat obtenu
via l’outil Facebook Search).
En utilisant cet outil, on obtient les résultats du post le plus récent au plus
ancien. Les commentaires et autres posts directs sur le mur de TaDaweb
(encadrés bleus à gauche) ne sont pas restitués par l’outil Facebook Search.
[email protected] PPaaggee
1188 ssuurr 7711
Outil « Twitter Search »
Twitter ouvre sur une grande diversité de sources d’information et apporte spontanéité (instantanéité)
et simplicité (un clic pour accéder à sa timeline, scroll, bookmark des tweets intéressants).
Le dernier outil permettant de cibler ses sources est « Twitter Search ». Tout comme l’outil
« Facebook Search » et « Google+ Search », ce module permet de surveiller soit les messages
publics sur Twitter, soit une page précise (un Profile). En choisissant User on peut par exemple
surveiller la page de Christophe Deschamps (crid) sur Twitter
Dans un premier temps, glisser l’icône de l’outil Twitter sur le Whiteboard. Le logiciel ouvre alors
automatiquement une fenêtre de saisie libre.
Cet outil permet une recherche plus
approfondie sur les mots-clés utilisés que ne le
permet « Facebook Search ».
Les utilisateurs pourront choisir le type de
ressources (« Service ») utilisé, choisir le
nombre d’information à extraire (« #Results »)
ainsi que le type de résultat.
En choisissant par exemple une
recherche sur les tweets
concernant notre thème de « la
veille pour le veilleur », on
utilisera les mots-clés « outil
cloud » comme montré ci-
dessus.
Le logiciel obtient les données
demandées sous forme de liste.
Ci-dessus, les résultats de la recherche sur les mots-clés « outil cloud ».
Cet outil, ainsi que « Facebook Search », peut également permettre à une entreprise de voir les
différents avis des usagers sur un sujet donné. L’entreprise peut alors se servir de ce feedback pour
améliorer son produit ou son image.
[email protected] PPaaggee
1199 ssuurr 7711
Création de TaDas directement depuis le navigateur « Bookmarklet:
Web Clipper »
Le Webclip permet de découper une partie d’un page relative à votre centre d’intérêt sur une source
déjà répertoriée.
Mais il est très utile de pouvoir découper une partie d’une page consultée, à la volée, lors d’un
« surf », c'est-à-dire lors d’une exploration du Web sur un sujet donné.
Un Bookmarklet1 dénommé « Web Clipper » permet d’extraite rapidement des Webclips
directement depuis le navigateur Internet.
Cette fonction est dynamique : elle ne stocke pas de façon statique et définitive. L’information ainsi
collectée va pouvoir être mise à jour lors des modifications ou ajouts faits sur le « clip » (l’extrait)
sélectionné, assurant ainsi une veille automatique.
Menu Explore. Le Web Clipper est accessible en cliquant sur le menu « Explore » du Dashboard en
ligne (en haut à droite), puis sur l’option « Tools ». Un simple glisser –déposer sur la barre d’outils
(toolbar) du navigateur permet de rendre active cette fonctionnalité (voir schéma suivant)
Une fois le Web Clipper dans la barre d’outils, il suffit de cliquer sur « +Clip a TaDa » pour obtenir en
bas de page la fonctionnalité. Pour sélectionner directement tout ou partie de la page il suffit de
cliquer sur « Select » puis sur « Expand » pour élargir la zone de sélection. « Save » permet ensuite
de créer un TaDa à la volée (voir ci-dessous, page suivante).
1 Un bookmarklet est un (petit) programme JavaScript pouvant être stocké dans la barre des favoris de votre
navigateur
[email protected] PPaaggee
2211 ssuurr 7711
II. Extraction de l’information : onglet Extract
Après avoir ciblé précisément la source à surveiller, le logiciel propose
de choisir le type d’information à extraire à l’aide du deuxième onglet
« Extract ». Cet outil offre la possibilité d’extraire différentes formes
d’informations, telles que du texte, des listes, des images ou encore
des tableaux. (Voir ci-contre les différents formats de données pouvant
être extrait).
Pour utiliser la commande d’extraction, il faut tout d’abord préciser la
source dont on va extraire les données : URL, RSS.
Remarque : Certaines formes de données comme des tableaux,
peuvent être extraites directement depuis une source URL ou RSS ou
mêmes depuis des sources telles que « Google Search », « Yahoo
Search », « Google+/Twitter/Facebook Search ».
Outil « Extract Webclip »
Dans l’onglet d’extraction, l’utilisateur pourra retrouver l’outil « Extract Webclip » déjà présenté ci-
dessus.
L’une des particularités de TaDaweb est qu’à travers ces différents onglets ou outils, l’utilisateur peut
utiliser différentes manières pour arriver au même résultat
Avec TaDaweb il y a toujours plusieurs façons pour réaliser une fonctionnalité.
Par exemple, sur un site web, vous pouvez utiliser
- soit l’Extract Webclip,
- soit l’Extract List
pour extraire la même information. La différence sera que la liste sera structurée et pourra être
filtrée. Il faut voir les outils comme des « Legos » qu’on assemble pour réaliser une opération :
différents outils pouvant être associés pour réaliser la même opération finale.
[email protected] PPaaggee
2222 ssuurr 7711
Outil « Extract Form »
Selon la page 9 du « Guide du débutant » créé par la compagnie
TaDaweb, cet outil a pour principale utilité de cibler tous les champs
d’un formulaire présents dans une page. En effet, beaucoup de pages
Web contiennent par exemple des barres de recherche ou encore des
cadres pour que l’utilisateur puisse s’enregistrer et se connecter ou
rechercher un type d’information. Cet outil permet donc de trouver tous
ces formulaires et d’en choisir une entrée adaptée à son besoin.
Prenons l’exemple du site Les Echos. Pour se diriger vers une page
précise à l’aide de la barre de recherche, entrer l’adresse du site désiré
dans le navigateur et utiliser la source « URL » (dans l’onglet source).
Glisser l’outil « Extract form » sur le Whiteboard pour le relier à l’icône URL à l’aide de l’outil de lien
(étapes 2 et 3 ci-contre)
Le logiciel ouvre une fenêtre proposant à l’utilisateur les
différents formulaires trouvés sur la page du site exploré.
Pour regrouper les différentes pages sur un sujet donné,
entrer les mots-clés désirés dans le formulaire de recherche
(ici, Intelligence économique).
Le site recherche tous les articles sur le site
correspondant au(x) mot(s) utilisé(s).
Pour finaliser la recherche, appuyer sur le
bouton « Execute ».
Sur le Whiteboard, le logiciel charge les données recherchées et leur attribut
une nouvelle adresse URL comme ci-contre (Intelligence économique).
Sur le Navigateur, le logiciel charge la nouvelle page correspondant à la
requête. L’utilisateur peut alors extraire de nouvelles informations sur la page
précise qu’il a demandé.
Lorsque la recherche concerne un site
demandant identification (l’utilisateur ayant un
compte créé auparavant), TaDaweb permet
d’extraire le formulaire d’authentification.
Entrer l’adresse du site désiré dans le
navigateur et glisser l’outil source «URL »
sur le WhiteBoard. Relier ce dernier à l’outil
« Extract Form ». S’ouvre alors une interface
dans laquelle l’utilisateur peut entrer ses
identifiants.
[email protected] PPaaggee
2233 ssuurr 7711
En cliquant sur « Execute », le logiciel va charger sur le Whiteboard une nouvelle URL avec les
informations demandées. Le Navigateur chargera la nouvelle page, montrant le nouveau contenu
auquel l’utilisateur peut dorénavant accéder.
Remarque : La sauvegarde sous cette forme ne permet pas de le publier sur le Dashboard en ligne
puisqu’à cette étape, aucune information n’a été extraite.
[email protected] PPaaggee
2244 ssuurr 7711
Outil « Extract List »
Cet outil très simple permet d’identifier automatiquement toutes données sous forme de listes (tout
résultat de recherche est présenté sous forme de liste) et de les extraire directement sous cette
même forme (cf. Vidéo)
Pour cela, relier l’icône URL comportant l’adresse du site contenant les listes à extraire, à l’icône
Extract List. Ici, un exemple d’extraction de liste sur
la source Les Echos. Toutes les listes sont alors
extraites automatiquement par le logiciel sous
l’icône « Smart List ». Les différentes informations
regroupées dans cette icône peuvent être
consultées en cliquant une première fois sur l’icône,
puis en cliquant sur « Show List ».
Exemple de résultat de
liste ci-dessus. Ces
listes pourront ensuite
être retravaillées avec les différents outils de transformations en vue d’en
optimiser la visualisation et de ne garder que les informations jugées
pertinentes.
Mentionnons que ...
- L’outil Extract List est un des outils les plus puissants de
TaDaweb puisqu’il reconnaît automatiquement des listes
présentes sur un site Web ... ce qui permet de simuler « presque » un flux RSS sur des sites
qui n’en possèdent pas.
- Pour extraire une liste précise sur une page Web, il faut tout d’abord créer un Webclip, puis
connecter un Extract List à ce Webclip.
[email protected] PPaaggee
2255 ssuurr 7711
Outil « Extract Link »
De la même manière que pour l’extraction de listes, TaDaweb Creator propose dans un premier
temps
d’identifier tous liens se trouvant sur une page web précise
de regrouper ces différents liens sous forme de liste.
Pour extraire ces différents liens sous forme d’URL, l’utilisateur doit
relier l’outil « URL » à « Extract Link ». Ici, la source est le site Les
Echos. Aucune entrée n’est alors demandée et l’extraction se fait
automatiquement. Le nombre de liens exportés est précisé entre
parenthèse sous la liste créée. Cette liste est consultable en double
cliquant dessus et peut être nommée via l’option « Description » comme ci-contre.
Notons que l’outil Extract link peut aussi extraire des liens concernant les images.
[email protected] PPaaggee
2266 ssuurr 7711
Outil « Extract Table »
TaDaweb Creator propose de simplifier la tâche du veilleur en créant l’outil « Extract Table ». Cet
outil est capable d’identifier les différents tableaux dans un site web pour permettre d’extraire le
tableau désiré sous sa forme initiale.
En reliant l’icône « Extract Table » à l’icône de source « URL », le logiciel cherche automatiquement
les différents tableaux pouvant se trouver sur le site. Dans un premier cas, le logiciel ne trouve qu’un
seul tableau, comme dans l’exemple du site outilsfroids.net. Le logiciel montre le tableau qu’il extrait.
Voir image ci-dessous
Si une seule ligne ou colonne du tableau semble pertinente à utiliser, cliquer
sur le numéro de la ligne ou colonne (gauche ou haut) de la donnée voulu et
cliquer sur « Extract ». La ligne ou colonne est extraite séparément du reste,
non plus sous forme de tableau mais de liste comme ci-contre.
Si le tableau entier semple pertinent à garder, cliquer sur « Cancel ».
Dans un deuxième cas, le logiciel trouve plusieurs tableaux sur la page. L’utilisateur
doit préciser quel tableau conserver en cliquant sur la ligne correspondant comme
dans l’exemple ci-dessous. Pour finaliser le choix du tableau, cliquer sur « Extract ».
En double cliquant sur l’icône « Table », l’utilisateur peut choisir une seule ligne ou
colonne à conserver en
cliquant sur son numéro. Cette extraction se
fait alors sous forme de liste comme
précédemment.
[email protected] PPaaggee
2277 ssuurr 7711
Si une seule ligne ou colonne du tableau semble pertinente à utiliser, cliquer
sur le numéro de la ligne ou colonne (gauche ou haut) de la donnée voulu et
cliquer sur « Extract ». La ligne ou colonne est extraite séparément du reste,
non plus sous forme de tableau mais de liste comme ci-contre.
Si le tableau entier semple pertinent à garder, cliquer sur « Cancel ».
Dans un deuxième cas, le logiciel trouve plusieurs tableaux sur la page. L’utilisateur
doit préciser quel tableau conserver en cliquant sur la ligne correspondant comme
dans l’exemple ci-dessous. Pour finaliser le choix du tableau, cliquer sur « Extract ».
En double cliquant sur l’icône « Table », l’utilisateur peut choisir une seule ligne ou
colonne à conserver en cliquant sur son numéro. Cette extraction se fait alors sous
forme de liste comme précédemment.
[email protected] PPaaggee
2288 ssuurr 7711
Outil « Extract RSS »
Cet outil a pour but de faciliter l’extraction d’informations
via l’utilisation d’un flux RSS. A la différence des types de
sources RSS Feed qui demande à l’utilisateur de trouver
lui-même l’adresse du flux RSS à surveiller, l’outil Extract
RSS permet de trouver tous les fils d’information proposés
par un site et de choisir quel flux surveiller.
Prenons pour exemple ici l’extraction de flux RSS du site
Easi-ie. Après avoir indiqué l’adresse du site dans la barre
de recherche de la partie droite, glisser l’outil « URL » sur
le Whiteboard. Faire de même avec l’outil « Extract RSS »
(étape 1), choisir l’icône représentant un lien (étape 2), pour l’étendre de l’onglet « Extract RSS »
à l’onglet URL.
Cette étape fait alors la connexion entre la source et le module d’extraction.
Une fois le lien créé, le logiciel propose
un encadré demandant quel flux RSS
surveiller en particulier (image ci-contre).
Il suffit alors à l’utilisateur de sélectionner
le flux RSS qu’il désire suivre en cliquant
dessus.
Ce choix est aussi disponible pour les
autres modules. En effet, si plusieurs
tableaux, liens ou encore images sont
disponibles sur le site (ou la partie du
site) consulté, l’outil correspondant
propose à l’utilisateur de choisir les
données qui l’intéresse.
Cette possibilité n’existe pas pour l’outil Extract List.
[email protected] PPaaggee
2299 ssuurr 7711
Outil « Extract Image »
La dernière forme d’extraction directe proposée par le logiciel TaDaweb est celle d’image se trouvant
sur un site. Cet outil permet de cibler une image contenue
sur la page et d’extraire celle-ci ou encore d’extraire toutes les
images contenues sur la page ciblée.
Si l’utilisateur désire utiliser deux images différentes se trouvant
sur le même site Scoop-it, il devra faire apparaître deux fois
l’icône « Extract image » sur le Whiteboard et les relier à la
source comme ci-contre.
Une fois l’icône Extract Image reliée à la source, une
interface s’ouvre, proposant de choisir l’image à garder
comme ci-contre. Après avoir cliqué sur le bouton
« select », l’interface se ferme, finalisant alors l’extraction
de l’image sélectionnée.
Si l’utilisateur souhaite extraire toutes les images contenues sur la page, il
devra alors faire un clic droit sur l’icône « Extract Image » pour obtenir le
résultat ci-contre.
En choisissant « Extract Image », le logiciel va recharger l’extraction de l’image choisie. En
sélectionnant « Select an other image », le logiciel rouvrira l’interface permettant de choisir l’image à
extraire.
« Extract all images » permet à l’utilisateur d’extraire toutes les images au lieu d’en cibler en
particulier.
1
2
2
[email protected] PPaaggee
3300 ssuurr 7711
III. Exploitation et structuration de l’information : onglet « Transform »
Une fois les sources et les données à extraire ciblées,
l’utilisation du logiciel entre dans sa troisième phase, celle
de la « transformation » des informations.
La troisième phase que met à notre disposition le logiciel
est la plus importante en regard de l’output. Grâce à ce
module il sera alors possible de créer certaines règles qui
permettront d’ajouter ou supprimer un contenu
automatiquement en fonction des besoins de l’utilisateur. Il
existe en tout 9 modules différents visant à transformer
votre flux d’information. (Voir schéma ci-contre).
Outil « Tansform »
Cet outil est à utiliser lorsque certaines informations extraites avec l’outil « Extract List », mais aussi
avec les outils « Extract Table » ou « Extract Webclip », ne sont pas pertinentes. Dans ce cas, l’outil
« Transform » permet de supprimer ces informations du résultat obtenu (cf. vidéo).
Dans l’exemple ci-contre, une liste a été extraite
depuis le site Scoop-It, mais le premier élément
« Your new post is loading » composant la liste
ne correspond pas aux informations à garder.
Dans ce cas, relier la liste que l’on vient de créer
à l’outil « Transform ».
Une fois ces deux éléments reliés, le logiciel
ouvre une nouvelle interface permettant à
l’utilisateur de trier les informations et de ne
garder que les pertinentes.
[email protected] PPaaggee
3311 ssuurr 7711
Dans la première partie gauche de l’interface nommée « transformation on
Text », l’option Filter déroulée permet de ne garder qu’un type de format de
données : alphabétiques, numériques ou encore les deux.
Dans cette nouvelle interface, l’utilisateur peut également choisir de supprimer/garder
certaines lignes/colonne en fonction des mots les composant. Cette fonction se trouve dans la
seconde partie gauche « Transformation on Line or Column ». Indiquer dans la case
« Containing Word » les mots des lignes à garder/supprimer et cliquer sur « Execute ».
L’utilisateur peut également indiquer des lignes/colonnes entières à supprimer (voir dernière
rubrique à gauche). Pour cela, se référer au numéro de la ligne dans la partie droite intitulée
« Data List, Table or Text » et entrer le numéro de la ligne ou colonne à supprimer dans la
partie « transformation on first Line/column ». Pour confirmer la transformation souhaitée,
cliquer sur en bout de ligne.
L’interface enregistre la modification effectuée par l’utilisateur dans la partie « Transformations
History » et supprime la ligne indiquée. Dans le cas d’une erreur de modification, l’utilisateur peut
annuler toutes les modifications effectuées en appuyant sur le bouton en bas de l’interface.
Si l’utilisateur à créer plusieurs modifications et ne veut en supprimer qu’une, sélectionner d’un clic la
modification concernée dans la partie « Transformations History » et cliquer sur . Cette
opération ne supprimera que la modification indiquée. Une fois toutes transformations terminées,
cliquer sur le bouton . Le logiciel créé une nouvelle liste comportant le résultat issu de toutes
les modifications effectuées par l’utilisateur.
[email protected] PPaaggee
3322 ssuurr 7711
Outil « Filter »
L’outil Filter comme son nom l’indique permet de créer un filtre à partir de
mots-clés. Ces « mots-clés » vont ensuite pouvoir être associés au sein
d’une syntaxe afin de garder ou éliminer les documents recueillis.
Pour utiliser cet outil, il suffit comme pour les autres de le déposer sur le
Whiteboard. L’interface ci-contre s’ouvre alors automatiquement. Si celle-ci
ne s’ouvre pas, elle est disponible en double cliquant sur l’icône « Keyword
List ».
Avec cette interface, l’utilisateur peut définir les mots-clés en les tapant dans
la zone de texte libre. Pour que la recherche sur la page ciblée soit toujours effectuée par filtrage avec
ces mots-clés, la case « Permanent Data » est cochée par défaut. Une fois le mot-clé écrit dans la
zone de texte, appuyer sur la touche « Add » pour l’ajouter à la liste de mots-clés à surveiller. Si l’un
des mots se trouvant dans la liste ne doit pas être utilisé lors de la veille, l’utilisateur devra alors le
désélectionner en cliquant sur « Remove ». Le mot-clé est alors supprimer de la liste.
Remarque : Une fois le filtrage terminé, l’utilisateur voudra sauvegarder son TaDa. Si celui-ci n’a pas
coché la case « Permanent Data », le message ci-dessous apparaît, l’informant que le
schéma de construction du TaDa sera
sauvegardé mais que rien ne sera publié sur le
Dashboard. Pour faire apparaître le TaDa sur le Dashboard, retrouver la « Keyword
List » n’ayant pas l’option «Permanent Data » et cocher la case.
La syntaxe de la requête est construite à partir d’une nouvelle interface en double-
cliquant sur le module « Filter » déposé sur le Whiteboard, relié à la source comme ci-
contre à gauche.
Ces différentes options proposent 6 filtrages différents. Le premier, qui est utilisé par
défaut est le filtre gardant les articles sélectionnés qui comportent soit dans le titre
soit dans le corps du texte le mot-clé désigné. La partie sur laquelle s’applique le
filtre est dénommé « lines » par TaDaweb.
L’autre filtre en ligne (situé sous le premier) fait
l’inverse et supprime les lignes comportant le /les mots clés.
Les autres options de filtre se font sur le texte entier et sur le
nombre de mot-clé utilisé avec respectivement pour les lignes
supérieures et inférieures :
Garder tout si le texte contient l’un des mots
Garder tout si le texte contient tous les mots
Supprimer tout si le texte contient l’un des mots
Supprimer tout si le texte contient tous les mots
[email protected] PPaaggee
3333 ssuurr 7711
Pour illustrer cette fonctionnalité, prenons le cas d’une recherche menée avec le
mot-clé : « agrégateurs de flux », sur le site Outils froids. Faire glisser l’icône « RSS
Feed » sur le Whiteboard et entrer l’adresse du flux RSS. Déposer l’outil « Filter »
sur le Whiteboard. Une interface s’ouvre automatiquement, proposant à l’utilisateur
d’entrer les mots-clés à surveiller. Valider la liste en cliquant sur « Save » (voir la
Keyword liste représentée ci-dessus).
Relier ensuite l’icône « List Outils froids » à l’icône « Filter ». L’utilisateur obtient
alors une nouvelle « List » ne regroupant que les 12 informations répondant au filtre
des mots-clés. Dans cet exemple, sur 187 articles à la base, il ne reste après filtrage que 12 articles
en rapport avec le sujet défini.
Remarque : Possibilité d’enregistrer la liste de mots-clés pour la réutiliser sur une autre source (cf. ci-
après). De même la syntaxe est réutilisable pour d’autres thèmes de veille.
L’outil Filter ne peut être appliqué qu’à certains résultats. On pourra par exemple appliquer cet outil
sur un résultat sous forme de liste ou de tableau, mais pas sur un résultat type Webclip puisque celui
–ci est considéré comme un tout (un texte en soi). Ainsi, par exemple, en appliquant un filtre visant à
supprimer une ligne contenant le mot « information », si ce mot apparaît dans le résultat du Webclip,
tout sera supprimé, car le logiciel voit le résultat comme un tout indivisible.
[email protected] PPaaggee
3344 ssuurr 7711
Outil « Merge »
Cet outil permet de regrouper différentes données provenant de sources différentes. Prenons par
exemple les flux RSS : l’outil TaDaweb permet de surveiller certains flux RSS distincts comme les flux
de commentaires. Si dans sa veille, l’utilisateur veut pouvoir suivre deux flux RSS différents puis les
regrouper, il le peut grâce au module Merge. Il peut ensuite avec ce même outil, présenter les
différentes données regroupées sous forme de liste ou encore de tableau.
Comme exemple ici, le site demainlaveille.fr. Utiliser deux fois l’outil « Extract RSS » pour suivre les
différents flux de ce site. Relier ces deux outils à la source.
Après avoir reliés ces différents modules, une
interface s’ouvre, laissant choisir quel flux RSS
suivre. Pour le Premier module « Extract
Rss », suivre par exemple le flux de commentaires. En double-cliquant sur le deuxième module
« Extract RSS », la même interface s’ouvre. Choisissons un autre flux à suivre, comme celui de mots-
clés.
Nous obtenons une liste différente pour chaque module
d’extraction.
Pour regrouper ces différentes listes, en
seul flux, l’utilisateur devra faire glisser le
module « Merge » et le relier aux deux
« List » par l’accessoire . L’outil propose
alors à l’utilisateur de gérer la forme de ce
regroupement selon la position dans la
matrice : soit sous forme de tableau
(placement sur l’axe l’horizontal), soit sous
forme de liste (placement sur l’axe vertical).
Dans ce dernier cas un positionnement supérieur ou inférieur donne l’ordre d’apparition des résultats
des 2 listes.
[email protected] PPaaggee
3355 ssuurr 7711
En choisissant de regrouper ces
données sous forme de liste, on
obtient le résultat ci-contre.
Tandis qu’en regroupant les
données sous forme de tableau, on
obtient le résultat ci-dessous.
Cet outil Merge peut être utilisé sur
d’autres formats de données
comme les images ou encore les
extraits de pages.
Notons que l’outil Merge va automatiquement trier la liste finale de deux flux RSS.
[email protected] PPaaggee
3366 ssuurr 7711
Outil « Split »
L’outil Split est un module ayant pour objectif de séparer un flux en plusieurs flux de sortie. Il est l’outil
inverse de « Merge ». La principale fonction de cet outil est de simplifier la lecture pour une meilleure
visibilité. Il permet de diviser un groupe de résultats en plusieurs sous-groupes
distincts, plus aisés à exploiter.
Cet outil propose plusieurs séparations possibles. Les valeurs possibles pour séparer
les données sont par groupe de deux, de 3 ou de 4. Ce module
permet aussi de séparer les différentes données par une entrée libre
alors appelée « by separator ». En choisissant cette option, l’utilisateur
aura à entrer une valeur définissant le séparateur de données.
En prenant l’exemple du site Actulligence, déposer l’icône URL sur le Whiteboard.
Relier cette source à l’outil « Extract List ». Vous obtenez alors une liste de 6
informations comme ci-contre. En reliant cette liste à l’outil « Split » et en choisissant
par exemple le séparateur « 2 by 2 », le logiciel propose alors une nouvelle liste regroupant les
informations sous-listes de deux par deux.
[email protected] PPaaggee
3377 ssuurr 7711
Outil « Compare »
Le module « Compare » permet de comparer différents résultats. Cet outil peut s’appliquer sur les
listes et tableaux, mais aussi sur des résultats de recherche mêlant Google
et Yahoo. Dans cet exemple, une recherche sur « TaDaweb » avec les
outils « Google Search » et Yahoo Search » a été mise en place.
Recherche sur deux outils différents :
En utilisant la même méthode que pour les outils précédents, cela abouti à la création de deux listes
regroupant les résultats de
recherche de Google et
Yahoo. Pour comparer les
résultats de ces deux
recherches, il faut alors relier
chacune de ces listes à l’outil
« Compare ».
Une fois ces deux listes
reliées par le module, le
logiciel ouvre une fenêtre
visant à choisir le mode de
comparaison des données.
En choisissant « Same result », le logiciel analyse les données communes aux deux moteurs tandis
que l’option « diffèrent » révèlera les différences dans les résultats.
Ici il est intéressant de voir que les deux moteurs de recherche ont 6 résultats en communs parmi
leurs 10 premiers résultats ... on n’est pas loin du dédoublonnage, mais l’outil n’assure pas par lui-
même l’élimination des doublons.
Pour valider cette comparaison, cliquer sur le bouton « ok ». Le logiciel conçoit automatiquement une
liste ne regroupant seulement que les résultats communs ou différents selon le besoin de l’utilisateur.
[email protected] PPaaggee
3399 ssuurr 7711
Outil « Navigate »
Ce module, comme son nom l’indique, aide à une navigation simple et rapide. L’outil Navigate permet
de cibler une partie d’une liste et de créer un lien direct vers cette partie. En connectant l'outil,
TaDaweb "naviguera" alors dans la page originale et produira une nouvelle icône de la page
sélectionnée du site Web.
La nouvelle page peut être traitée exactement comme une nouvelle source Web originale, avec des
informations qui peuvent en être extraites.
Cet outil ne peut pas s’utiliser tout seul dans le sens où il n’extrait pas réellement de données : c’est
donc un module complémentaire aux autres modules qui permet de cibler un groupe de documents
dans la source.
Prenons l’exemple de son utilisation la plus pratique, avec l’autre outil Loop. Nous utiliserons ici
comme source le moteur vertical UPSTO, qui regroupe les différents brevets américains. Sur ce site,
notre but est d’identifier les 3 derniers brevets d’IBM
Tout d’abord il faut alors préciser l’adresse de la page sur la partie droite constituant le
navigateur de TaDaweb Creator. Déposer ensuite l’icône URL qui chargera
automatiquement la source. Pour extraire l’information, déposer l’icône de l’outil « Extract
List » sur le Whiteboard. L’utilisateur obtient une liste des brevets indexés sur cette page
(voir ci-contre).
Remarque : L’outil Navigate étant assez puissant, le nombre d’informations collectées est limité à 10
pour une même source, afin de ne pas alourdir le fonctionnement de TaDaweb.
[email protected] PPaaggee
4400 ssuurr 7711
Du fait de cette limitation, il est nécessaire de transformer la liste pour ne
garder que 10 informations au maximum. Pour cela, déposer l’outil
« Transform » sur le Whiteboard et supprimer les 41 dernières informations
(voir ci-dessus).
On obtient alors une liste ne contenant plus que 10 résultats (voir ci-contre).
Déposer ensuite l’outil LOOP (voir § suivant) sur le Whiteboard relier sa
première partie (Start Loop) à la « Liste retravaillée ». Vous obtenez alors
un Webclip. Relier celui-ci à l’outil Navigate après avoir déposé celui-ci sur
l’espace de travail. Celui-ci va alors charger à droite, dans la partie navigateur du logiciel, la page
rattachée au premier lien de la liste retravaillée. Il suffit alors à l’utilisateur de cliquer sur l’outil « cible »
et de préciser sur la nouvelle page (voir ci-dessus) l’information qu’il souhaite extraire. Dans
notre exemple, nous voulons sélectionner l’information concernant les inventeurs associés à IBM.
Le copie d’écran ci-dessous présente le lien sur lequel l’outil « Navigate » va se diriger
automatiquement et la faire apparaître dans le navigateur.
[email protected] PPaaggee
4411 ssuurr 7711
Après avoir extrait ce « Webclip »,
correspondant à l’information recherchée, il ne
reste plus qu’à connecté celui-ci à la deuxième
partie de l’outil LOOP, « End Loop » (voir ci-
dessus).
En double cliquant sur l’icône End Loop,
l’information recherchée est extraite des autres
liens composant la liste. Une nouvelle liste est
alors obtenue, regroupant le type d’information
recherché (voir « Liste des inventeurs » rattachés
à la Sté IBM).
L’outil Navigate a pour principale utilité de combler un certain manque que l’on rencontre avec l’outil
LOOP. En effet, avec l’outil LOOP on ne peut extraire qu’un type d’informations, retranscrit dans la
liste d’extraction, tandis qu’en utilisant l’outil Navigate en complémentarité de l’outil LOOP, on peut
extraire un type d’informations directement sur une page.
Remarque : l’outil Navigate donne une URL et donc le résultat ne sera pas envoyé sur le Dashboard
[email protected] PPaaggee
4422 ssuurr 7711
Outil « Loop »
L’outil loop va permettre de répéter une ou plusieurs actions pour chaque élément de la liste connecté
à cette Loop.
L’outil « Loop » est le plus complexe à utiliser (cf. p.15 du Beginner's guide et vidéo). Il permet à
l’utilisateur d’automatiser une opération sur une liste à partir d’un choix d’attributs préalablement
effectué sur un premier document (par exemple titre, date, auteur, ...), de créer des boucles pour
appliquer des traitements similaires à d’autres documents de la liste à partir des mêmes attributs.
L’utilisateur peut par exemple ne faire apparaître que les titres ou encore les noms d’auteur
composant sa liste, pour ensuite
regrouper ces données sous forme de
tableau.
Cet outil n’est utilisable que sur les
données sous forme de liste.
Le site Amazon sera utilisé pour
montrer les capacités de cet outil.
Chercher d’abord à l’aide de votre
navigateur un thème à rechercher sur
Amazon.
Ici, il s’agit des mots-clés « veille technologique » recherchés dans la catégorie « Livres en français ».
Faire glisser l’icône source « URL » et la relier au module d’extraction « Extract List ». Le logiciel
effectue alors l’extraction de la liste du site (13 documents).
Après l’obtention de la liste, glisser-déposer l’outil de transformation « Loop » sur le Whiteboard et le
lier à la liste. L’outil construit alors automatiquement un « Webclip » qui correspond à un exemple de
données constituant votre liste.
Après cette étape, l’utilisateur devra double-
cliquer sur le Webclip obtenu pour préciser
quel type d’information garder. Une nouvelle
fenêtre s’ouvre (voir schéma ci-contre)
montrant le premier élément de la liste.
Surligner à l’aide du pointeur de la souris le
type d’information à conserver.
Dans cet exemple, seul le titre de l’article a
été surligné et donc conservé. Une fois les
données souhaitées surlignées, le bouton
« Extract » permet de finaliser l’extraction.
(Schéma ci-contre)
sous-ensemble
[email protected] PPaaggee
4433 ssuurr 7711
Une fois l’étape précédente terminée, le logiciel créé une nouvelle extraction
consultable par double-clic (Webclip « Titres livres » ci-contre). Pour extraire une
nouvelle liste d’information, double cliquer sur le Webclip originel (Webclip 1) pour
répéter l’opération en sélectionnant une nouvelle information à extraire en la
surlignant. Dans cet exemple, nous
choisissons d’extraire un deuxième
attribut : les noms d’auteurs. Un nouveau
Webclip apparaît. Il est possible
d’extraire autant de types d’informations
qu’on le veut, il suffit de répéter l’étape en sélectionnant à
chaque fois l’attribut à conserver.
Pour terminer la transformation du flux, il suffit alors de
relier les deux nouveaux Webclip au module «End Loop»
(étape 1 ci-contre). Pour concrétiser le lien et adapter la
sélection à l’ensemble de la liste, double-cliquer sur le
module « End Loop » ou cliquer droit, puis « Execute
Loop ». Celui-ci créé alors un tableau ne contenant plus
que le type d’information que vous avez sélectionné plus haut. (Voir résultat ci-dessous avec les titres
et les noms d’auteur).
[email protected] PPaaggee
4444 ssuurr 7711
Outil « Custom Text »
L’un des derniers outils que propose la plateforme TaDaweb est le Custom Text
◦ Permet de réaliser des recherches par mots-clés sur différents outils simultanément.
Ne comprenant pas les mêmes étapes de fonctionnement, cet outil se démarque des autres. En effet
la première étape ne consiste plus à placer la source mais l’outil de transformation. La source vient
alors s’ajouter au module de transformation
par la suite. Puisque cet outil permet la
recherche par mots-clés, il n’est utilisable
que via les sources réseaux sociaux « Twitter Search, Facebook Search et Google+ Search » et via
les moteurs de recherche « Google Search et Yahoo! Search ».
Une fois les moteurs ou réseaux sociaux liés à cet outil,
l’utilisateur peut démarrer sa recherche en cliquant sur l’outil
« custom Text » positionné sur le Whiteboard.
Une nouvelle fenêtre s’ouvre, permettant à l’utilisateur d’entrer
les mots-clés à rechercher.
En cochant la case « Permanent Data », l’utilisateur choisit de toujours apportés ce filtre par mots-clés
sur sa source ou non.
En cliquant sur « Save », vous obtenez alors le résultat de la recherche faite simultanément sur les
deux moteurs.
Le veilleur obtient ainsi deux listes correspondant aux
recherches effectuées avec les mêmes mots-clés sur
les deux sources.
Mais les fonctionnalités de l’outil Custom Text ne
s’arrêtent pas à la mise en commun d’une recherche
sur deux sources (Twitter Search et Facebook Search,
Google Search et Yahoo Search, Yahoo Search et
Google+ Search, ...).
Cet outil permet également :
◦ Ajout d’un élément statique. En reliant Custom Text avec l’outil Webclip et l’outil Extract
List, il devient possible d’ajouter un élément statique à la liste, pour exemple un en-tête.
◦ Transformation en bloc de texte. N’importe quel élément : liste, tableau, Webclip ou même
URL peut être transformé en bloc de texte avec Custom Text.
[email protected] PPaaggee
4455 ssuurr 7711
◦ Recherche avec valeur dynamique. En reliant Custom Text à divers outils-source (voir ci-
dessous) et en omettant de cocher la case « Permanent Data », il devient possible de
réutiliser le TaDa créé et sauvegardé (ayant pour sujet la Sté TaDaweb dans l’exemple
donné), pour effectuer la recherche sur les mêmes sources mais sur un nouveau sujet (sur la
Sté Easi-ie dans l’exemple donné).
En effet lorsqu’on exécute le TaDa, le Custom Text redemande avec quelle valeur l’action doit être
effectuée, puisque la case Permanent Data n’a pas été cochée.
De la même façon, Custom Text permet d’effectuer la même action sur le formulaire d’un site
proposant plusieurs options ou mots-clés de recherche, sans avoir à recommencer le processus
d’authentification.
◦ Création d’un outil de recherche spécifique à un site donné en reliant Custom Text a un
formulaire (recherche avec valeur dynamique).
[email protected] PPaaggee
4466 ssuurr 7711
En procédant ainsi et après avoir sauvegardé le TaDa correspondant, le formulaire peut être ré-exécuté
avec une nouvelle valeur pour faire une recherche avec un nouveau mot-clé sur le site Les Echos (voir
schéma ci-dessous où la recherche BCE est remplacée par Banque de France).
Au final, si TaDaweb offre directement et simultanément un accès à Yahoo, Google, Facebook et Twitter,
grâce aux outils : Extract Form + Custom Text, l’utilisateur peut de plus créer un outil de recherche
adapté à n’importe quel site.
[email protected] PPaaggee
4488 ssuurr 7711
Outil « Custom List »
L’outil Custom List permet plusieurs transformations similaires à Custom
Text. Dans un premier cas, l’utilisation de cet outil permet de combiner
plusieurs flux RSS ensemble pour ne former qu’un seul flux de sortie.
Prenons par exemple les flux RSS des sites Scoop-It, Outils froids, Easi et
Veille-ie and Co.
Déposer l’icône « Custom List » sur le Whiteboard. S’ouvre alors
l’interface ci-contre, dans laquelle l’utilisateur devra entrer les flux RSS des
sites à surveiller. Une fois ces flux sauvegardés, déposer l’outil « Loop »
sur le Whiteboard. Relier La « Custom
List » à l’icône « Start Loop ». Vous obtenez alors un « Webclip ».
Glisser-déposer l’outil RSS Feed sur le Whiteboard et relier celui-
ci au Webclip obtenu comme ci-contre. Vous obtenez alors une
nouvelle liste regroupant les informations se trouvant sur le premier
flux de votre « Custom List ». Ici, il s’agit donc des informations du
flux de Scoop-It. Pour regrouper tous les flux ensemble, relier cette dernière liste à l’icône « End
Loop » et double-cliquer sur ce dernier. L’utilisateur obtient le regroupement des différents flux sous
forme de liste.
Remarque : cette fonctionnalité est comparable à celle de RSS Feed
La deuxième utilisation de cet outil vise à enregistrer une liste de mots-clés afin de réutiliser ceux-ci
sur différents TaDas. Pour cela, déposer l’outil « Custom List » sur le Whiteboard. Dans l’interface qui
s’ouvre, entrer les mots-clés à surveiller. Cliquer sur le bouton « Save »
de l’interface puis « Save TaDa ! » du Whiteboard. Remplir les
champs nécessaires. Cette liste sera alors enregistrée comme chemin
de construction mais n’apparaîtra pas sur le Dashboard puisque sous
cette forme, il n’y a aucune source ni information extraite.
Ouvrir ensuite une nouvelle fenêtre pour construire
un nouveau TaDa. Aller dans l’onglet TaDa et faire glisser sur le Whiteboard le
TaDa de mots-clés. Cliquer ensuite sur « Execute TaDa » comme ci-contre.
Vous obtenez alors une liste regroupant les différents mots-clés. Glisser déposer ensuite votre source
d’information sur l’environnement de travail. Ici, il s’agit d’un flux RSS. Glisser-déposer l’outil
« Filter » de l’onglet « Extract » sur le Whiteboard. Relier la liste de mots-clés à la « Keyword List »,
les mots-clés s’ajoutent alors automatiquement à celle-ci. Pour finir, relier la liste de flux à l’outil
« Filter ». Vous obtenez alors une liste ne contenant que les mots-clés retenus (voir image ci-dessus).
Cette liste de mots-clés est réutilisable à l’infini.
[email protected] PPaaggee
4499 ssuurr 7711
Mais Custom List permet aussi d’utiliser des entrées dynamiques, comme Custom Text ou de
transformer une liste extraite sur Internet en tableau.
[email protected] PPaaggee
5500 ssuurr 7711
Modalités d’utilisation d’un TaDa
Synthèse des fonctionnalités (outils) associables de TaDaweb
[email protected] PPaaggee
5511 ssuurr 7711
Possibilités de mise en relation fonctionnelle entre les différentes étapes et outils de manipulation des
sources
En vert, les extractions possibles à partir d’une source donnée. Et inversement pour les croix rouges
Certains modules ne permettent cependant de transformer que certains types de sources, c’est
pourquoi la phase de transformation est celle qui requiert le plus d’attention.
Ainsi :
Le module « Merge » ne peut réunir que des listes, textes, tableaux et liens, pour déboucher
sur une seule sortie,
« Split » est applicable aux listes, textes, tableaux et liens,
Le module « Compare » ne peut comparer que des listes ou des tableaux,
« Loop » est un module applicable seulement aux données sous forme de listes,
« Custom Text » ne peut être lié qu’aux différents réseaux sociaux et moteurs de recherche,
« Filter » ne peut fonctionner avec le « Webclip » - dont le résultat est considéré comme un
seul texte par le logiciel et non comme une liste – Le Webclip doit donc être préalablement
transformé en liste si on souhaite utiliser l’outil Filter.
Pour ce faire utiliser l’outil « Extract list » sur le Webclip. Si le résultat ne donne rien, utiliser
« Extract link » lorsque chacun des éléments contenus dans le Webclip supporte un lien.
[email protected] PPaaggee
5522 ssuurr 7711
Points communs aux diverses fonctionnalités
Les « outils » de TaDaweb ne sont pas tous compatibles entre eux. Pour vérifier les capacités de mise
en relation des divers outils, se référer aux deux tableaux du paragraphe précédent.
◦ Chacun des outils proposés crée automatiquement l’icône représentant l’action et le résultat de
l’outil sur la source (un aperçu montrant les informations obtenues).
◦ Cependant, lorsqu’il y a d’absence de données, le logiciel fait apparaître une
nouvelle icône remplaçant le résultat attendu. Dans ce cas, ce n’est pas une
erreur de l’utilisateur, mais simplement une absence de données à l’instant T.
Cette recherche peut tout de même être sauvegardée et une alarme peut être
programmée pour que le veilleur soit averti lors de la mise en ligne des données attendues.
◦ Le nombre de données constituant une liste
est toujours précisé, même si celle-ci n’en
contient aucune, comme dans l’exemple ci-
contre ou l’outil « Extract Table » indique 0
document.
On peut remarquer que les relations créées
contenant des données et aboutissant à une
liste non vide sont verts, tandis que
l’extraction créée n’aboutissant pas (« Extract Table ») faute de données, donne une relation
orange. En cliquant sur l’icône « Table », le logiciel fait apparaître en bas du Whiteboard le
message pour signifier à l’utilisateur qu’elle ne contient aucune donnée.
« Execute » permet de réaliser une action ; « Edit » permet de la modifier
◦ Sélection d’un groupe d’informations dans un ensemble. Si plusieurs liens,
tableaux ou encore images sont disponibles sur le site (ou la partie de site) consulté, l’outil
Extract correspondant propose à l’utilisateur de choisir les données qui l’intéresse (lien, tableau,
liste, image). Cette possibilité n’existe pas pour l’outil Extract List.
[email protected] PPaaggee
5533 ssuurr 7711
Utiliser un même TaDa pour exploiter une nouvelle source
Pour exploiter une nouvelle source, il suffit de rentrer dans la barre d’adresse une nouvelle URL, puis
d’afficher la page demandée dans l’espace Navigateur.
Un glissé-déposé de l’icône URL permet de faire apparaître cette deuxième source sur le même
TaDa. Pour procéder à l’extraction de tout ou partie des articles ou paragraphes, suivre la procédure
décrite ci-dessus (fonction Webclip).
[email protected] PPaaggee
5544 ssuurr 7711
Utiliser un nouveau White Board pour créer un TaDa
Pour ne pas surcharger en données ce premier TaDa (TaDa noté TaDa 1), l’utilisateur peut en créer
un nouveau TaDa en cliquant sur le bouton situé sur la même ligne que la barre d’adresse.
Un nouveau TaDa (TaDa 2) est alors ouvert pour créer de nouvelles requêtes sur d’autres sites. Le
précédent TaDa et ses données restent toujours disponible en cliquant sur l’icône correspondant.
Utiliser le TaDa d’un autre utilisateur
Il est possible pour un utilisateur de récupérer le TaDa d’un autre. Pour cela, aller sur le Dashboard en
ligne dans l’onglet « Public TaDas » et cliquer sur le bouton du TaDa voulu. Ce TaDa est
alors mis à jour et « My TaDas » est retiré de la plateforme. L’utilisateur peut alors retrouver celui-ci
dans l’onglet « TaDa » de Tadaweb Creator et peur en réutiliser le chemin de sélection comme bon
lui semble (Voir réutilisation d’un chemin de sélection ci-après).
[email protected] PPaaggee
5555 ssuurr 7711
Sauvegarde un TaDa
Une fois les chemins de sélection définis et les données extraites, l‘utilisateur doit
sauvegarder ceux-ci en appuyant sur le bouton « Save TaDa », pour pouvoir ensuite
les réutiliser, les consulter ou encore les partager.
S’ouvre alors une interface permettant à l’utilisateur, de façon analogue à l’utilisation d’un document
Word, de nommer et de structurer la présentation des différentes informations collectées en leur
assignant des titres, sous-titres. On peut également illustrer la présentation en y ajoutant une image
depuis l’ordinateur.
Cette nouvelle fenêtre est composée de trois parties.
- La première partie à gauche et composée des éléments qui regroupent les différentes informations
présentent sur le TaDa (texte jaune sur fond vert à l’écran).
- La deuxième partie au centre est l’espace de modifications permettant de combiner les
informations (partie gauche, titres des sources sur fond vert) à des éléments de mise en page pour
la présentation des résultats (partie droite, options sur fond bleu).
- La troisième partie à droite regroupe les éléments permettant de classer et positionner titres,
divisions, synthèses, etc. dans l’espace de modification.
Tout d’abord, nous devons sélectionner dans la première partie à droite, les informations que le TaDa
contiendra en cliquant sur le correspondant. Les informations qui ne seront pas ajoutées par ce
moyen n’apparaîtront pas sur le TaDa final, c'est-à-dire sur l’output du TaDa.
Ensuite, nous devons sélectionner des éléments dans la troisième partie regroupant les éléments de
mise en page (bleu). Ne sélectionner que les éléments souhaités.
[email protected] PPaaggee
5566 ssuurr 7711
- Les éléments « Title », « Section » ou encore « Subsection » permettent de regrouper et de
nommer les différentes informations présentes dans la partie centrale à
l’aide de titres et sous-titres. En choisissant ces éléments, le logiciel
ouvre une petite interface permettant à l’utilisateur de donner un
descriptif à la partie concernée.
Les éléments sélectionnés se retrouvent dans la partie centrale. Ils peuvent être positionnés dans
l’ordre voulu à l’aide des flèches et leur titre modifié à l’aide du crayon ou supprimés .
- L’outil « Paragraphe » permet de rédiger manuellement un texte à insérer dans le TaDa. Il peut
par exemple s’agir d’une introduction, d’une synthèse ou d’une remontée d’information terrain.
- L’élément « Logo » permet d’ajouter dans le TaDa une seule et unique image venant de votre
ordinateur.
- L’élément « Table of Contents » quant à lui, est un outil permettant d’insérer une table des
matières pour une meilleure visibilité de la structure choisie pour le contenu du TaDa. Cette Table
des matières regroupe automatiquement tous les noms de parties, ou sous parties nommées par
l’utilisateur.
Une fois les modifications terminées, le bouton « Preview » (voir ci-dessus au bas de l’avant dernière
copie d’écran) permet de visualiser la structure choisie afin de la modifier éventuellement avant
sauvegarde (Done).
[email protected] PPaaggee
5577 ssuurr 7711
La table des matières permet d’accéder aux documents contenus dans le paragraphe grâce à des
liens hypertexte créés automatiquement.
Un bouton « Reset » permet de supprimer toutes les modifications effectuées dans l’espace central.
Lorsque le résultat est jugé satisfaisant il est validé par le bouton « Done ». A ce stade, on accède
alors à l’interface présentée ci-dessous.
Le logiciel ouvre donc une nouvelle interface permettant à l’utilisateur de valider la sauvegarde du
TaDa et de configurer son accès.
Dans cette fenêtre, un nom ainsi qu’une description peuvent être
assignés au TaDa créé comme dans l’exemple ci-contre.
L‘étape de la sauvegarde permet également d’insérer votre TaDa
dans une « Category » prédéfinie par TaDaweb.
L’onglet « Visibility » fait référence à l’accessibilité du TaDa
(public ou privé). Un TaDa privé pourra néanmoins être partagé
sous forme de journal avec un groupe de personne spécifique
qui doit être précisé (cf. ci-après).
Une fois ces données renseignées, appuyer sur « Save »
pour sauvegarder ou « Cancel » pour annuler toute la
sauvegarde.
Le TaDa sauvegardé devient alors disponible sur le
logiciel TaDaweb Creator (voir paragraphe ci-dessous) et
sur le Dashboard en ligne sous sa forme présentée ci-
contre.
[email protected] PPaaggee
5588 ssuurr 7711
Consulter, modifier, réutiliser la structure d’un TaDa
Lorsque l’utilisateur souhaite consulter ou modifier un TaDa déjà enregistré, il doit
récupérer ce TaDa dans le dernier onglet de la barre d’outils de TaDaweb
Creator, dénommé « TaDa ».
► Consultation des TaDas
Dans l’onglet « TaDa » de la barre d’outil, choisir le TaDa à consulter.
En glissant le TaDa sélectionné sur le Whiteboard (« Collecte de
l’information » dans le cas de figure), l’utilisateur obtient la possibilité de :
Visualiser la présentation du TaDa (sa sortie) qui donne le résultat
de veille (à partir du chemin de sélection créé) en cliquant sur
« Execute TaDa ».
Visualiser et modifier le chemin de sélection du TaDa (mode "édition" permettant de
modifier la structure du TaDa) en cliquant sur « Edit TaDa ».
Notons ici que les TaDas peuvent être assemblés comme des poupées russe : un TaDa pouvant en
contenir un autre et ainsi de suite. La "sortie" du TaDa sous sa « forme simplifié » permettant
d’encapsuler des TaDas les uns dans les autres. En quelque sorte, il est possible de continuer la
construction d’un TaDa à partir de la sortie d’un TaDa d’origine, il s’agit cependant d’un nouveau
TaDa dans ce cas.
Quant au mode "édition" (la « forme développé »), il va va garder le Look & Feel (la mise en page)
créé lors du "Save" du premier Tada (tandis que la "sortie" du TaDa sous sa « forme simplifié » est
considéré comme un nouveau TaDa.
Sortie du TaDa Présentation sous forme simplifiée
Mode édition du TaDa - Présentation développée permettant des modifications
[email protected] PPaaggee
5599 ssuurr 7711
► Modification du TaDa
Pour utiliser cette option, il est nécessaire de partir de la vue obtenue
par l’option « Edit TaDa » (forme développée) qui permet de visualiser
les différentes actions créées sur la source (voir ci-dessus).
- Pour supprimer l‘une de ses actions, il suffit de cliquer sur la
croix rouge de l’icône ou encore, s’il s’agit d’une source dans
une liste, d’ouvrir la liste, de sélectionner la source à supprimer
et de cliquer sur « Remove » (ci-contre, suppression de la
source RSS Feed « ZDnet»). Cette action disparaît alors,
modifiant le reste du chemin de sélection.
- Pour ajouter une action procéder comme indiqué ci-avant.
Pour que ces modifications soient prises en compte, cliquer sur le bouton « Save TaDa » du
Whiteboard (reprendre étape de sauvegarde ci-dessus). Les modifications du TaDa sont alors
sauvegardées, gardant tout de même l’ancien chemin de sélection du TaDa.
► Réutilisation d’un chemin de sélection
Fréquemment le chemin de sélection, caractérisé par une certaine succession de fonctionnalités, se
répète d’une source à l’autre : extraction d’une partie de texte (Webclip), d’une image, d’une liste, d’un
tableau de données,…. Il est donc avantageux de réutiliser ce chemin de sélection pour les nouvelles
sources concernées.
Pour cela, choisir dans le bandeau gauche (onglet TaDa) le TaDa dont les fonctionnalités serviront de
« patron ». Glisser le TaDa sélectionné sur le Whiteboard. A l’aide de l’option « Edit TaDa » décrite
plus haut, développer entièrement le TaDa comme ci-dessous.
Dans un premier temps, Il suffit alors de remplacer
la source par une autre. Dans le cas d’une source
URL, supprimer l’icône de la source à remplacer,
taper la nouvelle adresse dans la barre du
navigateur, et redéposer une nouvelle icône URL
sur le Whiteboard. En liant cette nouvelle icône
aux outils d’extractions du TaDa patron, le logiciel
recharge alors les nouvelles données en fonction
de la nouvelle source.
Dans le cas d’un flux, changer directement
l’adresse en double cliquant sur l’icône de la
source. Dans cet exemple, nous allons récupérer le TaDa « Collecte de l’information » et remplacer la
source du flux d’Easi-ie par celui de Veille ie and co. Double cliquer alors sur l’icône RSS Feed.
[email protected] PPaaggee
6600 ssuurr 7711
S’ouvre alors l’interface de gestion des flux RSS à surveiller comme ci-
dessous.
Sélectionner l’adresse à supprimer (ici Easi-ie) et cliquer sur
« Remove ». Entrer ensuite la nouvelle adresse à surveiller (ici, celle de
veille ie and co)
En cliquant sur « Save », le logiciel charge automatiquement les
résultats en fonction du nouveau site.
Ces étapes terminées, il ne reste donc plus qu’à sauvegarder ce
nouveau TaDa en utilisant les mêmes outils que le TaDa « patron ».
Remarque : Réutiliser la base d’un ancien TaDa permet avant tout un gain de temps, puisque
l’utilisateur n’aura plus la nécessité de glisser-déposer et relier les différents outils.
Rappelons qu’il est plus simple d’utiliser Custom Text ou Custom List. pour pouvoir changer les
données à la volée.
[email protected] PPaaggee
6611 ssuurr 7711
Mise en mémoire et enrichissement des informations d’un TaDa
◦ Sauvegarde de l’information collectée
Si le chemin de collecte et de sélection de l’information est mémorisé pour chaque TaDa par
l’outil lui-même, les informations contenues, actualisées au fur et à mesure des mouvements de la
source, ne sont elles-mêmes pas mémorisées lorsqu’elles subissent une modification.
- Toute modification d’un document vient « écraser » la version précédente du document dans
le TaDa.
- Par contre, lorsqu’une nouvelle information (document, donnée, ...) est émise par la source,
elle vient simplement s’ajouter à celles précédemment collectées. De même, les
informations des sources non mouvementées restent en l’état jusqu’à modification.
Ce mode de fonctionnement implique, pour ceux qui le souhaitent, de disposer d’un outil annexe
permettant de sauvegarder sur la période souhaitée la sortie d’un TaDa à un instant T.
◦ Annotations des documents sélectionnés
Le veilleur comme l’utilisateur des résultats de la Veille doit pouvoir travailler directement sur les
documents recueillis, à savoir : sur-lignages, annotations, notes de bas de page, ...
Pour faciliter la consultation de l’information sauvegardée, il nous est apparu intéressant de penser au
format e-book qui vient s’insérer dans les routines de consultation des documents écrits et dans les
tendances des sorties de la Veille. Dans cette optique, nous avons comparé les outils Yudu, Calaméo,
Zinepal ou encore Feedjournal.
Après tests de ces différents outils pour la gestion des résultats de la Veille de TaDaweb, il apparait
que :
Ces outils ne prennent pas en compte le format de sortie des TaDas,
Ils n’apportent pas une lisibilité optimale des informations,
Ils ne permettent pas une bonne exploitation de l’information.
L’équipe de développement de TaDaweb ayant décidé d’intégrer sous peu, à leur outil, des
formats de sortie de type PDF ou encore e-book pour autoriser la sauvegarde, nous avons arrêté
notre choix sur l’application Yudu, consultable en ligne et multiplateforme (smartphone, tablette, PC).
Yudu permet en effet ...
- De lire le format (PDF) sous forme de magazine, livre ou autres,
- D’exploiter l’information en proposant une recherche par mots-clés mais aussi en autorisant
l’annotation ou encore l’ajout de notes de bas de pages.
- De stocker l’information indéfiniment (jusqu’à 100 documents par semaine) jusqu’à
suppression directe par l’utilisateur.
[email protected] PPaaggee
6622 ssuurr 7711
SCRAPBOOK. Une autre solution consiste à utiliser Scrapbook, une extension gratuite de Firefox.
Extrêmement aisée et intuitive à mettre en œuvre, cette application autorise une mise en mémoire sur
le poste utilisateur et le classement familier en arborescence (type Windows) des diverses sorties de
TaDaweb
L’avantage de Scrapbook, qui permet d’enregistrer, stocker, gérer et annoter les pages Internet
d’intérêt (voir tutoriel sur notre site), réside dans sa praticité : il installe un panneau latéral qui vient
s’intégrer au navigateur Firefox. L’organisation des captures se fait par simple glissé-déposé depuis la
barre d’adresse.
[email protected] PPaaggee
6633 ssuurr 7711
Partage et diffusion de l’information : TaDaweb Dashboard
Introduction au Dasboard
Nous devons distinguer :
o Le Dashboard lié à Creator, accessible directement depuis le logiciel installé en cliquant sur
« Dasboard » (voir ci-dessus). Il permet de vérifier la présentation qu’aura le Dashboard en ligne
des TaDas et journaux créés, de les consulter et de les rechercher/sélectionner :
o Le Dashboard en ligne. Le partage et la consultation, à la différence de la création de TaDas, ne
s’effectue par sur l’outil TaDaweb Creator mais sur la plateforme en ligne, accessible depuis un
navigateur à l’adresse www.tadaweb.com, qui rend actif diverses fonctionnalités.
Cette seconde interface assure la diffusion en ligne. Elle constitue pour les utilisateurs une sorte
de tableau de bord du travail effectué sur le TaDaweb Creator.
Public TaDas
Il permet d’accéder aux TaDas publics créés par d’autres usagers (recherche sur mots-clés,,
sélection pour insertion dans ses propres Tadas), mais aussi à de nouvelles fonctionnalités
accessibles depuis les menus « Explore » et le menu personnel (ici « Paul »).
[email protected] PPaaggee
6644 ssuurr 7711
Sur cette page, l’utilisateur peut suivre une personne en particulier. Si par exemple, une personne
publie régulièrement des TaDas publics
susceptibles d’intéresser l’utilisateur, celui-ci
pourra alors la suivre pour ne rien manquer de
ce qu’elle publie. Pour cela, il suffit de cliquer
sur la photo de la personne dont on veut
suivre le flux d’information. Comme ci-contre.
Ce faisant, l’utilisateur est alors redirigé vers le
profil de la personne concernée et peut
accéder aux informations la concernant, à ses
TaDas catégorisés comme publics et aux
personnes qu’il suit et qui le suivent (voir
image ci-dessous).
En cliquant sur le bouton « Follow », celui-ci passe alors au rouge , vous permettant de ne
plus suivre cette personne.
[email protected] PPaaggee
6655 ssuurr 7711
TaDas privés
Menu utilisateur. Le menu déroulant obtenu en cliquant sur le nom d’utilisateur (en haut à droite)
permet d’accéder à ses propres « TaDas » et « Journals ».
La page TaDa permet de consulté et gérer les TaDas de l’utilisateur connecté. On accède à cette
page en cliquant en haut à droite de la page d’accueil, sur le nom de l’utilisateur, puis sur « TaDas ».
La page TaDa se compose de deux parties.
La première partie (haute) de la page TaDas permet à l’utilisateur de préciser son profil, de rechercher
différents TaDas lui appartenant à l’aide de filtres par catégories, et de voir les Follower, personnes
suivant l’un de ses TaDas ou encore les Following, personnes que l’utilisateur connecté suit.
En cliquant par exemple sur l’icône « Following », l’utilisateur obtient le résultat ci-dessous.
A travers cet exemple, nous pouvons par exemple retrouver la personne suivies dans l’étape
précédente.
En plus de cet espace de suivis, l’utilisateur pourra modifier son profil et le préciser s’il le souhaite.
Pour cela, cliquer sur l’icône ou sur la phrase « Click here to add a bio… ». L’utilisateur pourra
entrer de nouvelles informations le concernant et modifier les informations existantes.
[email protected] PPaaggee
6666 ssuurr 7711
La deuxième partie (basse) de la page regroupe les TaDas
de l’utilisateur connecté. L’utilisateur peut consulter sur
cette page les informations extraites lors de la veille. Cette
interface permet également de rafraîchir les données ou
encore de créer des alertes différentes par TaDas. Ci-
contre, exemple de TaDas.
Cliquer sur le bouton alarme du TaDa permet de
paramétrer celle-ci. L’utilisateur pourra ainsi choisir la
fréquence à laquelle sont TaDa sera mis à jour.
La seconde partie de l’alarme permet de choisir la
date de début de surveillance du TaDa.
L’utilisateur sera averti par mail lors de chaque
modification de source surveillée.
Cliquer sur le bouton « Publier dans le journal » enverra
le TaDa sélectionné vers le journal voulu. En cliquant
sur ce bouton, une interface s’ouvre, permettant de
choisir à quel journal envoyer le TaDa. (Voir ci-contre)
[email protected] PPaaggee
6677 ssuurr 7711
Journals privés
Menu utilisateur. Le menu déroulant obtenu en cliquant sur le nom d’utilisateur (en haut à droite)
permet d’accéder à ses propres « TaDas » et « Journals ».
Le « Journal » regroupe les différents TaDas. Ainsi, les TaDas créés sur le thème de la veille peuvent
tous être regroupés dans un journal du même nom.
Le journal est un outil pratique visant à surveiller toutes les sources du même thème. Il peut être
partagé avec une personne ou groupe en appuyant sur le bouton . Vous pouvez également
choisir de le partager sur différents réseaux sociaux ou encore partager le journal par email avec un
groupe de personne donné.
Le bouton permet quant à lui de rafraîchir les données des TaDas composant le journal, afin
de les mettre à jour suite aux mouvements qui ont affectés les sources utilisées..
On peut accéder à cet onglet en allant
directement dans l’onglet de l’utilisateur,
en haut à droite de la page d’accueil puis
en cliquant sur « Journals » ou bien
depuis le Dashboard en cliquant sur
« Journals » en haut à droite.
En cliquant sur cet onglet, l’utilisateur
arrive d’abord sur une interface de
gestion des Journaux.
Sur cette fenêtre, l’utilisateur doit choisir sur quel « Journal » se rendre. Dans l’exemple ci-dessus, un
seul journal a été créé : l’utilisateur peut donc accéder à ce journal en cliquant sur la bannière bleue
ou en créer un nouveau en cliquant sur « Create a new Journal ».
Pour les journaux existants, en cliquant sur
l’option « Edit », l’utilisateur obtient alors la
fenêtre suivante. Celle-ci permet de changer les
métadonnées du journal, ainsi que sa fréquence
de mise à jour.
L’utilisateur peut également supprimer le journal
en appuyant sur le bouton
[email protected] PPaaggee
6699 ssuurr 7711
Web Clipper
Menu Explore. En cliquant sur le menu « Explore » on peut accéder à la fonction « Web Clipper » à
partir de l’option « Tools ». Un simple glisser –déposer sur la barre d’outils (toolbar) du navigateur
permet de rendre active cette fonctionnalité (voir schéma suivant)
Une fois le Web Clipper dans la barre d’outils, il suffit de cliquer sur « +Clip a TaDa » pour obtenir en
bas de page la fonctionnalité. Pour sélectionner directement tout ou partie de la page il suffit de
cliquer sur « Select » puis sur « Expand » pour élargir la zone de sélection. « Save » permet ensuite
de créer un TaDa à la volée (voir ci-dessous, page suivante).
[email protected] PPaaggee
7711 ssuurr 7711
Signalement des ajouts ou modifications des pages Web surveillées
TaDaweb signale les modifications des pages surveillées sur le Dashboard en ligne, en indiquant en haut à droite, dans un encadré vert « Show new content ».
Il suffit alors de faire défiler le
Tada : tous les ajouts depuis la
dernière visite sont surlignés
en vert.
Pour faire disparaître ce
surlignage il suffit de cliquer en
haut à droite sur « Hide new
content », ce qui fait
réapparaître « Show new
content ».
Rechercher un mot
La fonction universelle peut ête utilsiée pour des recherches sur un TaDa ou un journal.