71
Tutoriel TaDaweb Auteurs P.Degoul - A.Poinsel - F.Gaspard Version V1.1.2 Date 17/06/2013 Les versions majeures sont notées par le premier nombre (Vx) ; les versions mineures correspondant à des évolutions fonctionnelles sont notées par le deuxième nombre (Vx.y) ; le dernier chiffre indique des mises à jour correspondant à de petites évolutions (Vx.y. z) [email protected] Page 1 sur 71 Réalisation d’un dispositif de veille automatisée basé sur une plateforme de veille innovante Une technologie qui pense "utilisateur" pour rendre la Veille plus attractive pour l’usager et plus simple et productive pour le veilleur Guide de l’utilisateur

Réalisation d’un dispositif de veille automatiséebarre d‘adresse et un espace de présentation de l‘URL demandé. Whiteboard. Situé au milieu, il s‘agit d‘un espace qui

  • Upload
    others

  • View
    1

  • Download
    1

Embed Size (px)

Citation preview

Tutoriel TaDaweb

Auteurs P.Degoul - A.Poinsel - F.Gaspard Version V1.1.2 Date 17/06/2013

Les versions majeures sont notées par le premier nombre (Vx) ; les versions mineures correspondant à des évolutions fonctionnelles

sont notées par le deuxième nombre (Vx.y) ; le dernier chiffre indique des mises à jour correspondant à de petites évolutions (Vx.y.z)

[email protected]

PPaaggee 11 ssuurr 7711

Réalisation d’un dispositif de veille automatisée

basé sur une plateforme de veille innovante

Une technologie qui pense "utilisateur"

pour rendre la Veille plus attractive pour l’usager

et plus simple et productive pour le veilleur

Guide de l’utilisateur

[email protected] PPaaggee

22 ssuurr 7711

Sommaire

Introduction générale ................................................................................................. 4

Logique de mise en place d’un dispositif de Veille ....................................... 4

Plateforme de Veille TaDaweb ........................................................................ 5

Organisation de l’information : TaDaweb Creator ................................................... 8

Introduction à TaDaweb Creator .................................................................................... 8

I. Surveillance des sources : onglet Source ................................................... 10

Outil "URL" et fonction "Webclip" ............................................................................... 10

Outil "RSS Feed" ................................................................................................................ 13

Outil « Google Search » .................................................................................................. 14

Outil « Google+ Search » ................................................................................................ 15

Outil « Yahoo! Search » .................................................................................................. 16

Outil « Facebook Search » ............................................................................................. 17

Outil « Twitter Search » ................................................................................................... 18

Création de TaDas directement depuis le navigateur « Bookmarklet: Web

Clipper » ...................................................................................................................................... 19

II. Extraction de l’information : onglet Extract ................................................. 21

Outil « Extract Webclip » ................................................................................................ 21

Outil « Extract Form » ..................................................................................................... 22

Outil « Extract Link » ....................................................................................................... 25

Outil « Extract Table » ..................................................................................................... 26

Outil « Extract RSS » ....................................................................................................... 28

Outil « Extract Image » .................................................................................................... 29

III. Exploitation et structuration de l’information : onglet « Transform » ........ 30

Outil « Tansform » ............................................................................................................ 30

Outil « Filter » .................................................................................................................... 32

Outil « Merge » .................................................................................................................. 34

Outil « Split » ..................................................................................................................... 36

Outil « Compare » ............................................................................................................. 37

Outil « Navigate » ............................................................................................................. 39

Outil « Loop » .................................................................................................................... 42

Outil « Custom Text » ...................................................................................................... 44

[email protected] PPaaggee

33 ssuurr 7711

Outil « Custom List » ....................................................................................................... 48

Modalités d’utilisation d’un TaDa ............................................................................ 50

Synthèse des fonctionnalités (outils) associables de TaDaweb ......................... 50

Points communs aux diverses fonctionnalités ........................................................ 52

Utiliser un même TaDa pour exploiter une nouvelle source ................................. 53

Utiliser un nouveau White Board pour créer un TaDa ............................................ 54

Utiliser le TaDa d’un autre utilisateur.......................................................................... 54

Sauvegarde un TaDa ....................................................................................................... 55

Consulter, modifier, réutiliser la structure d’un TaDa ............................................ 58

Mise en mémoire et enrichissement des informations d’un TaDa ...................... 61

Partage et diffusion de l’information : TaDaweb Dashboard ................................ 63

Introduction au Dasboard .............................................................................................. 63

Public TaDas ...................................................................................................................... 63

TaDas privés ...................................................................................................................... 65

Journals privés ................................................................................................................. 67

Web Clipper ........................................................................................................................ 69

Signalement des ajouts ou modifications des pages Web surveillées.............. 71

Rechercher un mot ........................................................................................................... 71

[email protected] PPaaggee

44 ssuurr 7711

Introduction générale

Logique de mise en place d’un dispositif de Veille

La logique de fonctionnement du processus de Veille est en général calquée sur le cycle proposé par

la CIA comportant les 4 étapes clés bien connues.

Cependant si cette forme cyclique s’explique pour un

grand organisme qui sépare les fonctions

opérationnelles des fonctions de recherche-

sélection-analyse-diffusion de l’information, pour les

petites structures où ces fonctions sont souvent

intimement associées, cette forme apparaît souvent

théorique puisque l’usage de l’information n’est pas

clairement indiqué.

Nous préférons donc un schéma plus ouvert, reliant en 4 étapes itératives la spécification des

objectifs à l’action qui constitue la finalité même de la Veille. La formulation de ces 4 étapes met en

exergue les 4 points clés qui selon nous conditionnent la réussite du processus.

[email protected] PPaaggee

55 ssuurr 7711

Plateforme de Veille TaDaweb

Pour la séquence d’implémentation, nous avons sélectionné TaDaweb (www.tadaweb.com), une

plateforme de Veille « dans le cloud », permettant l’extraction, l’organisation et la publication

d’informations à partir de sources Web et de remontées d’informations terrain. Ce nouvel outil, encore

en version Beta, a été créé par la compagnie TaDaweb en juillet 2012 et salué à la mi-février 2013 par

Christophe Deschamps, comme une « solution innovante », aux « fonctionnalités étonnantes ».

Elle propose en natif la plus part des fonctions attachées à une plateforme et ce de façon

ergonomique et intuitive. Basé sur une logique simple et agréable, cet outil est composé de deux

parties qui seront étudiés plus loin :

1. TaDaweb Creator, module qui comprend trois groupes de fonctionnalités : collecte, extraction

et transformation permettant d’aboutir à une présentation structurée et communicante de

l’information.

[email protected] PPaaggee

66 ssuurr 7711

2. Dashboard en ligne destiné à la consultation et au partage des informations, véritable

tableau de bord du travail effectué sur le "TaDaweb Creator".

Ce logiciel peut être comparé à l’outil Yahoo Pipes, déjà présenté sur notre site, au niveau de ses

fonctionnalités, mais en moins rébarbatif. A l’usage il apparaît beaucoup plus facile à mettre en œuvre

et à utiliser et permet à tout veilleur de se familiariser de façon aisée aux fonctionnalités d’une

plateforme de Veille.

La richesse de ses fonctionnalités peut être synthétisée de la façon suivante :

Présentation en natif des résultats de Veille sous forme structurée et agréable à consulter

pour l’usager (le TaDa, un homologue de la Newsletter, mais cliquable),

Intégration d’un mode de communication, d’échange et de diffusion des informations des

TaDas sous forme de Journal, accessible de façon publique ou privés (DSI),

Prise en compte des remontées d’information terrain (rapport d’étonnement),

Productivité améliorée et utilisation facilitée pour le veilleur :

◦ Autoréalisation des fonctions (de l’action au résultat) après glissé-déposé des icônes,

[email protected] PPaaggee

77 ssuurr 7711

◦ Chemin de sélection clair et aisément compréhensible,

◦ Réutilisation d’un chemin de sélection d’une thématique (ou source) à l’autre,

◦ Fonctionnalités pensées utilisateur rendant plus simple la mise en œuvre de la Veille,

◦ Plateforme intégrant la recherche de sources par elle-même, les alertes, etc.

Si cette plateforme permet d’apporter une réponse positive à la complexité habituellement rencontrée

dans ce type d’outil, nous devons reconnaître néanmoins quelques points faibles.

Outre les inévitables bugs liés à toute préversion commerciale, nous devons signaler certaines

absences de fonctionnalités constituant des points de faiblesse :

Absence d’un véritable outil de dédoublonnage,

Pas de sauvegarde lorsqu’une nouvelle information vient renouveler/actualiser une information

déjà présente dans le Tada,

Absence de format de sortie adapté à la mise en mémoire (formats traditionnels tels que : PDF, e-

book, ...)

Cependant nous devons noter que ces divers points sont en cours d’intégration dans TaDaweb par

l’équipe de développement menée par son Dirigeant : M. François Gaspard.

[email protected] PPaaggee

88 ssuurr 7711

Organisation de l’information : TaDaweb Creator

Introduction à TaDaweb Creator

Cette première partie de l’outil, se présente comme un logiciel à installer qui permet d’organiser la

Veille grâce aux différentes fonctions proposées, débouchant sur une présentation structurée,

actualisée, de l’information collectée, appelée « TaDa ».

TaDaweb Creator est composé de trois parties : un navigateur, un espace de travail ou Whiteboard et

une barre latérale d’outils.

Navigateur. Situé dans la partie droite de la fenêtre de TaDaweb Creator, il comprend une

barre d’adresse et un espace de présentation de l’URL demandé.

Whiteboard. Situé au milieu, il s’agit d’un espace qui permet d’installer l’environnement de

travail : collecte et sélection de l’information.

Barre latérale. Située sur la gauche, elle regroupe les fonctions et outils permettant de

configurer la Veille. Trois onglets permettent de collecter (Onglet « Source »), et de

sélectionner, trier, combiner, comparer les informations (Onglets « Extract et Transform »). Un

quatrième onglet « TaDa » permet de retrouver les TaDas créés et enregistrés.

Ce logiciel installé constitue le module de travail destiné à la « création » du chemin de veille, comme

l’indique son nom « Creator ». L’ordre de présentation des trois onglets « Source », « Extract » et

« Transform » suit les trois étapes de manipulation des données. Chacun d’eux regroupent différents

outils permettant le sourcing, l’extraction et la pré-exploitation de l’information.

Ces outils peuvent être interconnectés sur le White Board comme nous le verrons plus loin,

afin de combiner et compléter les fonctionnalités (sous certaines réserves).

[email protected] PPaaggee

99 ssuurr 7711

Pour créer une veille, il est nécessaire de définir une source : il peut s’agir d’une page Web (URL),

d’un flux RSS (RSS Feed) ou de résultats de recherche issus de Google, Yahoo!, Google+, Twitter ou

Facebook.

L’onglet Source du logiciel TaDaweb Creator propose ainsi six types de sources à utiliser pour

commencer sa veille (voir barre latérale gauche).

Pour accéder aux fonctionnalités de chacune d’elle, il suffit de "Glisser-Déposer"

l’icône désirée sur l’espace de travail.

[email protected] PPaaggee

1100 ssuurr 7711

I. Surveillance des sources : onglet Source

Outil "URL" et fonction "Webclip"

En déplaçant cette icône dans l’espace de travail, l’adresse de la page apparaît automatiquement

sous celle-ci.

En passant le curseur sur cette icône une main apparaît (permettant son

déplacement dans l’espace de travail) avec deux symboles.

Le premier (triangle noir vers le bas) permet de décrire la page du site. Dans le cas illustré ici,

nous pouvons indiquer que nous avons demandé la page « Intelligence économique » du site

Les Echos. Il permet également de réafficher la page correspondant à l’URL.

Le second (croix rouge) permet de supprimer l’icône URL du Whiteboard. A noter qu’on peut

également supprimer un icône ou un groupe d’icônes à l’aide du bouton « supprimer »

(schématisé par une poubelle) en haut du WhiteBoard.

Pour sélectionner une partie que l’on souhaite collecter ou dont on souhaite surveiller les

mouvements dans la page Web affichée, cliquer sur l’icône URL (située dans le Whiteboard)

pour rendre actif le pictogramme « cible » : fonction Webclip, situé en haut de cet espace. Sa

couleur passe alors du rose au vert.

En cliquant sur ce pictogramme, la page surveillée devient ombrée. Il suffit alors de déplacer le

curseur sur la zone ombrée pour mettre en clair (blanc) la partie présentant un intérêt (voir copie

d’écran ci-dessous).

Pour finaliser la sélection, un bouton "Agrandissement" permet d’élargir la zone à surveiller.

◦ Un premier clic sur cette icône élargit la sélection du paragraphe sélectionné :

permet d’englober le contenu du paragraphe lorsqu’on a désigné le titre par exemple (ou

inversement), ou encore la mention « ... lire la suite ».

◦ Un deuxième clic élargit la sélection à l’ensemble des paragraphes ou articles de la page,

◦ Un troisième clic permet de prendre en compte l’entête de la page,

◦ Un quatrième et dernier clic permet de prendre en compte la page (y compris les

publicités ou informations annexes situées en général dans une colonne à droite des

articles).

[email protected] PPaaggee

1111 ssuurr 7711

Dans l’exemple ci-dessous:

- dans le site EASI nous avons sélectionné la catégorie (la page) « Utilitaires-Outils » (texte en

bleu sous l’icône URL de EASI du Whiteboard)

- Puis sélectionné l’article « Comment récupérer ses flux RSS de Google Reader ».

Une fois la zone choisie par la mise en surlignage clair, il suffit de cliquer sur le

bouton pour extraire les informations sélectionnées vers le Whiteboard (ou

de double cliquer sur le bloc à extraire).

Le chemin de sélection est alors automatiquement représenté par deux

nouvelles icônes, la première présentant l’action créée « Extract Webclip » et

la deuxième le résultat de la sélection, l’extrait ou « Webclip ».

A chacun des niveaux représentés, il est possible comme précédemment

d’affecter une description (cf. texte en bleu sous-titrant le texte proposé par

TaDaweb Creator).

Pour l’extrait en soi, le Webclip propose en plus de la description, une option supplémentaire qui

permet de visualiser l’extrait choisi (voir ci-dessous) qui sera consultable en ligne via le Dashboard.

[email protected] PPaaggee

1122 ssuurr 7711

Il est possible de sélectionner un autre article de la même page, de façon indépendante à la première

sélection en cliquant une nouvelle fois sur l’icône URL pour rendre actif le pictogramme « cible ».

Dans l’exemple ci-dessous nous avons ainsi sélectionné l’article (« Du nouveau dans Drive : créez,

partagez et éditez des cartes mentales ») et même l’ensemble des 10 articles les plus récents (ici au 7

avril 2013) présentés sur la page Web. Comme précédemment, il est possible d’affecter des

descriptions aux nœuds du processus. A chaque fois, il est possible d’accéder aux extraits

sélectionnés en cliquant sur le bouton « show » visible lorsque le curseur passe sur le triangle noir

associé au Webclip.

Certaines des informations extraites concernent des

données ou un texte « figé » (peu susceptible de

modifications ultérieures) qui seront ensuite

regroupées dans un « journal » créé sur le Dashboard

en ligne, en vue d’en diffuser le contenu à d’autres

utilisateurs. Dans le schéma ci-contre, ce type

d’information correspond aux Webclip A et B.

D’autres informations extraites, fréquemment

modifiées, doivent faire l’objet d’une surveillance : ce

type d’information correspond au Webclip puisqu’il

s’agit d’une page qui est amenée à évoluer selon

l’actualité des articles. L’organisation de la surveillance sera présentée plus loin.

Nota : la fonction Webclip peut aussi être mise en puevre à la volée, sur une page Web avec le Web

Clipper

[email protected] PPaaggee

1133 ssuurr 7711

Outil "RSS Feed"

Cet outil a pour but de faciliter l’extraction d’informations via l’utilisation d’un flux RSS. A la différence

de l’outil URL qui permet d’extraire des informations à partir d’une URL quelconque, l’outil « RSS

Feed » permet de suivre spécifiquement les fils d’information proposés par un site.

Pour utiliser cet outil, il suffit d’un glissé-déposé sur le Whiteboard.

Ce faisant, le logiciel ouvre une fenêtre dans laquelle l’utilisateur entre

les adresses des flux RSS à surveiller.

Soit la page

dispose d’un flux

RSS. C’est le cas de

l’exemple de la

newsletter du site

Easi-ie. Il suffit de

cliquer sur l’icône

(voir ci-contre).

En cliquant sur cette icône, il suffit de copier

l’adresse qui apparaît dans la barre d’adresse du

Navigateur puis de la coller dans l’interface

d’entrée de l’outil « RSS Feed » comme ci-dessus.

Après avoir finalisé l’extraction des données liées

au flux RSS, l’utilisateur obtient alors une liste de

données, consultable par clic. Notons que les résultats de sortie de plusieurs flux sont triés

automatiquement.

Nota : pour repérer plus aisément la présence de flux RSS sur une page présentant un intérêt,

utiliser l’outil « Extract RSS » présenté plus loin.

Soit le site ne contient pas de flux RSS. Pour créer le flux RSS d’une page spécifique, utiliser

l’outil « Diphur », présenté ici sur notre site.

Mentionnons que l’on peut aussi utiliser l’outil « Extract list » de TaDaweb (voir-ci après) qui

permet de traiter l’information d’une page, « presque » comme un flux RSS.

[email protected] PPaaggee

1144 ssuurr 7711

Outil « Google Search »

A la différence des précédents outils qui pointent vers une URL

spécifique, cet outil permet de surveiller les résultats obtenus sur une

thématique donnée grâce à un groupe de mots-clés pouvant mettre

en œuvre l’algèbre booléenne ainsi que les autres opérateurs

traditionnels de Google (guillemets, recherche par formats, etc). Comme les précédents outils, il

s’utilise en le déposant sur le Whiteboard.

S’ouvre une interface d’entrée libre permettant à l’utilisateur de définir les mots-clés avec lequel il

souhaite surveiller les sources et documents correspondants.

L’utilisateur pourra restreindre les résultats de sa recherche à un format de document

donné (tous, PDF, documents, ou xls). Le bouton « Search », permet d’accéder aux 10

premiers résultats de la recherche. (10 étant une entrée par défaut non modifiable).

Le logiciel créé le résultat sous forme de liste se composant des titres des 10 premiers

résultats de la recherche. Cette liste est consultable par double clic ou en choisissant

l’option « Show List » par clic droit sur l’icône « List ». Pour une recherche sur les mots-clés « E-

réputation AND RSS», l’outil prend en compte la demande formulée par les opérateurs booléens et

donne alors un résultat précis comme ci-dessous :

Remarque : Une requête directement sur

Google ou Yahoo (voir ci-dessous)

donnera toujours des résultats différents

ce ceux obtenus ici, en fonction de la

langue, du pays d’origine de la requête, de

l’historique de consultation de l’utilisateur

etc. De ce fait, les résultats obtenus par

les outils Google et Yahoo Search de

TaDaweb peuvent présenter des

différences par rapport à ceux présentés

par la même requête posée directement

dans ces moteurs.

Note importante : L’avantage des résultats retournés par Google Search est qu’ils ne sont pas

biaisés par l’historique de navigation de l’utilisateur, et donc que les résultats présentés

ici par TaDaweb montrent exactement les sites qui ont le meilleur ranking dans

Google, contrairement à une recherche via un navigateur.

[email protected] PPaaggee

1155 ssuurr 7711

Outil « Google+ Search »

Cet outil permet de surveiller à l’aide de mots-clés, différents types d’informations à travers le réseau

social de Google, « Google + ».

Dans un premier temps, glisser l’icône de l’outil « Google +

Search » sur le Whiteboard. Le logiciel ouvre alors

automatiquement une fenêtre de saisie libre.

Les utilisateurs pourront alors choisir le type de ressources à

rechercher : « Service » où « Post », recherche les Posts

publics, tandis que « User » (page) ou « Community »

permettent de surveiller une page en particulier, par exemple celle qui concerne les compétiteurs.

Le nombre d’informations à extraire est donné par « #Results » ainsi que le type de résultat (voir ci-

contre).

Prenons l’exemple d’une recherche sur le sujet des plateformes de curation. Les informations

recherchées étant, comme ci-contre, une dizaine de posts

des différents utilisateurs, contenant les mots « plateforme

curation » et étant catégorisé comme

« Recent ».

Le logiciel obtient alors les données demandées

et les restituent sous forme de liste (image ci-

contre). Ici, le nombre de résultat demandé est de 10, mais la liste finale ne contient que

7 résultats, le nombre d’informations trouvées étant inférieur à celui voulu. En double-

cliquant sur la « List », l’utilisateur peut avoir un aperçu des informations extraites, comme ci-dessous.

[email protected] PPaaggee

1166 ssuurr 7711

Outil « Yahoo! Search »

Ce module s’utilise de la même façon que l’outil Google Search. Il contient plus d’options (restriction,

précision). Après avoir glissé-déposé l’icône sur le

Whiteboard, le logiciel ouvre l’interface d’entrée de mots-

clés.

Il est possible ici d’affiner sa recherche en précisant le

format du document (tous, PDF, office), mais il se

différencie de son concurrent en permettant de préciser le

type de ressource à trouver (« service ») ou encore en

modifiant le nombre de résultats à obtenir.

En choisissant les services « News » ou « Blog », l’outil propose également d’affiner la recherche par

un critère d’actualité.

En prenant l’exemple d’une recherche sur « Outils AND agrégateurs», l’utilisateur obtient une liste des

résultats les plus pertinents.

Cette liste est consultable par les mêmes moyens que ceux employés plus haut pour l’outil « Google

Search » (voir ci-dessous).

Dans un travail de veille, ces outils peuvent être utilisés pour comparer les premiers résultats de

recherche des différents moteurs Google et Yahoo. Dans l’exemple utilisé ci-dessus, les résultats

trouvés par les différents moteurs sont totalement différents. Pour une comparaison optimale des

résultats, utiliser l’outil « Compare » présenté plus loin.

Remarque : Voir ci-dessus à propos de Google, les écarts qui peuvent être constatés entre les

résultats d’une même requête posée dans l’outil Yahoo de TaDaweb et sur le moteur

Yahoo!

[email protected] PPaaggee

1177 ssuurr 7711

Outil « Facebook Search »

Cet outil permet de surveiller les résultats obtenus sur un mot ou groupe de mots-clés publié(s) dans

le réseau social Facebook. Les mots-clés entrés via cet outil peuvent être recherchés

en choisissant « Post », lorsque le mot-clé est présent dans les posts publics (recherche

similaire à la recherche de posts publics depuis facebook),

en choisissant « Page », pour rechercher une page précise sur Facebook (page publique

d’une marque comme par exemple https://www.facebook.com/nespresso ou d’un utilisateur

par exemple).

Comme les précédents outils, il s’utilise en le déposant

sur le Whiteboard.

S’ouvre alors une interface d’entrée libre permettant à

l’utilisateur de définir les mots-clés qu’il souhaite surveiller.

Le logiciel présente les données

correspondant à la requête sous forme d’une icône « List ». Cette liste,

consultable par clic, donne le résultat ci-dessous côté droit (Résultat obtenu

via l’outil Facebook Search).

En utilisant cet outil, on obtient les résultats du post le plus récent au plus

ancien. Les commentaires et autres posts directs sur le mur de TaDaweb

(encadrés bleus à gauche) ne sont pas restitués par l’outil Facebook Search.

[email protected] PPaaggee

1188 ssuurr 7711

Outil « Twitter Search »

Twitter ouvre sur une grande diversité de sources d’information et apporte spontanéité (instantanéité)

et simplicité (un clic pour accéder à sa timeline, scroll, bookmark des tweets intéressants).

Le dernier outil permettant de cibler ses sources est « Twitter Search ». Tout comme l’outil

« Facebook Search » et « Google+ Search », ce module permet de surveiller soit les messages

publics sur Twitter, soit une page précise (un Profile). En choisissant User on peut par exemple

surveiller la page de Christophe Deschamps (crid) sur Twitter

Dans un premier temps, glisser l’icône de l’outil Twitter sur le Whiteboard. Le logiciel ouvre alors

automatiquement une fenêtre de saisie libre.

Cet outil permet une recherche plus

approfondie sur les mots-clés utilisés que ne le

permet « Facebook Search ».

Les utilisateurs pourront choisir le type de

ressources (« Service ») utilisé, choisir le

nombre d’information à extraire (« #Results »)

ainsi que le type de résultat.

En choisissant par exemple une

recherche sur les tweets

concernant notre thème de « la

veille pour le veilleur », on

utilisera les mots-clés « outil

cloud » comme montré ci-

dessus.

Le logiciel obtient les données

demandées sous forme de liste.

Ci-dessus, les résultats de la recherche sur les mots-clés « outil cloud ».

Cet outil, ainsi que « Facebook Search », peut également permettre à une entreprise de voir les

différents avis des usagers sur un sujet donné. L’entreprise peut alors se servir de ce feedback pour

améliorer son produit ou son image.

[email protected] PPaaggee

1199 ssuurr 7711

Création de TaDas directement depuis le navigateur « Bookmarklet:

Web Clipper »

Le Webclip permet de découper une partie d’un page relative à votre centre d’intérêt sur une source

déjà répertoriée.

Mais il est très utile de pouvoir découper une partie d’une page consultée, à la volée, lors d’un

« surf », c'est-à-dire lors d’une exploration du Web sur un sujet donné.

Un Bookmarklet1 dénommé « Web Clipper » permet d’extraite rapidement des Webclips

directement depuis le navigateur Internet.

Cette fonction est dynamique : elle ne stocke pas de façon statique et définitive. L’information ainsi

collectée va pouvoir être mise à jour lors des modifications ou ajouts faits sur le « clip » (l’extrait)

sélectionné, assurant ainsi une veille automatique.

Menu Explore. Le Web Clipper est accessible en cliquant sur le menu « Explore » du Dashboard en

ligne (en haut à droite), puis sur l’option « Tools ». Un simple glisser –déposer sur la barre d’outils

(toolbar) du navigateur permet de rendre active cette fonctionnalité (voir schéma suivant)

Une fois le Web Clipper dans la barre d’outils, il suffit de cliquer sur « +Clip a TaDa » pour obtenir en

bas de page la fonctionnalité. Pour sélectionner directement tout ou partie de la page il suffit de

cliquer sur « Select » puis sur « Expand » pour élargir la zone de sélection. « Save » permet ensuite

de créer un TaDa à la volée (voir ci-dessous, page suivante).

1 Un bookmarklet est un (petit) programme JavaScript pouvant être stocké dans la barre des favoris de votre

navigateur

[email protected] PPaaggee

2200 ssuurr 7711

[email protected] PPaaggee

2211 ssuurr 7711

II. Extraction de l’information : onglet Extract

Après avoir ciblé précisément la source à surveiller, le logiciel propose

de choisir le type d’information à extraire à l’aide du deuxième onglet

« Extract ». Cet outil offre la possibilité d’extraire différentes formes

d’informations, telles que du texte, des listes, des images ou encore

des tableaux. (Voir ci-contre les différents formats de données pouvant

être extrait).

Pour utiliser la commande d’extraction, il faut tout d’abord préciser la

source dont on va extraire les données : URL, RSS.

Remarque : Certaines formes de données comme des tableaux,

peuvent être extraites directement depuis une source URL ou RSS ou

mêmes depuis des sources telles que « Google Search », « Yahoo

Search », « Google+/Twitter/Facebook Search ».

Outil « Extract Webclip »

Dans l’onglet d’extraction, l’utilisateur pourra retrouver l’outil « Extract Webclip » déjà présenté ci-

dessus.

L’une des particularités de TaDaweb est qu’à travers ces différents onglets ou outils, l’utilisateur peut

utiliser différentes manières pour arriver au même résultat

Avec TaDaweb il y a toujours plusieurs façons pour réaliser une fonctionnalité.

Par exemple, sur un site web, vous pouvez utiliser

- soit l’Extract Webclip,

- soit l’Extract List

pour extraire la même information. La différence sera que la liste sera structurée et pourra être

filtrée. Il faut voir les outils comme des « Legos » qu’on assemble pour réaliser une opération :

différents outils pouvant être associés pour réaliser la même opération finale.

[email protected] PPaaggee

2222 ssuurr 7711

Outil « Extract Form »

Selon la page 9 du « Guide du débutant » créé par la compagnie

TaDaweb, cet outil a pour principale utilité de cibler tous les champs

d’un formulaire présents dans une page. En effet, beaucoup de pages

Web contiennent par exemple des barres de recherche ou encore des

cadres pour que l’utilisateur puisse s’enregistrer et se connecter ou

rechercher un type d’information. Cet outil permet donc de trouver tous

ces formulaires et d’en choisir une entrée adaptée à son besoin.

Prenons l’exemple du site Les Echos. Pour se diriger vers une page

précise à l’aide de la barre de recherche, entrer l’adresse du site désiré

dans le navigateur et utiliser la source « URL » (dans l’onglet source).

Glisser l’outil « Extract form » sur le Whiteboard pour le relier à l’icône URL à l’aide de l’outil de lien

(étapes 2 et 3 ci-contre)

Le logiciel ouvre une fenêtre proposant à l’utilisateur les

différents formulaires trouvés sur la page du site exploré.

Pour regrouper les différentes pages sur un sujet donné,

entrer les mots-clés désirés dans le formulaire de recherche

(ici, Intelligence économique).

Le site recherche tous les articles sur le site

correspondant au(x) mot(s) utilisé(s).

Pour finaliser la recherche, appuyer sur le

bouton « Execute ».

Sur le Whiteboard, le logiciel charge les données recherchées et leur attribut

une nouvelle adresse URL comme ci-contre (Intelligence économique).

Sur le Navigateur, le logiciel charge la nouvelle page correspondant à la

requête. L’utilisateur peut alors extraire de nouvelles informations sur la page

précise qu’il a demandé.

Lorsque la recherche concerne un site

demandant identification (l’utilisateur ayant un

compte créé auparavant), TaDaweb permet

d’extraire le formulaire d’authentification.

Entrer l’adresse du site désiré dans le

navigateur et glisser l’outil source «URL »

sur le WhiteBoard. Relier ce dernier à l’outil

« Extract Form ». S’ouvre alors une interface

dans laquelle l’utilisateur peut entrer ses

identifiants.

[email protected] PPaaggee

2233 ssuurr 7711

En cliquant sur « Execute », le logiciel va charger sur le Whiteboard une nouvelle URL avec les

informations demandées. Le Navigateur chargera la nouvelle page, montrant le nouveau contenu

auquel l’utilisateur peut dorénavant accéder.

Remarque : La sauvegarde sous cette forme ne permet pas de le publier sur le Dashboard en ligne

puisqu’à cette étape, aucune information n’a été extraite.

[email protected] PPaaggee

2244 ssuurr 7711

Outil « Extract List »

Cet outil très simple permet d’identifier automatiquement toutes données sous forme de listes (tout

résultat de recherche est présenté sous forme de liste) et de les extraire directement sous cette

même forme (cf. Vidéo)

Pour cela, relier l’icône URL comportant l’adresse du site contenant les listes à extraire, à l’icône

Extract List. Ici, un exemple d’extraction de liste sur

la source Les Echos. Toutes les listes sont alors

extraites automatiquement par le logiciel sous

l’icône « Smart List ». Les différentes informations

regroupées dans cette icône peuvent être

consultées en cliquant une première fois sur l’icône,

puis en cliquant sur « Show List ».

Exemple de résultat de

liste ci-dessus. Ces

listes pourront ensuite

être retravaillées avec les différents outils de transformations en vue d’en

optimiser la visualisation et de ne garder que les informations jugées

pertinentes.

Mentionnons que ...

- L’outil Extract List est un des outils les plus puissants de

TaDaweb puisqu’il reconnaît automatiquement des listes

présentes sur un site Web ... ce qui permet de simuler « presque » un flux RSS sur des sites

qui n’en possèdent pas.

- Pour extraire une liste précise sur une page Web, il faut tout d’abord créer un Webclip, puis

connecter un Extract List à ce Webclip.

[email protected] PPaaggee

2255 ssuurr 7711

Outil « Extract Link »

De la même manière que pour l’extraction de listes, TaDaweb Creator propose dans un premier

temps

d’identifier tous liens se trouvant sur une page web précise

de regrouper ces différents liens sous forme de liste.

Pour extraire ces différents liens sous forme d’URL, l’utilisateur doit

relier l’outil « URL » à « Extract Link ». Ici, la source est le site Les

Echos. Aucune entrée n’est alors demandée et l’extraction se fait

automatiquement. Le nombre de liens exportés est précisé entre

parenthèse sous la liste créée. Cette liste est consultable en double

cliquant dessus et peut être nommée via l’option « Description » comme ci-contre.

Notons que l’outil Extract link peut aussi extraire des liens concernant les images.

[email protected] PPaaggee

2266 ssuurr 7711

Outil « Extract Table »

TaDaweb Creator propose de simplifier la tâche du veilleur en créant l’outil « Extract Table ». Cet

outil est capable d’identifier les différents tableaux dans un site web pour permettre d’extraire le

tableau désiré sous sa forme initiale.

En reliant l’icône « Extract Table » à l’icône de source « URL », le logiciel cherche automatiquement

les différents tableaux pouvant se trouver sur le site. Dans un premier cas, le logiciel ne trouve qu’un

seul tableau, comme dans l’exemple du site outilsfroids.net. Le logiciel montre le tableau qu’il extrait.

Voir image ci-dessous

Si une seule ligne ou colonne du tableau semble pertinente à utiliser, cliquer

sur le numéro de la ligne ou colonne (gauche ou haut) de la donnée voulu et

cliquer sur « Extract ». La ligne ou colonne est extraite séparément du reste,

non plus sous forme de tableau mais de liste comme ci-contre.

Si le tableau entier semple pertinent à garder, cliquer sur « Cancel ».

Dans un deuxième cas, le logiciel trouve plusieurs tableaux sur la page. L’utilisateur

doit préciser quel tableau conserver en cliquant sur la ligne correspondant comme

dans l’exemple ci-dessous. Pour finaliser le choix du tableau, cliquer sur « Extract ».

En double cliquant sur l’icône « Table », l’utilisateur peut choisir une seule ligne ou

colonne à conserver en

cliquant sur son numéro. Cette extraction se

fait alors sous forme de liste comme

précédemment.

[email protected] PPaaggee

2277 ssuurr 7711

Si une seule ligne ou colonne du tableau semble pertinente à utiliser, cliquer

sur le numéro de la ligne ou colonne (gauche ou haut) de la donnée voulu et

cliquer sur « Extract ». La ligne ou colonne est extraite séparément du reste,

non plus sous forme de tableau mais de liste comme ci-contre.

Si le tableau entier semple pertinent à garder, cliquer sur « Cancel ».

Dans un deuxième cas, le logiciel trouve plusieurs tableaux sur la page. L’utilisateur

doit préciser quel tableau conserver en cliquant sur la ligne correspondant comme

dans l’exemple ci-dessous. Pour finaliser le choix du tableau, cliquer sur « Extract ».

En double cliquant sur l’icône « Table », l’utilisateur peut choisir une seule ligne ou

colonne à conserver en cliquant sur son numéro. Cette extraction se fait alors sous

forme de liste comme précédemment.

[email protected] PPaaggee

2288 ssuurr 7711

Outil « Extract RSS »

Cet outil a pour but de faciliter l’extraction d’informations

via l’utilisation d’un flux RSS. A la différence des types de

sources RSS Feed qui demande à l’utilisateur de trouver

lui-même l’adresse du flux RSS à surveiller, l’outil Extract

RSS permet de trouver tous les fils d’information proposés

par un site et de choisir quel flux surveiller.

Prenons pour exemple ici l’extraction de flux RSS du site

Easi-ie. Après avoir indiqué l’adresse du site dans la barre

de recherche de la partie droite, glisser l’outil « URL » sur

le Whiteboard. Faire de même avec l’outil « Extract RSS »

(étape 1), choisir l’icône représentant un lien (étape 2), pour l’étendre de l’onglet « Extract RSS »

à l’onglet URL.

Cette étape fait alors la connexion entre la source et le module d’extraction.

Une fois le lien créé, le logiciel propose

un encadré demandant quel flux RSS

surveiller en particulier (image ci-contre).

Il suffit alors à l’utilisateur de sélectionner

le flux RSS qu’il désire suivre en cliquant

dessus.

Ce choix est aussi disponible pour les

autres modules. En effet, si plusieurs

tableaux, liens ou encore images sont

disponibles sur le site (ou la partie du

site) consulté, l’outil correspondant

propose à l’utilisateur de choisir les

données qui l’intéresse.

Cette possibilité n’existe pas pour l’outil Extract List.

[email protected] PPaaggee

2299 ssuurr 7711

Outil « Extract Image »

La dernière forme d’extraction directe proposée par le logiciel TaDaweb est celle d’image se trouvant

sur un site. Cet outil permet de cibler une image contenue

sur la page et d’extraire celle-ci ou encore d’extraire toutes les

images contenues sur la page ciblée.

Si l’utilisateur désire utiliser deux images différentes se trouvant

sur le même site Scoop-it, il devra faire apparaître deux fois

l’icône « Extract image » sur le Whiteboard et les relier à la

source comme ci-contre.

Une fois l’icône Extract Image reliée à la source, une

interface s’ouvre, proposant de choisir l’image à garder

comme ci-contre. Après avoir cliqué sur le bouton

« select », l’interface se ferme, finalisant alors l’extraction

de l’image sélectionnée.

Si l’utilisateur souhaite extraire toutes les images contenues sur la page, il

devra alors faire un clic droit sur l’icône « Extract Image » pour obtenir le

résultat ci-contre.

En choisissant « Extract Image », le logiciel va recharger l’extraction de l’image choisie. En

sélectionnant « Select an other image », le logiciel rouvrira l’interface permettant de choisir l’image à

extraire.

« Extract all images » permet à l’utilisateur d’extraire toutes les images au lieu d’en cibler en

particulier.

1

2

2

[email protected] PPaaggee

3300 ssuurr 7711

III. Exploitation et structuration de l’information : onglet « Transform »

Une fois les sources et les données à extraire ciblées,

l’utilisation du logiciel entre dans sa troisième phase, celle

de la « transformation » des informations.

La troisième phase que met à notre disposition le logiciel

est la plus importante en regard de l’output. Grâce à ce

module il sera alors possible de créer certaines règles qui

permettront d’ajouter ou supprimer un contenu

automatiquement en fonction des besoins de l’utilisateur. Il

existe en tout 9 modules différents visant à transformer

votre flux d’information. (Voir schéma ci-contre).

Outil « Tansform »

Cet outil est à utiliser lorsque certaines informations extraites avec l’outil « Extract List », mais aussi

avec les outils « Extract Table » ou « Extract Webclip », ne sont pas pertinentes. Dans ce cas, l’outil

« Transform » permet de supprimer ces informations du résultat obtenu (cf. vidéo).

Dans l’exemple ci-contre, une liste a été extraite

depuis le site Scoop-It, mais le premier élément

« Your new post is loading » composant la liste

ne correspond pas aux informations à garder.

Dans ce cas, relier la liste que l’on vient de créer

à l’outil « Transform ».

Une fois ces deux éléments reliés, le logiciel

ouvre une nouvelle interface permettant à

l’utilisateur de trier les informations et de ne

garder que les pertinentes.

[email protected] PPaaggee

3311 ssuurr 7711

Dans la première partie gauche de l’interface nommée « transformation on

Text », l’option Filter déroulée permet de ne garder qu’un type de format de

données : alphabétiques, numériques ou encore les deux.

Dans cette nouvelle interface, l’utilisateur peut également choisir de supprimer/garder

certaines lignes/colonne en fonction des mots les composant. Cette fonction se trouve dans la

seconde partie gauche « Transformation on Line or Column ». Indiquer dans la case

« Containing Word » les mots des lignes à garder/supprimer et cliquer sur « Execute ».

L’utilisateur peut également indiquer des lignes/colonnes entières à supprimer (voir dernière

rubrique à gauche). Pour cela, se référer au numéro de la ligne dans la partie droite intitulée

« Data List, Table or Text » et entrer le numéro de la ligne ou colonne à supprimer dans la

partie « transformation on first Line/column ». Pour confirmer la transformation souhaitée,

cliquer sur en bout de ligne.

L’interface enregistre la modification effectuée par l’utilisateur dans la partie « Transformations

History » et supprime la ligne indiquée. Dans le cas d’une erreur de modification, l’utilisateur peut

annuler toutes les modifications effectuées en appuyant sur le bouton en bas de l’interface.

Si l’utilisateur à créer plusieurs modifications et ne veut en supprimer qu’une, sélectionner d’un clic la

modification concernée dans la partie « Transformations History » et cliquer sur . Cette

opération ne supprimera que la modification indiquée. Une fois toutes transformations terminées,

cliquer sur le bouton . Le logiciel créé une nouvelle liste comportant le résultat issu de toutes

les modifications effectuées par l’utilisateur.

[email protected] PPaaggee

3322 ssuurr 7711

Outil « Filter »

L’outil Filter comme son nom l’indique permet de créer un filtre à partir de

mots-clés. Ces « mots-clés » vont ensuite pouvoir être associés au sein

d’une syntaxe afin de garder ou éliminer les documents recueillis.

Pour utiliser cet outil, il suffit comme pour les autres de le déposer sur le

Whiteboard. L’interface ci-contre s’ouvre alors automatiquement. Si celle-ci

ne s’ouvre pas, elle est disponible en double cliquant sur l’icône « Keyword

List ».

Avec cette interface, l’utilisateur peut définir les mots-clés en les tapant dans

la zone de texte libre. Pour que la recherche sur la page ciblée soit toujours effectuée par filtrage avec

ces mots-clés, la case « Permanent Data » est cochée par défaut. Une fois le mot-clé écrit dans la

zone de texte, appuyer sur la touche « Add » pour l’ajouter à la liste de mots-clés à surveiller. Si l’un

des mots se trouvant dans la liste ne doit pas être utilisé lors de la veille, l’utilisateur devra alors le

désélectionner en cliquant sur « Remove ». Le mot-clé est alors supprimer de la liste.

Remarque : Une fois le filtrage terminé, l’utilisateur voudra sauvegarder son TaDa. Si celui-ci n’a pas

coché la case « Permanent Data », le message ci-dessous apparaît, l’informant que le

schéma de construction du TaDa sera

sauvegardé mais que rien ne sera publié sur le

Dashboard. Pour faire apparaître le TaDa sur le Dashboard, retrouver la « Keyword

List » n’ayant pas l’option «Permanent Data » et cocher la case.

La syntaxe de la requête est construite à partir d’une nouvelle interface en double-

cliquant sur le module « Filter » déposé sur le Whiteboard, relié à la source comme ci-

contre à gauche.

Ces différentes options proposent 6 filtrages différents. Le premier, qui est utilisé par

défaut est le filtre gardant les articles sélectionnés qui comportent soit dans le titre

soit dans le corps du texte le mot-clé désigné. La partie sur laquelle s’applique le

filtre est dénommé « lines » par TaDaweb.

L’autre filtre en ligne (situé sous le premier) fait

l’inverse et supprime les lignes comportant le /les mots clés.

Les autres options de filtre se font sur le texte entier et sur le

nombre de mot-clé utilisé avec respectivement pour les lignes

supérieures et inférieures :

Garder tout si le texte contient l’un des mots

Garder tout si le texte contient tous les mots

Supprimer tout si le texte contient l’un des mots

Supprimer tout si le texte contient tous les mots

[email protected] PPaaggee

3333 ssuurr 7711

Pour illustrer cette fonctionnalité, prenons le cas d’une recherche menée avec le

mot-clé : « agrégateurs de flux », sur le site Outils froids. Faire glisser l’icône « RSS

Feed » sur le Whiteboard et entrer l’adresse du flux RSS. Déposer l’outil « Filter »

sur le Whiteboard. Une interface s’ouvre automatiquement, proposant à l’utilisateur

d’entrer les mots-clés à surveiller. Valider la liste en cliquant sur « Save » (voir la

Keyword liste représentée ci-dessus).

Relier ensuite l’icône « List Outils froids » à l’icône « Filter ». L’utilisateur obtient

alors une nouvelle « List » ne regroupant que les 12 informations répondant au filtre

des mots-clés. Dans cet exemple, sur 187 articles à la base, il ne reste après filtrage que 12 articles

en rapport avec le sujet défini.

Remarque : Possibilité d’enregistrer la liste de mots-clés pour la réutiliser sur une autre source (cf. ci-

après). De même la syntaxe est réutilisable pour d’autres thèmes de veille.

L’outil Filter ne peut être appliqué qu’à certains résultats. On pourra par exemple appliquer cet outil

sur un résultat sous forme de liste ou de tableau, mais pas sur un résultat type Webclip puisque celui

–ci est considéré comme un tout (un texte en soi). Ainsi, par exemple, en appliquant un filtre visant à

supprimer une ligne contenant le mot « information », si ce mot apparaît dans le résultat du Webclip,

tout sera supprimé, car le logiciel voit le résultat comme un tout indivisible.

[email protected] PPaaggee

3344 ssuurr 7711

Outil « Merge »

Cet outil permet de regrouper différentes données provenant de sources différentes. Prenons par

exemple les flux RSS : l’outil TaDaweb permet de surveiller certains flux RSS distincts comme les flux

de commentaires. Si dans sa veille, l’utilisateur veut pouvoir suivre deux flux RSS différents puis les

regrouper, il le peut grâce au module Merge. Il peut ensuite avec ce même outil, présenter les

différentes données regroupées sous forme de liste ou encore de tableau.

Comme exemple ici, le site demainlaveille.fr. Utiliser deux fois l’outil « Extract RSS » pour suivre les

différents flux de ce site. Relier ces deux outils à la source.

Après avoir reliés ces différents modules, une

interface s’ouvre, laissant choisir quel flux RSS

suivre. Pour le Premier module « Extract

Rss », suivre par exemple le flux de commentaires. En double-cliquant sur le deuxième module

« Extract RSS », la même interface s’ouvre. Choisissons un autre flux à suivre, comme celui de mots-

clés.

Nous obtenons une liste différente pour chaque module

d’extraction.

Pour regrouper ces différentes listes, en

seul flux, l’utilisateur devra faire glisser le

module « Merge » et le relier aux deux

« List » par l’accessoire . L’outil propose

alors à l’utilisateur de gérer la forme de ce

regroupement selon la position dans la

matrice : soit sous forme de tableau

(placement sur l’axe l’horizontal), soit sous

forme de liste (placement sur l’axe vertical).

Dans ce dernier cas un positionnement supérieur ou inférieur donne l’ordre d’apparition des résultats

des 2 listes.

[email protected] PPaaggee

3355 ssuurr 7711

En choisissant de regrouper ces

données sous forme de liste, on

obtient le résultat ci-contre.

Tandis qu’en regroupant les

données sous forme de tableau, on

obtient le résultat ci-dessous.

Cet outil Merge peut être utilisé sur

d’autres formats de données

comme les images ou encore les

extraits de pages.

Notons que l’outil Merge va automatiquement trier la liste finale de deux flux RSS.

[email protected] PPaaggee

3366 ssuurr 7711

Outil « Split »

L’outil Split est un module ayant pour objectif de séparer un flux en plusieurs flux de sortie. Il est l’outil

inverse de « Merge ». La principale fonction de cet outil est de simplifier la lecture pour une meilleure

visibilité. Il permet de diviser un groupe de résultats en plusieurs sous-groupes

distincts, plus aisés à exploiter.

Cet outil propose plusieurs séparations possibles. Les valeurs possibles pour séparer

les données sont par groupe de deux, de 3 ou de 4. Ce module

permet aussi de séparer les différentes données par une entrée libre

alors appelée « by separator ». En choisissant cette option, l’utilisateur

aura à entrer une valeur définissant le séparateur de données.

En prenant l’exemple du site Actulligence, déposer l’icône URL sur le Whiteboard.

Relier cette source à l’outil « Extract List ». Vous obtenez alors une liste de 6

informations comme ci-contre. En reliant cette liste à l’outil « Split » et en choisissant

par exemple le séparateur « 2 by 2 », le logiciel propose alors une nouvelle liste regroupant les

informations sous-listes de deux par deux.

[email protected] PPaaggee

3377 ssuurr 7711

Outil « Compare »

Le module « Compare » permet de comparer différents résultats. Cet outil peut s’appliquer sur les

listes et tableaux, mais aussi sur des résultats de recherche mêlant Google

et Yahoo. Dans cet exemple, une recherche sur « TaDaweb » avec les

outils « Google Search » et Yahoo Search » a été mise en place.

Recherche sur deux outils différents :

En utilisant la même méthode que pour les outils précédents, cela abouti à la création de deux listes

regroupant les résultats de

recherche de Google et

Yahoo. Pour comparer les

résultats de ces deux

recherches, il faut alors relier

chacune de ces listes à l’outil

« Compare ».

Une fois ces deux listes

reliées par le module, le

logiciel ouvre une fenêtre

visant à choisir le mode de

comparaison des données.

En choisissant « Same result », le logiciel analyse les données communes aux deux moteurs tandis

que l’option « diffèrent » révèlera les différences dans les résultats.

Ici il est intéressant de voir que les deux moteurs de recherche ont 6 résultats en communs parmi

leurs 10 premiers résultats ... on n’est pas loin du dédoublonnage, mais l’outil n’assure pas par lui-

même l’élimination des doublons.

Pour valider cette comparaison, cliquer sur le bouton « ok ». Le logiciel conçoit automatiquement une

liste ne regroupant seulement que les résultats communs ou différents selon le besoin de l’utilisateur.

[email protected] PPaaggee

3388 ssuurr 7711

Dédoublonnage

.

[email protected] PPaaggee

3399 ssuurr 7711

Outil « Navigate »

Ce module, comme son nom l’indique, aide à une navigation simple et rapide. L’outil Navigate permet

de cibler une partie d’une liste et de créer un lien direct vers cette partie. En connectant l'outil,

TaDaweb "naviguera" alors dans la page originale et produira une nouvelle icône de la page

sélectionnée du site Web.

La nouvelle page peut être traitée exactement comme une nouvelle source Web originale, avec des

informations qui peuvent en être extraites.

Cet outil ne peut pas s’utiliser tout seul dans le sens où il n’extrait pas réellement de données : c’est

donc un module complémentaire aux autres modules qui permet de cibler un groupe de documents

dans la source.

Prenons l’exemple de son utilisation la plus pratique, avec l’autre outil Loop. Nous utiliserons ici

comme source le moteur vertical UPSTO, qui regroupe les différents brevets américains. Sur ce site,

notre but est d’identifier les 3 derniers brevets d’IBM

Tout d’abord il faut alors préciser l’adresse de la page sur la partie droite constituant le

navigateur de TaDaweb Creator. Déposer ensuite l’icône URL qui chargera

automatiquement la source. Pour extraire l’information, déposer l’icône de l’outil « Extract

List » sur le Whiteboard. L’utilisateur obtient une liste des brevets indexés sur cette page

(voir ci-contre).

Remarque : L’outil Navigate étant assez puissant, le nombre d’informations collectées est limité à 10

pour une même source, afin de ne pas alourdir le fonctionnement de TaDaweb.

[email protected] PPaaggee

4400 ssuurr 7711

Du fait de cette limitation, il est nécessaire de transformer la liste pour ne

garder que 10 informations au maximum. Pour cela, déposer l’outil

« Transform » sur le Whiteboard et supprimer les 41 dernières informations

(voir ci-dessus).

On obtient alors une liste ne contenant plus que 10 résultats (voir ci-contre).

Déposer ensuite l’outil LOOP (voir § suivant) sur le Whiteboard relier sa

première partie (Start Loop) à la « Liste retravaillée ». Vous obtenez alors

un Webclip. Relier celui-ci à l’outil Navigate après avoir déposé celui-ci sur

l’espace de travail. Celui-ci va alors charger à droite, dans la partie navigateur du logiciel, la page

rattachée au premier lien de la liste retravaillée. Il suffit alors à l’utilisateur de cliquer sur l’outil « cible »

et de préciser sur la nouvelle page (voir ci-dessus) l’information qu’il souhaite extraire. Dans

notre exemple, nous voulons sélectionner l’information concernant les inventeurs associés à IBM.

Le copie d’écran ci-dessous présente le lien sur lequel l’outil « Navigate » va se diriger

automatiquement et la faire apparaître dans le navigateur.

[email protected] PPaaggee

4411 ssuurr 7711

Après avoir extrait ce « Webclip »,

correspondant à l’information recherchée, il ne

reste plus qu’à connecté celui-ci à la deuxième

partie de l’outil LOOP, « End Loop » (voir ci-

dessus).

En double cliquant sur l’icône End Loop,

l’information recherchée est extraite des autres

liens composant la liste. Une nouvelle liste est

alors obtenue, regroupant le type d’information

recherché (voir « Liste des inventeurs » rattachés

à la Sté IBM).

L’outil Navigate a pour principale utilité de combler un certain manque que l’on rencontre avec l’outil

LOOP. En effet, avec l’outil LOOP on ne peut extraire qu’un type d’informations, retranscrit dans la

liste d’extraction, tandis qu’en utilisant l’outil Navigate en complémentarité de l’outil LOOP, on peut

extraire un type d’informations directement sur une page.

Remarque : l’outil Navigate donne une URL et donc le résultat ne sera pas envoyé sur le Dashboard

[email protected] PPaaggee

4422 ssuurr 7711

Outil « Loop »

L’outil loop va permettre de répéter une ou plusieurs actions pour chaque élément de la liste connecté

à cette Loop.

L’outil « Loop » est le plus complexe à utiliser (cf. p.15 du Beginner's guide et vidéo). Il permet à

l’utilisateur d’automatiser une opération sur une liste à partir d’un choix d’attributs préalablement

effectué sur un premier document (par exemple titre, date, auteur, ...), de créer des boucles pour

appliquer des traitements similaires à d’autres documents de la liste à partir des mêmes attributs.

L’utilisateur peut par exemple ne faire apparaître que les titres ou encore les noms d’auteur

composant sa liste, pour ensuite

regrouper ces données sous forme de

tableau.

Cet outil n’est utilisable que sur les

données sous forme de liste.

Le site Amazon sera utilisé pour

montrer les capacités de cet outil.

Chercher d’abord à l’aide de votre

navigateur un thème à rechercher sur

Amazon.

Ici, il s’agit des mots-clés « veille technologique » recherchés dans la catégorie « Livres en français ».

Faire glisser l’icône source « URL » et la relier au module d’extraction « Extract List ». Le logiciel

effectue alors l’extraction de la liste du site (13 documents).

Après l’obtention de la liste, glisser-déposer l’outil de transformation « Loop » sur le Whiteboard et le

lier à la liste. L’outil construit alors automatiquement un « Webclip » qui correspond à un exemple de

données constituant votre liste.

Après cette étape, l’utilisateur devra double-

cliquer sur le Webclip obtenu pour préciser

quel type d’information garder. Une nouvelle

fenêtre s’ouvre (voir schéma ci-contre)

montrant le premier élément de la liste.

Surligner à l’aide du pointeur de la souris le

type d’information à conserver.

Dans cet exemple, seul le titre de l’article a

été surligné et donc conservé. Une fois les

données souhaitées surlignées, le bouton

« Extract » permet de finaliser l’extraction.

(Schéma ci-contre)

sous-ensemble

[email protected] PPaaggee

4433 ssuurr 7711

Une fois l’étape précédente terminée, le logiciel créé une nouvelle extraction

consultable par double-clic (Webclip « Titres livres » ci-contre). Pour extraire une

nouvelle liste d’information, double cliquer sur le Webclip originel (Webclip 1) pour

répéter l’opération en sélectionnant une nouvelle information à extraire en la

surlignant. Dans cet exemple, nous

choisissons d’extraire un deuxième

attribut : les noms d’auteurs. Un nouveau

Webclip apparaît. Il est possible

d’extraire autant de types d’informations

qu’on le veut, il suffit de répéter l’étape en sélectionnant à

chaque fois l’attribut à conserver.

Pour terminer la transformation du flux, il suffit alors de

relier les deux nouveaux Webclip au module «End Loop»

(étape 1 ci-contre). Pour concrétiser le lien et adapter la

sélection à l’ensemble de la liste, double-cliquer sur le

module « End Loop » ou cliquer droit, puis « Execute

Loop ». Celui-ci créé alors un tableau ne contenant plus

que le type d’information que vous avez sélectionné plus haut. (Voir résultat ci-dessous avec les titres

et les noms d’auteur).

[email protected] PPaaggee

4444 ssuurr 7711

Outil « Custom Text »

L’un des derniers outils que propose la plateforme TaDaweb est le Custom Text

◦ Permet de réaliser des recherches par mots-clés sur différents outils simultanément.

Ne comprenant pas les mêmes étapes de fonctionnement, cet outil se démarque des autres. En effet

la première étape ne consiste plus à placer la source mais l’outil de transformation. La source vient

alors s’ajouter au module de transformation

par la suite. Puisque cet outil permet la

recherche par mots-clés, il n’est utilisable

que via les sources réseaux sociaux « Twitter Search, Facebook Search et Google+ Search » et via

les moteurs de recherche « Google Search et Yahoo! Search ».

Une fois les moteurs ou réseaux sociaux liés à cet outil,

l’utilisateur peut démarrer sa recherche en cliquant sur l’outil

« custom Text » positionné sur le Whiteboard.

Une nouvelle fenêtre s’ouvre, permettant à l’utilisateur d’entrer

les mots-clés à rechercher.

En cochant la case « Permanent Data », l’utilisateur choisit de toujours apportés ce filtre par mots-clés

sur sa source ou non.

En cliquant sur « Save », vous obtenez alors le résultat de la recherche faite simultanément sur les

deux moteurs.

Le veilleur obtient ainsi deux listes correspondant aux

recherches effectuées avec les mêmes mots-clés sur

les deux sources.

Mais les fonctionnalités de l’outil Custom Text ne

s’arrêtent pas à la mise en commun d’une recherche

sur deux sources (Twitter Search et Facebook Search,

Google Search et Yahoo Search, Yahoo Search et

Google+ Search, ...).

Cet outil permet également :

◦ Ajout d’un élément statique. En reliant Custom Text avec l’outil Webclip et l’outil Extract

List, il devient possible d’ajouter un élément statique à la liste, pour exemple un en-tête.

◦ Transformation en bloc de texte. N’importe quel élément : liste, tableau, Webclip ou même

URL peut être transformé en bloc de texte avec Custom Text.

[email protected] PPaaggee

4455 ssuurr 7711

◦ Recherche avec valeur dynamique. En reliant Custom Text à divers outils-source (voir ci-

dessous) et en omettant de cocher la case « Permanent Data », il devient possible de

réutiliser le TaDa créé et sauvegardé (ayant pour sujet la Sté TaDaweb dans l’exemple

donné), pour effectuer la recherche sur les mêmes sources mais sur un nouveau sujet (sur la

Sté Easi-ie dans l’exemple donné).

En effet lorsqu’on exécute le TaDa, le Custom Text redemande avec quelle valeur l’action doit être

effectuée, puisque la case Permanent Data n’a pas été cochée.

De la même façon, Custom Text permet d’effectuer la même action sur le formulaire d’un site

proposant plusieurs options ou mots-clés de recherche, sans avoir à recommencer le processus

d’authentification.

◦ Création d’un outil de recherche spécifique à un site donné en reliant Custom Text a un

formulaire (recherche avec valeur dynamique).

[email protected] PPaaggee

4466 ssuurr 7711

En procédant ainsi et après avoir sauvegardé le TaDa correspondant, le formulaire peut être ré-exécuté

avec une nouvelle valeur pour faire une recherche avec un nouveau mot-clé sur le site Les Echos (voir

schéma ci-dessous où la recherche BCE est remplacée par Banque de France).

Au final, si TaDaweb offre directement et simultanément un accès à Yahoo, Google, Facebook et Twitter,

grâce aux outils : Extract Form + Custom Text, l’utilisateur peut de plus créer un outil de recherche

adapté à n’importe quel site.

[email protected] PPaaggee

4477 ssuurr 7711

[email protected] PPaaggee

4488 ssuurr 7711

Outil « Custom List »

L’outil Custom List permet plusieurs transformations similaires à Custom

Text. Dans un premier cas, l’utilisation de cet outil permet de combiner

plusieurs flux RSS ensemble pour ne former qu’un seul flux de sortie.

Prenons par exemple les flux RSS des sites Scoop-It, Outils froids, Easi et

Veille-ie and Co.

Déposer l’icône « Custom List » sur le Whiteboard. S’ouvre alors

l’interface ci-contre, dans laquelle l’utilisateur devra entrer les flux RSS des

sites à surveiller. Une fois ces flux sauvegardés, déposer l’outil « Loop »

sur le Whiteboard. Relier La « Custom

List » à l’icône « Start Loop ». Vous obtenez alors un « Webclip ».

Glisser-déposer l’outil RSS Feed sur le Whiteboard et relier celui-

ci au Webclip obtenu comme ci-contre. Vous obtenez alors une

nouvelle liste regroupant les informations se trouvant sur le premier

flux de votre « Custom List ». Ici, il s’agit donc des informations du

flux de Scoop-It. Pour regrouper tous les flux ensemble, relier cette dernière liste à l’icône « End

Loop » et double-cliquer sur ce dernier. L’utilisateur obtient le regroupement des différents flux sous

forme de liste.

Remarque : cette fonctionnalité est comparable à celle de RSS Feed

La deuxième utilisation de cet outil vise à enregistrer une liste de mots-clés afin de réutiliser ceux-ci

sur différents TaDas. Pour cela, déposer l’outil « Custom List » sur le Whiteboard. Dans l’interface qui

s’ouvre, entrer les mots-clés à surveiller. Cliquer sur le bouton « Save »

de l’interface puis « Save TaDa ! » du Whiteboard. Remplir les

champs nécessaires. Cette liste sera alors enregistrée comme chemin

de construction mais n’apparaîtra pas sur le Dashboard puisque sous

cette forme, il n’y a aucune source ni information extraite.

Ouvrir ensuite une nouvelle fenêtre pour construire

un nouveau TaDa. Aller dans l’onglet TaDa et faire glisser sur le Whiteboard le

TaDa de mots-clés. Cliquer ensuite sur « Execute TaDa » comme ci-contre.

Vous obtenez alors une liste regroupant les différents mots-clés. Glisser déposer ensuite votre source

d’information sur l’environnement de travail. Ici, il s’agit d’un flux RSS. Glisser-déposer l’outil

« Filter » de l’onglet « Extract » sur le Whiteboard. Relier la liste de mots-clés à la « Keyword List »,

les mots-clés s’ajoutent alors automatiquement à celle-ci. Pour finir, relier la liste de flux à l’outil

« Filter ». Vous obtenez alors une liste ne contenant que les mots-clés retenus (voir image ci-dessus).

Cette liste de mots-clés est réutilisable à l’infini.

[email protected] PPaaggee

4499 ssuurr 7711

Mais Custom List permet aussi d’utiliser des entrées dynamiques, comme Custom Text ou de

transformer une liste extraite sur Internet en tableau.

[email protected] PPaaggee

5500 ssuurr 7711

Modalités d’utilisation d’un TaDa

Synthèse des fonctionnalités (outils) associables de TaDaweb

[email protected] PPaaggee

5511 ssuurr 7711

Possibilités de mise en relation fonctionnelle entre les différentes étapes et outils de manipulation des

sources

En vert, les extractions possibles à partir d’une source donnée. Et inversement pour les croix rouges

Certains modules ne permettent cependant de transformer que certains types de sources, c’est

pourquoi la phase de transformation est celle qui requiert le plus d’attention.

Ainsi :

Le module « Merge » ne peut réunir que des listes, textes, tableaux et liens, pour déboucher

sur une seule sortie,

« Split » est applicable aux listes, textes, tableaux et liens,

Le module « Compare » ne peut comparer que des listes ou des tableaux,

« Loop » est un module applicable seulement aux données sous forme de listes,

« Custom Text » ne peut être lié qu’aux différents réseaux sociaux et moteurs de recherche,

« Filter » ne peut fonctionner avec le « Webclip » - dont le résultat est considéré comme un

seul texte par le logiciel et non comme une liste – Le Webclip doit donc être préalablement

transformé en liste si on souhaite utiliser l’outil Filter.

Pour ce faire utiliser l’outil « Extract list » sur le Webclip. Si le résultat ne donne rien, utiliser

« Extract link » lorsque chacun des éléments contenus dans le Webclip supporte un lien.

[email protected] PPaaggee

5522 ssuurr 7711

Points communs aux diverses fonctionnalités

Les « outils » de TaDaweb ne sont pas tous compatibles entre eux. Pour vérifier les capacités de mise

en relation des divers outils, se référer aux deux tableaux du paragraphe précédent.

◦ Chacun des outils proposés crée automatiquement l’icône représentant l’action et le résultat de

l’outil sur la source (un aperçu montrant les informations obtenues).

◦ Cependant, lorsqu’il y a d’absence de données, le logiciel fait apparaître une

nouvelle icône remplaçant le résultat attendu. Dans ce cas, ce n’est pas une

erreur de l’utilisateur, mais simplement une absence de données à l’instant T.

Cette recherche peut tout de même être sauvegardée et une alarme peut être

programmée pour que le veilleur soit averti lors de la mise en ligne des données attendues.

◦ Le nombre de données constituant une liste

est toujours précisé, même si celle-ci n’en

contient aucune, comme dans l’exemple ci-

contre ou l’outil « Extract Table » indique 0

document.

On peut remarquer que les relations créées

contenant des données et aboutissant à une

liste non vide sont verts, tandis que

l’extraction créée n’aboutissant pas (« Extract Table ») faute de données, donne une relation

orange. En cliquant sur l’icône « Table », le logiciel fait apparaître en bas du Whiteboard le

message pour signifier à l’utilisateur qu’elle ne contient aucune donnée.

« Execute » permet de réaliser une action ; « Edit » permet de la modifier

◦ Sélection d’un groupe d’informations dans un ensemble. Si plusieurs liens,

tableaux ou encore images sont disponibles sur le site (ou la partie de site) consulté, l’outil

Extract correspondant propose à l’utilisateur de choisir les données qui l’intéresse (lien, tableau,

liste, image). Cette possibilité n’existe pas pour l’outil Extract List.

[email protected] PPaaggee

5533 ssuurr 7711

Utiliser un même TaDa pour exploiter une nouvelle source

Pour exploiter une nouvelle source, il suffit de rentrer dans la barre d’adresse une nouvelle URL, puis

d’afficher la page demandée dans l’espace Navigateur.

Un glissé-déposé de l’icône URL permet de faire apparaître cette deuxième source sur le même

TaDa. Pour procéder à l’extraction de tout ou partie des articles ou paragraphes, suivre la procédure

décrite ci-dessus (fonction Webclip).

[email protected] PPaaggee

5544 ssuurr 7711

Utiliser un nouveau White Board pour créer un TaDa

Pour ne pas surcharger en données ce premier TaDa (TaDa noté TaDa 1), l’utilisateur peut en créer

un nouveau TaDa en cliquant sur le bouton situé sur la même ligne que la barre d’adresse.

Un nouveau TaDa (TaDa 2) est alors ouvert pour créer de nouvelles requêtes sur d’autres sites. Le

précédent TaDa et ses données restent toujours disponible en cliquant sur l’icône correspondant.

Utiliser le TaDa d’un autre utilisateur

Il est possible pour un utilisateur de récupérer le TaDa d’un autre. Pour cela, aller sur le Dashboard en

ligne dans l’onglet « Public TaDas » et cliquer sur le bouton du TaDa voulu. Ce TaDa est

alors mis à jour et « My TaDas » est retiré de la plateforme. L’utilisateur peut alors retrouver celui-ci

dans l’onglet « TaDa » de Tadaweb Creator et peur en réutiliser le chemin de sélection comme bon

lui semble (Voir réutilisation d’un chemin de sélection ci-après).

[email protected] PPaaggee

5555 ssuurr 7711

Sauvegarde un TaDa

Une fois les chemins de sélection définis et les données extraites, l‘utilisateur doit

sauvegarder ceux-ci en appuyant sur le bouton « Save TaDa », pour pouvoir ensuite

les réutiliser, les consulter ou encore les partager.

S’ouvre alors une interface permettant à l’utilisateur, de façon analogue à l’utilisation d’un document

Word, de nommer et de structurer la présentation des différentes informations collectées en leur

assignant des titres, sous-titres. On peut également illustrer la présentation en y ajoutant une image

depuis l’ordinateur.

Cette nouvelle fenêtre est composée de trois parties.

- La première partie à gauche et composée des éléments qui regroupent les différentes informations

présentent sur le TaDa (texte jaune sur fond vert à l’écran).

- La deuxième partie au centre est l’espace de modifications permettant de combiner les

informations (partie gauche, titres des sources sur fond vert) à des éléments de mise en page pour

la présentation des résultats (partie droite, options sur fond bleu).

- La troisième partie à droite regroupe les éléments permettant de classer et positionner titres,

divisions, synthèses, etc. dans l’espace de modification.

Tout d’abord, nous devons sélectionner dans la première partie à droite, les informations que le TaDa

contiendra en cliquant sur le correspondant. Les informations qui ne seront pas ajoutées par ce

moyen n’apparaîtront pas sur le TaDa final, c'est-à-dire sur l’output du TaDa.

Ensuite, nous devons sélectionner des éléments dans la troisième partie regroupant les éléments de

mise en page (bleu). Ne sélectionner que les éléments souhaités.

[email protected] PPaaggee

5566 ssuurr 7711

- Les éléments « Title », « Section » ou encore « Subsection » permettent de regrouper et de

nommer les différentes informations présentes dans la partie centrale à

l’aide de titres et sous-titres. En choisissant ces éléments, le logiciel

ouvre une petite interface permettant à l’utilisateur de donner un

descriptif à la partie concernée.

Les éléments sélectionnés se retrouvent dans la partie centrale. Ils peuvent être positionnés dans

l’ordre voulu à l’aide des flèches et leur titre modifié à l’aide du crayon ou supprimés .

- L’outil « Paragraphe » permet de rédiger manuellement un texte à insérer dans le TaDa. Il peut

par exemple s’agir d’une introduction, d’une synthèse ou d’une remontée d’information terrain.

- L’élément « Logo » permet d’ajouter dans le TaDa une seule et unique image venant de votre

ordinateur.

- L’élément « Table of Contents » quant à lui, est un outil permettant d’insérer une table des

matières pour une meilleure visibilité de la structure choisie pour le contenu du TaDa. Cette Table

des matières regroupe automatiquement tous les noms de parties, ou sous parties nommées par

l’utilisateur.

Une fois les modifications terminées, le bouton « Preview » (voir ci-dessus au bas de l’avant dernière

copie d’écran) permet de visualiser la structure choisie afin de la modifier éventuellement avant

sauvegarde (Done).

[email protected] PPaaggee

5577 ssuurr 7711

La table des matières permet d’accéder aux documents contenus dans le paragraphe grâce à des

liens hypertexte créés automatiquement.

Un bouton « Reset » permet de supprimer toutes les modifications effectuées dans l’espace central.

Lorsque le résultat est jugé satisfaisant il est validé par le bouton « Done ». A ce stade, on accède

alors à l’interface présentée ci-dessous.

Le logiciel ouvre donc une nouvelle interface permettant à l’utilisateur de valider la sauvegarde du

TaDa et de configurer son accès.

Dans cette fenêtre, un nom ainsi qu’une description peuvent être

assignés au TaDa créé comme dans l’exemple ci-contre.

L‘étape de la sauvegarde permet également d’insérer votre TaDa

dans une « Category » prédéfinie par TaDaweb.

L’onglet « Visibility » fait référence à l’accessibilité du TaDa

(public ou privé). Un TaDa privé pourra néanmoins être partagé

sous forme de journal avec un groupe de personne spécifique

qui doit être précisé (cf. ci-après).

Une fois ces données renseignées, appuyer sur « Save »

pour sauvegarder ou « Cancel » pour annuler toute la

sauvegarde.

Le TaDa sauvegardé devient alors disponible sur le

logiciel TaDaweb Creator (voir paragraphe ci-dessous) et

sur le Dashboard en ligne sous sa forme présentée ci-

contre.

[email protected] PPaaggee

5588 ssuurr 7711

Consulter, modifier, réutiliser la structure d’un TaDa

Lorsque l’utilisateur souhaite consulter ou modifier un TaDa déjà enregistré, il doit

récupérer ce TaDa dans le dernier onglet de la barre d’outils de TaDaweb

Creator, dénommé « TaDa ».

► Consultation des TaDas

Dans l’onglet « TaDa » de la barre d’outil, choisir le TaDa à consulter.

En glissant le TaDa sélectionné sur le Whiteboard (« Collecte de

l’information » dans le cas de figure), l’utilisateur obtient la possibilité de :

Visualiser la présentation du TaDa (sa sortie) qui donne le résultat

de veille (à partir du chemin de sélection créé) en cliquant sur

« Execute TaDa ».

Visualiser et modifier le chemin de sélection du TaDa (mode "édition" permettant de

modifier la structure du TaDa) en cliquant sur « Edit TaDa ».

Notons ici que les TaDas peuvent être assemblés comme des poupées russe : un TaDa pouvant en

contenir un autre et ainsi de suite. La "sortie" du TaDa sous sa « forme simplifié » permettant

d’encapsuler des TaDas les uns dans les autres. En quelque sorte, il est possible de continuer la

construction d’un TaDa à partir de la sortie d’un TaDa d’origine, il s’agit cependant d’un nouveau

TaDa dans ce cas.

Quant au mode "édition" (la « forme développé »), il va va garder le Look & Feel (la mise en page)

créé lors du "Save" du premier Tada (tandis que la "sortie" du TaDa sous sa « forme simplifié » est

considéré comme un nouveau TaDa.

Sortie du TaDa Présentation sous forme simplifiée

Mode édition du TaDa - Présentation développée permettant des modifications

[email protected] PPaaggee

5599 ssuurr 7711

► Modification du TaDa

Pour utiliser cette option, il est nécessaire de partir de la vue obtenue

par l’option « Edit TaDa » (forme développée) qui permet de visualiser

les différentes actions créées sur la source (voir ci-dessus).

- Pour supprimer l‘une de ses actions, il suffit de cliquer sur la

croix rouge de l’icône ou encore, s’il s’agit d’une source dans

une liste, d’ouvrir la liste, de sélectionner la source à supprimer

et de cliquer sur « Remove » (ci-contre, suppression de la

source RSS Feed « ZDnet»). Cette action disparaît alors,

modifiant le reste du chemin de sélection.

- Pour ajouter une action procéder comme indiqué ci-avant.

Pour que ces modifications soient prises en compte, cliquer sur le bouton « Save TaDa » du

Whiteboard (reprendre étape de sauvegarde ci-dessus). Les modifications du TaDa sont alors

sauvegardées, gardant tout de même l’ancien chemin de sélection du TaDa.

► Réutilisation d’un chemin de sélection

Fréquemment le chemin de sélection, caractérisé par une certaine succession de fonctionnalités, se

répète d’une source à l’autre : extraction d’une partie de texte (Webclip), d’une image, d’une liste, d’un

tableau de données,…. Il est donc avantageux de réutiliser ce chemin de sélection pour les nouvelles

sources concernées.

Pour cela, choisir dans le bandeau gauche (onglet TaDa) le TaDa dont les fonctionnalités serviront de

« patron ». Glisser le TaDa sélectionné sur le Whiteboard. A l’aide de l’option « Edit TaDa » décrite

plus haut, développer entièrement le TaDa comme ci-dessous.

Dans un premier temps, Il suffit alors de remplacer

la source par une autre. Dans le cas d’une source

URL, supprimer l’icône de la source à remplacer,

taper la nouvelle adresse dans la barre du

navigateur, et redéposer une nouvelle icône URL

sur le Whiteboard. En liant cette nouvelle icône

aux outils d’extractions du TaDa patron, le logiciel

recharge alors les nouvelles données en fonction

de la nouvelle source.

Dans le cas d’un flux, changer directement

l’adresse en double cliquant sur l’icône de la

source. Dans cet exemple, nous allons récupérer le TaDa « Collecte de l’information » et remplacer la

source du flux d’Easi-ie par celui de Veille ie and co. Double cliquer alors sur l’icône RSS Feed.

[email protected] PPaaggee

6600 ssuurr 7711

S’ouvre alors l’interface de gestion des flux RSS à surveiller comme ci-

dessous.

Sélectionner l’adresse à supprimer (ici Easi-ie) et cliquer sur

« Remove ». Entrer ensuite la nouvelle adresse à surveiller (ici, celle de

veille ie and co)

En cliquant sur « Save », le logiciel charge automatiquement les

résultats en fonction du nouveau site.

Ces étapes terminées, il ne reste donc plus qu’à sauvegarder ce

nouveau TaDa en utilisant les mêmes outils que le TaDa « patron ».

Remarque : Réutiliser la base d’un ancien TaDa permet avant tout un gain de temps, puisque

l’utilisateur n’aura plus la nécessité de glisser-déposer et relier les différents outils.

Rappelons qu’il est plus simple d’utiliser Custom Text ou Custom List. pour pouvoir changer les

données à la volée.

[email protected] PPaaggee

6611 ssuurr 7711

Mise en mémoire et enrichissement des informations d’un TaDa

◦ Sauvegarde de l’information collectée

Si le chemin de collecte et de sélection de l’information est mémorisé pour chaque TaDa par

l’outil lui-même, les informations contenues, actualisées au fur et à mesure des mouvements de la

source, ne sont elles-mêmes pas mémorisées lorsqu’elles subissent une modification.

- Toute modification d’un document vient « écraser » la version précédente du document dans

le TaDa.

- Par contre, lorsqu’une nouvelle information (document, donnée, ...) est émise par la source,

elle vient simplement s’ajouter à celles précédemment collectées. De même, les

informations des sources non mouvementées restent en l’état jusqu’à modification.

Ce mode de fonctionnement implique, pour ceux qui le souhaitent, de disposer d’un outil annexe

permettant de sauvegarder sur la période souhaitée la sortie d’un TaDa à un instant T.

◦ Annotations des documents sélectionnés

Le veilleur comme l’utilisateur des résultats de la Veille doit pouvoir travailler directement sur les

documents recueillis, à savoir : sur-lignages, annotations, notes de bas de page, ...

Pour faciliter la consultation de l’information sauvegardée, il nous est apparu intéressant de penser au

format e-book qui vient s’insérer dans les routines de consultation des documents écrits et dans les

tendances des sorties de la Veille. Dans cette optique, nous avons comparé les outils Yudu, Calaméo,

Zinepal ou encore Feedjournal.

Après tests de ces différents outils pour la gestion des résultats de la Veille de TaDaweb, il apparait

que :

Ces outils ne prennent pas en compte le format de sortie des TaDas,

Ils n’apportent pas une lisibilité optimale des informations,

Ils ne permettent pas une bonne exploitation de l’information.

L’équipe de développement de TaDaweb ayant décidé d’intégrer sous peu, à leur outil, des

formats de sortie de type PDF ou encore e-book pour autoriser la sauvegarde, nous avons arrêté

notre choix sur l’application Yudu, consultable en ligne et multiplateforme (smartphone, tablette, PC).

Yudu permet en effet ...

- De lire le format (PDF) sous forme de magazine, livre ou autres,

- D’exploiter l’information en proposant une recherche par mots-clés mais aussi en autorisant

l’annotation ou encore l’ajout de notes de bas de pages.

- De stocker l’information indéfiniment (jusqu’à 100 documents par semaine) jusqu’à

suppression directe par l’utilisateur.

[email protected] PPaaggee

6622 ssuurr 7711

SCRAPBOOK. Une autre solution consiste à utiliser Scrapbook, une extension gratuite de Firefox.

Extrêmement aisée et intuitive à mettre en œuvre, cette application autorise une mise en mémoire sur

le poste utilisateur et le classement familier en arborescence (type Windows) des diverses sorties de

TaDaweb

L’avantage de Scrapbook, qui permet d’enregistrer, stocker, gérer et annoter les pages Internet

d’intérêt (voir tutoriel sur notre site), réside dans sa praticité : il installe un panneau latéral qui vient

s’intégrer au navigateur Firefox. L’organisation des captures se fait par simple glissé-déposé depuis la

barre d’adresse.

[email protected] PPaaggee

6633 ssuurr 7711

Partage et diffusion de l’information : TaDaweb Dashboard

Introduction au Dasboard

Nous devons distinguer :

o Le Dashboard lié à Creator, accessible directement depuis le logiciel installé en cliquant sur

« Dasboard » (voir ci-dessus). Il permet de vérifier la présentation qu’aura le Dashboard en ligne

des TaDas et journaux créés, de les consulter et de les rechercher/sélectionner :

o Le Dashboard en ligne. Le partage et la consultation, à la différence de la création de TaDas, ne

s’effectue par sur l’outil TaDaweb Creator mais sur la plateforme en ligne, accessible depuis un

navigateur à l’adresse www.tadaweb.com, qui rend actif diverses fonctionnalités.

Cette seconde interface assure la diffusion en ligne. Elle constitue pour les utilisateurs une sorte

de tableau de bord du travail effectué sur le TaDaweb Creator.

Public TaDas

Il permet d’accéder aux TaDas publics créés par d’autres usagers (recherche sur mots-clés,,

sélection pour insertion dans ses propres Tadas), mais aussi à de nouvelles fonctionnalités

accessibles depuis les menus « Explore » et le menu personnel (ici « Paul »).

[email protected] PPaaggee

6644 ssuurr 7711

Sur cette page, l’utilisateur peut suivre une personne en particulier. Si par exemple, une personne

publie régulièrement des TaDas publics

susceptibles d’intéresser l’utilisateur, celui-ci

pourra alors la suivre pour ne rien manquer de

ce qu’elle publie. Pour cela, il suffit de cliquer

sur la photo de la personne dont on veut

suivre le flux d’information. Comme ci-contre.

Ce faisant, l’utilisateur est alors redirigé vers le

profil de la personne concernée et peut

accéder aux informations la concernant, à ses

TaDas catégorisés comme publics et aux

personnes qu’il suit et qui le suivent (voir

image ci-dessous).

En cliquant sur le bouton « Follow », celui-ci passe alors au rouge , vous permettant de ne

plus suivre cette personne.

[email protected] PPaaggee

6655 ssuurr 7711

TaDas privés

Menu utilisateur. Le menu déroulant obtenu en cliquant sur le nom d’utilisateur (en haut à droite)

permet d’accéder à ses propres « TaDas » et « Journals ».

La page TaDa permet de consulté et gérer les TaDas de l’utilisateur connecté. On accède à cette

page en cliquant en haut à droite de la page d’accueil, sur le nom de l’utilisateur, puis sur « TaDas ».

La page TaDa se compose de deux parties.

La première partie (haute) de la page TaDas permet à l’utilisateur de préciser son profil, de rechercher

différents TaDas lui appartenant à l’aide de filtres par catégories, et de voir les Follower, personnes

suivant l’un de ses TaDas ou encore les Following, personnes que l’utilisateur connecté suit.

En cliquant par exemple sur l’icône « Following », l’utilisateur obtient le résultat ci-dessous.

A travers cet exemple, nous pouvons par exemple retrouver la personne suivies dans l’étape

précédente.

En plus de cet espace de suivis, l’utilisateur pourra modifier son profil et le préciser s’il le souhaite.

Pour cela, cliquer sur l’icône ou sur la phrase « Click here to add a bio… ». L’utilisateur pourra

entrer de nouvelles informations le concernant et modifier les informations existantes.

[email protected] PPaaggee

6666 ssuurr 7711

La deuxième partie (basse) de la page regroupe les TaDas

de l’utilisateur connecté. L’utilisateur peut consulter sur

cette page les informations extraites lors de la veille. Cette

interface permet également de rafraîchir les données ou

encore de créer des alertes différentes par TaDas. Ci-

contre, exemple de TaDas.

Cliquer sur le bouton alarme du TaDa permet de

paramétrer celle-ci. L’utilisateur pourra ainsi choisir la

fréquence à laquelle sont TaDa sera mis à jour.

La seconde partie de l’alarme permet de choisir la

date de début de surveillance du TaDa.

L’utilisateur sera averti par mail lors de chaque

modification de source surveillée.

Cliquer sur le bouton « Publier dans le journal » enverra

le TaDa sélectionné vers le journal voulu. En cliquant

sur ce bouton, une interface s’ouvre, permettant de

choisir à quel journal envoyer le TaDa. (Voir ci-contre)

[email protected] PPaaggee

6677 ssuurr 7711

Journals privés

Menu utilisateur. Le menu déroulant obtenu en cliquant sur le nom d’utilisateur (en haut à droite)

permet d’accéder à ses propres « TaDas » et « Journals ».

Le « Journal » regroupe les différents TaDas. Ainsi, les TaDas créés sur le thème de la veille peuvent

tous être regroupés dans un journal du même nom.

Le journal est un outil pratique visant à surveiller toutes les sources du même thème. Il peut être

partagé avec une personne ou groupe en appuyant sur le bouton . Vous pouvez également

choisir de le partager sur différents réseaux sociaux ou encore partager le journal par email avec un

groupe de personne donné.

Le bouton permet quant à lui de rafraîchir les données des TaDas composant le journal, afin

de les mettre à jour suite aux mouvements qui ont affectés les sources utilisées..

On peut accéder à cet onglet en allant

directement dans l’onglet de l’utilisateur,

en haut à droite de la page d’accueil puis

en cliquant sur « Journals » ou bien

depuis le Dashboard en cliquant sur

« Journals » en haut à droite.

En cliquant sur cet onglet, l’utilisateur

arrive d’abord sur une interface de

gestion des Journaux.

Sur cette fenêtre, l’utilisateur doit choisir sur quel « Journal » se rendre. Dans l’exemple ci-dessus, un

seul journal a été créé : l’utilisateur peut donc accéder à ce journal en cliquant sur la bannière bleue

ou en créer un nouveau en cliquant sur « Create a new Journal ».

Pour les journaux existants, en cliquant sur

l’option « Edit », l’utilisateur obtient alors la

fenêtre suivante. Celle-ci permet de changer les

métadonnées du journal, ainsi que sa fréquence

de mise à jour.

L’utilisateur peut également supprimer le journal

en appuyant sur le bouton

[email protected] PPaaggee

6688 ssuurr 7711

[email protected] PPaaggee

6699 ssuurr 7711

Web Clipper

Menu Explore. En cliquant sur le menu « Explore » on peut accéder à la fonction « Web Clipper » à

partir de l’option « Tools ». Un simple glisser –déposer sur la barre d’outils (toolbar) du navigateur

permet de rendre active cette fonctionnalité (voir schéma suivant)

Une fois le Web Clipper dans la barre d’outils, il suffit de cliquer sur « +Clip a TaDa » pour obtenir en

bas de page la fonctionnalité. Pour sélectionner directement tout ou partie de la page il suffit de

cliquer sur « Select » puis sur « Expand » pour élargir la zone de sélection. « Save » permet ensuite

de créer un TaDa à la volée (voir ci-dessous, page suivante).

[email protected] PPaaggee

7700 ssuurr 7711

[email protected] PPaaggee

7711 ssuurr 7711

Signalement des ajouts ou modifications des pages Web surveillées

TaDaweb signale les modifications des pages surveillées sur le Dashboard en ligne, en indiquant en haut à droite, dans un encadré vert « Show new content ».

Il suffit alors de faire défiler le

Tada : tous les ajouts depuis la

dernière visite sont surlignés

en vert.

Pour faire disparaître ce

surlignage il suffit de cliquer en

haut à droite sur « Hide new

content », ce qui fait

réapparaître « Show new

content ».

Rechercher un mot

La fonction universelle peut ête utilsiée pour des recherches sur un TaDa ou un journal.