11
Module ScIn11 – partie informatique L1 Sciences et Techniques Document de travail – TD1 - Utilisation de Google 2016-2017 Cette présentation de Google est basée sur : « Vos recherches avec Google », Bruno Bernard Simon, Klog édition, 2014 ainsi que sur plusieurs pages web : http://www.generation-nt.com/google-guide-presentation-moteur-recherche-fonctions-article-24819-1.html http://www.rankspirit.com/mieux-utiliser-google.php http://micromut.fr/internet/Pdf/Mieux_utiliser_Google.pdf (document GoogleUtilisation.pdf) Pendant les tests sur Google, vous risquez de devoir prouver que vous n'êtes pas un robot. Le mécanisme utilisé est appelé captcha 1 . Vous pouvez consulter les sites : https://fr.wikipedia.org/wiki/CAPTCHA http://www.captcha.net/ http://www.lemonde.fr/pixels/article/2016/02/10/petite-histoire-des- captchas-ces-tests-d-identification-en-pleine- mutation_4862727_4408996.html 1.a- Le paramétrage de Google Pour adapter Google à votre mode de travail, vous pouvez choisir le domaine de recherche (tous documents, images, cartes, etc.), vous pouvez définir une limite spatio-temporelle à votre recherche (un pays pour les sites, une langue d'écriture des pages, un intervalle de temps récent, etc.) et vous disposez d'un menu de paramétrage, accessible en cliquant sur la roue dentée en haut à droite de l'écran. Ce menu de paramétrage contient deux séries d'options concernant respectivement les langues à prendre en compte (pour les requêtes et pour la sélection des documents) et les résultats de vos recherches dont : - le filtre "safe search" qui élimine les sites non appropriés. Attention, l'utilisation de ce filtre est importante depuis les salles du département IEM (en cas de problème, votre compte peut-être bloqué … relisez la charte d'utilisation que vous avez signée!), - la suppression de la recherche systématique (avant la fin de saisie) et le choix du nombre de réponses par page, - l'affichage des réponses dans une nouvelle fenêtre du navigateur, 1 Captcha : Completely Automated Public Turing Test To Tell Computers and Humans Apart.

Module ScIn11 – partie informatique

  • Upload
    others

  • View
    2

  • Download
    0

Embed Size (px)

Citation preview

Module ScIn11 – partie informatiqueL1 Sciences et Techniques

Document de travail – TD1 - Utilisation de Google2016-2017

Cette présentation de Google est basée sur :« Vos recherches avec Google », Bruno Bernard Simon, Klog édition, 2014

ainsi que sur plusieurs pages web :http://www.generation-nt.com/google-guide-presentation-moteur-recherche-fonctions-article-24819-1.html

http://www.rankspirit.com/mieux-utiliser-google.php

http://micromut.fr/internet/Pdf/Mieux_utiliser_Google.pdf (document GoogleUtilisation.pdf)

Pendant les tests sur Google, vous risquez de devoir prouver que vous n'êtes pas un robot. Le mécanisme utilisé est appelé captcha1. Vous pouvez consulter les sites :

https://fr.wikipedia.org/wiki/CAPTCHA

http://www.captcha.net/

http://www.lemonde.fr/pixels/article/2016/02/10/petite-histoire-des-captchas-ces-tests-d-identification-en-pleine-

mutation_4862727_4408996.html

1.a- Le paramétrage de GooglePour adapter Google à votre mode de travail, vous pouvez choisir le domaine de recherche (tous documents, images, cartes, etc.), vous pouvez définir une limite spatio-temporelle à votre recherche (un pays pour les sites, une langue d'écriture des pages, un intervalle de temps récent, etc.) et vous disposez d'un menu de paramétrage, accessible en cliquant sur la roue dentée en haut à droite de l'écran.

Ce menu de paramétrage contient deux séries d'options concernant respectivement les langues à prendre en compte (pour les requêtes et pour la sélection des documents) et les résultats de vos recherches dont :

- le filtre "safe search" qui élimine les sites non appropriés. Attention, l'utilisation de ce filtre est importante depuis les salles du département IEM (en cas de problème, votre compte peut-être bloqué … relisez la charte d'utilisation que vous avez signée!),

- la suppression de la recherche systématique (avant la fin de saisie) et le choix du nombre de réponses par page,

- l'affichage des réponses dans une nouvelle fenêtre du navigateur,

1 Captcha : Completely Automated Public Turing Test To Tell Computers and Humans Apart.

- la modification de l'historique (celui-ci étant personnel, il faut être connecté à votre compte Google).

Avant de continuer, vous devez :

- activer le filtre « Safe Search » en choisissant « filtrer les contenus »

- demander l'affichage des résultats dans une nouvelle fenêtre

Vous pouvez :- ne pas utiliser votre navigateur habituel et supprimer tout historique de ce navigateur,- vous connecter à votre compte Gmail (ou Google) si vous en avez un, afin de voir comment

est conservé l'historique.

1.b- Les aides de Google

Google effectue une « autocomplétiondes mots » et propose des réponsesavant que vous ayez fini de saisir votrerequête.Attention, plusieurs « easter eggs » deGoogle peuvent se glisser dans lespropositions (vous pouvez tester enrecherchant anagramme en français,anagram ou recursion en anglais).

Pour une telle recherche systématique,seules les dix premières réponses sontprésentées.

Google, comme de nombreux sites, utilise des cookies pour garder des traces de votre navigation et de vos recherches. D'après la page web « Types de cookies utilisés par Google », ces cookies permettent :

- d'enregistrer vos préférences (langue, localisation géographique, etc.),- de conserver, sous forme chiffrée, l'identifiant de votre compte Google, vos dates et heures de connexion les plus récentes,- de rendre la publicité plus attractive (aide pour sélectionner les publicités),- de conserver des informations pour Google Analytics.

Vous pouvez, dans les options du navigateur :

- supprimer les cookies qui ont été enregistrés,- effacer l'historique de votre navigation.

1.c- Les règles de base de GoogleLes règles de base de constitution de vos requêtes sont présentées ci-dessous, accompagnées d'un test simple à effectuer.

dans votre requête, l'ordre des mots importe

lancez les deux requêtes : paris dakar

dakar paris

comparez les positions respectives du site wikipaedia

et du site officiel du rallye Paris-Dakar

votre requête est limitée à 10 mots non éliminables (les mots

éliminés par Google sont les articles, conjonction, etc.)

lancez les deux requêtes :du vin ordinaire de Bourgogne dans chaque bouteille duquel on

aurait fait fondre deux livres de sucre

vin ordinaire Bourgogne bouteille deux livres

sucre

pour retrouver la citation de Stendhal : Le lacrima christi est imbuvable pour moi. C'est du vin

ordinaire de Bourgogne dans chaque bouteille duquel on aurait fait fondre

deux livres de sucre.

les accents ne sont pas pris en compte dans la recherche …

MAIS ils influent sur l'analyse du contexte

lancez les deux requêtes :hotel et hôtel

ou les deux requêtes :aï et ai

* est un joker pour un mot entier lancez les deux requêtes : gare de Dijon *gare de Dijon

Tips and tricksPour la recherche simple avec Google :

1- pas de phrases, des mots-clés : n'hésitez pas à utiliser plusieurs mots-clés2- restez aussi près que possible du texte que vous supposez figurer dans les documents3- utilisez des guillemets pour délimiter les expressions (mots contigus dans les documents)4- utilisez le mot-joker * 5- utilisez le pipe | pour une alternative entre mots

Pour tester ces critères de recherche simple :

question 1- ordre des mots et utilisation des guillemetsa) comparez l'ordre des mots clés avion énergie solaire et énergie solaire avion.

Dans les deux cas, sur quelle page apparaîssent les premiers sites liés à l'environnement.b) comparez les résultats précédents avec "énergie solaire" avion. Où apparaîssent les

premiers sites liés à l'environnement ?c) recherchez "énergie solaire" applications et repérez les annonces commerciales.

L'avion solaire Solar Impulse apparaît-il dans les premières pages de résultats ?d) recherchez "énergie solaire" applications avion. Où apparaissent les premières

pages sur l'avion solaire Solar Impulse ?e) comparez voiture solaire et "voiture solaire". Cherchez la première page avec les

mots voiture et solaire non contigus.

question 2- l'exclusion (avec le signe -), les alternatives (avec |)a) effectuez une recherche avec "moyen de transport" "énergie solaire" puis

éliminez les résultats sur les voitures solaires en ajoutant à votre requête -voitureb) comparez "programmation système" java|python et "programmation système"c) recherchez "mercure" et retrouvez les pages commerciales. En utilisant l'opérateur –

éliminez les pages relatives aux hôtels Mercure et à la planète Mercure.

question 3- utilisation du joker *Rechercher des documents sur les moyens de transport à énergie solairea) recherchez avec transport "* solaire"b) comparez les résultats de "énergie *" voiture et énergie voiturec) retrouvez les sujets durables avec "* durable"d) recherchez "le * de Dijon"

1.d- La recherche avancée de documentsL'écran de recherche avancée vous permet :- de rechercher les documents associés à « tous les mots » « un des mots » « aucun des mots » indiqués- de rechercher les documents associés à une expression,- de rechercher les documents associés à un intervalle de valeurs (numériques, dates, etc).

Vous pouvez compléter vos critères de recherche par :- la langue des pages web cherchées (attention, la langue est déterminée par le site lui-même

et non par une analyse de la page proprement dite),- la géo-localisation,- la date de dernière mise à jour (attention, il s'agit de la dernière mise à jour lors de

l'indexation de la page et non au moment où vous lancez votre requête),- le site ou domaine de recherche,- la position des mots-clés dans la page (url, titre, etc),- l'utilisation du filtre de SafeSearch,- le type de fichier (via l'extension),- les droits sur le document (la licence sous laquelle le document est publié). Les droits sur

les documents relèvent le plus souvent des licences Creative Commons. Vous pouvez consulter :

http://creativecommons.fr/licences/http://freedomdefined.org/Definition/Fr

Les tests ci-dessous portent sur ces critères de recherche avancée.

question 4- Rechercher des documents sur :- les avions à moteur en étoile- les avions électriques ou solaires- les pages du site www.lemonde.fr qui parlent du prix Nobel de chimie en 2016- les prix Nobel de médecine des trois dernières années - l'orienté objet en informatique mais pas en programmation- les fichiers au format pdf sur le site de la région Bourgogne-Franche-Comté

1.e- Les opérateurs pour la recherche avancéeLes opérateurs Google vous permettent d'effectuer les mêmes recherches sans utiliser l'interface de recherche avancée. Vous avez déjà testé :

- les opérateurs logiques : AND OR NOTNOT peut être noté –OR peut être noté | AND peut-être noté +

- les guillemets pour encadrer les expressions (i.e., plusieurs mots qui doivent rester ensemble)

- la notation .. pour un intervalle (numérique, année, monnaie, etc)- le signe + pour conserver un mot vide qui serait automatiquement supprimé par Google- le joker * pour un mot entier

Vous disposez aussi d'opérateurs applicables à un seul ou tous les mots-clés d'une requ te (ế voir) :d'opérateurs relatifs à la structure des pages

opérateurs pour rechercher

inanchor:xxx dans les textes associés aux ancres

intitle:xxx allintitle:xxx dans les titres des pages

intext:xxx allintext:xxx dans le texte proprement dit

inurl:xxx allinurl:xxx dans l'url

autres opérateurs

filetype:xxx un format de fichier particulier

site:xxx sur un site donné

link:xxx pages contenant un lien vers le site indiqué

Vous pouvez aussi utiliser des opérateurs généraux (utilisant le code postal ou éventuellement le nom de ville ou de région) :

movie:21000weather:21000

map:21000

question 5- Effectuez les recherches :- Dijon sur le site de l'UB- perl sur des sites du domaine .fr- Dijon dans les titres- ville de Dijon dans les titres- Dijon Beaune dans les titres- Dijon dans l'url- Dijon Bourgogne dans l'url- fichiers zip avec Dijon- formation scientifique avec un lien sur le site www.bourgognefranchecomte.fr- tous les liens externes au site de l'UB pointant sur ce site- site de vente en ligne amazon.com

- avec local dans l'url- avec www dans l'url- sans www dans l'url- avec the xxx game dans le titre (utilisez des quotes simples ')- avec top xxx novels où xxx est compris entre 5 et 10

question 6- Comparez les résultats de :-inurl:htm -inurl:html intitle:"index of" java

intitle:"index of" java

question 7- Combien de réponses en moins obtenez-vous sur le site de vente en ligne amazon.com en éliminant les url en https ?

1.f- Divers autres outilsRecherche d'images

Recherchez systématiquement des images libres de droit

et activez Safe Search

Google propose deux modes de recherche d'images. Avec l'interface de recherche vous pouvez sélectionner les images :

rectangulaire), couleur, format (png, jpg), droits sur l'image, etc.

barre de requêtes images pour fournir une image qui sert de modèle … Google cherche alors des images similaires.

Par exemple une recherche par le contenu sur l'image

vous propose entre autres :

Vous pouvez utiliser les opérateurs Google pour la recherche d'images en les donnant directement dans la zone de requête (). Dans ce cas, vous voyez apparaître sur l'écran le menu complémentaire des opérateurs.

Recherchez des images :- avec un seul mot-clé : daisy3

- en ajoutant l'opérateur imgtype (valeurs possibles face, photo, clip art, line drawing, animated) pour chercher un visage

- en ajoutant l'opérateur filetype (valeurs possibles jpg, gif, png, bmp, svg, webp, ico) pour chercher une image au format svg.

3 daisy (marguerite)

Images animées et easter eggs de Google

Souvent appelées doodles, les images animées sont proposées au fil de l'actualité. Une archive de ces images est disponible sur :

https://www.google.com/doodles

Les easters eggs sont des fonctionnalités « humoristiques » ajoutées dans Google. Vous pouvez en tester quelques exemples tirés des sites :

http://www.cbsnews.com/pictures/17-amazing-google-easter-eggs/http://www.webrankinfo.com/dossiers/google-search/easter-eggs#dr-who

- pour des modifications d'écran :- do a barrel roll- askew- gravity search puis Google Gravity – Mr.doob

- pour des calculs :- once in a blue moon- the loneliest number- the answer to the ultimate question of life the universe and everything- the number of horns on a unicorn

- pour des propositions d'orthographes alternatives :- anagram (paramétrage en anglais) ou anagramme- recursion (paramétrage en anglais)

- pour des écrans à thème :- google hacker puis page google hacker- LMGTFY pour Let Me Google That For You (réponse aux questions idiotes)- blink html- Zerg Rush- Bletchley Park- ewmew fudd- festivus- conway's game of life

- deux calculs :1.2+(sqrt(1-(sqrt(x^2+y^2))^2) + 1 - x^2-y^2) * (sin (10 * (x*3+y/5+7))+1/4) from -1.6 to 1.6

sqrt(cos(x))*cos(300x)+sqrt(abs(x))-0.7) *(4-x*x)^0.01, sqrt(6-x^2), -sqrt(6-x^2) from -4.5 to 4.5

CalculetteLorsque vous saisissez une expression à calculer (par exemple (2+5)/6) dans la zone de recherche, Goole calcule et vous affiche une calculette.

Les alertesVous pouvez demander à recevoir un mail lorsque de nouveaux documents relatifs à certains mots-clés sont indexés par Google. Le site Google Alerts est

https://www.google.fr/alertsVous disposez d'une barre de recherche. Vous devez indiquer votre adresse email et paramétrer les options (fréquence d'envoi, type de source, langue, région, sélection ou intégralité des résultats, etc.)Voir :

http://www.actulligence.com/2014/03/27/les-systemes-de-veille-par-alertes-en-questions/Vous recevez des messages :

Google booksVous pouvez rechercher des livres à partir de Google Books. Une zone de recherche est disponible dans laquelle les opérateurs Google peuvent être utilisés.

Une interface de recherche avancée est aussi disponible (en cliquant sur la roue dentée). Elle permet de rechercher à partir d'expressions ou à partir d'information précises (auteur, éditeur, date de publication, etc.), voir ci-dessous.

Google ScholarSur le même schéma que Google Books, Google Scholar vous permet de trouver des articles de recherche. Le site est :

https://scholar.google.fr/Vous disposez d'une zone de recherche dans laquelle les opérateurs sont reconnus. L'écran de travail permet de sélectionner directement date, critères de tri, domaines de recherche. Les résultats sont -dans la mesure du possible- présentés avec un lien pour le téléchargement de l'article. Vous pouvez paramétrer l'affichage et ouvrir un écran de recherche avancée.

maintenant fournies par le satellite Landsat 8 … et de qualité bien supérieure à celle des anciennes images.Voir le document googleEarth.pdf qui vous est fourni pour plus de détails).

Sur Google Maps, vous pouvez demander une url courte à intégrer dans vos documents. Vous devez cliquer sur partager puis cocher URL courte.

Remarques diverses- le comportement des outils de Google peut être moins efficace (ou limité) si vous n'êtes pas

connectés à un compte Google ;

- des liens sponsorisés sont affichés, souvent sous forme d'images à droite de l'écran des résultats. Ils font parfois référence à Google Shopping. Les adresses, affichées sous les liens sponsorisés, sont appelés "annonces". Votre géo-localisation pour le choix de ces adresses est fait à partir de votre adresse IP ou de l'information indiquée comme « position » dans vos paramètres de recherche ;

- les pages similaires proposées par Google sont sélectionnées sur les mots-clés uniquement, elles sont donc peu précises ;

- les pages « en cache » sont sous la forme qu'elles avaient lors de leur indexation par Google (elles ne sont donc pas à jour).

1.g- Exercice facultatif : tricher avec les url ...D'après BB Simon, « Vos recherches avec Google »,pages 118-119.

Vérifiez l'url ci-dessous qui doit vous faire accéder à la version scannée d'une première page d'article dans un vieux numéro de l'hebdomadaire « Le Nouvel Observateur ».

https://referentiel.nouvelobs.com/archives_pdf/OBS1291_19890803/OBS1291_19890803_0 4 2.pdf

Que se passe-t-il avec les adresses : https://referentiel.nouvelobs.com/

https://referentiel.nouvelobs.com/archives_pdf/https://referentiel.nouvelobs.com/archives_pdf/ OBS1291_19890803/

Pour construire les adresses des pages suivantes de l'article, vous devez retrouver dans l'url initiale :https://referentiel.nouvelobs.com/archives_pdf/OBS 1291 _ 19890803 /OBS 1291 _ 19890803 _ 042 .pdf

- le numéro concerné 1291- la date de publication 3 août 1989 (sous la forme AAAAMMJJ)- le numéro de page 42 (noté sur trois caractères, 042)

Retrouvez toutes les page de l'article « Climat le ciel est devenu fou » (numéro 1291 du 3 août 1989, pages 42-43) puis les pages de tous les articles sur le thème « y a plus de saisons » (pages 44-51 du même numéro).

Retrouvez toutes les page de l'article « Chaleur, sécheresse : des profits comme s'il en pleuvait » de M. Gilson et P. Boulet-Gercourt, publié dans le numéro suivant (une semaine plus tard exactement). Le sommaire des numéros est en page 3.