Moteurs de recherche alternatifs, libres et décentralisés : yacy, nutch and seeks Hackpéro GwadaLUG du 7 décembre 2011 by fwix and hnourel (seeks enthusiasts)
- 1.
- Moteurs de recherche alternatifs, libres et dcentraliss
- Hackpro Gwadalug 7 dcembre 2011
- Byfwixandhnourel(seeks enthusiasts)
2.
- Quel(s) moteur(s) utilisez-vous?
3. Enjeux trouver tous types de ressources :
-
- 4. forums Usenet , images ,
5. vido , 6. fichiers, 7. etc... Profiler, surveiller,
influencer
9. 1 pays 10. ... 11. 12. To be or not to be (on google) Google
leader toutes catgories: Les risques:
14. Profilage des utilisateurs: publicit... La loi amricaine
oblige Google transmettre aux services secrets amricains toutes les
donnes de leurs utilisateurs quel que soit leur emplacement
gographique... 15. Des moteurs libres Yacy
17. Java Seeks
19. C+++ scripts python et PHPYacy, Seeks:des moteurs de
recherche libres et dcentraliss Ht://Dig, mnogoSearch,
Nutch:moteurs de recherche libres, mais non dcentraliss 20.
- Yacy : par le peuple, pour le peuple
- Un crawler dcentralis pour la libert d'information
22. pas de profiling ou d'enregistrements des donnes
utilisateur
-
- 1,4 milliards de documents
- 23. + de 600 peer-oprateurs par mois
24. environ 130 000 rsultats par jour.
- mais aussi : ScienceNet(Institut de Technologie de Karlsruhe),
services TOR cachs, rseaux WIFI...
25.
26.
- Trs simple installer / utiliser
-
-
- multi plateforme (java) : Windows / Mac OS X / GNU
Linux...
- 27. version packag pour Debian, Ubuntu, ...
- 28. pas besoin de serveur web ni de DB externe
29. interface web de configuration sexy
- Dcentralis, communautaire et libre
32. vie prive respecte 33.
- Faible pertinence des rsultats
- On the Feasibility of Peer-to-Peer Web Indexing and Search(MIT
2003) relative inadquation de l'indexation via P2P (BP, espace
disque, index documents / mots cls...)
- demanderait plus de ressources que disponible
- http://db.cs.berkeley.edu/papers/iptps03-feasibility.ps
35.
- Seeks would not exist if we could believe in Yacy BENIZ
-
http://www.seeks-project.info/site/2011/12/03/what-freedom-in-websearch-truely-means/
36.
- Seeks, Yacy, des orientations diffrentes...
37.
- Un mta moteur de recherche libre
- Seeksagit comme un proxy et adresse ses requtes sur de
nombreuses sources :
-
- Moteur de recherche :Google, Bing, Blekko, Yahoo, Yauba,
Exalead,...
-
- Sites spcialiss:Youtube, Dailymotion, Google images, Bing
Images, Yahoo Images, Flickr,...
-
- Plate-forme de microblogging : Twitter ,Identi.ca,...
- 38. Plate-forme gnrique Mediawiki, Dokuwiki, WordPress,
Redmine,...
39. Formats standards(OpenSearch, RSS, ATOM)
40.
- Un moteur de Social search
-
- DHTpour stockage des rsultats (query = key)
-
- Curation: amlioration des rsultats selon les liens cliqus
(+reject...)
41.
- Collaboration, confidentialit et libert
-
- Privacy: be served anonymously;
-
- Freedom to control the results : edit, reject, share, rank
;
-
- Freedom to trustwho you search with, who influences your
results, .
-
http://www.seeks-project.info/site/2011/12/03/what-freedom-in-websearch-truely-means/
42.
- Seeks: fonctionnalits utilisateur
- Dmonstration: https://seeks.avaland.org
- (*)Redmine : gestionnaire web based libre de projets et de code
source
43.
- Seekss'installe sur unposte de travailou sur unserveurGNU/Linux
Il est packag pour les distributions suivantes :
45. Gentoo 46. Ubuntu
- Sinon pour les autres distributions, il faut rcuprer les
sources sur :http://seeks-project.info/wiki/index.php/Download ou
faire l'installation l'aide de ce script :
- http://www.seeks-project.info/seeks/install_seeks.sh
47.
- Seeks: outils admin. et dv.
- 2 mthodes d'utilisation de la recherche collaborative :
-
- Passive : utiliser seeks comme simple moteur de recherche.
- 48. Active: utiliser l'API pour enrichir ses requtes et
rsultats
49.
- Fichiers de configuration
- Ajout d'une source Seeks
50. search-engine 51.
- Seeks: QQ points (trs) forts
-
- Collaborationetconfidentialit
-
- Partage des rsultats mme en mode desktop parcross posting
-
- soutenu par une entreprise
52.
-
- Dispo uniquement pour Unix (point faible ? ;-))
-
- Lenteur relative induite par le P2P si bcp de sources
-
- Ajout de nombreuses sources relativement fastidieux
-
-
- ide : script d'ajout de sources partir d'un fichier OPML
53.
- Goodies : mycroft.mozdev.org/submitos.html
54.
- Merci pour votre attention,
55. vous pouvez
56. nous demanderon koudmenpour installer / configurer le votre
Gwadalug.org : groupe des utilisateurs de logiciels libres (de|en)
Guadeloupe...