Upload
duongkien
View
214
Download
0
Embed Size (px)
Citation preview
Traitement des Connaissances
BASES DE DONNEESVS.
BASES DE CONNAISSANCES
Manuel Aupetit
2/38Bases de données Vs. Bases de connaissances - Fév. 2004
Plan (1)Introduction
Bases de donnéesDéfinitionsHistoriqueModèle relationnel et modèles objet
Bases de connaissancesDéfinitions et motivationsExemple de méthodologie de constructionExemples de bases de connaissances
3/38Bases de données Vs. Bases de connaissances - Fév. 2004
Plan (2)
ComparaisonSur le plan de la représentation des donnéesSur le plan technologiqueDomaines d’application
Conclusion
Bases de données Bases de connaissances Comparaison
4/38Bases de données Vs. Bases de connaissances - Fév. 2004
IntroductionNécessité de stocker des quantités de données de plus en plus importantesL’informatique donne de nouvelles possibilités de stockage
Besoin d’organiser et stocker les connaissances (entreprises)Types de bases de connaissancesDifficulté de représentation
Bases de données Bases de connaissances Comparaison
5/38Bases de données Vs. Bases de connaissances - Fév. 2004
DéfinitionsCollection de données persistantes utilisées par des systèmes informatiques
Système de Gestion de Base de Données (SGBD)
ActeursConcepteurAdministrateur des donnéesAdministrateur de la baseUtilisateur final
Bases de données Bases de connaissances Comparaison
6/38Bases de données Vs. Bases de connaissances - Fév. 2004
Différences SGBD/BD
Base de données
Applications Utilisateurs
Système de gestion de bases de données
Bases de données Bases de connaissances Comparaison
7/38Bases de données Vs. Bases de connaissances - Fév. 2004
Rôles et niveaux d’abstractionDonnées réelles
Modèle conceptuel
Modèle externe Modèle interne
Concepteur de la base
Administrateurde la base
Administrateurdes données
Utilisateur final
Bases de données Bases de connaissances Comparaison
8/38Bases de données Vs. Bases de connaissances - Fév. 2004
Historique – Années 60Modèles orientés fichiers
Une table par fichierEnregistrements et champsEvolution avec système indexéProblèmes de redondance, pas de contrôle des données, manipulation difficile
Nom Adresse Achat
Alice Montréal CD
Alice Montréal DVD
Alice Montréal Livre 1
Bob Toronto Livre 2
Bob Toronto BD
Bases de données Bases de connaissances Comparaison
9/38Bases de données Vs. Bases de connaissances - Fév. 2004
Historique – Fin des années 60Modèle hiérarchique
Information Management System d’IBMUne table racine, relations parent-enfantsRelations "one-to-many" bien gérées
Modèle réseauCOnference on DAta Systems Languages crée groupe de recherche pour remplacer le modèle hiérarchiqueUniversal Datenbank System de SiemensRelations "many-to-many" grâce aux parents multiplesDifficile à programmer et maintenir
Bases de données Bases de connaissances Comparaison
10/38Bases de données Vs. Bases de connaissances - Fév. 2004
Historique – Années 70-80 (1)Edgar F. Codd (ingénieur IBM)
Travail de recherche d'information au niveau de la base, non au niveau utilisateurArticle publié en 1970 :
Données en structure naturelle, indépendance entre stockage physique et représentationDonnées accédées par langage de haut niveau
Problèmes avec IMS d'IBMMais réaction favorable de la communauté scientifique
Bases de données Bases de connaissances Comparaison
11/38Bases de données Vs. Bases de connaissances - Fév. 2004
Historique – Années 70-80 (2)System R (IBM)
Prototype en 74-75, version complète en 78-79Langage SQLIMS reste le standard IBM
Ingres (Berkeley)Développement commence en 73Résultats en 74, révisions, diffusion, modifications…Code libreLangage QUELArrêté en 82, devient Postgres en 85
Bases de données Bases de connaissances Comparaison
12/38Bases de données Vs. Bases de connaissances - Fév. 2004
Emergence du modèle relationnelOracle développe produit compatible SQL
Avant même IBMContribue à imposer SQL
Codd récompensé pour ses travaux en 80Association for Computing Machinery's Turing Award
IBM met sur le marché son systèmeModèle relationnel standard début années 80
Principaux acteurs aujourd'huiOracle DatabaseDB2 d'IBMMySQL (libre)
Bases de données Bases de connaissances Comparaison
13/38Bases de données Vs. Bases de connaissances - Fév. 2004
12 règles de Codd1. Représentation logique et non physique2. Données accessibles par nom de table, clé, colonne3. Données manquante = NULL4. Description représentée comme les données5. Existence d'un langage6. Mise à jour des vues7. Langage permet insertion, mise à jour, suppression8. Programmes indépendants de l'implantation physique9. Programmes indépendants de l'implantation logique10.Contraintes stockées dans le dictionnaire des données11.Programmes indépendants de centralisation ou répartition12.Contraintes impossible à contourner à bas niveau
Bases de données Bases de connaissances Comparaison
14/38Bases de données Vs. Bases de connaissances - Fév. 2004
Relationnel : Termes employés
Bases de données Bases de connaissances Comparaison
15/38Bases de données Vs. Bases de connaissances - Fév. 2004
Relationnel : Exemple simpleN° de client Nom du client Courriel du client Adresse du client N° de commande Article acheté Prix
A01 Alice [email protected] Montréal AZKVJ01 DVD 20
A01 Alice [email protected] Montréal KFOAA04 CD 14
A01 Alice [email protected] Montréal JGOAE07 Livre 7
B01 Bob [email protected] Québec FJOAR43 Meuble 400
B01 Bob [email protected] Québec FJQSO91 TV 700
N° declient
Nom duclient
Courrieldu client
Adressedu client
A01 Alice [email protected] Montréal
B01 Bob [email protected] Québec
N° de commande N° de client Article acheté Prix
AZKVJ01 A01 DVD 20
KFOAA04 A01 CD 14
JGOAE07 A01 Livre 7
FJOAR43 B01 Meuble 400
FJQSO91 B01 TV 700
Bases de données Bases de connaissances Comparaison
16/38Bases de données Vs. Bases de connaissances - Fév. 2004
Algèbre relationnelle et SQLCombinaison de relations d'opérateurs
Union, différence, produit, projection, sélection, jointure, intersection, divisionCombinaison d'opérations
SQL pour effectuer les opérationsCréation, altération, suppression de tables, insertionDéfinir des types, des domaines, des contraintes d'intégritéApparition (80) SQL1 (89) SQL2 (92) SQL3 (99)Syntaxe proche du langage courant, en anglaisImplémenté en partie par les acteurs des SGBD
Bases de données Bases de connaissances Comparaison
17/38Bases de données Vs. Bases de connaissances - Fév. 2004
Les modèles objetBinary Large Objects (BLOBs)
Milieu des 90s, données non structurées, multimédiaModèle relationnel peu adapté
Modèle orienté objetGemStone en 83, puis ObjectStore, ONTOS, O2, Matisse, Open ODB, Versant, etc. dans les années 90Objets persistants (pas comme POO)Règles similaires à Codd
Modèle relationnel-objetUniSQL/X en 92, relationnel étendu (héritage, polymorphisme…)Informix en 93, puis Oracle et IBM
Bases de données Bases de connaissances Comparaison
18/38Bases de données Vs. Bases de connaissances - Fév. 2004
Définitions et motivationsEntrepôt centralisé d'informations
Bibliothèque publique, base de données reliées à un sujet particulierRessource lue par machine et sert à diffuser l'informationNon statique
Automatisation du stockageStructure établieLiens avec données déjà existantesW3C : Internet Semantic Web
Bases de données Bases de connaissances Comparaison
19/38Bases de données Vs. Bases de connaissances - Fév. 2004
Utilisations (1)Entreprises
Organiser et stocker la connaissance propre à l'entreprise
E-learningLittérature traditionnelle exprimée de façon condenséeForme d'expression moins "littéraire"Relations entre les sujets expliciteCheminement personnel à travers les sujetsMais pas de progression dans la difficulté, accès à toutMais moins d'explications et d'exercices
Bases de données Bases de connaissances Comparaison
20/38Bases de données Vs. Bases de connaissances - Fév. 2004
Utilisations (2)Documents de référence
Dictionnaires ou encyclopédiesGlossaire évolué (hiérarchie "IsA"), héritageInformations relatives accessibles directement
Terminologie de référenceMotivation : groupes de recherches qui n'utilisent pas la même terminologie confusionProposition de définitions, compromis, référenceRecherches sur terminologie vérification, clarification
Bases de données Bases de connaissances Comparaison
21/38Bases de données Vs. Bases de connaissances - Fév. 2004
Représentation des connaissancesRussell & Norvig (1995)
Knowledge EngineeringExaminer le domaine de connaissancesDéterminer concepts importants et donner représentationAcquisition de connaissancesMaîtrise de la syntaxe et sémantique du langage de représentation, pratique et expérienceConcepts communs réutilisables une fois décrits (temps, mesures, substances, matériaux, objets courants…)OntologiesLangage précis, concis, pas d'ambiguïtéSéparation données/inférences
Bases de données Bases de connaissances Comparaison
22/38Bases de données Vs. Bases de connaissances - Fév. 2004
Méthodologie de construction (1)OursAvecTrèsPetitCerveau(Winnie)
Compréhensible par l'homme, pas par la machine
a, OursAvecTrèsPetitCerveau(a) => Idiot(a)Trop spécifique
Ours(Winnie)a, Ours(a) => Animal(a)b, Animal(b) => ChosePhysique(b)
TailleRelative(CerveauDe(Winnie), CerveauDe(OursType)) = Très(Petit)
∀
∀∀
Bases de données Bases de connaissances Comparaison
23/38Bases de données Vs. Bases de connaissances - Fév. 2004
Méthodologie de construction (2)a, Animal(a) <=> Cerveau(CerveauDe(a))a, PartieDe(CerveauDe(a), a)
Tous les animaux ont un cerveau, qui est une partie de l'animal
x,y, (PartieDe(x,y) Λ ChosePhysique(y))=> ChosePhysique(x)
Une partie d'une chose physique est aussi une chose physique
∀∀
∀
Bases de données Bases de connaissances Comparaison
24/38Bases de données Vs. Bases de connaissances - Fév. 2004
Méthodologie de construction (3)a, TailleRelative(
CerveauDe(a), CerveauDe(MembreType(EspèceDe(a)))) < Petit
=> Idiot(a)
b, Ours(b) <=> (EspèceDe(b) = Oursidé)OursType = MembreType(Oursidé)
Si un animal a un cerveau plus petit que la moyenne de son espèce, il est stupide
∀
∀
Bases de données Bases de connaissances Comparaison
25/38Bases de données Vs. Bases de connaissances - Fév. 2004
Méthodologie de construction (4)x, ChosePhysique(x) => ( t, Taille(x) = t)
Minuscule < Petit < Moyen < Grand < Immensea,b, TailleRelative(a,b) = Taille(a)/Taille(b)
Description des tailles
Moyen = 1x, (x > Moyen) => (Très(x) > x)x, (x < Moyen) => (Très(x) < x)
Description de la fonction Très
∀ ∃
∀
∀∀
Bases de données Bases de connaissances Comparaison
26/38Bases de données Vs. Bases de connaissances - Fév. 2004
ObservationsReprésentation beaucoup plus complexe que la première ligne trop simpliste
Propriétés réutilisables pour tous animauxHiérarchie Ours/Animal/ChosePhysiqueChoix d'échelle de dimensions
Quelques règles simplesPourquoi une phrase est vraie, sinon chercher à la rendre vraie si elle doit l'êtreGénéraliserRelier une nouvelle classe à celles déjà créées
Bases de données Bases de connaissances Comparaison
27/38Bases de données Vs. Bases de connaissances - Fév. 2004
Exemples concrets
Wikimedia Foundation
Juin 2003, suite à WikipediaWikipediaWiktionaryWikiquoteWikibooksWikisourceNupedia (encyclopédie non Wiki)
Bases de données Bases de connaissances Comparaison
28/38Bases de données Vs. Bases de connaissances - Fév. 2004
Wikipedia (1)Caractéristiques
Encyclopédie gratuiteCréée en 2001200 000 articles en langue anglaise, 45 000 en allemand
Bases de données Bases de connaissances Comparaison
29/38Bases de données Vs. Bases de connaissances - Fév. 2004
Wikipedia (2)
RéservesEncyclopédies de différentes langues totalement disjointesRecherches par Google
Bases de données Bases de connaissances Comparaison
30/38Bases de données Vs. Bases de connaissances - Fév. 2004
WiktionaryCaractéristiques
Dictionnaire créé en décembre 2002Section en anglais comprend 30 000 entréesDéfinitions en anglais de tous les mots de toutes les langues, synonymes, traductions, prononciation, étymologieFutures améliorations : définitions dans toutes les langues
InconvénientsTout le monde peut entrer une définition, sans même s'enregistrerErreurs à prévoir
Bases de données Bases de connaissances Comparaison
31/38Bases de données Vs. Bases de connaissances - Fév. 2004
Wikiquote, Wikibooks & WikisourceWikiquote
Collection de citationsRecherches par auteur, thème, œuvre, pays, type…
WikibooksBase de textes pédagogiquesPlutôt pour étudiantsPas très développé, trop récent
WikisourceBase de textes du domaine public (textes de lois, déclarations, littérature ancienne, hymnes, discours…)Pas écrit par des utilisateurs
Bases de données Bases de connaissances Comparaison
32/38Bases de données Vs. Bases de connaissances - Fév. 2004
Diverses bases de connaissancesA vocation technique
Site de support de MicrosoftIndiana Knowledge Base (9 000 réponses)
A vocation généralisteWhatis.comFact Guru, créé par une Université d'Ottawa qui développe des bases pour des clients
Sociétés de KBKnowledgeBase.netBrainEKP (Enterprise Knowledge Platform)
Bases de données Bases de connaissances Comparaison
33/38Bases de données Vs. Bases de connaissances - Fév. 2004
Représentation des donnéesBase de données
Détails sur collections de donnéesStructurée pour un humain, mais pas d'inférences interprétables par une machine
Base de connaissancesDescription des caractéristiques de types d'élémentsEnsemble de règles qui donnent du sens et lient les éléments entre eux de par leur natureBeaucoup plus riche et complexeEn théorie, description du monde possible
Bases de données Bases de connaissances Comparaison
34/38Bases de données Vs. Bases de connaissances - Fév. 2004
Plan technologiqueLes bases de connaissances gèrent la représentation des données, qui peuvent être physiquement stockées dans une BD
Intérêt des modèles objet
Processeur decommunication
Base deconnaissances
Base dedonnées
Système degestion de BC
Système degestion de BD
Bases de données Bases de connaissances Comparaison
35/38Bases de données Vs. Bases de connaissances - Fév. 2004
Domaines d'applicationBases de données
Données bancairesClients, patientsDonnées administrativesCommerce électroniqueDonnées brutes sans relations de classes
Bases de connaissancesConcepts reliésReprésentation de concepts générauxDescription d'un monde structuré
Bases de données Bases de connaissances Comparaison
36/38Bases de données Vs. Bases de connaissances - Fév. 2004
ConclusionRemarques
Bases de données largement suffisantes dans certains domainesRéfléchir aux besoins de représentation que l'on aBases de données trop implantées dans certains domainesBases de connaissances domaine complexe, mais pourtant exemples de liberté de modifications sur le Web…Connaissance trop complexe pour être représentéeConnaissance d'un expert trop dense pour être acquiseNe pas considérer une base de connaissances comme une référence ultime, trop dangereuxValeur de la connaissance représentée ?
37/38Bases de données Vs. Bases de connaissances - Fév. 2004
Références bibliographiquesRussell, S.J.; Norvig, P.; "Artificial Intelligence: A Modern Approach"; Prentice Hall; pp. 149-291; 1995Codd, E.; "Is Your DBMS Really Relational?"; ComputerWorld; 14 Octobre 1985Codd, E.; "Does Your DBMS Run By the Rules?"; ComputerWorld; 21 Octobre 1985Date, C.J.; "Introduction to Databases"; Addison-Wesley, 2004Craven, A.; DiPasquo, D.; Freitag, D.; McCallum, A.; Mitchell, T.; Nigam, K.; Slattery, S.; Learning to construct knowledge bases from the World Wide Web; Artificial Intelligence 118, Elsevier; Juin 1999Goñi, A.; Blanco, J.M.; Illarramendi, A.; "Connecting Knowledge bases with databases: a complete mapping relation"; Facultad de Informática, Universidad del País VascoHan, J.; Cai, Y.; Cercone, N.; "Knowledge Discovery in Databases: An Attribute-Oriented Approach"; Proc. of 1992 Int'l Conf. on Very Large Data Bases (VLDB'92); pp. 547-559; Vancouver, Canada; Août 1992Simonet, A.; Simonet, M.; Bassolet, C.-G.; Roger, M.; "A View-Centred Approach Unifying Databases and Knowledge Bases"; IASTED AI'2000, Practical Applications of Artificial Intelligence; Mars 1999
38/38Bases de données Vs. Bases de connaissances - Fév. 2004
Références Internet"Introduction to Databases";http://www.fbi.fh-darmstadt.de/~databases/schedule.html"Introduction to Databases for the Web: Pt. 1"; 16 Août 1998; http://www.databasejournal.com/sqletc/article.php/1428721"Dr. E. F. Codd's 12 rules for defining a fully relational database";http://www.cis.ohio-state.edu/~sgomori/570/coddsrules.html"Bases de données";http://www.ced-entreprises.com/polenet/competences/bases1.htm"Le modèle Objet-Relationnel"; http://info.mfca.ups-tlse.fr/BD/Modele-OR.htm"Knowledge Base", searchCRM.com Definitions; http://searchcrm.techtarget.com/sDefinition/0,,sid11_gci753399,00.html"The Rise of Relational Databases" (Chap. 6); Funding a Revolution: Government Support for Computing Research; http://www.nap.edu/readingroom/books/far/ch6.htmlWikimedia Foundation; http://wikimediafoundation.orgIndiana Knowledge Base; http://kb.indiana.eduFact Guru; http://www.factguru.comSuperior Knowledge Base; http://www.thebrain.comKnowledge Base Software; http://ww.knowledgebase.net