Bases de donn ees avanc ees - gilleron/cours-bases-de-donnees-avanc...  Objectifs et organisation

  • View
    215

  • Download
    1

Embed Size (px)

Text of Bases de donn ees avanc ees - gilleron/cours-bases-de-donnees-avanc...  Objectifs et...

  • Bases de donnees avancees

    Remi Gilleron

    Inria Lille - Nord Europe & LIFL & Univ Lille 3

    septembre 2013

    Remi Gilleron (Mostrare) Informatique M1 MIASHS septembre 2013 1 / 143

  • Objectifs et organisation

    Objectifs du cours

    comprendre lenvironnement informatique des entreprises ;

    connatre les concepts avances sur les bases de donnees relationnelles :optimisation, contraintes dintegrite et acces concurrents ;

    connatre les autres modeles de donnees associes au decisionnel, auWeb et auBig Data : modele en etoile, modele cle-valeur, modelecolonne, modele document, modele graphe

    Organisation du cours

    12 seances de 2 heures

    Remi Gilleron (Mostrare) Informatique M1 MIASHS septembre 2013 2 / 143

  • Plan

    1 Systemes dinformation

    2 Bases de donnees relationnellesNotions fondamentalesCalcul relationnel et optimisation de requetes

    3 Complements sur les BDs relationnellesSQL- Le langage de definition des donneesarchhitecture BDR les utilisateurs, les droits, les vuesSQL- gerer la concurrence

    4 Autres modeles de donneesDecisionnel et modele en etoileBig Data et bases NoSQLModeles NoSQL de donnees

    Remi Gilleron (Mostrare) Informatique M1 MIASHS septembre 2013 3 / 143

  • Schema general

    Le Systeme dinformation (SI)

    est la memoire de lactivite de lentreprise,

    est linterface entre le systeme de pilotage et le systeme operant.

    Le Systeme dinformation (SI)

    est constitue dun systeme operationnel

    et dun systeme decisionnel,

    il est desormais integre dans un systeme dinformation et decommunication (SIC).

    Remi Gilleron (Mostrare) Informatique M1 MIASHS septembre 2013 4 / 143

  • Informatique operationnelle 70

    est axee sur la production, la memorisation et le traitement des donnees delactivite de lentreprise. On peut distinguer :

    laspect statique : enregistrement des donnees, faits, regles etcontraintes ;

    laspect dynamique : mise a jour (ajout, modification et suppression)des donnees, faits, regles et contraintes.

    Elle est centrale pour lactivite de lentreprise et est organisee autour debases de donnees relationnelles avec les suites logicielles associees (SGBDRtels que Oracle) et le langage SQL.

    Remi Gilleron (Mostrare) Informatique M1 MIASHS septembre 2013 5 / 143

  • Informatique decisionnelle 90

    est axee sur laide a la decision.Les donnees sur lactivite issues du systeme operationnel et de sourcesexternes sont extraites, filtrees, historisees et traitees a laide doutilsdETL (Extraction Treatment Loading) pour etre deposees dans desinfocentres et/ou des entrepots de donnees (datawarehouse).Ces donnees sont alors utilisees pour la production de syntheses et derapports afin de faciliter la prise de decision. Ceci a laide de suiteslogicielles telles que Business Object.

    Remi Gilleron (Mostrare) Informatique M1 MIASHS septembre 2013 6 / 143

  • Systeme dinformation et de communication 00

    ne se contente plus de stocker, traiter et synthetiser les donnees pourlactivite de lentreprise mais prend en compte les aspects decommunication : communication interne et externe de lentreprise,echange de donnees informatisees (EDI) avec tous les partenaires, ...On parle dIntranet, dExtranet, de portail dentreprise. Il concerne toutesles bases et entrepots de donnees lentreprise mais aussi les bases dedocuments (gerees par des CMS Content Management Systems). Ilsutilisent les technologies Web.

    Remi Gilleron (Mostrare) Informatique M1 MIASHS septembre 2013 7 / 143

  • Exemple dune banque

    le systeme operationnel va memoriser toutes les informations sur lesclients, leurs differents comptes et les operations sur ces comptes :debit, credit, virement, change, ... ; declencher des actions (envoi dereleves, ...) ; ...

    le systeme decisionnel conserve sur une periode, par exemplemensuelle, le nombre doperations, leur montant moyen, la moyennedes soldes sur les differents comptes, ... sur une duree historique deune ou plusieurs annees. Il dispose egalement dinformations (tres,trop) personnelles sur le client.

    le systeme de communication met a disposition des clients un portaildentreprise pour leurs activites : solde, virement, prets, ... ; il permetegalement des echanges avec les partenaires (mouvements financiers,virements internationaux, ...) ; ...

    Remi Gilleron (Mostrare) Informatique M1 MIASHS septembre 2013 8 / 143

  • Conclusion

    Existant

    des systemes dinformation et de communication contenant des bases dedonnees, des bases de documents et des entrepots de donnees. Lestechnologies sont eprouvees : technologies Internet, bases de donneesrelationnelles, systemes de gestion de contenus, entrepots de donnees etoutils de production de rapports.

    Evolutions en cours

    developpement des petits objets portables communicants et leurintegration dans le SIC avec images et videos,

    developpement des capteurs et generation de flux de donnees(positionnement GPS, consommation electrique, ...)

    des masses de donnees et le phenomene Big Data : cloud, gestionet traitement de donnees reparties, analyse de masses de donnees, ...

    Remi Gilleron (Mostrare) Informatique M1 MIASHS septembre 2013 9 / 143

  • Plan

    1 Systemes dinformation

    2 Bases de donnees relationnellesNotions fondamentalesCalcul relationnel et optimisation de requetes

    3 Complements sur les BDs relationnellesSQL- Le langage de definition des donneesarchhitecture BDR les utilisateurs, les droits, les vuesSQL- gerer la concurrence

    4 Autres modeles de donneesDecisionnel et modele en etoileBig Data et bases NoSQLModeles NoSQL de donnees

    Remi Gilleron (Mostrare) Informatique M1 MIASHS septembre 2013 10 / 143

  • Bases de Donnees

    Un systeme dinformation est construit autour de volumes de donnees deplus en plus important. Ces donnees doivent etre stockees sur des supportsphysiques. Les donnees sont stockees et organisees dans des bases dedonnees BD (databases DB).Un utilisateur doit pouvoir les retrouver. Il faut pouvoir les interroger pardes requetes.Les donnees evoluent, il faut donc pouvoir les manipuler : ajouter,modifier, supprimer des donnees.Le logiciel de base qui permet de manipuler ces donnees est appele unsysteme de gestion de bases de donnees SGBD (database managementsystem DBMS).

    Tout systeme dinformation est construit autour de bases dedonnees

    Remi Gilleron (Mostrare) Informatique M1 MIASHS septembre 2013 11 / 143

  • Exemple - BD gestion de commandes

    Contenu : les clients, les produits, les prix, les fournisseurs, lafacturation, la livraison, ...

    Applications : toutes les applications de gestion de lentreprise,

    Manipulation : par les services de lentreprise mais aussi de lexterieur(commandes par le site web, ...)

    Variabilite : forte, des ajouts et modifications frequentes ;

    Consultation : par les services de lentreprise mais aussi de lexterieur(suivi de commande, ...)

    Remi Gilleron (Mostrare) Informatique M1 MIASHS septembre 2013 12 / 143

  • Exemple - BD et Web

    Un site dynamique est construit sur une base de donnees.

    lutilisateur sollicite une page, la demande est envoyee au site, leserveur execute un programme,

    les informations utiles sont extraites de la base de donnees etrapatriees au serveur,

    une feuille de style est appliquee, un document html est construit etenvoye sur le reseau,

    le document est affiche dans le navigateur de lutilisateur.

    linteret est de distinguer les donnees des traitements et de laffichage :pour modifier le contenu du site, il suffit de mettre a jour les informationsdans la base de donnees ; pour modifier la presentation, il suffit de modifierle style du document Web.

    Remi Gilleron (Mostrare) Informatique M1 MIASHS septembre 2013 13 / 143

  • Fonctionnalites principales

    BD

    memoriser de grandes quantites de donnees essentielles a la vie delentreprise,

    les organiser, faciliter les requetes et permettre levolution,

    donner lacces a des applications diverses, a des utilisateurs differentsavec des modes dacces varies.

    SGBD

    gerer le stockage sur des supports physiques eventuellement repartiset distants,

    assurer la rapidite des acces, lindependance des donnees et desapplications,

    assurer le controle de la concurrence car les donnees sont partagees etreparties,

    assurer la protection des donnees : reprise sur panne, verifier les droitsdusage et dacces,

    Remi Gilleron (Mostrare) Informatique M1 MIASHS septembre 2013 14 / 143

  • Le modele relationnel

    Dans un contexte operationnel ou les donnees sont en volume important,ou les donnees evoluent, ou les utilisateurs sont nombreux avec des accesconcurrents, le modele de reference est

    le modele relationnel base sur des tables verifiant des proprietes deforme normales implante dans

    des systemes de gestion de bases de donnees relationnelles (SGBR telsque Oracle, PosGres, SQLite, ...) et utilisant

    un langage dinterrogation standardise SQL et

    des transactions verifiant les proprietes ACID : Atomicite, Coherence,Isolation et Durabilite.

    Remi Gilleron (Mostrare) Informatique M1 MIASHS septembre 2013 15 / 143

  • Les relations

    Un domaine est lensemble des valeurs que peut prendre une donnee.

    Une relation (ou table) est un sous ensemble du produit des domainesqui porte un nom.

    Un attribut est une colonne de relation caracterisee par un nom.

    Une relation peut etre definie en extension par lensemble desenregistrements (lignes, tuples) constituant la relation a un instantdonne ou en intention par le schema de la relation qui contient lenom de la relation, la liste des attribu