10

Bases de données Multimédia · 2020. 2. 11. · Les types de données sont étendus et les opérations d'encapsulation et d'héritage sont supportées. SQL 3 intègre l'aspect objet

  • Upload
    others

  • View
    0

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Bases de données Multimédia · 2020. 2. 11. · Les types de données sont étendus et les opérations d'encapsulation et d'héritage sont supportées. SQL 3 intègre l'aspect objet

Université de Corse - IUT LPTAIS � Bases de Données Multimédiaa

1

Bases de données Multimédia

IUT LPTAIS

Capocchi [email protected]://lcapocchi.free.fr

Rappels

Université de Corse - IUT LPTAIS � Bases de Données Multimédiaa

2

Sommaire

�Rappels

�Qu'est ce qu'une base de données ?

�Évolution des bases de données et de leur utilisation

�Systèmes de gestion des bases de données

�Étapes de la conception des bases de données

�« Métiers » des bases de données

�Résumé

�Exercices

Université de Corse - IUT LPTAIS � Bases de Données Multimédiaa

3

Qu'est ce qu'une BD ?

�Notion de base de données

�On définit une Base de Données (BD) comme un ensemble de fichiers (informatiques ou non) structuré et organisé afin de stocker et de gérer de l'information.

�Pour les manipuler, on utilise généralement un logiciel spécialisé appelé: SGBD (Système de Gestion de Bases de Données).

�On appelle aussi « système d'information » l'ensemble composé par la base de données, le SGBD et les programmes associés.

Université de Corse - IUT LPTAIS � Bases de Données Multimédiaa

4

Qu'est ce qu'une BD ?

�Utilisation d'une base de données

�La BD doit permettre de retrouver de l'information par son contenu en se fondant sur des critères de recherche.

�La BD doit pouvoir répondre à des questions pour lesquelles elle n'a pas forcément été prévue à la conception.

�Une BD est susceptible d'être utilisée par des applications différentes.

�Ce que l'on recherche dans l'utilisation d'une BD est d'assurer l'indépendance entre le traitement et les données.

�Pour ce faire on associe à la BD une description que l'on appelle « méta-donnée » ou « catalogue ».

Page 2: Bases de données Multimédia · 2020. 2. 11. · Les types de données sont étendus et les opérations d'encapsulation et d'héritage sont supportées. SQL 3 intègre l'aspect objet

Université de Corse - IUT LPTAIS � Bases de Données Multimédiaa

5

Qu'est ce qu'une BD ?

�Utilisation d'une base de données

�Le catalogue décrit la structure interne de la base de données qui est spécifique au SGBD employé.

�Abstraction des données: l'utilisateur ou l'application utilisatrice ne doit pas être dépendant de la représentation interne.

Titre Musicien Label Année

1 Nocturne 1978

2 Underground 2005

NumCD

Streetwise Olivier Temine

Thelonious Monk Columba

Nombre entier supérieur à 1

Chaîne de caractères de

taille 30

Nombre entier supérieur à 1900

inférieur à l'année en cours

Chaîne de caractères de

taille 20

Université de Corse - IUT LPTAIS � Bases de Données Multimédiaa

6

Qu'est ce qu'une BD ?

�Qualité d'une base de données

�L'un des objectifs de création d'une BD est de pouvoir retrouver les données par leur contenu.

�Il faut s'assurer que les données sont de « bonne qualité »

�Comment définir la qualité d'une BD ?

�La cohérence des données contenues dans la base;

�L'absence de redondance.

Université de Corse - IUT LPTAIS � Bases de Données Multimédiaa

7

Qu'est ce qu'une BD ?

�Qualité d'une base de données

�La cohérence des données nécessite une reflexion préalable sur la normalisation du contenu des champs.

�Exemple: un champ contient la qualité d'un personne (Monsieur, Madame, Mademoiselle).

�Si l'on trouve dans ce champs « Mr » à la place de « Monsieur », les recherches par le contenue « Monsieur » risque d'être erronés.

�On qualifie cette état de silence: Certains résultats pertinents sont ignorés lors d'une intérrogation.

�Si l'on saisit « Mme » pour « Madame » et « Mlle » pour « Mademoiselle », et qu'il y ait eu plusieurs saisies de « Mme » alors qu'il s'agissait d'une demoiselle -> + de résultats -> bruit

Université de Corse - IUT LPTAIS � Bases de Données Multimédiaa

8

Qu'est ce qu'une BD ?

�Qualité d'une base de données

�La redondance est plus délicate à identifier:

�Si l'on considère un carnet d'adresse qui contiendrait en même temps le code postal et le nom de la ville.

�Exemple

� Incohérence dans la saisie du nom de la ville « Bordeaux ». La recherche du nom de la ville ne donnera pas le même résultat que celui du code postal

Nom Téléphone Ville Code PostalJaco 0656783445 Bordeaux 33000

Stanley 0634234567 Nancy 54000Marcus 0657352356 Bordo 33000Charles 0623568974 Nancy 54000Steve 0623154178 Bordeaux 33000

Page 3: Bases de données Multimédia · 2020. 2. 11. · Les types de données sont étendus et les opérations d'encapsulation et d'héritage sont supportées. SQL 3 intègre l'aspect objet

Université de Corse - IUT LPTAIS � Bases de Données Multimédiaa

9

Évolution des BD et de leur utilisation

�Contexte

�Évolution rapide des ordinateurs à partir des années 60.�On passe de la notion de calculateur à des machines capables de traiter de l'information.

�On obtient une indépendance par rapport à l'architecture.

�La décennies des années 70 est une période « faste »�Utilisation des langages de haut niveau (Pascal).�On envisage des systèmes d'exploitation indépendant de la machine employée (UNIX).

�On pose les fondements des techniques utilisées dans les réseaux (TCP/IP).

�Dans ce contexte, E. F. Codd définit l'approche relationnelle en base de données.

Université de Corse - IUT LPTAIS � Bases de Données Multimédiaa

10

Évolution des BD et de leur utilisation

�Contexte

�L'objectif principale est d'éloigner l'utilisateur des détails d'implémentation et de faciliter l'usage de l'informatique.

�De rendre générique et réutilisable les développements informatiques.

�Les fonctionnalités des BD sont séparées en trois niveaux:

�Niveau physique

�Niveau logique

�Niveau externe

Université de Corse - IUT LPTAIS � Bases de Données Multimédiaa

11

Évolution des BD et de leur utilisation

�Modèles

�Les modèles de données correspondent à la manière de structurer l'information dans une BD.

�Ils reposent sur les principes et les théories issus du domaine de la recherche en informatique.

�Ils permettent de traduire la réalité de l'information vers une représentation utilisable en informatique.

Université de Corse - IUT LPTAIS � Bases de Données Multimédiaa

12

Évolution des BD et de leur utilisation

�Modèles

�Modèle hiérarchique et modèle réseau�Modèle «hiérarchique»: classification arborescente des données.�Chaque enregistrement n'a qu'un seul possesseur (une commande n'a qu'un seul client).

�Modèle «réseau»: extension du modèle hiérarchique:� Il permet des liaisons transversales� Il utilise une structure de graph� Il lève des limitations du modèle hiérarchique.

�Les enregistrements sont reliés par des pointeurs.�Des SGBD sont encore employés (IMS, IDMS,...).

Page 4: Bases de données Multimédia · 2020. 2. 11. · Les types de données sont étendus et les opérations d'encapsulation et d'héritage sont supportées. SQL 3 intègre l'aspect objet

Université de Corse - IUT LPTAIS � Bases de Données Multimédiaa

13

Evolution des BD et de leur utilisation

�Modèles

�Modèle relationnel�1970, E. F. Codd propose le modèle « relationnel » dans « A Relation Model of Data for Large Shared Data Banks »

�Le modèle relationnel permet de modéliser les informations contenues dans les BD en utilisant des relations c'est à dire des ensembles d'attributs.

�En même temps Codd met au point un langage d'interrogation des données, SEQUEL qui deviendra ensuite SQL (Structured Query Language).

�Normalisé par l'ISO, SQL a permit le succès du modèle relationnel dans les entreprises.

�Les requêtes écrites en SQL pour un SGBD fonctionnent sans trop de modifications avec un autre SGBD (portabilité)

Université de Corse - IUT LPTAIS � Bases de Données Multimédiaa

14

Évolution des BD et de leur utilisation

�Modèles

�Modèle objet�1980, le concept objet à été adapté au BD.

�Le modèle relationnel ne permet pas de modéliser facilement toutes les réalités.

�Un objet permet de représenter directement un élément du monde réel.

�Le concept objet est mieux adapté pour modéliser des types de données multimédia important (son, images, vidéos,...).

�Les BD « orientées objet » apporte au application développée en langage objet la persistance des objets.�Les objets peuvent être réutilisés sans redéfinition�Ces concepts sont intégrés à partir de SQL 2.

�Problème de performance dans les SGBD.

Université de Corse - IUT LPTAIS � Bases de Données Multimédiaa

15

Évolution des BD et de leur utilisation

�Modèles

�Modèle relationnel-objet�La gestion des données autres que du texte et des nombres (image, son ou vidéo) implique l'évolution du modèle relationnel.

�Le modèle relationnel-objet permet de disposer de types évolués « abstrait » plus simple à concevoir et surtout plus commodes à faire évoluer.

�Les types de données sont étendus et les opérations d'encapsulation et d'héritage sont supportées.

�SQL 3 intègre l'aspect objet.

Université de Corse - IUT LPTAIS � Bases de Données Multimédiaa

16

Évolution de l'utilisation des BD

�BD réparties

�Explosion de l'utilisation des médias et du réseau: répartition des données sur des sites géographiques distants.

�Les BD réparties assurent une plus grande fiabilité, de meilleurs performances et facilitent l'évolution du SI.

�Fiabilité et sécurité: copie des données sur site distant à intervalles réguliers.

�Disponibilité: réplication des données dans le but de rapprocher les utilisateurs des données (topologie réseau).

�Répartition des données sur sites séparés: transparent pour l'utilisateur. Pour celui-ci, un seul serveur est présent sur un seul site.

�Inconvénient des technologies: augmentation de la charge de travail pour la sécurité réseaux.

Page 5: Bases de données Multimédia · 2020. 2. 11. · Les types de données sont étendus et les opérations d'encapsulation et d'héritage sont supportées. SQL 3 intègre l'aspect objet

Université de Corse - IUT LPTAIS � Bases de Données Multimédiaa

17

Évolution de l'utilisation des BD

�XML

�Le concepteur du web, T.B. Lee définit un langage de description de document utilisant des balises: SGML (Standard Generalized Markup Language)

�Le découpage du document par les balises est spécifié dans un document: la DTD (Data Type Definition).

�HTML et XML sont des versions simplifiés de SGML.

�HTML permet de spécifier des critères de présentation (gras, italique, ....) et de décrire les liens entre fichiers.

�Les moteurs de recherche index par rapport à une liste de mots clés car il sont incapables de différencier dans le texte le titre d'un résumé ou la légende d'une image.

�Pour y remédier, W3C définit le langage permettant de décrire la structure interne d'un document: XML.

Université de Corse - IUT LPTAIS � Bases de Données Multimédiaa

18

Évolution de l'utilisation des BD

�XML

�Structure d'un document XML sous forme d'arbres comme HTML).

�La description de cette structure est dans une DTD ou un schéma XML.

�HTML possède aussi une DTD mais elle est normalisée par W3C et peut être modifiée et adaptée pour ses besoins.

�A terme HTML sera remplacé par XML.

�La présentation des données repose alors sur « les feuilles de styles » (telle que eXtended Stylesheet Language).

�Les moteurs de recherche peuvent extraire par exemple les titres ou les résumés d'un paragraphe d'un fichier XML.

�L'indexation est aussi plus précise.

Université de Corse - IUT LPTAIS � Bases de Données Multimédiaa

19

Évolution de l'utilisation des BD

�XML

�Quel est le rapport avec les BD ?

�Une page Web peut être le résultat d'une requête provenant d'un SGBD.

�Si le SGBD peut générer directement du XML -> facilite le processus.

�Le langage XML s'impose comme un format d'échange universel.

�Séparation de la structure et de la présentation

�Édition du document indépendante du logiciel

�Utilisation du format XML comme format d'échange entre SGBD.

Université de Corse - IUT LPTAIS � Bases de Données Multimédiaa

20

Evolution de l'utilisation des BD

�XML

�<catalogue><article><nom>banane</nom><prix> 2 </prix><quantité> 1000 </quantité></article><article><nom>piège</nom><prix> 300 </prix><quantité> 35 </quantité></article>

catalogue

article article

quantité quantité

prixprix

nom

nom

banane

2

1000

piège

300

35

Page 6: Bases de données Multimédia · 2020. 2. 11. · Les types de données sont étendus et les opérations d'encapsulation et d'héritage sont supportées. SQL 3 intègre l'aspect objet

Université de Corse - IUT LPTAIS � Bases de Données Multimédiaa

21

Évolution de l'utilisation des BD

�Contenu multimédia

�Développement important de l'utilisation des données multimédia depuis le début des années 90.

�Les BD multimédia posent de nouveaux problèmes pour effectuer des recherches sur ce genre de données.

�Une solution est d'indexer à la main des données par des mots clés: si volume de données important , devient illusoire.

�Une solution du domaine de la recherche, indexer par rapport aux motifs contenus dans les images?

�Des solutions existent pour identifier le style de musique par rapport à une analyse de contenue des fichiers son.

�Pas de solutions évidentes de ce genre pour la vidéo !

Université de Corse - IUT LPTAIS � Bases de Données Multimédiaa

22

Système de gestion de BD

�Fichiers informatiques

�Historiquement, un fichier est vue comme un morceau de bande magnétique (exploité telle quelle dans le langage C).

�L'utilisation d'un fichier pour stocker de l'information nécessite un découpage par enregistrement (taille fixe).

�Déplacement dans le fichier en faisant bouger «la tête de lecture» d'un enregistrement à un autre.

�Les données sont stockées dans les enregistrements par découpage interne suivant la taille de chaque données.

�Dans les BD, on recherche les données par le contenu.

�Recherche séquentielle sur tout les enregistrements.Fichier

Université de Corse - IUT LPTAIS � Bases de Données Multimédiaa

23

Système de gestion de BD

�Fichiers informatiques

�Une alternative à la recherche séquentiel est de construire des tables descriptives pour accélérer l'accès aux données.

�Une première table permet l'accès direct à un enregistrement par une clé associé à l'adresse (pointeur) de l'enregistrement

�Une seconde table index contient l'ordre relatif des enregistrements ordonnés suivant les valeurs du champ.

�Cette seconde table permet d'employer des méthodes de recherche plus efficaces (intégrées aux SGBD). Fichier

Index

Université de Corse - IUT LPTAIS � Bases de Données Multimédiaa

24

Système de gestion de BD

�Fonctionnalités d'un SGBD

�Modèle théorique en trois couches permettant d'organiser et de concevoir les fonctionnalités des SGBD: l'architecture ANSI/SPARC.

�Vielle de 40 ans elle a pour objectif d'avoir une indépendance entre les données et les traitements.

Niveau externe

Schéma conceptuel

Niveau interne

UtilisateurVues

Modèleconceptuel

Modèle physiqueSGBD

Page 7: Bases de données Multimédia · 2020. 2. 11. · Les types de données sont étendus et les opérations d'encapsulation et d'héritage sont supportées. SQL 3 intègre l'aspect objet

Université de Corse - IUT LPTAIS � Bases de Données Multimédiaa

25

Système de gestion de BD

�Fonctionnalités d'un SGBD

�Niveau interne ou physique:�Décrit les structures de stockage de l'information.

�Très dépendant du SGBD�Fondé sur un modèle de données physique.

�Niveau conceptuel:�C'est le schéma conceptuel de la BD réalisé à l'analyse.�C'est une documentation de la BD.

�Niveau externe:�C'est le schéma de visualisation des données.�Permet de masquer la complexité d'une BD en fonction des besoins de l'utilisateur.

�Facilite la lecture et la sécurité de l'information

Niveau externe

Schéma conceptuel

Niveau interne

UtilisateurVues

Modèleconceptuel

Modèle physiqueSGBD

Université de Corse - IUT LPTAIS � Bases de Données Multimédiaa

26

Système de gestion de BD

�Fonctionnalités d'un SGBD

�Les SGBD ne respectent pasforcement ce découpage.

�Ils doivent posséder les principales caractéristiques qui découlent de ce modèle en couches:�Indépendance physique des données

�Masquer la représentation interne des données ainsi que les méthodes système d'accès aux utilisateurs.

�Indépendance logique des données�Permettre la modification du schéma conceptuel sans remettre en cause les mécanismes de stockage.

�Intégrité des données�Faire en sorte que l'information résultant des liens entre les données soit cohérente.

Niveau externe

Schéma conceptuel

Niveau interne

UtilisateurVues

Modèleconceptuel

Modèle physiqueSGBD

Université de Corse - IUT LPTAIS � Bases de Données Multimédiaa

27

Système de gestion de BD

�Fonctionnalités d'un SGBD

�En supplément dans le cadredes BD réparties:

�Réplication des données:�copie automatisée de sauvegarde

�Virtualisation des données: �Masquage de la distribution géographique des données.

�Haute disponibilité des données:�Duplication de la BD sur différents sites pour diminuer la distance client/serveur et la charge des serveurs.

Niveau externe

Schéma conceptuel

Niveau interne

UtilisateurVues

Modèleconceptuel

Modèle physiqueSGBD

Université de Corse - IUT LPTAIS � Bases de Données Multimédiaa

28

Système de gestion de BD

�Fonctionnalités d'un SGBD

�Le but principal de l'utilisation d'un SGBD est de masquer la représentation des données et les méthodes d'accès.

�Pour des questions d'efficacité, les SGBD utilisent leur propre gestion des fichiers.

�Un SGBD doit permettre également la manipulation des données de manière transparente:�Ajout et modification des champs.

�Il conserve alors une description de la structure de la BD: le dictionnaire de données.

�La réalisation de ces opérations avec l'indépendance souhaité par rapport à la représentation se fait grâce à:�Un Langage de Description de Données (LDD)�Un Langage de Manipulation de Données (LMD)

Page 8: Bases de données Multimédia · 2020. 2. 11. · Les types de données sont étendus et les opérations d'encapsulation et d'héritage sont supportées. SQL 3 intègre l'aspect objet

Université de Corse - IUT LPTAIS � Bases de Données Multimédiaa

29

Système de gestion de BD

�Fonctionnalités d'un SGBD

�Ces langages sont de type « non procédural »�Ils s'intéressent à l'effet de l'opération (le quoi) et non à la manière dont elle est réalisée (le comment)

�Ils simplifient la manière d'effectuer les opérations:�La modification de la taille d'un champ peut être énoncée en une seule instruction avec le LDD.

Université de Corse - IUT LPTAIS � Bases de Données Multimédiaa

30

Système de gestion de BD

�Fonctionnalités d'un SGBD

�Le SGBD doit également assurer la protection des données.�Il doit permettre de restaurer les données.�Les journaux enregistrent toutes les opérations.�C'est le mécanisme de la journalisation.

�Les opérations de transactions permettent la modification dans la BD.�Les mesures de la qualité de ces transactions:

�Atomicité: une transaction est exécutée entièrement ou abandonnée.

�Cohérence: une transaction va d'un état cohérent vers un autre état cohérent.

�Isolement: les transactions simultanées n'interfèrent pas�Durabilité: une transaction à des effets permanents.

Université de Corse - IUT LPTAIS � Bases de Données Multimédiaa

31

Étapes de la conception des BD

�Décomposition en trois étapes

�Analyse du système du mode réel�Mise en forme du modèle pour l'intégrer dans un SGBD�Création effective dans le SGBD des structures et remplissage.

Université de Corse - IUT LPTAIS � Bases de Données Multimédiaa

32

Étapes de la conception des BD

�Analyse du mode réel

�C'est une approche « humaine » qui se fonde sur des entretiens avec les personnes concernés.

�Ressemble à une analyse du discours et de l'organisation de l'entreprise.

�Lors de cette phase on détermine:�Les objectifs du SI à concevoir�Tous les éléments à prendre en compte dans le système

�Champs qui contiendrons les données�Les liens entres ces objets et les éléments caractéristiques de ces liens.

�Cette modélisation du monde réel permet de proposer un schéma conceptuel qui servira à la description du SI.

�Ce schéma est réalisé avec la symbolique du modèle « entité-association » ou UML (Unified Modeling Language)

Page 9: Bases de données Multimédia · 2020. 2. 11. · Les types de données sont étendus et les opérations d'encapsulation et d'héritage sont supportées. SQL 3 intègre l'aspect objet

Université de Corse - IUT LPTAIS � Bases de Données Multimédiaa

33

Étapes de la conception des BD

�Passage au SGBD

�La représentation précédente doit être transformée pour la rendre acceptable par le SGBD.

�Cette étape peut considérablement modifier les objets du monde réel et les liens définis dans le schéma précédent.

�C'est pendant cette phase que l'on vérifie la qualité de la BD (élimination de redondance).

�Si des incohérences sont mises en évidence à ce niveau de la conception, le modèle conceptuel précédent est revu.

�A l'issu de cette phase on obtient un schéma relationnel fournissant aux utilisateurs les informations nécessaires pour effectuer leur requêtes.�Par exemple: la description des noms de tables, des champs et leurs types.

Université de Corse - IUT LPTAIS � Bases de Données Multimédiaa

34

Étapes de la conception des BD

�Création et utilisation de la BD

�On utilise le SGBD pour passer à la création des tables qui constituent la BD.

�Ensuite il faut insérer les données dans les tables !�La création des tables et l'utilisation de la BD nécessite SQL

Monde réel

Modèleentité-association

Schémarelationnel

BD

physique

LMD

LDDSGBDVue 2

Vue 3

Vue 1

Analyse

Transformation

Université de Corse - IUT LPTAIS � Bases de Données Multimédiaa

35

« Métiers » des BD

�Consultants/Analystes

�Ils prennent en charge la première étape qui consiste en l'analyse des activités et des flux d'information mis en jeu dans le monde réel à modéliser.

�Concepteur de la base�Ce sont les personnes qui s'occupent de traduire le modèle précédent en un modèle logique exploitable par le SGBD.

�Administrateur de BD (DBA, DataBase Administrator)�Il a la responsabilité du fonctionnement général du SGBD.

�Utilisateur standard et programmeur d'application�Ce sont eux qui utilisent le SI.

Université de Corse - IUT LPTAIS � Bases de Données Multimédiaa

36

Résumé

�Une BD désigne l'ensemble des données stockées.

�Pour manipuler ces données on utilise un SGBD.

�BD+SGBD = SI

�La conception d'une BD est composée de:

�L'analyse du monde -> schéma entité-association

�Transformation -> schéma relationnel

�Implémentation du schéma relationnel par le SGBD -> BD

�Les métiers en rapport avec les BD divers.

Page 10: Bases de données Multimédia · 2020. 2. 11. · Les types de données sont étendus et les opérations d'encapsulation et d'héritage sont supportées. SQL 3 intègre l'aspect objet

Université de Corse - IUT LPTAIS � Bases de Données Multimédiaa

37

Résumé (suite)

�L'évolution des SGBD c'est faite parallèlement aux concepts de modélisation des BD.

�Le modèle relationnel et le plus utilisé !

�Le modèle objet n'a pas connu le même succès.

�Une solution mixte semble prendre de l'ampleur: le modèle relationnel-objet.

�D'autre manière d'utiliser les BD:

�Répartition des données pour améliorer leur disponibilité et leur sécurité

�Le langage XML est devenu le format d'échange et de stockage pour les SGBD.

�La prise en compte des données multimédia change le modèle des BD et les SGBD (évol. du modèle relationnel).

Université de Corse - IUT LPTAIS � Bases de Données Multimédiaa

38

Exercices

� Feuilles TD !

Université de Corse - IUT LPTAIS � Bases de Données Multimédiaa

39

Bibliographie et Webographie

� Création de bases de donnéesNicolas Larrousse, Pearson Education, 2006.