View
216
Download
0
Category
Preview:
Citation preview
Vue d'ensemble des services de stockage AWS
Présentation des services de stockage proposés par AWS
Novembre 2015
Amazon Web Services – Vue d'ensemble des services de stockage AWS Novembre 2015
Page 2 sur 50
© 2015, Amazon Web Services, Inc. et ses filiales. Tous droits réservés.
Mentions légales Ce document est fourni à titre informatif uniquement. Il présente l'offre de
produits et les pratiques actuelles d'AWS à la date de publication de ce document,
des informations qui sont susceptibles d'être modifiées sans avis préalable. Il
incombe aux clients de procéder à leur propre évaluation indépendante des
informations contenues dans ce document et chaque client est responsable de
son utilisation des produits ou services AWS, chacun étant fourni « en l'état »,
sans garantie d'aucune sorte, qu'elle soit explicite ou implicite. Ce document ne
crée pas de garanties, représentations, engagements contractuels, conditions ou
assurances à l'encontre d'AWS, de ses affiliés, fournisseurs ou donneurs de
licence. Les responsabilités et obligations d'AWS vis-à-vis de ses clients sont
régies par les contrats AWS. Le présent document ne fait partie d'aucun et ne
modifie aucun contrat entre AWS et ses clients.
Amazon Web Services – Vue d'ensemble des services de stockage AWS Novembre 2015
Page 3 sur 50
Table des matières Résumé 4
Introduction 4
Amazon S3 5
Amazon Glacier 12
Amazon EBS 17
Stockage d'instance Amazon EC2 25
AWS Storage Gateway 32
AWS Import/Export Snowball 38
Amazon CloudFront 42
Références et suggestions de lecture 47
Amazon Web Services – Vue d'ensemble des services de stockage AWS Novembre 2015
Page 4 sur 50
Résumé Amazon Web Services (AWS) est une plateforme de cloud computing flexible,
économique et simple à utiliser. Ce livre blanc est conçu pour aider les architectes
et les développeurs à comprendre les différents services et les diverses
fonctionnalités disponibles dans le cloud AWS. Il présente chaque fonction ou
service de stockage et décrit des modèles d'utilisation, de performances, de
durabilité et de disponibilité, d'évolutivité et d'élasticité, de sécurité, d'interfaces et
de modèle de coûts.
Introduction La solution Amazon Web Services (AWS) fournit un stockage de données à
moindre coût, avec un niveau de durabilité et de disponibilité élevé. AWS offre
un vaste choix d'options de stockage pour la sauvegarde, l'archivage et la reprise
après sinistre, ainsi que le stockage de blocs, de fichiers et d'objets. Dans ce livre
blanc, nous examinons les fonctions et les services de stockage dans le cloud
AWS suivants.
Amazon Web Services – Vue d'ensemble des services de stockage AWS Novembre 2015
Page 5 sur 50
Amazon Simple Storage
Service (Amazon S3)
Service qui fournit un stockage évolutif
dans le cloud.
Amazon Glacier Service qui fournit un stockage
d'archives à coût extrêmement bas
dans le cloud.
Amazon Elastic Block Store
(Amazon EBS) Service qui fournit des volumes de
stockage permanent de niveau bloc
pour les instances Amazon Elastic
Compute Cloud (Amazon EC2).
Stockage d'instance
Amazon EC2 Volumes de stockage temporaire de
niveau bloc à utiliser avec les instances
Amazon EC2.
AWS Storage Gateway Service d'intégration des
environnements informatiques
internes au stockage dans le cloud.
AWS Import/Export
Snowball
Fonction du service AWS
Import/Export qui permet le transfert
de grandes quantités de données.
Amazon CloudFront Service qui fournit un réseau de diffusion de contenu global (CDN).
Amazon S3 Amazon Simple Storage Service (Amazon S3) offre aux développeurs et aux
équipes informatique un stockage d'objets sécurisé, durable et hautement
évolutif pour un coût très réduit. Amazon S3 offre une interface de services Web
simple pour stocker et extraire facilement des données, à tout moment et depuis
n'importe quel accès Internet, quel que soit le volume. Vous pouvez écrire, lire et
supprimer des objets contenant entre 1 octet et 5 To de données. Extrêmement
évolutif, Amazon S3 offre un accès simultané en lecture et en écriture à ces
données par un grand nombre de clients ou de threads d'application distincts.
Amazon S3 offre toute une gamme de classes de stockage conçues pour
différents cas d'utilisation, notamment :
Amazon S3 Standard, pour un stockage à usage général des données
fréquemment consultées
Amazon S3 Standard-Infrequent Access (Standard-IA), optimisé pour les
données à longue durée de vie, mais moins fréquemment consultées.
Amazon Web Services – Vue d'ensemble des services de stockage AWS Novembre 2015
Page 6 sur 50
Modèles d'utilisation
Amazon S3 est souvent utilisé pour le stockage et la distribution de fichiers
multimédias et de contenus Web statiques. Ce contenu peut être fourni
directement depuis Amazon S3, car chaque objet possède une adresse HTTP URL
unique. Sinon, Amazon S3 peut servir de stockage d'origine pour un réseau de
distribution de contenu (CDN), comme Amazon CloudFront. Grâce à son
élasticité, Amazon S3 est particulièrement adapté pour l'hébergement de contenu
Web qui nécessite une bande passante capable de gérer des pics de demandes
extrêmes. De même, puisqu'aucun approvisionnement de stockage n'est requis,
Amazon S3 est idéal pour les sites Web à croissance rapide hébergeant du
contenu gourmand en données, généré par l'utilisateur, comme des sites de
partage de vidéos et de photos.
Amazon S3 est également fréquemment utilisé pour héberger des sites Web
statiques entiers. Amazon S3 est une solution économique, hautement disponible
et évolutive pour toutes ces utilisations, y compris pour le stockage de fichiers
HTML statiques, d'images, de vidéos et de scénarios côté client dans des formats
comme JavaScript.
Amazon S3 est également souvent utilisé comme magasin de données pour le
traitement et les analyses à grande échelle, telles que les analyses de transaction
financières, les analyses des flux de clics et le service de transcodage de fichiers
multimédias. De par son évolutivité horizontale, Amazon S3 vous permet
d'accéder à vos données simultanément depuis plusieurs nœuds de calcul, sans
être limité par une connexion unique.
En dernier lieu, Amazon S3 est souvent utilisé comme une solution hautement
durable, évolutive et sécurisée pour la sauvegarde et l'archivage des données
critiques. Vous pouvez facilement déplacer les données gelées vers Amazon Glacier à
l'aide des règles de gestion du cycle de vie des données stockées dans Amazon S3.
Vous pouvez également utiliser la réplication entre régions d'Amazon S3 pour copier
automatiquement des objets à travers des compartiments S3 dans différentes
régions AWS de manière asynchrone, fournissant des solutions de reprise après
sinistre pour la continuité des activités.1
Amazon Web Services – Vue d'ensemble des services de stockage AWS Novembre 2015
Page 7 sur 50
Cependant, Amazon S3 ne convient pas à toutes les situations de stockage.
Vous trouverez ci-dessous certains besoins de stockage pour lesquels il est
conseillé d'étudier une autre option de stockage AWS qu'Amazon S3.
Besoin de stockage Solution Autres services AWS
Système de fichiers Amazon S3 utilise un espace de nom et n'est pas conçu pour servir de système de fichiers autonome en vertu de la norme POSIX. En revanche, vous pouvez utiliser le système de fichiers Amazon Elastic File System (Amazon EFS).
Amazon Elastic File
System (EFS)
Données structurées
avec requête
Amazon S3 n'offre pas de capacités de demande
de récupération d'objets spécifiques. Quand vous
utilisez Amazon S3, nous considérons que vous
connaissez la clé et le nom de compartiment exacts
des fichiers que vous voulez récupérer dans le
service. Par conséquent, Amazon S3 ne peut pas
servir de base de données ou de moteur de
recherche en tant que tel. Par contre, vous pouvez
associer Amazon S3 à Amazon DynamoDB, Amazon
CloudSearch ou Amazon Relational Data Service
(Amazon RDS) de façon à indexer et à interroger les
métadonnées sur les objets et les compartiments
Amazon S3.
Amazon DynamoDB
Amazon RDS
Amazon CloudSearch
Modification rapide des
données Les données qui doivent être mises à jour très
fréquemment seraient mieux traitées par des
solutions de stockage qui prennent en compte les
latences de lecture et d'écriture, comme les volumes
Amazon EBS, Amazon RDS, Amazon DynamoDB ou
les bases de données relationnelles s'exécutant sur
Amazon EC2.
Amazon EBS Amazon
DynamoDB
Amazon RDS
Données d'archives Les données qui nécessitent un stockage d'archive chiffré avec un accès en lecture occasionnel, ayant un objectif de délai de récupération (RTO) long, peuvent être stockées de manière plus économique dans Amazon Glacier.
Amazon Glacier
Hébergement de sites
Web dynamiques
Bien qu'Amazon S3 soit idéal pour les sites Web
à contenu statique, il est conseillé d'héberger les sites
Web dynamiques qui dépendent de l'interaction avec
la base de données ou les scripts côté serveur sur
Amazon EC2.
Amazon EC2
Amazon Web Services – Vue d'ensemble des services de stockage AWS Novembre 2015
Page 8 sur 50
Performances
Si vous utilisez Amazon S3 depuis Amazon EC2, dans la même région, vous
bénéficiez d'un accès rapide entre Amazon S3 et Amazon EC2. Amazon S3 est
également conçu pour que les latences côté serveur soient insignifiantes par
rapport aux latences d'Internet. De plus, Amazon S3 est conçu pour
dimensionner le stockage, les demandes et le nombre d'utilisateurs afin de
prendre en charge un très grand nombre d'applications à l'échelle du Web.
Si vous accédez à Amazon S3 à l'aide de plusieurs threads, plusieurs applications
ou plusieurs clients simultanément, le débit cumulé total d'Amazon S3 s'ajuste
généralement sur des débits qui dépassent de loin ce que n'importe quel serveur
peut générer ou consommer.
Pour accélérer le chargement d'objets volumineux, vous pouvez effectuer un
téléchargement partitionné pour charger un seul objet en tant qu'ensemble de
parties.2 Une fois le chargement de toutes les parties de l'objet terminé,
Amazon S3 les assemble et crée l'objet. Le téléchargement partitionné permet
d'améliorer le débit et la récupération rapide après des problèmes réseau.
Vous pouvez également suspendre et reprendre les téléchargements d'objets et
démarrer le téléchargement d'un objet dans Amazon S3 quand il est en cours de
création.
Pour accélérer l'accès aux données concernées, de nombreux développeurs
associent Amazon S3 à un moteur de recherche comme Amazon CloudSearch ou
à une base de données comme Amazon DynamoDB ou Amazon RDS. Dans ces
situations, Amazon S3 stocke les informations réelles, et le moteur de recherche
ou la base de données constitue le référentiel des métadonnées associées (nom
de l'objet, taille, mots clés, par exemple). La base de données permet d'indexer et
d'interroger facilement les métadonnées, ce qui permet de localiser rapidement
une référence d'objet à l'aide d'un moteur de recherche ou d'une requête de base
de données. Cela permet de mettre en évidence et de récupérer l'objet lui-même
depuis Amazon S3.
Amazon Web Services – Vue d'ensemble des services de stockage AWS Novembre 2015
Page 9 sur 50
Durabilité et disponibilité
Le stockage Amazon S3 Standard et le stockage Standard-IA offrent un niveau
supérieur de durabilité et de disponibilité des données sur la plateforme AWS en
stockant de façon automatique et synchrone vos données sur plusieurs appareils
et plusieurs installations à la fois, au sein de votre région géographique
sélectionnée. La correction d'erreur est intégrée et il n'y a pas de point unique de
défaillance. Conçu pour supporter la perte de données simultanée dans deux
sites, le stockage Amazon S3 est idéal pour servir de stockage de données
principal des données critiques pour l'activité. En fait, le stockage Amazon S3 est
conçu pour fournir 99,999999999 % (lisez « onze-neuf ») de durabilité par objet
et 99,99 % de disponibilité sur une période d'un an.
En outre, vous avez la possibilité d'activer la réplication entre régions sur chaque
compartiment Amazon S3. Une fois activée, la réplication entre régions copie
automatiquement les objets à travers les compartiments dans différentes régions
AWS de façon asynchrone, fournissant 99,999999999 % (lisez « onze-neuf ») de
durabilité et 99,99 % de disponibilité des objets Amazon S3 source et de
destination.
Evolutivité et élasticité
Amazon S3 est conçu pour offrir de façon automatique un très haut niveau
d'évolutivité et d'élasticité. Contrairement à un système de fichiers classique qui
rencontre des problèmes lors du stockage d'un grand nombre de fichiers dans un
répertoire, Amazon S3 prend en charge un nombre presque illimité de fichiers
dans n'importe quel compartiment. De même, contrairement à un disque dur qui
peut stocker une quantité totale limitée de données avant de devoir partitionner
les données sur les lecteurs et/ou serveurs, un compartiment Amazon S3 peut
stocker un nombre presque illimité d'octets. Vous pouvez stocker un nombre
illimité d'objets (fichiers) dans un seul compartiment et Amazon S3 gère
automatiquement le dimensionnement et la distribution des copies redondantes
de vos informations vers d'autres serveurs sur d'autres sites de la même région,
qui utilisent tous l'infrastructure haute performance d'Amazon.
Amazon Web Services – Vue d'ensemble des services de stockage AWS Novembre 2015
Page 10 sur 50
Sécurité
Hautement sécurisé, Amazon S3 dispose de plusieurs mécanismes pour un
contrôle d'accès précis aux ressources Amazon S3, et prend en charge le
chiffrement.
Vous pouvez gérer l'accès à Amazon S3 en attribuant à d'autres comptes et
utilisateurs AWS l'autorisation d'effectuer des opérations liées aux ressources en
écrivant une stratégie d'accès.3
Vous pouvez protéger les données Amazon S3 au repos en utilisant le
chiffrement côté serveur, par lequel vous demandez à Amazon S3 de chiffrer les
objets avant de les écrire sur les disques des centres de données et de les
déchiffrer lorsque vous téléchargez les objets. Vous pouvez également utiliser le
chiffrement côté client, par lequel vous chiffrez les objets côté client et chargez
les données chiffrées sur Amazon S3.4 5 Vous pouvez protéger les données en
transit en utilisant SSL (Secure Sockets Layer) ou le chiffrement côté client.
Vous pouvez utiliser le contrôle de version pour préserver, récupérer et restaurer
chaque version de chaque objet stocké dans votre compartiment Amazon S3. La
gestion des versions permet de récupérer facilement les données en cas d'actions
involontaires des utilisateurs ou de défaillances des applications. En outre, vous
pouvez ajouter une couche de sécurité facultative en activant l'option Suppression
authentification multi-facteurs (MFA) pour un compartiment.6 Lorsque cette
option est activée pour un compartiment, deux méthodes d'authentification sont
requises pour modifier l'état de la gestion des versions du compartiment ou pour
supprimer définitivement la version d'un objet : informations d'identification du
compte AWS valides plus un code à six chiffres (un mot de passe temporaire à
usage unique) depuis un périphérique jeton virtuel ou physique.
Afin de suivre les demandes d'accès au compartiment, vous pouvez activer la
journalisation des accès au serveur.7 Chaque enregistrement de journal
d'accès fournit des informations détaillées sur une demande d'accès donnée
(demandeur, nom du compartiment, heure de la demande, action associée à la
demande, état de la réponse et code d'erreur, le cas échéant). Les informations
des journaux d'accès peuvent s'avérer utiles en cas d'audit de sécurité ou d'audit
des accès. Cela peut également vous aider à en savoir plus sur votre base de
clients et à comprendre votre facture Amazon S3.
Amazon Web Services – Vue d'ensemble des services de stockage AWS Novembre 2015
Page 11 sur 50
Interfaces
Amazon S3 utilise des API de service Web aux normes REST et SOAP pour la
gestion et les opérations relatives aux données. Ces API permettent de stocker les
objets Amazon S3 dans des compartiments au nom unique (dossiers de niveau
supérieur). Chaque objet doit avoir une clé d'objet unique (nom de fichier) servant
d'identifiant de l'objet dans ce compartiment. Bien qu'Amazon S3 soit un magasin
d'objet basé sur le Web plutôt qu'un système de fichiers traditionnel, vous pouvez
facilement émuler une hiérarchie de système de fichiers (dossier1/dossier2/fichier)
dans Amazon S3 en créant des noms de clé d'objet correspondant au nom de
chemin d'accès complet de chaque fichier.
La plupart des applications de conception des développeurs sur Amazon S3 utilise
une boîte à outils de très haut niveau ou un kit SDK (Software Development Kit)
qui encapsule l'API REST sous-jacente. Les kits SDK AWS sont disponibles pour
Android, Browser, iOS, Java, .NET, Node.js, PHP, Python, Ruby et GO. L'interface
ligne de commande AWS intégrée (AWS CLI) fournit également un ensemble de
commandes de fichiers Amazon S3 supérieures de type Linux pour les opérations
courantes, comme ls, cp, mv, sync, etc. L'interface de ligne de commande AWS
CLI d'Amazon S3 permet de procéder à des chargements et téléchargements
récursifs à l'aide d'une seule commande Amazon S3 au niveau du dossier, ainsi
qu'à des transferts parallèles. Vous pouvez également utiliser l'interface AWS CLI
pour accéder par ligne de commande à l'API Amazon S3 de bas niveau. Grâce à
AWS Management Console, vous pouvez créer et gérer des compartiments
Amazon S3, charger et télécharger des objets et parcourir les contenus de vos
compartiments Amazon S3 à l'aide d'une interface utilisateur Web simple.
En outre, vous pouvez utiliser la fonction de notification Amazon S3 pour recevoir
des notifications lorsque certains événements se produisent dans votre
compartiment. Actuellement, Amazon S3 peut publier des événements tels que la
date de création ou de suppression d'un objet, ou de la perte d'un objet RRS.
Les notifications peuvent être émises pour les rubriques Amazon Simple
Notification Service (SNS), les files d'attente Amazon Simple Queue Service (SQS)
et les fonctions AWS Lambda.8 9 10
Amazon Web Services – Vue d'ensemble des services de stockage AWS Novembre 2015
Page 12 sur 50
Modèle de coût
Avec Amazon S3, vous ne payez que le stockage que vous utilisez réellement.
Aucun frais minimum ne s'applique et aucun coût d'installation n'est engagé. La
tarification d'Amazon S3 se base sur trois composantes : le stockage (par Go par
mois), le transfert de données entrantes ou sortantes (par Go par mois) et les
requêtes (par x millier(s) de requêtes par mois). Pour les nouveaux clients, AWS
propose un niveau gratuit d'AWS, qui comprend jusqu'à 5 Go de stockage
Amazon S3, 20 000 requêtes Get, 2 000 requêtes Put et 15 Go de transfert de
données sortantes par mois pendant un an, gratuitement.11 Les informations
relatives aux tarifs sont disponibles à la page de tarification d'Amazon S3.12
Amazon Glacier Amazon Glacier est un service de stockage très économique qui fournit un
archivage et une sauvegarde en ligne des données très sécurisés, durables et
flexibles. Avec Amazon Glacier, les clients peuvent archiver leurs données de
façon fiable pour seulement 0,01 USD par Go par mois. Amazon Glacier permet
aux clients de transférer vers AWS les charges administratives liées au
fonctionnement et au dimensionnement du stockage afin qu'ils n'aient plus à se
soucier de la planification des capacités, de la mise en service du matériel, de la
réplication des données, de la détection et de la réparation des défaillances
matérielles ou des migrations fastidieuses de matériel.
Vos données sont stockées dans Amazon Glacier en tant qu'archives. Une archive
peut représenter un seul fichier, ou plusieurs fichiers que vous associez pour les
charger en une archive unique. La récupération d'archives à partir
d'Amazon Glacier exige le lancement d'une tâche. Vos archives sont organisées
par coffres.
Amazon Glacier est conçu pour fonctionner avec d'autres services AWS. Vous
pouvez déplacer les données gelées entre Amazon Glacier et Amazon S3 en toute
transparence à l'aide des règles de gestion du cycle de vie des données S3. Vous
pouvez également utiliser les services AWS Import/Export pour accélérer le
transfert de grandes quantités de données dans Amazon Glacier en utilisant des
périphériques de stockage portables pour le transfert.
Amazon Web Services – Vue d'ensemble des services de stockage AWS Novembre 2015
Page 13 sur 50
Modèles d'utilisation
Les organisations ont recours à Amazon Glacier pour répondre à un certain
nombre de cas d'utilisation. Ces cas d'utilisation comprennent l'archivage des
informations d'entreprise hors site, des ressources multimédias et des données
scientifiques et de recherche, ainsi que la conservation des actifs numériques et le
remplacement des bandes magnétiques.
Cependant, Amazon Glacier ne convient pas à toutes les situations de stockage.
Vous trouverez ci-dessous quelques besoins de stockage pour lesquels il est
conseillé d'étudier une autre option de stockage AWS qu'Amazon Glacier.
Besoin de stockage
Solution Autres solutions AWS
Services
Modification
rapide des
données
Les données qui doivent être mises à jour très
fréquemment seraient mieux traitées par une solution de
stockage prenant en compte des latences de lecture et
d'écriture inférieures, comme les volumes Amazon EBS,
Amazon RDS, Amazon DynamoDB ou les bases de
données relationnelles s'exécutant sur EC2.
Amazon EBS
Amazon RDS
Amazon DynamoDB
Amazon EC2
Accès immédiat Les données stockées dans Amazon Glacier ne sont
pas disponibles immédiatement. Les tâches de
récupération durent généralement entre 3 et 5 heures,
par conséquent si vous avez besoin d'un accès
immédiat à vos données, Amazon S3 est un meilleur
choix.
Amazon S3
Performances
Amazon Glacier est un service de stockage économique conçu pour stocker sur le
long terme des données rarement consultées. Les tâches de récupération
d'Amazon Glacier durent généralement entre 3 et 5 heures.
Vous pouvez améliorer le chargement des archives les plus volumineuses en
utilisant le chargement en plusieurs parties des archives jusqu'à 40 To environ
(limite d'archive unique).13 Vous pouvez charger des parties distinctes d'une
archive volumineuse de façon indépendante, dans n'importe quel ordre et en
parallèle, pour améliorer le chargement des archives volumineuses. Vous pouvez
même procéder à des récupérations par plage sur des archives stockées dans
Amazon Glacier, en spécifiant une plage ou une portion de l'archive.14 Vous
pouvez spécifier une plage d'octets à récupérer afin de maîtriser vos coûts de
bande passante, de gérer vos téléchargements de données et de récupérer une
partie ciblée d'une archive volumineuse.
Amazon Web Services – Vue d'ensemble des services de stockage AWS Novembre 2015
Page 14 sur 50
Durabilité et disponibilité
Amazon Glacier est conçu pour fournir une durabilité annuelle moyenne de
99,999999999 % (lire « onze-neuf ») pour une archive. Le service stocke
vos données de façon redondante sur plusieurs installations, et sur plusieurs
appareils au sein de chaque installation. Pour accroître la durabilité,
Amazon Glacier stocke vos données de manière synchrone sur différentes
installations avant de renvoyer la valeur SUCCESS indiquant la réussite du
chargement d'une archive. Contrairement aux systèmes traditionnels qui peuvent
nécessiter une vérification laborieuse des données et une réparation manuelle,
Amazon Glacier effectue des contrôles réguliers et systématiques de l'intégrité
des données. Par ailleurs, il est conçu de façon à pouvoir bénéficier d'une
réparation automatique.
Evolutivité et élasticité
Amazon Glacier s'ajuste pour répondre aux besoins de stockage croissants et
souvent imprévisibles. Une archive unique est limitée en taille à 40 To, mais la
quantité totale de données pouvant être stockées dans le service est illimitée. Que
vous stockiez des pétaoctets de données ou des gigaoctets, Amazon Glacier
augmente ou diminue automatiquement votre stockage, au besoin.
Sécurité
Par défaut, vous êtes le seul à pouvoir accéder à vos données dans Amazon
Glacier. Si d'autres personnes doivent accéder à vos données, vous pouvez
configurer un contrôle d'accès aux données dans Amazon Glacier grâce au service
AWS Identity and Access Management (IAM).15 Il suffit alors de créer une
stratégie IAM qui spécifie les utilisateurs d'un compte ayant le droit d'effectuer
des opérations sur un coffre donné.
Amazon Glacier utilise le chiffrement côté serveur pour copier toutes les données
inactives. Amazon Glacier s'occupe de la gestion et de la protection des clés pour
votre compte, à l'aide de l'un des chiffrements par bloc les plus puissants qui
existent, AES (Advanced Encryption Standard) 256 bits. Si vous préférez gérer
vos propres clés, vous pouvez chiffrer vos données avant de les charger.
Amazon Web Services – Vue d'ensemble des services de stockage AWS Novembre 2015
Page 15 sur 50
Amazon Glacier vous permet de verrouiller les coffres lorsque la conservation
des données à long-terme est requise par la réglementation ou les règles de
conformité. Vous pouvez définir des contrôles de conformité sur des coffres
Amazon Glacier individuels et les appliquer à l'aide de stratégies verrouillables.
Par exemple, vous pouvez spécifier des contrôles tels que « enregistrements non
supprimables » ou « rétention de données temporelles » dans une stratégie de
verrouillage de coffre, puis verrouiller la stratégie pour éviter de futures
modifications. Une fois verrouillée, la stratégie devient immuable et
Amazon Glacier applique les contrôles prescrits pour vous aider à atteindre vos
objectifs de conformité.
Pour vous aider à gérer l'accès aux données, Amazon Glacier est intégré à
Amazon CloudTrail, permettant de capturer et de stocker des appels d'API,
effectués dans Amazon Glacier sur votre compte AWS, dans des fichiers
journaux qui sont transmis à un compartiment Amazon S3 que vous spécifiez.16
Interfaces
Vous pouvez utiliser Amazon Glacier de deux manières, chacune avec sa propre
interface. L'API d'Amazon Glacier permet à la fois de gérer et d'effectuer des
opérations sur les données.
Tout d'abord, Amazon Glacier fournit une interface de services Web REST natifs
reposant sur des normes, ainsi que des kits SDK Java et .NET. Vous pouvez
utiliser la console AWS Management Console ou les actions d'API d'Amazon
Glacier pour créer des coffres afin d'organiser les archives dans Amazon Glacier.
Vous pouvez ensuite utiliser les actions d'API d'Amazon Glacier pour charger et
récupérer des archives, vérifier l'état de vos tâches et configurer votre coffre de
façon à recevoir une notification via le service Amazon Simple Notification
Service (Amazon SNS) quand une tâche est terminée.17
Amazon Web Services – Vue d'ensemble des services de stockage AWS Novembre 2015
Page 16 sur 50
Ensuite, Amazon Glacier peut servir de classe de stockage dans Amazon S3 en
utilisant la gestion du cycle de vie des objets qui fournit un archivage automatique
selon une stratégie depuis Amazon S3 vers Amazon Glacier. Il suffit de définir une
ou plusieurs règles de cycle de vie pour un compartiment Amazon S3, spécifiant
les objets à transférer dans Amazon Glacier, et le moment. Vous pouvez spécifier
une période relative ou absolue (y compris 0 jour) après laquelle les objets
Amazon S3 spécifiés doivent être transférés dans Amazon Glacier. L'API
d'Amazon S3 inclut désormais une nouvelle opération de restauration
« RESTORE », et le processus de récupération depuis Amazon Glacier avec la
commande RESTORE dure entre 3 et 5 heures comme les autres récupérations
dans Amazon Glacier. L'opération de récupération place une copie de l'objet
récupéré dans le stockage RRS d'Amazon S3 pour une période de rétention
spécifiée ; l'objet archivé d'origine reste stocké dans Amazon Glacier. Pour plus
d'informations sur l'utilisation d'Amazon Glacier depuis Amazon S3, reportez-
vous à la section Gestion du cycle de vie des objets du Manuel du développeur
d'Amazon S3.18
Notez que lorsque vous utilisez Amazon Glacier comme une classe de stockage
dans Amazon S3, vous utilisez l'API d'Amazon S3, et quand vous utilisez le service
« natif » d'Amazon Glacier, vous utilisez l'API d'Amazon Glacier. Les objets
archivés dans Amazon Glacier à l'aide d'Amazon S3 peuvent être répertoriés et
récupérés uniquement à l'aide de l'API d'Amazon S3 ou de la console AWS
Management. Ils ne s'affichent pas en tant qu'archives dans un coffre
Amazon Glacier.
Modèle de coût
Avec Amazon Glacier, vous ne payez que pour ce que vous utilisez et aucun
frais minimum ne s'applique. Avec une utilisation normale, la tarification
d'Amazon Glacier s'appuie sur trois composantes : le stockage (par Go par mois),
le transfert de données sortantes (par Go par mois) et les requêtes (par millier de
requêtes de chargement (UPLOAD) et de récupération (RETRIEVAL) par mois).
Amazon Web Services – Vue d'ensemble des services de stockage AWS Novembre 2015
Page 17 sur 50
Notez qu'Amazon Glacier est conçu d'après l'hypothèse que les récupérations
seront rares et inhabituelles, et que les données seront stockées pendant des
périodes étendues. Vous pouvez récupérer jusqu'à 5 % de votre stockage mensuel
moyen (évaluation quotidienne) pour chaque mois gratuit. Si vous récupérez
une quantité de données supérieure en un mois, des frais de récupération
supplémentaires (par Go) vous seront facturés. Des frais (par Go) calculés au
prorata s'appliquent également aux éléments qui ont été supprimés avant une
période de 90 jours. Les informations relatives au tarif sont disponibles à la page
de tarification Amazon Glacier.19
Amazon EBS Les volumes Amazon Elastic Block Store (Amazon EBS) offrent un stockage
durable au niveau bloc à utiliser avec les instances Amazon EC2 (machines
virtuelles). Les volumes Amazon EBS sont des stockages hors instances qui
persistent indépendamment de la durée d'exécution d'une instance Amazon EC2
unique. Une fois qu'un volume Amazon EBS est attaché à une instance EC2, vous
pouvez utiliser le volume EBS comme un disque dur physique, généralement en
le formatant avec le système de fichiers de votre choix et en utilisant l'interface
d'E/S de fichier fournie par le système d'exploitation de l'instance. Pour les
images machine Amazon (APM, Amazon Machine Images) qui sont sauvegardées
par Amazon EBS, vous pouvez utiliser un volume Amazon EBS pour démarrer
une instance Amazon EC2. Vous pouvez également attacher plusieurs volumes
Amazon EBS à une même instance Amazon EC2. Notez toutefois que chaque
volume EBS unique ne peut être attaché qu'à une seule instance Amazon EC2,
quel que soit le moment.
Amazon EBS permet également de créer des instantanés ponctuels des volumes,
qui sont conservés dans Amazon S3. Ces instantanés peuvent être utilisés comme
point de départ des nouveaux volumes Amazon EBS et pour protéger les données
sur le long terme. Le même instantané peut être utilisé pour instancier autant de
volumes que vous le souhaitez. Vous pouvez également copier ces instantanés
d'une région AWS à une autre, ce qui vous permet d'utiliser plus facilement de
nombreuses régions AWS à des fins d'expansion géographique, de migration
des centres de données et de reprise après sinistre. Les tailles des volumes
Amazon EBS sont comprises entre 1 Go et 16 To, et sont allouées par incréments
de 1 Go.
Amazon Web Services – Vue d'ensemble des services de stockage AWS Novembre 2015
Page 18 sur 50
Modèles d'utilisation
Amazon EBS est conçu pour les données qui changent relativement souvent
et qui requièrent une persistance à long terme. Amazon EBS est idéal comme
stockage principal pour une base de données ou un système de fichiers, ou pour
des applications qui nécessitent un accès à un stockage brut en mode bloc.
Parmi les différents types de volume Amazon EBS, Amazon EBS Magnetic est
bien adapté aux données rarement consultées. Les volumes à usage général
Amazon EBS, reposant sur des disques SSD (Solid-State Drive), sont
particulièrement bien adaptés aux volumes de démarrage et pour les petites et
moyennes bases de données. Les volumes IOPS provionnées Amazon EBS
(reposant également sur SSD) sont parfaits pour une utilisation avec des charges
de travail gourmandes en E/S, des bases de données relationnelles et des bases
de données NoSQL.
Cependant, Amazon EBS ne convient pas à toutes les situations de stockage.
Vous trouverez ci-dessous certains besoins de stockage pour lesquels il est
conseillé d'étudier une autre option de stockage AWS qu'Amazon EBS.
Besoin de stockage Solution Services AWS
Stockage temporaire
Pensez à utiliser des volumes de stockage d'instance locaux pour les besoins tels que les disques temporaires, les tampons, les files d'attente et les caches.
Amazon Local
Stockage d'instance
Haute durabilité
du stockage Si vous avez besoin d'un stockage à haute durabilité, utilisez Amazon S3. Le stockage standard Amazon S3 est conçu pour fournir 99,999999999 % de durabilité annuelle par objet. Vous pouvez même décider de créer un instantané des volumes EBS. Cet instantané est alors sauvegardé dans Amazon S3, fournissant ainsi la durabilité d'Amazon S3.
Amazon S3
Données statiques ou contenu Web
Si vos données ne changent pas souvent, Amazon S3 peut s'avérer la solution la plus économique et évolutive pour le stockage de ces informations fixes. De même, le contenu Web distribué par Amazon EBS nécessite un serveur Web s'exécutant sur Amazon EC2 ; en revanche, vous pouvez fournir du contenu Web directement à partir d'Amazon S3.
Amazon S3
Amazon Web Services – Vue d'ensemble des services de stockage AWS Novembre 2015
Page 19 sur 50
Performances
Comme décrit précédemment, Amazon EBS propose trois types de volumes : le
volume magnétique, le volume à usage général (reposant sur SSD) et le volume
IOPS provisionnées (reposant sur SSD). Ces trois volumes se distinguent par
leurs performances et leurs modèles de tarification, ce qui vous permet d'adapter
vos performances de stockage et vos coûts en fonction des besoins de vos
applications. Vous pouvez connecter plusieurs volumes de tous les types et
répartir les données entre ces volumes afin d'améliorer les performances d'E/S
disponibles de vos applications Amazon EC2.
Les volumes magnétiques permettent un stockage économique adapté aux
applications avec des E/S modérées ou transmises en paquets. Les volumes
magnétiques sont conçus pour fournir en moyenne 100 opérations d'E/S par
seconde (IOPS), avec la possibilité d'émettre en rafales, au mieux, quelques
centaines d'opérations d'E/S par seconde. Ils peuvent aussi faire office de
volumes de démarrage, quand la capacité de transmission en paquets peut
fournir un démarrage rapide de l'instance.
Les volumes à usage général (SSD) offrent un stockage économique idéal pour un
large éventail de charges de travail. Ces volumes fournissent des latences
inférieures à 10 millisecondes, la possibilité d'émettre en rafale allant jusqu'à
3 000 E/S par seconde pour une durée étendue et des performances de base
allant de 3 E/S par seconde/Go à 10 000 E/S par seconde (à 3 334 Go). La taille
des volumes à usage général (SSD) peut aller de 1 Go à 16 To. Les volumes à
usage général (SSD) ont une plage de limite de débit de 128 Mo/s pour les
volumes inférieurs ou égaux à 170 Go. Pour les volumes supérieurs à 170 Go,
cette limite augmente au taux de 128 Mo/s par To, jusqu'à un maximum de
160 Mo (à 214 Go et plus).
Amazon Web Services – Vue d'ensemble des services de stockage AWS Novembre 2015
Page 20 sur 50
Les volumes d'IOPS provisionnées (SSD) sont conçus pour offrir des
performances très élevées et prévisibles pour les charges de travail gourmandes
en E/S, notamment les charges de travail de base de données qui sont sensibles
aux performances de stockage et à l'homogénéité du débit d'E/S à accès aléatoire.
Vous spécifiez un taux d'E/S par seconde lorsque vous créez le volume et
Amazon EBS fournit à l'intérieur des 10 % de leurs performances E/S par seconde
provisionnées 99,9 % du temps sur une année donnée. La taille d'un volume
d'IOPS provisionnées (SSD) peut aller de 4 Go à 16 To et vous pouvez allouer
jusqu'à 20 000 E/S par seconde par volume. Le rapport maximum des E/S par
seconde provisionnées sur la taille du volume requis est de 30. Par exemple, un
volume avec 3 000 E/S par seconde doit faire au moins 100 Go. Les volumes
d'IOPS provisionnées (SSD) ont une plage de débit limite de 256 Ko pour chaque
E/S par seconde fournie, jusqu'à un maximum de 320 Mo/s (à 1 280 E/S par
seconde).
Les volumes Amazon EBS étant des périphériques attachés au réseau, d'autres
E/S réseau effectuées par une instance Amazon EC2, ainsi que la charge totale
sur le réseau partagé, peuvent nuire aux performances des volumes Amazon EBS
individuels. Pour activer vos instances Amazon EC2 afin d'utiliser les IOPS
provisionnées de manière optimale sur un volume Amazon EBS, vous pouvez
lancer des types d'instance Amazon EC2 sélectionnés comme instances
optimisées pour Amazon EBS. Les instances optimisées Amazon EBS délivrent
un débit dédié entre Amazon EC2 et Amazon EBS, à des vitesses allant de
500 Mbit/s à 4 000 Mbit/s selon le type d'instance utilisé. Lorsqu'ils sont
connectés aux instances optimisées Amazon EBS, les volumes d'IOPS
provisionnées fournissent à l'intérieur des 10 % de leurs performances E/S par
seconde provisionnées 99,9 % du temps. Les volumes EBS nouvellement créés
reçoivent leurs performances maximales au moment où ils sont disponibles et ne
nécessitent pas d'initialisation (anciennement préchauffage). Toutefois, vous
devez initialiser les blocs de stockage sur des volumes ayant été restaurés à partir
d'instantanés avant de pouvoir accéder au bloc.20
Amazon Web Services – Vue d'ensemble des services de stockage AWS Novembre 2015
Page 21 sur 50
En associant Amazon EC2 à Amazon EBS, vous bénéficiez pratiquement des
mêmes techniques d'optimisation de performances de disque que celles fournies
par un stockage et des serveurs sur site. Par exemple, en connectant plusieurs
volumes Amazon EBS à une instance Amazon EC2 unique, vous pouvez
partitionner la charge d'E/S d'application totale en allouant un volume aux
données des journaux de base de données, un ou plusieurs volumes au stockage
de fichiers de base de données et d'autres volumes aux données du système de
fichiers. Chaque volume Amazon EBS peut être configuré de manière distincte
en stockage à usage général Amazon EBS (SSD), stockage d'IOPS provisionnées
(SSD) ou stockage magnétique, au besoin. Vous pouvez aussi répartir vos
données sur plusieurs volumes Amazon EBS de même configuration à l'aide du
RAID 0 (répartition de disque) ou du logiciel du gestionnaire de volumes
logiques, regroupant ainsi des IOPS disponibles, un débit de volume total et une
taille de volume totale.
Durabilité et disponibilité
Les volumes Amazon EBS sont conçus pour être hautement disponibles et fiables.
Les données de volume Amazon EBS sont répliquées sur plusieurs serveurs dans
une seule zone de disponibilité (AZ) pour éviter la perte de données résultant de
la défaillance d'un seul composant. La durabilité de votre volume Amazon EBS
dépend à la fois de la taille de votre volume et de la quantité de données qui a
changé depuis votre dernier instantané. Les instantanés Amazon EBS sont des
sauvegardes incrémentielles à un instant donné, contenant uniquement les blocs
de données qui ont changé depuis le dernier instantané. Les volumes
Amazon EBS sont conçus avec un taux de défaillance annuel (AFR) allant de 0,1 à
0,2 %, où la défaillance signifie une perte totale ou partielle du volume, en
fonction de la taille et des performances du volume. Ce taux AFR rend les
volumes EBS vingt fois plus fiables que les disques durs classiques, dont le taux
AFR est d'environ 4 %. EBS prend également en charge la fonction d'instantané,
qui permet d'effectuer des sauvegardes de vos données à un instant donné.
Amazon Web Services – Vue d'ensemble des services de stockage AWS Novembre 2015
Page 22 sur 50
Pour optimiser à la fois la durabilité et la disponibilité des données Amazon EBS,
vous pouvez créer des instantanés de vos volumes Amazon EBS très souvent.
(Pour garantir la cohérence des données, nous vous recommandons de suspendre
brièvement toute opération d'écriture sur le volume, ou de démonter le volume,
pendant que la commande d'instantané est générée. Vous pouvez continuer à
utiliser le volume pendant que l'instantané est en cours de création.) Si votre
volume Amazon EBS échoue, tous les instantanés de ce volume restent intacts, et
vous pouvez recréer votre volume à partir du dernier point d'instantané. Votre
volume Amazon EBS étant créé dans une zone de disponibilité particulière, le
volume sera indisponible si la zone de disponibilité est elle-même indisponible.
Toutefois, l'instantané d'un volume Amazon EBS est disponible sur toutes les
zones de disponibilité d'une région, et vous pouvez utiliser un instantané
Amazon EBS pour créer un ou plusieurs volumes Amazon EBS dans n'importe
quelle zone de disponibilité d'une région. Les instantanés Amazon EBS peuvent
également être copiés d'une région sur une autre, et facilement partagés avec
d'autres comptes d'utilisateur. Par conséquent, les instantanés Amazon EBS sont
un mécanisme simple de clonage de disque ou d'image de disque pour la
sauvegarde, le partage et la reprise après sinistre.
Evolutivité et élasticité
A l'aide de la console AWS Management Console ou l'API Amazon EBS, vous
pouvez configurer et libérer facilement et rapidement des volumes Amazon EBS
pour les adapter à vos besoins de stockage. Les volumes Amazon EBS individuels
ne sont pas redimensionnables, par conséquent si vous avez besoin de stockage
supplémentaire, vous pouvez développer la quantité d'espace disponible
d'Amazon EBS pour votre instance Amazon EC2 de deux manières.
Le plus simple est de créer un volume Amazon EBS et de le connecter afin de
commencer à l'utiliser en association avec vos volumes existants. Toutefois, si
vous devez développer la taille d'un volume Amazon EBS unique, vous pouvez
redimensionner un volume de manière efficace à l'aide d'un instantané, comme
décrit ci-après :
1. Détachez le volume Amazon EBS d'origine.
2. Créez un instantané des données du volume Amazon EBS d'origine dans
Amazon S3.
Amazon Web Services – Vue d'ensemble des services de stockage AWS Novembre 2015
Page 23 sur 50
3. Créez un nouveau volume Amazon EBS depuis l'instantané, mais
définissez un volume de plus grande taille que le volume d'origine.
4. Attachez le nouveau volume de plus grande taille à l'instance Amazon EC2
à la place du volume d'origine. (Dans la plupart des cas, un utilitaire au
niveau du système d'exploitation est également nécessaire pour étendre le
système de fichiers.)
5. Supprimez le volume Amazon EBS d'origine.
Sécurité
IAM vous permet de contrôler l'accès à vos volumes Amazon EBS en indiquant
qui est autorisé à accéder à quels volumes EBS.
Le chiffrement Amazon EBS offre un chiffrement transparent des instantanés et
des volumes de données EBS sans avoir à développer et à gérer une
infrastructure de gestion de clés sécurisée. Le chiffrement EBS assure la sécurité
des données au repos en chiffrant vos instantanés et vos volumes de données à
l'aide de clés gérées par Amazon ou de clés créées et gérées par vous-même à
l'aide du service AWS KMS (AWS Key Management Service). De plus, le
chiffrement intervient sur les serveurs qui hébergent les instances Amazon EC2,
lors du déplacement des données entre les instances EC2 et les volumes de
données EBS.
Le contrôle d'accès, associé au chiffrement, représente une stratégie de sécurité
de protection renforcée pour vos données. Pour de plus amples informations,
consultez la section Chiffrement Amazon EBS du Guide de l'utilisateur
Amazon EBS.21
Amazon Web Services – Vue d'ensemble des services de stockage AWS Novembre 2015
Page 24 sur 50
Interfaces
Amazon propose une API de gestion REST pour Amazon EBS, et prend en charge
les opérations EBS à la fois dans les kits SDK AWS et dans l'interface de ligne de
commande AWS (CLI). Les actions d'API et les opérations EBS permettent de
créer, supprimer, décrire, attacher et détacher des volumes Amazon EBS pour
vos instances Amazon EC2 ; de créer, supprimer et décrire des instantanés
depuis Amazon EBS vers Amazon S3 ; et de copier des instantanés d'une région à
une autre. Si vous préférez travailler avec une interface utilisateur graphique,
AWS Management Console vous apporte toutes les capacités de l'API dans une
interface de navigation conviviale. Quelle que soit la manière dont vous créez
votre volume Amazon EBS, tout le stockage est alloué lors de la création du
volume, et vous êtes facturé pour ce stockage alloué même si vous n'y écrivez
aucune donnée.
Amazon EBS ne fournit pas d'API de données. Par contre, Amazon EBS présente
une interface de périphérique de stockage en mode bloc à l'instance Amazon EC2.
Cela signifie que pour l'instance Amazon EC2, un volume Amazon EBS apparaît
comme un disque dur local. Pour écrire des données dans les volumes
Amazon EBS, et pour les lire, vous utilisez les interfaces d'E/S du système de
fichiers natif de votre système d'exploitation.
Modèle de coût
Comme pour les autres services AWS, avec Amazon EBS vous ne payez
généralement que pour ce que vous utilisez. La tarification Amazon EBS repose
sur trois composantes : le stockage alloué, les demandes d'E/S et le stockage des
instantanés. Les volumes magnétiques Amazon EBS sont facturés par Go par
mois de stockage alloué et par million de demandes d'E/S. Les volumes à usage
général Amazon EBS (SSD) sont facturés par Go par mois de stockage alloué, et
les volumes d'IOPS provisionnées Amazon EBS (SSD) sont facturés par Go par
mois de stockage alloué et par IOPS provisionnées par mois. Pour tous les types
de volume, les instantanés Amazon EBS sont facturés par Go par mois de
données stockées. Une copie d'instantané Amazon EBS est facturée pour les
données transférées entre les régions, et pour les frais d'instantané Amazon EBS
standard en vigueur dans la région de destination.
Amazon Web Services – Vue d'ensemble des services de stockage AWS Novembre 2015
Page 25 sur 50
Il est important de se rappeler que pour les volumes Amazon EBS, vous êtes
facturé pour le stockage (alloué) provisionné, que vous l'utilisiez ou non. Pour
les instantanés Amazon EBS, vous ne payez que le stockage que vous utilisez
(consommez) réellement. Notez que les instantanés Amazon EBS sont
incrémentiels et compressés, pour réduire la quantité de stockage consommé
dans chaque instantané par rapport au stockage consommé pour un volume
Amazon EBS.
Le transfert d'informations entre les différentes offres de stockage AWS (c'est-à-
dire une interface Amazon EC2 transférant des informations avec Amazon EBS,
Amazon S3, Amazon RDS, etc.) est gratuit tant que les offres de stockage se
trouvent dans la même région AWS.
Les informations relatives au tarif d'Amazon EBS sont disponibles à la page de
tarification Amazon EBS.22
Stockage d'instance Amazon EC2 Les volumes de stockage de l'instance Amazon EC2 (également appelés disques
éphémères) offrent un stockage temporaire au niveau bloc pour de nombreux
types d'instance Amazon EC2.23 Ce stockage est composé d'un bloc préconfiguré
et pré-attaché de stockage disque sur le même serveur physique qui héberge
l'instance Amazon EC2 pour laquelle le bloc fournit le stockage. Le volume du
stockage disque fourni varie selon le type d'instance Amazon EC2. Dans les
familles d'instance Amazon EC2 qui fournissent un stockage d'instance, les
instances plus volumineuses ont tendance à fournir davantage de volumes de
stockage d'instance, et des volumes plus importants.
Amazon Web Services – Vue d'ensemble des services de stockage AWS Novembre 2015
Page 26 sur 50
Certains types d'instance, tels que les micro-instances (t1, t2) et les instances C4
optimisées pour le calcul, utilisent le stockage Amazon EBS uniquement, sans
fournir de stockage d'instance. Notez également que les instances utilisant
Amazon EBS pour le périphérique racine (en d'autres termes, qui démarrent
depuis Amazon EBS) n'exposent pas les volumes de stockage d'instance par
défaut. Vous pouvez choisir d'exposer les volumes de stockage d'instance au
moment du lancement de l'instance en spécifiant un mappage de périphérique de
stockage en mode bloc. Pour de plus amples informations, veuillez consulter la
section Mappage de périphérique de stockage en mode bloc dans le Guide de
l'utilisateur Amazon EC2.24
De plus, les familles d'instance optimisée stockage (I2) et stockage dense (D2)
Amazon EC2 fournissent un stockage d'instance à des fins spéciales destiné à des
cas d'utilisation spécifiques. Les instances I2 fournissent un stockage d'instance
basé sur SSD très rapide, capable de prendre en charge plus de 365 000 IOPS
aléatoires d'écriture et 315 000 IOPS en première écriture ; elles sont par ailleurs
optimisées pour des performances d'E/S aléatoires très élevées et un coût faible en
termes d'E/S par seconde (IOPS). En revanche, les instances D2 sont optimisées
pour une densité de stockage très élevée, un faible coût de stockage et des
performances d'E/S séquentielles élevées, offrant des performances en lecture
jusqu'à 3,5 Go/seconde et des performances en écriture jusqu'à 3,1 Go/seconds
avec une taille de bloc de 2 Mo et jusqu'à 48 téraoctets de stockage local basé
sur HDD.
Modèles d'utilisation
En général, les volumes de stockage d'instance local EC2 sont particulièrement
adaptés pour le stockage temporaire d'informations qui changent en permanence,
telles que les tampons, les caches, les données temporaires et d'autres contenus
provisoires, ou encore pour des données qui sont répliquées sur une flotte
d'instances, telles qu'un pool à charge équilibrée de serveurs Web. Le stockage
d'instance Amazon EC2 est bien adapté à cette fin. Il se compose du périphérique
de démarrage de la machine virtuelle (pour les AMI de stockage d'instance
uniquement), plus un ou plusieurs volumes supplémentaires dédiés à l'instance
Amazon EC2 (à la fois pour les AMI Amazon EBS et pour les AMI de stockage
d'instance). Ce stockage est utilisable uniquement à partir d'une instance
Amazon EC2 pendant la durée de vie de cette instance. Notez que, contrairement
aux volumes Amazon EBS, les volumes de stockage d'instance ne peuvent pas
être détachés ou attachés à une autre instance.
Amazon Web Services – Vue d'ensemble des services de stockage AWS Novembre 2015
Page 27 sur 50
Pour un nombre d'E/S élevé et une capacité de stockage importante, le stockage
d'instance Amazon EC2 est particulièrement adapté pour ces cas d'utilisation
spécifiques. Les instances à nombre d'E/S élevé (la famille I2) fournissent des
volumes de stockage d'instance reposant sur SSD, et conviennent parfaitement à
de nombreuses charges de travail de bases de données hautes performances. Les
exemples d'application incluent des bases de données NoSQL telles que
Cassandra et MongoDB, des bases de données en cluster, des systèmes de
traitement de transaction en ligne (OLTP) et des applications similaires. Les
instances à capacité de stockage élevée (famille D2) prennent en charge une
densité de stockage par instance Amazon EC2 beaucoup plus importante. Elles
conviennent donc parfaitement aux applications bénéficiant de performances
élevées des E/S séquentielles sur des ensembles de données très volumineux. Les
exemples d'application incluent les entrepôts de données, les nœuds de stockage
Hadoop/MapReduce, les systèmes de fichiers parallèles et les applications
similaires.
Notez que les applications qui utilisent du stockage d'instance pour des données
persistantes fournissent généralement la durabilité des données par la réplication
ou en copiant régulièrement les données vers un stockage durable.
Cependant, les volumes de stockage d'instance Amazon EC2 ne conviennent pas
à toutes les situations de stockage. Vous trouverez ci-dessous certains besoins de
stockage pour lesquels il est conseillé d'étudier une autre option de stockage AWS
que les volumes de stockage d'instance Amazon EC2.
Amazon Web Services – Vue d'ensemble des services de stockage AWS Novembre 2015
Page 28 sur 50
Besoin de stockage Solution Services AWS
Stockage permanent
Si vous avez besoin d'un stockage sur disque virtuel permanent, semblable au disque dur physique, pour les fichiers ou autres données qui doivent persister plus longtemps que la durée de vie d'une instance Amazon EC2 unique, les volumes Amazon EBS ou Amazon S3 sont plus appropriés.
Amazon EC2 Amazon EBS Amazon S3
Stockage de base de données relationnelle
Dans la plupart des cas, les bases de données relationnelles requièrent un stockage qui persiste au-delà de la durée de vie d'une instance Amazon EC2 unique, faisant des volumes Amazon EBS le choix naturel.
Amazon EC2 Amazon EBS
Stockage partagé Les volumes de stockage d'instance sont dédiés à une instance Amazon EC2 unique et ne peuvent pas être partagés avec d'autres systèmes ou utilisateurs. Si vous avez besoin d'un stockage pouvant être détaché d'une instance et attaché à une instance différente, ou si vous souhaitez avoir la possibilité de partager les données facilement, les volumes Amazon EFS, Amazon S3 ou Amazon EBS sont le meilleur choix.
Amazon EFS Amazon S3 Amazon EBS
Instantanés Si vous recherchez l'avantage, la durabilité à long-terme,
la disponibilité et la capacité de partager les instantanés de
disque à un instant donné, les volumes Amazon EBS sont
à privilégier.
Amazon EBS
Performances
Les volumes de stockage d'instance non basés sur SSD dans la plupart des
familles d'instance Amazon EC2 sont dotés de caractéristiques de performances
semblables à celles des volumes Amazon EBS standard. La machine virtuelle de
l'instance Amazon EC2 et les volumes de stockage d'instance locaux étant sur le
même serveur physique, l'interaction avec ce stockage est très rapide,
particulièrement pour les accès séquentiels. Pour augmenter le nombre cumulé
d'IOPS, ou améliorer le débit de disque séquentiel, il est possible de regrouper
plusieurs volumes de stockage d'instance à l'aide du logiciel RAID 0 (répartition
de disque). Puisque la bande passante des disques n'est pas limitée par le réseau,
le débit séquentiel cumulé de plusieurs volumes d'instance peut être supérieur à
celui d'Amazon EBS, pour un nombre de volumes identique.
Amazon Web Services – Vue d'ensemble des services de stockage AWS Novembre 2015
Page 29 sur 50
En raison de la façon dont Amazon EC2 virtualise les disques, la première
opération d'écriture sur un quelconque emplacement d'un volume de stockage
d'instance s'effectue plus lentement que les écritures suivantes. Pour la plupart
des applications, l'amortissement de ce coût sur la durée de vie de l'instance est
acceptable. Cependant, si vous exigez des performances de disque élevées, il est
recommandé de préchauffer vos disques en écrivant une fois sur chaque
emplacement disque avant l'utilisation en production. Les types d'instance I2,
R3 et HI1 utilisent la sauvegarde sur disques SSD attachés directement qui
fournit des performances maximales au lancement, sans préchauffage.
De plus, les volumes basés sur le stockage d'instance R3 et I2 prennent en charge
la commande TRIM sur les instances Linux. Pour ces volumes, vous pouvez
utiliser la commande TRIM pour informer le contrôleur SSD chaque fois que
vous n'avez plus besoin des données que vous avez écrites. Cette notification
fournit au contrôleur plus d'espace disponible, ce qui peut réduire l'amplification
d'écriture et augmenter les performances.
Les volumes de stockage d'instance SSD dans les instances d'E/S élevées
Amazon EC2 fournissent des dizaines de milliers à des centaines de milliers
d'IOPS aléatoires de 4 Ko de faible latence. En raison des caractéristiques d'E/S
des périphériques SSD, les performances en écriture sont variables. Pour de plus
amples informations, veuillez consulter la section Instances d'E/S élevées dans le
Guide de l'utilisateur Amazon EC2.25
Les volumes de stockage d'instance dans les instances à stockage élevé
Amazon EC2 fournissent une densité de stockage très élevée et d'excellentes
performances en lecture/écriture par instance. Pour de plus amples informations,
veuillez consulter la section Instances à stockage élevé dans le Guide de
l'utilisateur Amazon EC2.26
Amazon Web Services – Vue d'ensemble des services de stockage AWS Novembre 2015
Page 30 sur 50
Durabilité et disponibilité
Les volumes de stockage d'instance locaux Amazon EC2 ne sont pas conçus pour
être utilisés en tant que stockage durable sur disque. Contrairement aux données
de volume Amazon EBS, les données figurant dans les volumes de stockage
d'instance ne sont maintenues que pendant la durée de vie de l'instance
Amazon EC2 associée. Cette fonctionnalité signifie que les données des volumes
de stockage d'instance sont maintenues à travers les redémarrages d'instance
ordonnés, mais si l'instance Amazon EC2 est arrêtée, puis redémarrée, prend fin
ou échoue, toutes les données des volumes de stockage d'instance sont perdues.
Pour plus d'informations sur le cycle de vie d'une instance Amazon EC2, consultez
la section Cycle de vie d'une instance dans le Guide de l'utilisateur Amazon EC2.27
Nous vous conseillons de ne pas utiliser les volumes de stockage d'instance locaux
pour des données qui doivent être conservées dans le temps, telles que des fichiers
permanents ou le stockage de base de données, sans fournir de persistance de
données par le biais de la réplication de données ou la copie régulière des données
dans un dispositif de stockage durable tel qu'Amazon
EBS ou Amazon S3. Notez que cette recommandation s'applique également aux
volumes de stockage d'instance SSD à usage général et à haute densité dans les
types d'instance de stockage élevé et d'E/S élevées.
Evolutivité et élasticité
Le nombre et la capacité de stockage des volumes de stockage d'instance locaux
Amazon EC2 sont déterminés par le type d'instance. Bien que vous ne puissiez ni
augmenter ni diminuer le nombre de volumes de stockage d'instance sur une
instance Amazon EC2 unique, ce stockage est toujours évolutif et élastique ; vous
pouvez dimensionner le nombre total de stockage d'instance en augmentant ou
diminuant le nombre d'instances Amazon EC2 en cours d'exécution.
Pour obtenir une élasticité complète du stockage, intégrez une des autres options
de stockage adaptées, telles qu'Amazon S3 ou Amazon EFS, à votre stratégie de
stockage Amazon EC2.
Amazon Web Services – Vue d'ensemble des services de stockage AWS Novembre 2015
Page 31 sur 50
Sécurité
IAM vous aide à contrôler de façon sécurisée quels utilisateurs peuvent effectuer
des opérations telles que le lancement et l'arrêt des instances EC2 sur votre
compte, et les volumes de stockage d'instance peuvent uniquement être montés et
utilisés depuis les instances EC2 auxquelles ils appartiennent. De même, quand
vous arrêtez une instance ou que vous y mettez fin, les applications et les données
figurant dans son stockage d'instance sont effacées, et par conséquent aucune
autre instance ne pourra accéder à l'avenir au stockage d'instance.
L'accès à une instance EC2 est contrôlé par le système d'exploitation invité. Si
vous vous souciez de la confidentialité des données sensibles stockées dans un
volume de stockage d'instance, nous vous recommandons de chiffrer vos données
pour plus de sécurité. Pour cela, vous pouvez vous servir de vos propres outils de
chiffrement ou utiliser les outils de chiffrement tiers disponibles sur AWS
Marketplace.28
Interfaces
Il n'existe pas d'API de gestion séparée pour les volumes de stockage d'instance
Amazon EC2. En revanche, les volumes de stockage d'instance sont spécifiés à
l'aide de la fonctionnalité de mappage de périphérique de stockage en mode bloc
de l'API Amazon EC2 et de la console AWS Management Console. Vous ne pouvez
pas créer ou détruire des volumes de stockage d'instance, mais vous pouvez
décider s'ils sont exposés ou non à l'instance Amazon EC2, et à quel nom de
périphérique chaque volume est mappé.
Il n'existe pas non plus d'API de données séparée pour les volumes de stockage
d'instance. Tout comme les volumes Amazon EBS, les volumes de stockage
d'instance présentent une interface de périphérique de stockage en mode bloc à
l'instance Amazon EC2. Cela signifie que pour l'instance Amazon EC2, un volume
de stockage d'instance apparaît comme un disque dur local. Pour écrire des
données dans les volumes de stockage d'instance, ainsi que pour les lire, vous
utilisez les interfaces d'E/S du système de fichiers natif de votre système
d'exploitation.
Amazon Web Services – Vue d'ensemble des services de stockage AWS Novembre 2015
Page 32 sur 50
Notez que dans certains cas, un périphérique de volume de stockage d'instance
local est attaché à une instance Amazon EC2 au lancement, mais doit être
formaté avec un système de fichier approprié et monté avant de pouvoir l'utiliser.
De même, vous devez suivre attentivement l'état de vos mappages de
périphérique de stockage en mode bloc. Il n'existe pas de méthode simple pour
une application s'exécutant sur une instance Amazon EC2 pour déterminer quel
périphérique de stockage en mode bloc est un volume (éphémère) de stockage
d'instance et lequel est un volume (permanent) Amazon EBS.
Modèle de coût
Le coût d'une instance Amazon EC2 inclut tous les volumes de stockage
d'instance locaux, si le type d'instance les a fournis. Aucun frais supplémentaire
ne s'applique pour le stockage de données sur des volumes de stockage d'instance
local, cependant, le transfert de données depuis et vers les volumes de stockage
d'instance Amazon EC2 depuis d'autres zones de disponibilité ou en dehors de la
région Amazon EC2 peut entraîner des frais de transfert de données, et des frais
supplémentaires s'appliquent pour l'utilisation de tout stockage permanent, tel
que Amazon S3, Amazon Glacier, les volumes Amazon EBS et les instantanés
Amazon EBS. Les informations relatives au tarif d'Amazon EC2, Amazon EBS et
du transfert de données sont disponibles à la page de tarification Amazon EC2.29
AWS Storage Gateway Le service AWS Storage Gateway connecte un composant logiciel sur site à une
unité de stockage basée sur le cloud, afin d'assurer une intégration continue et
sécurisée entre l'environnement informatique sur site d'une entreprise et
l'infrastructure de stockage AWS. Ce service vous permet de stocker vos données,
en toute sécurité, dans le cloud AWS, et de bénéficier d'un stockage évolutif et
économique. AWS Storage Gateway prend en charge les protocoles de stockage
standard du secteur, compatibles avec vos applications existantes. Il offre des
performances à faible latence en maintenant les données auxquelles vous
accédez fréquemment sur site, tout en sécurisant le stockage de toutes vos
données chiffrées dans Amazon S3 ou Amazon Glacier. Pour les scénarios de
reprise après sinistre, AWS Storage Gateway peut, combiné à Amazon EC2,
servir de solution hébergée dans le cloud mettant en miroir la totalité de votre
environnement de production.
Amazon Web Services – Vue d'ensemble des services de stockage AWS Novembre 2015
Page 33 sur 50
Vous pouvez télécharger le composant logiciel AWS Storage Gateway en tant
qu'image de machine virtuelle (VM) que vous installez sur un hôte de votre
centre de données ou en tant qu'instance EC2. Une fois votre passerelle Gateways
installée et associée à votre compte AWS via le processus d'activation AWS, vous
pouvez utiliser AWS Management Console pour créer des volumes mis en cache
sur Gateway, des volumes stockés sur Gateway ou une bibliothèque de bandes
virtuelles (VTL) sur Gateway, chacun pouvant être monté en tant que
périphérique iSCSI par vos applications sur site.
Avec les volumes mis en cache sur Gateway, vous pouvez utiliser Amazon S3 pour
conserver vos données principales, tout en conservant une partie de ces données
dans un cache local pour les accès plus fréquents. Ces volumes mis en cache sur
Gateway minimisent le besoin de mettre à l'échelle votre infrastructure de
stockage sur site, tout en fournissant à vos applications un accès à faible latence
aux données fréquemment consultées. Vous pouvez créer des volumes
de stockage pouvant aller jusqu'à 32 To et les monter en tant que périphériques
iSCSI depuis vos serveurs d'applications sur site. Chaque passerelle Gateway
configurée pour les volumes mis en cache sur Gateway prend en charge jusqu'à
20 volumes et un stockage de volume total de 150 To. Les données écrites sur ces
volumes sont stockées dans Amazon S3, avec uniquement un cache des données
récemment écrites et récemment consultées stockées localement sur votre
équipement de stockage sur site.
Les volumes stockés sur Gateway stockent vos données principales localement,
tout en les sauvegardant de manière asynchrone dans AWS. Ces volumes
fournissent à vos applications sur site un accès à faible latence pour vos
ensembles de données, tout en permettant des sauvegardes durables hors site.
Vous pouvez créer des volumes de stockage pouvant aller jusqu'à 1 To et les
monter en tant que périphériques iSCSI depuis vos serveurs d'applications sur
site. Chaque passerelle Gateway configurée pour les volumes stockés sur Gateway
prend en charge jusqu'à 12 volumes et un stockage de volume total de 12 To. Les
données écrites sur les volumes stockés sur Gateway sont stockées sur votre
équipement de stockage sur site, et sauvegardées de manière asynchrone dans
Amazon S3, sous forme d'instantanés Amazon EBS.
Amazon Web Services – Vue d'ensemble des services de stockage AWS Novembre 2015
Page 34 sur 50
Une passerelle VTL (Gateway-VTL) vous permet d'effectuer un archivage des
données hors ligne en présentant votre application de sauvegarde existante avec
une bibliothèque de bandes virtuelles iSCSI constituée d'un convertisseur média
virtuel et de lecteurs de bandes virtuelles. Vous pouvez créer des bandes
virtuelles dans votre VTL à l'aide de AWS Management Console et dimensionner
chaque bande virtuelle de 100 Go à 2,5 To. Une VTL peut conserver jusqu'à
1 500 bandes virtuelles, avec une capacité cumulée maximale de 150 To. Une fois
les bandes virtuelles créées, votre application de sauvegarde les détecte grâce à sa
procédure d'inventaire multimédia standard. Une fois créées, les bandes sont
accessibles immédiatement et stockées dans Amazon S3.
Nous vous recommandons de stocker les bandes virtuelles que vous devez
consulter fréquemment dans une VTL. Les données que vous avez rarement
besoin de récupérer peuvent être archivées dans votre étagère de bandes
virtuelles (VTS, Virtual Tape Shelf), sauvegardée dans Amazon Glacier, réduisant
encore ainsi vos coûts de stockage.
Modèles d'utilisation
Les organisations ont recours à AWS Storage Gateway pour répondre à un certain
nombre de cas d'utilisation. Ces cas d'utilisation incluent le partage de fichiers
d'entreprise, l'activation des applications de sauvegarde sur site existantes pour
stocker des sauvegardes principales dans Amazon S3, la reprise après sinistre et
la mise en miroir des données sur des ressources informatiques dans le cloud,
puis leur archivage par la suite dans Amazon Glacier.
Amazon Web Services – Vue d'ensemble des services de stockage AWS Novembre 2015
Page 35 sur 50
Performances
Comme la machine virtuelle AWS Storage Gateway se trouve entre votre
application, Amazon S3 et le stockage sur site sous-jacent, les performances réelles
dépendent d'un certain nombre de facteurs. Ces facteurs sont notamment le débit
et la configuration de vos disques locaux sous-jacents, la bande passante réseau
entre votre initiateur iSCSI et la machine virtuelle de la passerelle, la quantité de
stockage local alloué à la machine virtuelle de la passerelle et la bande passante
entre la machine virtuelle de la passerelle et Amazon S3. Concernant les volumes
mis en cache sur Gateway, pour fournir un accès en lecture à faible latence à vos
applications sur site, il est important de fournir suffisamment de stockage local en
cache pour stocker vos données récemment consultées. La documentation sur
AWS Storage Gateway fournit des recommandations sur l'optimisation de la
configuration de votre environnement pour obtenir de meilleures performances,
notamment sur le dimensionnement approprié de votre stockage local.30
AWS Storage Gateway utilise votre bande passante Internet de manière efficace
pour accélérer le chargement de vos données d'application sur site dans AWS. La
passerelle AWS Storage Gateway charge uniquement les données modifiées, ce
qui réduit la quantité de données envoyées sur Internet. Pour améliorer encore le
débit et réduire vos coûts de réseau, vous pouvez également utiliser AWS Direct
Connect pour établir une connexion réseau dédiée entre votre passerelle sur site
et AWS.31
Durabilité et disponibilité
AWS Storage Gateway stocke de manière durable vos données d'application sur
site en les chargeant dans Amazon S3 ou Amazon Glacier. Conçus pour fournir
une durabilité annuelle moyenne de 99,99999999999 %, ces deux services AWS
stockent les données dans plusieurs installations et sur plusieurs appareils au
sein de chaque installation. Ils effectuent également des contrôles réguliers et
systématiques de l'intégrité des données et sont conçus de façon à pouvoir
bénéficier d'une réparation automatique.
Amazon Web Services – Vue d'ensemble des services de stockage AWS Novembre 2015
Page 36 sur 50
Evolutivité et élasticité
Dans les deux configurations de volume mis en cache ou stocké sur Gateway,
AWS Storage Gateway stocke les données dans Amazon S3, qui a été conçu pour
offrir de façon automatique un très haut niveau d'évolutivité et d'élasticité.
Contrairement à un système de fichiers classique qui peut rencontrer des
problèmes lors du stockage d'un grand nombre de fichiers dans un répertoire,
Amazon S3 prend en charge un nombre presque illimité de fichiers dans
n'importe quel compartiment. De même, contrairement à un disque dur qui peut
stocker une quantité totale limitée de données avant de devoir partitionner les
données sur les lecteurs ou serveurs, un compartiment Amazon S3 peut stocker
un nombre presque illimité d'octets. Vous pouvez stocker un nombre illimité
d'objets et Amazon S3 gère le dimensionnement et la distribution des copies
redondantes de vos informations vers d'autres serveurs sur d'autres sites de la
même région, qui utilisent tous l'infrastructure haute performance d'Amazon.
Dans une configuration de passerelle VTL, AWS Storage Gateway stocke les
données dans Amazon S3 ou Amazon Glacier, fournissant une infrastructure de
bande virtuelle qui évolue en toute transparence pour répondre à vos besoins
professionnels et éliminer la lourde tâche de mise à disposition, de mise à
l'échelle et d'entretien d'une infrastructure de bande virtuelle.
Sécurité
IAM vous aide à assurer la sécurité grâce à un dispositif de contrôle d'accès à
AWS Storage Gateway. Avec IAM, vous pouvez créer plusieurs utilisateurs IAM
sous votre compte AWS. L'API AWS Storage Gateway active une série d'actions
que chaque utilisateur IAM peut effectuer sur AWS Storage Gateway.32
AWS Storage Gateway chiffre toutes les données en transit vers et depuis AWS en
utilisant SSL. Toutes les données d'instantané et de volume stockées dans AWS à
l'aide des volumes stockés ou mise en cache sur Gateway et toutes les données de
bandes virtuelles stockées dans AWS à l'aide d'une passerelle VTL sont chiffrées
au repos avec AES-256, une norme de chiffrement par clé symétrique sécurisé
utilisant des clés de chiffrement 256 bits. AWS Storage Gateway prend en charge
l'authentification entre votre passerelle et les initiateurs iSCSI via le protocole
CHAP (Challenge-Handshake Authentication Protocol).
Amazon Web Services – Vue d'ensemble des services de stockage AWS Novembre 2015
Page 37 sur 50
Interfaces
AWS Management Console permet de télécharger la machine virtuelle AWS
Storage Gateway sur sites ou dans une instance Amazon EC2 (AMI contenant
l'image de la machine virtuelle de la passerelle). Il vous suffit alors de choisir
entre la configuration de stockage mise en cache sur Gateway, stocké sur
Gateway ou passerelle VTL et d'activer votre passerelle de stockage en associant
son adresse IP à votre compte AWS. Les étapes du déploiement d'AWS Storage
Gateway sont détaillées à la section Démarrage du Guide de l'utilisateur AWS
Storage Gateway.33
L'interface AWS CLI intégrée fournit également un ensemble de commandes
supérieures de type Linux pour les opérations courantes du service AWS Storage
Gateway.
Vous pouvez également vous servir des kits SDK AWS pour développer des
applications qui interagissent avec AWS Storage Gateway. Les kits SDK AWS
pour Java, .NET, JavaScript/Node.js, Ruby, PHP, et Go encapsulent les API AWS
Storage Gateway sous-jacentes pour simplifier vos tâches de programmation.
Modèle de coût
Avec AWS Storage Gateway, vous ne payez que ce que vous utilisez. La
tarification d'AWS Storage Gateway s'appuie sur les composantes suivantes :
utilisation de la passerelle (par passerelle par mois), utilisation du stockage
d'instantané (par Go par mois), utilisation du stockage de volume (par Go par
mois), stockage d'étagère de bandes virtuelles (par Go par mois), stockage de
bibliothèque de bandes virtuelles (par Go par mois), récupération depuis une
étagère de bandes virtuelle (par Go) et transfert de données sortantes (par Go par
mois). Les informations relatives au tarif sont disponibles à page de tarification
AWS Storage Gateway.34
Amazon Web Services – Vue d'ensemble des services de stockage AWS Novembre 2015
Page 38 sur 50
AWS Import/Export Snowball AWS Import/Export Snowball (AWS Snowball) accélère le transfert de grandes
quantités de données vers et hors d'AWS en utilisant les composants Snowball
sécurisés. Le composant AWS Snowball est conçu à cet effet pour transférer et
stocker des données de manière efficace. Il est suffisamment robuste pour
supporter un choc de 6 G et léger (moins de 50 livres (environ 22 kg) pour être
transporté par une seule personne. Il est entièrement indépendant, avec une
alimentation et une connexion réseau de 10 Go à l'arrière, et un écran E Ink et
un panneau de configuration à l'avant. Chaque Snowball est résistant aux
intempéries et constitue son propre conteneur d'expédition.
AWS transfère directement les données sur et à partir de vos périphériques de
stockage Snowball à l'aide du réseau interne à haut débit d'Amazon, sans passer
par Internet. Pour les ensembles de données volumineux, AWS Import/Export
Snowball se révèle souvent plus rapide qu'un transfert via Internet, et plus
économique que la mise à niveau de votre connectivité. AWS Import/Export
Snowball prend en charge l'importation et l'exportation des données depuis et
vers des compartiments Amazon S3. A partir de là, les données peuvent être
copiées ou déplacées vers d'autres services AWS, comme Amazon EBS et
Amazon Glacier.
Modèles d'utilisation
AWS Import/Export Snowball est idéal pour transférer n'importe où des
téraoctets de données, voire de nombreux pétaoctets, dans ou depuis le cloud
AWS en toute sécurité, particulièrement dans les cas où vous ne souhaitez pas
effectuer des mises à jour coûteuses sur votre infrastructure réseau
(rencontrant fréquemment de grands nombres de données), vous êtes dans un
environnement physiquement isolé ou dans une zone sans connexion Internet
haut-débit disponible ou coûteuse à mettre en place. En règle générale, si le
chargement de vos données via Internet prend au moins une semaine, vous
devez envisager d'utiliser AWS Import/Export Snowball.
Amazon Web Services – Vue d'ensemble des services de stockage AWS Novembre 2015
Page 39 sur 50
Les cas d'utilisation courants incluent notamment la migration dans le cloud,
la reprise après sinistre, la mise hors service du centre de données et la
distribution de contenu. Quand vous mettez un centre de données hors service,
plusieurs étapes permettent de se prémunir contre la perte des données critiques
et Snowball garantit un transfert sécurisé et économique des données dans AWS.
Dans un scénario de distribution de contenu, vous pouvez utiliser les composants
Snowball si vous recevez régulièrement de grandes quantités de données ou que
vous devez les partager avec des clients ou des collaborateurs. Les composants
Snowball sont envoyés depuis AWS directement sur les sites des clients.
Toutefois, AWS Import/Export Snowball ne constitue peut-être pas la meilleure
solution si vos données peuvent être transférées via Internet en moins d'une
semaine.
Performances
Le composant Snowball est conçu pour transférer et stocker des données de
manière efficace, incluant une connexion réseau haut débit de 10 Gbit/s conçue
pour réduire le temps de transfert de données, vous permettant de transférer
jusqu'à 50 téraoctets de données depuis votre source de données vers le
composant en moins d'une journée, plus le temps d'expédition.
Vous pouvez utiliser le client Snowball pour estimer la durée du transfert de vos
données (consultez le Guide de l'utilisateur AWS Import/Export pour obtenir
plus d'informations).35 Cela peut pendre 13 heures environ pour copier 50 To de
données depuis votre source de données vers un composant Snowball avec une
connexion locale de 10 Gbit/s, supposant une utilisation du réseau à 80 %. Dans
ce cas, la durée du transfert de données de bout en bout dans AWS est d'environ
une semaine, en comptant le délai d'expédition et de traitement par défaut des
centres de données AWS. La copie de 100 To de données peut s'effectuer dans la
même durée en utilisant deux Snowballs 50 To en parallèle.
En général, vous pouvez améliorer le débit du transfert depuis votre source de
données vers le Snowball en limitant l'utilisation du réseau local, en éliminant
les bonds inutiles entre le Snowball et la station de travail, et en utilisant un
ordinateur puissant comme station de travail.
Amazon Web Services – Vue d'ensemble des services de stockage AWS Novembre 2015
Page 40 sur 50
Durabilité et disponibilité
Une fois les données importées dans AWS, les caractéristiques de durabilité et de
disponibilité du stockage cible s'appliquent. Amazon S3 est conçu pour une
durabilité de 99,999999999 % (lisez « onze-neuf »).
Evolutivité et élasticité
Chaque composant AWS Import/Export Snowball est capable de stocker 50 To
de données. Pour transférer davantage de données, vous pouvez utiliser plusieurs
composants. Pour Amazon S3, les fichiers individuels sont chargés en tant
qu'objets pouvant aller jusqu'à 5 To, mais vous pouvez charger un nombre
illimité d'objets dans Amazon S3. La quantité totale cumulée de données pouvant
être importées est quasiment illimitée.
Sécurité
Vous pouvez intégrer AWS Import/Export Snowball à IAM pour contrôler les
actions qu'un utilisateur est habilité à exécuter.36 Vous pouvez octroyer aux
utilisateurs IAM de votre compte AWS un accès à toutes les actions Snowball ou à
un sous-ensemble d'actions. De même, un utilisateur IAM qui crée une tâche
AWS Import/Export Snowball doit avoir les autorisations nécessaires pour
accéder aux compartiments Amazon S3 qui seront utilisés pour les opérations
d'importation. Vous pouvez contrôler l'accès au Snowball grâce à une distribution
minutieuse du manifeste de la tâche et du code de déverrouillage.
Pour AWS Import/Export Snowball, AWS Key Management Service (AWS KMS)
protège les clés de chiffrement utilisées pour protéger les données sur chaque
Snowball.37 Lorsque vous créez votre tâche, vous choisissez ou créez également
un nom de tâche Amazon Resource Name (ARN), pour une clé AWS KMS que
vous possédez. La mention d'un ARN de clé AWS KMS indique au Snowball la clé
AWS KMS principale à utiliser pour chiffrer les clés uniques sur le Snowball.
AWS Import/Export Snowball est sécurisé physiquement à l'aide d'un TPM
(Trusted Platform Module) standard dans le secteur qui s'appuie sur un
processeur dédié qui détecte toutes modifications non autorisées apportées au
matériel, au microprogramme ou au logiciel.
Amazon Web Services – Vue d'ensemble des services de stockage AWS Novembre 2015
Page 41 sur 50
Interfaces
Voici la procédure d'implémentation d'un Snowball pour l'importation de vos
données dans AWS.
1. Pour commencer, vous devez vous connecter à la console de gestion AWS
Import/Export Snowball et créer une tâche.
2. AWS prépare alors un Snowball pour votre tâche.
3. Le Snowball vous est alors expédié via UPS. Votre numéro de suivi et
un lien vers le site Web de suivi UPS sont disponibles sur la console de
gestion AWS Import/Export Snowball.
4. Quelques jours après, UPS vous livre le Snowball à l'adresse que vous avez
indiquée lors de la création de la tâche.
5. Ensuite, préparez-vous pour le transfert de vos données en récupérant vos
informations d'identification, le manifeste de votre tâche et le code de
déverrouillage du manifeste, et en téléchargeant le client Snowball. Le
client Snowball est l'outil qui permet de gérer le flux de données depuis
votre source de données sur site, vers le Snowball.
6. Installez le client Snowball sur la station de travail de l'ordinateur qui
contient votre source de données.
7. Déplacez le Snowball dans votre centre de données, ouvrez-le et branchez-
le sur l'alimentation, puis connectez-le à votre réseau local.
8. Mettez le Snowball sous-tension et lancez le client Snowball. Vous
indiquez l'adresse IP du Snowball, le chemin d'accès à votre manifeste et le
code de déverrouillage.
Le client Snowball déchiffre le manifeste et s'en sert pour authentifier
votre accès au Snowball.
9. Utilisez alors le client Snowball pour transférer les données à importer
dans Amazon S3 depuis votre source de données vers le Snowball.
10. Une fois vos données transférées, mettez le Snowball hors tension et retirez
les câbles. L'étiquette d'expédition E Ink s'actualise automatiquement pour
afficher l'installation AWS pour l'envoi, et vous pouvez suivre l'état de la
tâche à l'aide du service Amazon Simple Notification Services (Amazon
SNS), de la messagerie texte ou directement depuis la console.38
11. UPS renvoie le Snowball à AWS.
12. AWS reçoit le Snowball et importe vos données dans Amazon S3. En
moyenne, il faut compter une journée pour qu'AWS lance l'importation de
vos données dans S3, et l'importation peut prendre plusieurs jours. En cas
de complications ou de problèmes, nous vous contactons par e-mail.
Amazon Web Services – Vue d'ensemble des services de stockage AWS Novembre 2015
Page 42 sur 50
Une fois la tâche de transfert de données traitée et vérifiée, AWS procède à la
suppression logicielle du composant Snowball conformément aux directives du
National Institute of Standards and Technology (NIST) for media sanitization.
Modèle de coût
Avec AWS Import/Export Snowball, comme avec la plupart des autres services
AWS, vous payez uniquement pour ce que vous utilisez. La tarification d'AWS
Import/Export Snowball compte trois composantes : frais de service (par tâche),
frais de journée supplémentaire au besoin (les premiers 10 jours d'utilisation sur
site sont gratuits) et transfert de données. En ce qui concerne le stockage de
destination, la tarification du stockage Amazon S3 standard s'applique. Les
informations relatives au tarif sont disponibles à la page de tarification AWS
Import/Export.39
Amazon CloudFront Amazon CloudFront est un service Web de diffusion de contenu qui accélère la
distribution des contenus dynamiques, statiques et diffusés en continu de votre
site Web en le rendant disponible depuis un réseau mondial d'emplacements
périphériques. Quand un utilisateur demande le contenu que vous proposez avec
Amazon CloudFront, l'utilisateur est dirigé vers l'emplacement périphérique qui
fournit la latence la plus faible et, par conséquent, le contenu est remis avec de
meilleures performances que si l'utilisateur était passé par un centre de données
plus éloigné. Si le contenu se trouve déjà dans l'emplacement périphérique avec
la plus faible latence, Amazon CloudFront le remet immédiatement. Si le contenu
ne se trouve pas actuellement dans cet emplacement périphérique, Amazon
CloudFront l'extrait d'un compartiment Amazon S3 ou d'un serveur HTTP (par
exemple, un serveur Web) que vous avez identifié comme la source de la version
définitive de votre contenu. Amazon CloudFront met en cache vos contenus aux
emplacements périphériques pour une période que vous définissez.
Amazon Web Services – Vue d'ensemble des services de stockage AWS Novembre 2015
Page 43 sur 50
Amazon CloudFront prend en charge tous les fichiers qui peuvent être délivrés
sur HTTP. Ces fichiers comprennent des pages Web dynamiques (des pages
HTML ou PHP, par exemple) et tous les fichiers statiques populaires qui font
partie de votre application Web, tels que les images, les fichiers audio, les vidéos,
les fichiers multimédias ou les téléchargements de logiciels. Pour des fichiers
multimédias à la demande, vous pouvez également choisir de diffuser votre
contenu en continu à l'aide du protocole RTMP (Real-Time Messaging Protocol).
Amazon CloudFront prend également en charge la diffusion de fichiers
multimédias en direct sur HTTP.
Amazon CloudFront est optimisé pour fonctionner avec d'autres services AWS,
tels qu'Amazon S3, Amazon EC2, Elastic Load Balancing et Amazon Route 53.
Amazon CloudFront fonctionne aussi sans problème avec n'importe quel serveur
d'origine tiers sur lequel vous stockez les versions définitives et originales de vos
fichiers.
Modèles d'utilisation
Amazon CloudFront est idéal pour la diffusion de contenu statique fréquemment
consulté qui bénéficie de la diffusion périphérique, tel que les images de sites
Web populaires, les vidéos, les fichiers multimédias ou les téléchargements de
logiciels. Amazon CloudFront permet également de fournir des applications
Web dynamiques sur HTTP. Ces applications peuvent inclure du contenu
statique, du contenu dynamique ou un site entier constitué des deux. Amazon
CloudFront est également couramment utilisé pour la diffusion en continu de
fichiers audio et vidéo sur les navigateurs Web et les appareils mobiles. Pour
mieux comprendre vos modèles d'utilisation en tant qu'utilisateur final, vous
pouvez consulter les rapports Amazon CloudFront.40
Si vous avez besoin de supprimer un objet des caches du serveur périphérique
Amazon CloudFront avant sa date d'expiration, vous pouvez invalider l'objet ou
utiliser la gestion des versions pour diffuser une version différente de l'objet qui
a un nom différent.41 42 De plus, il est conseillé de diffuser des données rarement
consultées directement depuis le serveur d'origine, évitant ainsi les frais
supplémentaires liés à l'accès depuis l'origine des données qui risquent de ne
plus être réutilisées en périphérie.
Amazon Web Services – Vue d'ensemble des services de stockage AWS Novembre 2015
Page 44 sur 50
Performances
Amazon CloudFront est conçu pour la diffusion de contenu à faible latence et à
bande passante élevée. Amazon CloudFront accélère la distribution des contenus
en acheminant les utilisateurs finaux vers l'emplacement périphérique le mieux
placé pour répondre à la demande de l'utilisateur final dans un réseau mondial
d'emplacements périphériques. En règle générale, les demandes sont acheminées
vers l'emplacement périphérique Amazon CloudFront le plus proche en terme de
latence. Cette approche réduit considérablement le nombre de réseaux que
l'utilisateur final doit traverser et améliore ainsi les performances. Les utilisateurs
bénéficient alors d'une latence plus faible (ici la latence désigne le temps de
chargement du premier octet d'un objet) et des vitesses de transfert de données
soutenues supérieures requises pour fournir des objets populaires à l'échelle.
Durabilité et disponibilité
Un réseau de distribution de contenu étant un cache périphérique, Amazon
CloudFront n'offre pas de stockage durable. Le serveur d'origine, tel
qu'Amazon S3 ou un serveur Web s'exécutant sur Amazon EC2, fournit le
stockage de fichiers durable requis. Amazon CloudFront assure un haut niveau de
disponibilité grâce à un réseau mondial distribué d'emplacements périphériques.
Les demandes d'origine provenant des emplacements périphériques des serveurs
d'origine AWS (Amazon EC2, Amazon S3, par exemple) sont transmises aux
chemins d'accès réseau constamment gérés et optimisés par Amazon en termes
de disponibilité et de performances. Ce réseau périphérique offre de meilleurs
niveaux de fiabilité et de disponibilité grâce à la suppression de tout point central
de défaillance. Les copies de vos fichiers sont désormais conservées dans des
emplacements périphériques à travers le monde.
Amazon Web Services – Vue d'ensemble des services de stockage AWS Novembre 2015
Page 45 sur 50
Evolutivité et élasticité
Amazon CloudFront est conçu pour fournir une évolutivité et une élasticité
transparentes. Vous pouvez facilement débuter avec très peu de connexions et
vous développer jusqu'à atteindre un volume important de connexions
internationales. Avec Amazon CloudFront, vous n'avez pas à vous soucier de la
gestion de la capacité du serveur Web coûteuse pour répondre aux pics de trafic
potentiels générés par la demande de vos contenus. Le service répond
automatiquement au fur et à mesure que la demande pour vos contenus évolue,
sans aucune intervention de votre part.
Amazon CloudFront utilise également plusieurs couches de mise en cache à chaque
emplacement périphérique et regroupe les demandes simultanées pour un même
objet avant de contacter votre serveur d'origine. Ces améliorations permettent de
réduire davantage le besoin de mettre à l'échelle votre infrastructure d'origine au
fur et à mesure que votre site Web devient plus populaire.
Sécurité
Amazon CloudFront est un service de distribution de vos données très sécurisé.
Il s'intègre à IAM pour vous permettre de créer des utilisateurs pour votre
compte AWS et d'indiquer les actions Amazon CloudFront qu'un utilisateur (ou
un groupe d'utilisateurs) est habilité à exécuter sur votre compte AWS.
Vous pouvez configurer Amazon CloudFront de manière à créer des fichiers
journaux qui contiennent les informations détaillées sur chaque demande
d'utilisateur reçue par Amazon CloudFront. Ces journaux d'accès sont disponibles
pour les distributions Web et RTMP.43 De plus, Amazon CloudFront s'intègre aux
métriques Amazon CloudWatch pour que vous puissiez gérer votre site Web ou
votre application.44
Interfaces
Vous pouvez gérer et configurer Amazon CloudFront de plusieurs façons. AWS
Management Console offre un moyen simple de gérer Amazon CloudFront et
prend en charge toutes les API Amazon CloudFront. Par exemple, vous pouvez
activer ou désactiver les distributions, configurer les CNAME et activer la
journalisation des utilisateurs finaux à l'aide de la console. Vous pouvez
également utiliser les outils de ligne de commande Amazon CloudFront,
l'API REST native ou un des kits SDK pris en charge.
Amazon Web Services – Vue d'ensemble des services de stockage AWS Novembre 2015
Page 46 sur 50
Nul besoin d'API de données pour Amazon CloudFront, et vous n'avez pas besoin
de commande pour précharger des données. En revanche, les données sont
automatiquement chargées dans les emplacements périphériques Amazon
CloudFront dès le premier accès à un objet depuis cet emplacement.
Modèle de coût
L'utilisation d'Amazon CloudFront ne nécessite aucun contrat à long terme, ni
engagement mensuel d'utilisation minimale ; vous ne payez que pour le volume
de contenu réellement traité via ce service. La tarification d'Amazon CloudFront
comprend deux composantes : le transfert régional de données sortantes (par Go)
et les demandes (par tranche de 10 000). Dans le cadre du niveau gratuit, les
nouveaux clients AWS bénéficient gratuitement de 50 Go de transfert de données
sortantes et de 2 000 000 requêtes HTTP et HTTPS par mois, pendant un an.
Notez que si vous utilisez un service AWS comme origine (Amazon S3,
Amazon EC2, Elastic Load Balancing ou autres, par exemple), les données
transférées depuis l'origine vers les emplacements périphériques (« accès depuis
l'origine » Amazon CloudFront) ne seront pas facturées. Le transfert de données
sortantes d'Amazon CloudFront vers votre serveur d'origine sera facturé au tarif
« Transfert régional de données sortantes depuis l'origine ».
CloudFront propose trois classes de prix en fonction de l'endroit où vous devez
distribuer vos contenus. Si vous n'avez pas besoin de distribuer votre contenu à
travers le monde, mais à certains emplacements uniquement comme aux Etats-
Unis et en Europe par exemple, vous pouvez réduire vos frais de distribution en
choisissant une classe de prix qui inclut uniquement ces emplacements.
Bien qu'aucun engagement mensuel ni aucun contrat à long terme ne soit requis,
CloudFront propose toutefois un programme de planification de capacité
réservée (facultatif) qui vous permet de vous engager pour un niveau d'utilisation
mensuel minimum pendant 12 mois, ou plus, et en retour de bénéficier d'une
remise considérable. Les informations relatives au tarif sont disponibles à la page
de tarification Amazon CloudFront.45
Amazon Web Services – Vue d'ensemble des services de stockage AWS Novembre 2015
Page 47 sur 50
Collaborateurs Les personnes qui suivent ont participé à l'élaboration de ce document :
Shruti Worlikar, architecte de solutions, Amazon Web Services
Fabio Silva, architecte de solutions, Amazon Web Services
Références et suggestions de lecture
Services de stockage AWS
Amazon S346
Amazon Glacier47
Amazon EBS48
Amazon EC2 Instance Store49
AWS Storage Gateway50
AWS Import/Export Snowball51
Amazon CloudFront52
Amazon Web Services – Vue d'ensemble des services de stockage AWS
Novembre 2015
Page 48 sur 50
Autres ressources
Kits SDK AWS, boîtes à outils IDE et outils de ligne de commande53
Calculateur de coûts mensuels Amazon Web Services54
Blog Amazon Web Services55
Forums Amazon Web Services56
Niveau gratuit d'AWS57
Etude de cas AWS58
Notes
1 https://docs.aws.amazon.com/AmazonS3/latest/dev/crr.html
2 http://docs.aws.amazon.com/AmazonS3/latest/dev/uploadobjusingmpu.html
3 http://docs.aws.amazon.com/AmazonS3/latest/dev/access-control-overview.html#access-
control-resources-manage-permissions-basics
4 http://docs.aws.amazon.com/AmazonS3/latest/dev/serv-side-encryption.html
5 http://docs.aws.amazon.com/AmazonS3/latest/dev/UsingClientSideEncryption.html
6http://docs.aws.amazon.com/AmazonS3/latest/dev/Versioning.html#MultiFac
torAuthenticati onDelete
7 http://docs.aws.amazon.com/AmazonS3/latest/dev/ServerLogs.html
8 http://aws.amazon.com/sns/
9 http://aws.amazon.com/sqs/
10 http://aws.amazon.com/lambda/
11 http://aws.amazon.com/free/
12 http://aws.amazon.com/s3/pricing/
13 http://docs.aws.amazon.com/amazonglacier/latest/dev/uploading-archive-mpu.html
14 http://docs.aws.amazon.com/amazonglacier/latest/dev/downloading-an-
archive.html#downloading-an-archive-range
15 https://aws.amazon.com/iam
Amazon Web Services – Vue d'ensemble des services de stockage AWS
Novembre 2015
Page 49 sur 50
16 http://aws.amazon.com/cloudtrail/
17 http://aws.amazon.com/sns/
18 http://docs.aws.amazon.com/AmazonS3/latest/dev/object-lifecycle-mgmt.html
19 http://aws.amazon.com/glacier/pricing/
20 http://docs.aws.amazon.com/AWSEC2/latest/UserGuide/ebs-initialize.html
21 http://docs.aws.amazon.com/AWSEC2/latest/UserGuide/EBSEncryption.html
22 http://aws.amazon.com/ebs/pricing/
23 http://docs.aws.amazon.com/AWSEC2/latest/UserGuide/InstanceStorage.html
24 http://docs.aws.amazon.com/AWSEC2/latest/WindowsGuide/block-device-mapping-
concepts.html
25 http://docs.aws.amazon.com/AWSEC2/latest/UserGuide/i2-instances.html
26 http://docs.aws.amazon.com/AWSEC2/latest/UserGuide/high_storage_instances.html
27 http://docs.aws.amazon.com/AWSEC2/latest/UserGuide/ec2-instance-lifecycle.html
28 https://aws.amazon.com/marketplace
29 http://aws.amazon.com/ec2/pricing/
30 http://docs.aws.amazon.com/storagegateway/latest/userguide/WhatIsStorageGateway.html
31 http://aws.amazon.com/directconnect/
32 http://docs.aws.amazon.com/storagegateway/latest/userguide/AWSStorageGatewayAPI.html
33 http://docs.aws.amazon.com/storagegateway/latest/userguide/GettingStarted-common.html
34 http://aws.amazon.com/storagegateway/pricing/
35 http://aws.amazon.com/importexport/tools
36 http://docs.aws.amazon.com/AWSImportExport/latest/DG/auth-access-control.html
37 https://aws.amazon.com/kms/
38 https://aws.amazon.com/sns/
39 http://aws.amazon.com/importexport/pricing/
40 http://docs.aws.amazon.com/AmazonCloudFront/latest/DeveloperGuide/reports.html
Amazon Web Services – Vue d'ensemble des services de stockage AWS
Novembre 2015
Page 50 sur 50
41 http://docs.aws.amazon.com/AmazonCloudFront/latest/DeveloperGuide/Invalidation.html
42 http://docs.aws.amazon.com/AmazonCloudFront/latest/DeveloperGuide/ReplacingObjects.ht ml
43 http://docs.aws.amazon.com/AmazonCloudFront/latest/DeveloperGuide/AccessLogs.html
44 http://docs.aws.amazon.com/AmazonCloudFront/latest/DeveloperGuide/monitoring-using-
cloudwatch.html
45 http://aws.amazon.com/cloudfront/pricing/
46 http://aws.amazon.com/s3/
47 http://aws.amazon.com/glacier/
48 http://aws.amazon.com/ebs/
49 http://docs.aws.amazon.com/AWSEC2/latest/UserGuide/InstanceStorage.html
50 http://aws.amazon.com/storagegateway/
51 http://aws.amazon.com/importexport/
52 http://aws.amazon.com/cloudfront/
53 http://aws.amazon.com/tools/
54 http://calculator.s3.amazonaws.com/index.html
55 https://aws.amazon.com/blogs/aws/
56 https://forums.aws.amazon.com/index.jspa
57 http://aws.amazon.com/free/
58 http://aws.amazon.com/solutions/case-studies/
Recommended