Ciel, mes données ne sont plus relationnelles

Ciel ! Mes données ne sont plus relationnelles

BLEND WEB MIX 01 Octobre 2013

Xavier Gorse

@xgorse

Association Française des Utilisateurs de PHP

• Crée en 2001• Forum PHP ( 21 & 22 Novembre 2013 à Paris)• AperoPHP et Rendez Vous• Antennes Locale• Président en 2009 www.afup.org

• Initié en 2010 par Hugo Hamon• Pas encore une vraie association• Sfpot mensuel avec conférence suivie d’un apéro• Antenne à Marseille, Lyon ??

Association Francophone des utilisateurs de SYmfony

www.afsy.fr

• Fondateur en 2005

• Lyon & Paris

• Agence Web Technique de 15 personnes

• Symfony depuis 2006

• Partenaire officiel SensioLabs

www.elao.com

• Trend

• Key-value databases

• Document databases

• Graph databases

• Column-oriented databases

RDBMS performance

Data complexity

Relational database

Requirement of application

Salary&list&

Most&Web&apps&

Social&Network&

Loca5on7based&services&

Source @ianSrobinson - @jimwebber from NeoTechnology

complexity = f(size, connectedness, uniformity)

Data Size

2007 2008 2009 2010 20112012

Data Size

• 500 million page views a day

• ~3TB of new data to store a day

• Posts are about 50GB a day. Follower list updates are about 2.7TB a day.

Connectedness

Source @ianSrobinson - @jimwebber from NeoTechnology

1990 2010 20202000

web 2.0 “web 3.0”web 1.0

Inform

nec(vity)

Text)Documents)

Hypertext)

Feeds)

Blogs)

Wikis)

Tagging)Folksonomies)

Ontologies)

Uniformity

• Semi-‐structured data

• Different data lifecycle

• Store more data about each en7ty

• Individualisa7on & decentraliza7on of content genera7on

NoSQLNot Only SQL

• Non-‐Rela7onal

• Cluster Friendly

• Schema less

• Distributed architecture

ACID & CAP Theorem

• Atomicity

• Consistency

• Isola7on

• Durability

Cap Theorem

• Consistency

• Availability

• Par77on Tolerance

Column 1 : value

Column 2 : value

Column 3 : value

Field 1 : value

Field A : value

Field B : value

Field 2 : valueNode 3

Node 2

Node 4

Node 5

Node 1

Key/Value Column-oriented

Document

Column-oriented

ValueKey

Column 1 : value

Column 2 : value

Column 3 : value

Field 1 : value

Field A : value

Field B : value

Node 2

Node 4

Node 5

Node 1

Document

Column-oriented

ValueKey

Key-value databases

• Inspired by Amazon’s Dynamo (2007)

• Global collection of key-value

• Big scalable HashMap

• Strengths

• Simple data model

• High performance

• Great at scaling out horizontally

• Weaknesses

• Simplistic data model

• Poor for complex data

Key-value databases

• Written in C - BSD License - 2009

• Very fast and light-weigth

• All data in memory

• Persistence

• Master/Slave Replication

• Used for caching, session or working queue

Key-value databases

http://redis.io/

• Riak

• Memcache (RAM)

• Voldemort

• Amazon DynamoDB (Saas)

• IronCache (Saas)

Key-value databases

Column 1 : value

Column 2 : value

Column 3 : value

Field 1 : value

Field A : value

Field B : value

Node 2

Node 4

Node 5

Node 1

Document

Column-oriented

ValueKey

Document databases

• Inspired by IBM Lotus Notes/Domino

• Idem from Key/Value with value as a document

• A document is a key-value collection

• Flexible schema

• Non-relational, data is de-normalized

Document databases • Strengths

• Simple, powerful data model

• Good scaling, Easy/Auto sharding

• Usually “ACID” compliant

• Weaknesses

• Unsuited for interconnected data

• Query model limited to keys (and indexes)

Document databases • Written in C++ - License AGPL - 2009

• JSON-style documents

• Full Index Support

• Fast In-Place Updates

• Auto-Sharding

• Replication & High Availability

• A lot of Connector

• Big Community

• Commercial Support

http://www.mongodb.org

Document databases

• Lotus Notes / Domino

• CouchDB written in Erlang, Javascript for Query

• OrientDBwritten in Java, relationship as graph

Column 1 : value

Column 2 : value

Column 3 : value

Field 1 : value

Field A : value

Field B : value

Node 2

Node 4

Node 5

Node 1

Document

Column-oriented

ValueKey

Graph databases

• Nodes with properties

• Named relationships with properties

• Focus on the data structure

• Direct pointer to its adjacent element and no indexlookups are necessary

Graph databases• Strengths

• Powerful data model

• Fast for connected data

• A new data architecture

• Weaknesses

• No Sharding : All data in one instance

• Using Node/Relation property for Query kill performance

• A new data architecture

Graph databases• Java - GPL/Commercial - 2007

• Query language : Cypher / Gremlin

• REST Interface

• Embed Mode

• High Availability ( Master / Slave)

• Commercial Support

http://neo4j.org

GraphDB - Products

• Titan

• OrientDB

• InfiniteGraph

• AllegroGraph

Column 1 : value

Column 2 : value

Column 3 : value

Field 1 : value

Field A : value

Field B : value

Node 2

Node 4

Node 5

Node 1

Document

Column-oriented

ValueKey

Column-oriented database

• A big table, with column families

• Data stored by column instead of row

• Build for distributed architecture

• Map-reduce for querying/processing

• Flexible schema

• Easy sharding (partitioning)

Column-oriented database• Strengths

• Data model supports semi-structured data

• Naturally indexed (columns)

• Horizontally scalable – RW increase linearly

• Fault tolerant – no single point of failure

• Weaknesses

• Unsuited for interconnected data

Column-oriented database• Java - Apache License 2 - 2008

• Developed by Facebook

• Decentralized

• Supports replication and multi data center replication

• Scalability

• Fault-tolerant

• MapReduce support

http://cassandra.apache.org/

Column-oriented database

• HBase (Apache)

• HyperTable

• BigTable (Google)

Conclusion

• Application architecture impact

• Store your data in the way you want to query it

• Denormalize your data and try to keep them up-to-date !

Ciel, mes données ne sont plus relationnelles

Engineering

Notion de SGBD Bases de Données Relationnelles - …tiprof.fr/SGBasesDonnees/Supports-Cours/coursBD-TheorieSysteme... · Bases de Données Relationnelles Théorie + Système + Conception

Développer ses qualités relationnelles et convaincre

LOGO Formation aux techniques relationnelles Formation aux techniques relationnelles avril 2008

Ciel Bâtiment Ciel Guide juridique Ciel Paye Bâtiment Ciel

LES BASES DE DONNÉES RELATIONNELLES - 2

Les compétences « relationnelles » en question

NSI Terminale - Base de données relationnelles

Les bases de Données Relationnelles

BASES DE DONNÉES Relationnelles - cedric.cnam.frcedric.cnam.fr/vertigo/Cours/grenier/sgbd-b7.pdf · Slide 1 INFORMATIQUE -CNAM, Paris BASES DE DONNÉES Relationnelles Équipe VERTIGO

données relationnelles avec MERISE Initiation à la ...christine.lang7.free.fr/tutos/developpez.com/initiation-merise.pdf · Initiation à la conception de bases de données relationnelles

Conception des bases de données relationnelles

BD Relationnelles versus BD Objets Fariza Tahi

données relationnelles avec MERISE Initiation à la

Bases de données relationnelles avec Accesspasseport.univ-lille1.fr/site/initiatic/BASE_DE_DONNEES-_ACCESS/... · Système de Gestion de Bases de Données Relationnelles (SGBDR)

Bases de données relationnelles & SQL - EPHE

1 Mes attitudes relationnelles dominantes RÉPONDEZ SPONTANÉMENT EN METTANT UNE CROIX DANS LA COLONNE CORRESPONDANTE : PLUTÔT VRAI : si vous pensez ou agissez

Détection de communautés multi-relationnelles dans les ... · Détection de communautés multi-relationnelles dans les réseaux sociaux hétérogènes Soumaya Guesmi* — Chiraz

dans les bases de données relationnelles - lsis.org · Optimisation des BD Relationnelles – Bernard ESPINASSE 1 Optimisation et performance dans les bases de données relationnelles

LES PROCEDURES tère des qualités relationnelles de l

Bases de données relationnelles - …users.polytech.unice.fr/~hugues/BDR/Harmo/coursharmo/BDR3.pdf · 1 Bases de données relationnelles Harmonisation ESSI - MS ISI - MS IMAFA Anne-Marie