Un article de Wikipedia.y-project.com.
Une base de données relationnelle est une base de données structurée suivant les principes de l?algèbre relationnelle. La théorie des bases de données relationnelles est due à Edgar Frank Codd.
Elle est mise en ?uvre au moyen d?un Système de Gestion de Bases de Données Relationnelles (SGBDR).
[] Principe
Le concept permet de stocker et d?organiser une grande quantité d?information. Les SGBD permettent de naviguer dans ces données et d?extraire les informations voulues demandées via une requête.
Les données apparaissent comme stockées dans des tables qu?on nomme également relations. Ce système se démarque donc totalement - en termes d?interface - des bases de données de type hiérarchique. En matière d?implémentation, et en fonction des statistiques d?accès à la base, du hiérarchique sera utilisé, mais son emploi n?aura jamais besoin d?être pris en compte par l?utilisateur, ce qui conduit à :
- Une grande simplicité d?usage
- Une transparence pour l?utilisateur de toute réorganisation technique de la base (la seule différence que verra l?utilisateur se situant, si l?opération est réussie, dans les temps de réponse).
- Une facilité de combinaison de contenu de plusieurs tables (opération join).
Les relations possédent un certain nombre d?attributs permettant de décrire un n-uplet. La non-duplication des n-uplets est assurée par le SGBDR.
Dans les relations, il est possible de définir deux types de clés :
- clé primaire
- permet d?identifier un et un seul n-uplet (par exemple le numéro de sécurité sociale).
- clé étrangère
- c?est un attribut d?une relation qui est clé primaire dans une autre relation. Elle permet donc de lier deux relations entre elles.
Pour accéder aux données, on utilise différents opérateurs, notamment la sélection et la projection, mais aussi les jointures (dont il existe différents types).
Les opérations sont communiquées sous forme de requêtes aux SGBDR. La plupart utilisent le langage normé SQL.
Dans une base de données relationnelle, le but est de séparer les informations au maximum pour éviter les doublons, et d'empêcher la perte d?information.
[] Détails techniques
Dans la table PERSONNE ci-dessous, l?ensemble {PersID, nom, prénom, date_naiss, ville_naiss} est un ensemble d'attributs. Chaque attribut définit une information élémentaire à l?intérieur d?une ligne (aussi appelée tuple) de la table. Il ne peut exister deux fois le même tuple dans une relation. Les attributs sont parfois aussi appelés colonnes.
On peut définir des clés, qui sont des contraintes d?intégrité portant sur une relation. Elles consistent à imposer qu?il ne puisse exister deux tuples ayant même valeur pour un sous-groupe d?attributs (la clé) de la relation. Si on reprend l?exemple de la table PERSONNE, la clé pourrait être PersID, donc deux tuples différents ne pourraient pas avoir une même valeur pour l?attribut PersID (mais les valeurs des autres attributs peuvent être identiques).
Certaines clés sont dites clés étrangères ; ce sont des contraintes d?intégrité portant sur une relation R1, consistant à imposer que la valeur d?un groupe d?attributs apparaisse comme valeur de clé dans une autre relation R2. Si l?on reprend l?exemple des deux tables PERSONNE et VILLE, la clé étrangère de la table PERSONNE pourrait être ville_naiss, qui pointe sur la table VILLE. Il est impératif que le nombre d?attributs formant la clé étrangère de la table R1 corresponde au nombre d?attributs formant la clé primaire de la table R2.
Ces clés étangères sont issues du processus de normalisation du modèle des données.
Lors de l?implémentation d?une base de données, il faut penser à certains aspects :
- Personne ne doit pouvoir mettre à jour des données dans une table pendant qu?une autre personne les modifie déjà, car cela pourrait aboutir à des incohérences. Un système comme Paradox l?autorise cependant grâce à un mécanisme ingénieux mettant à jour automatiquement tous les affichages en cours au même instant.
- Les transactions sont atomiques, c?est-à-dire qu?en cas de panne majeure du système informatique au milieu d?une modification, un mécanisme doit permettre d?annuler les transactions en cours si elle n?ont pas pu être exécutées totalement (mécanisme dit du COMMIT).
- Des vérifications d?intégrité doivent assurer que chaque valeur inscrite dans un tuple soit une valeur permise (par exemple, on peut interdire de mettre une valeur supérieure à 12 dans un attribut « mois »).
Exemple :
|
On a une table « personne » contenant le nom, le prénom, la date de naissance et la ville de naissance pour chaque personne. Une ligne de la table contiendra donc les informations relatives à une personne.
|
|
| PERSONNE
|
| PersID | nom | prénom | date_naiss | ville_naiss
|
| 1 | Dupont | bob | 01-01-1950 | 1
|
| 2 | yyyy | meurise | 29-04-1999 | 2
|
| 3 | zzzz | codd | 26-12-2000 | 1
|
note : ici ville_naiss est une clé étrangère (table VILLE)
|
|
De même, on a une table « ville » contenant la population et la superficie de chaque ville.
|
|
| VILLE
|
| VilleID | nom | population | superficie | region
|
| 1 | Paris | 123456 | 123456 | 12
|
| 2 | Lyon | 12345 | 12345 | 22
|
| 3 | Grenoble | 1234 | 1234 | 22
|
note : ici region est une clé étrangère (table REGION)
|
Si on veut pouvoir connaître, pour chaque personne, la population et la superficie de sa ville de naissance, il est utile, au lieu de stocker le nom de la ville de naissance dans la table « personne », de stocker un identifiant (clé étrangère) se référant à un numéro unique pour chaque ville (clé primaire). Ainsi, les informations concernant chaque ville sont stockées unitairement.
Un des langages les plus utilisés pour construire des requêtes permettant d?interroger et de manipuler les données des bases de données relationnelles est le langage SQL. Pour reprendre notre exemple, SQL sert à formaliser des questions (requêtes) du type : « Quelles sont toutes les personnes nées dans la ville X » ou « Dans quelle ville est né Dupont ».
[] Améliorations
SQL n?étant pas exactement proche de la formulation intuitive d?une requête, deux approches sont utilisées pour s?en affranchir :
- création de langages frontaux traduisant en SQL des phrases simples du genre : « Lister par région le chiffre d?affaires moyen de chaque produit »
- création de requêtes en remplissant un formulaire avec les conditions qu?on souhaite voir vérifiées et en laissant vierges les autres champs (Query by example)
SQL reste cependant incontournable à ce jour pour effectuer des requêtes générales très complexes. Plusieurs systèmes affichent dans un premier temps en réponse à une requête complexe son coût prévisible (en temps ou en ressources d?accès), en demandant à l?utilisateur confirmation ou invalidation préalablement à toute exécution. On peut imaginer en effet sur des bases courantes des requêtes SQL dont l?exécution demanderait des centaines d?heures ou des milliers d?euros. Une réécriture simple suffit souvent à obtenir le même résultat, ou un analogue fonctionnel, de façon bien plus économique.
[] API standard pour accéder au SGBDR
API de bas niveau:
- ODBC dans l'univers Microsoft
- JDBC dans l'univers Java
Afin de gérer la différence conceptuelle entre le monde objet (C++, Java, DotNet...) et la representation relationnelle, de nouveaux standard sont apparus:
- dans l'univers Java, l'accès se fait à travers les standards JDO et SDO et EJB.
[] Historique
Les bases de données relationnelles étaient pressenties dans les années 1970 comme remplaçants des fichiers classiques dans les systèmes d?exploitation (voir technologie FS). Cela fut implémenté dans les ordinateurs du type IBM Système 38 ou AS/400, ainsi que dans un système d?exploitation nommé Pick, mais sans se généraliser. Les brevets de cette époque étant maintenant dans le domaine public, l?idée redevient d?actualité dans les années 2000 avec le système WinFS (voir Microsoft Windows).
Voir aussi : formes normales
DernierMirror
Le Texte ci-dessus est disponible sous GNU Free Documentation License.
La source est wikipedia http://fr.wikipedia.org/wiki/base de données relationnelle