Canalblog
Editer l'article Suivre ce blog Administration + Créer mon blog
Publicité
mli07 Terminographie
Derniers commentaires
Archives
6 janvier 2014

Structured Query Language

SQL
Apparu en 1974
Auteur Donald D. Chamberlin et Raymond F. Boyce
Développeur IBM
Dernière version stable SQL:2011 (le 2011)
Paradigme déclaratif, procédural, orienté objet
Typage statique et fort
Dialectes SQL-86, SQL-89, SQL-92, SQL:1999, SQL:2003, SQL:2008, SQL:2011
Influencé par Datalog
A influencé CQL, LINQ, Windows PowerShell
Implémentations nombreuses
Système d'exploitation Multiplate-forme

 

SQL
Extension .sql
Développé par ISO/CEI
Type de format Base de données
Standard(s) ISO/CEI 9075

SQL (sigle de Structured Query Language, en français langage de requête structurée) est un langage informatique normalisé servant à exploiter des bases de données relationnelles. La partie langage de manipulation des données de SQL permet de rechercher, d'ajouter, de modifier ou de supprimer des données dans les bases de données relationnelles.

 

Outre le langage de manipulation des données, la partie langage de définition des données permet de créer et de modifier l'organisation des données dans la base de données, la partie langage de contrôle de transaction permet de commencer et de terminer des transactions, et la partie langage de contrôle des données permet d'autoriser ou d'interdire l'accès à certaines données à certaines personnes.

 

Créé en 1974, normalisé depuis 1986, le langage est reconnu par la grande majorité des systèmes de gestion de bases de données relationnelles (abrégé SGBDR) du marché.

 

SQL fait partie de la même famille que les langages SEQUEL (dont il est le descendant), QUEL ou QBE (Zloof).

 

 

Bref historique

 

En juin 1970, Edgar Frank Codd publia l'article A Relational Model of Data for Large Shared Data Banks (« Un référentiel de données relationnel pour de grandes banques de données partagées ») dans la revue Communications of the ACM (Association for Computing Machinery). Ce référentiel relationnel fondé sur la logique des prédicats du premier ordre a été rapidement reconnu comme un modèle théorique intéressant, pour l'interrogation des bases de données, et a inspiré le développement du langage Structured English QUEry Language (SEQUEL) (« langage d'interrogation structuré en anglais »), renommé ultérieurement SQL pour cause de conflit de marque déposée.

 

Développée chez IBM en 1970 par Donald Chamberlain et Raymond Boyce, cette première version a été conçue pour manipuler et éditer des données stockées dans la base de données relationnelle à l'aide du système de gestion de base de données IBM System R. Le nom SEQUEL, qui était déposé commercialement par l'avionneur Hawker Siddeley pour un système d'acquisition de données, a été abandonné et contracté en SQL en 19751. SQL était censé alors devenir un élément clé du futur projet FS.

 

En 1979, Relational Software, Inc. (actuellement Oracle Corporation) présenta la première version commercialement disponible de SQL, rapidement imité par d'autres fournisseurs.

 

SQL a été adopté comme recommandation par l'Institut de normalisation américaine (ANSI) en 1986, puis comme norme internationale par l'ISO en 1987 sous le nom de ISO/CEI 9075 - Technologies de l'information - Langages de base de données - SQL.

 

La norme internationale SQL est passée par un certain nombre de révisions :

 

AnnéeNomAppellationCommentaires
1986 ISO/CEI 9075:1986 SQL-86 ou SQL-87 Édité par l'ANSI puis adopté par l'ISO en 1987.
1989 ISO/CEI 9075:1989 SQL-89 ou SQL-1 Révision mineure.
1992 ISO/CEI 9075:1992 SQL-92 (en) alias SQL2 Révision majeure.
1999 ISO/CEI 9075:1999 SQL-99 (en) alias SQL3 Expressions rationnelles, requêtes récursives, déclencheurs, types non-scalaires et quelques fonctions orientées objet (les deux derniers points sont quelque peu controversés et pas encore largement implémentés).
2003 ISO/CEI 9075:2003 SQL:2003 (en) Introduction de fonctions pour la manipulation XML, « window functions », ordres standardisés et colonnes avec valeurs auto-produites (y compris colonnes d'identité).
2008 ISO/CEI 9075:2008 SQL:2008 (en) Ajout de quelques fonctions de fenêtrage (ntile, lead, lag, first value, last value, nth value), limitation du nombre de ligne (OFFSET / FETCH), amélioration mineure sur les types distincts, curseurs et mécanismes d'auto incréments.
2011 ISO/CEI 9075:2011 SQL:2011 (en)  

 

Comme toute norme internationale publié par l'ISO, ISO/CEI 9075 est disponible à l'achat sur le site de cette organisation. Le dernier brouillon de la norme est disponible sur wiscorp.com.

 

Utilisation

 

Le langage SQL s'utilise principalement de trois manières :

 

  • un programme écrit dans un langage de programmation donné utilise l'interface de programmation du SGBD pour lui transmettre des instructions en langage SQL. Ces programmes utilisent des composants logiciels tels que ODBC ou JDBC. Cette technique est utilisée par l'invite de commande qui permet à un administrateur d'effectuer des opérations sur les bases de données; opérations qu'il décrit en SQL ;

 

  • technique dite embedded SQL : des instructions en langage SQL sont incorporées dans le code source d'un programme écrit dans un autre langage ;

 

  • technique des procédures stockées : des fonctions écrites en langage SQL sont enregistrées dans la base de données en vue d'être exécutées par le SGBD. Cette technique est utilisée pour les trigger - procédures déclenchées automatiquement sur modification du contenu de la base de données.

 

Syntaxe générale

 

Les instructions SQL s'écrivent d'une manière qui ressemble à celle de phrases ordinaires en anglais. Cette ressemblance voulue vise à faciliter l'apprentissage et la lecture2.

 

C'est un langage déclaratif, c'est-à-dire qu'il permet de décrire le résultat escompté, sans décrire la manière de l'obtenir. Les SGBD sont équipés d'optimiseurs de requêtes - des mécanismes qui déterminent automatiquement la manière optimale d'effectuer les opérations, notamment par une estimation de la complexité algorithmique. Celle-ci est fondée sur des statistiques récoltées à partir des données contenues dans la base de données (nombre d'enregistrements, nombre de valeurs distinctes dans une colonne, etc.).

 

Les instructions de manipulation du contenu de la base de données commencent par les mots clés SELECT, UPDATE, INSERT ou DELETE qui correspondent respectivement aux opérations de recherche de contenu, modification, ajout et suppression. Divers mots clés tels que FROM, JOIN et GROUP permettent d'indiquer les opérations d'algèbre relationnelle à effectuer en vue d'obtenir le contenu à manipuler.

 

Les instructions de manipulation des métadonnées - description de la structure, l'organisation et les caractéristiques de la base de données - commencent avec les mots clés CREATE, ALTER ou DROP qui correspondent aux opérations d'ajouter, modifier ou supprimer une métadonnée. Ces mots clés sont immédiatement suivies du type de métadonnée à manipuler - TABLE, VIEW, INDEX, ...

 

Les mots clés GRANT et REVOKE permettent d'autoriser des opérations à certaines personnes, d'ajouter ou de supprimer des autorisations. Tandis que les mots clés COMMIT et ROLLBACK permettent de confirmer ou annuler l'exécution de transactions.

 

La syntaxe de SQL fait l'objet de la norme ISO 9075. Cette norme laisse la possibilité aux producteurs de SGBD d'y ajouter des instructions spécifiques et non normalisées. La norme a évolué au cours des années en vue de s'adapter aux demandes, et les éditeurs de SGBD ont souvent ajouté des possibilités à leurs produits avant que celle-ci fassent objet de normes3, ce qui provoque des variations dans la compréhension et l'interprétation qui est faite d'un code source en SQL par les différents logiciels de SGBD4. Ces différences font qu'un code source écrit sans précautions pour un SGBD donné ne fonctionnera pas forcément avec un autre SGBD.

 

Exemples de code

 

  • modification d'une table :

 

ALTER TABLE table1 ADD COLUMN colonne5 INTEGER NULL;

 

  • Recherche

 

SELECT nom, service
FROM   employe
WHERE  statut = 'stagiaire'
ORDER  BY nom;

 

  • procédure stockée

 

 DECLARE N INTEGER;
 SET N = 1;
 FOR C 
 AS C_USR_MISE_A_JOUR 
    CURSOR FOR 
       SELECT USR_ID, USR_NOM
       FROM   T_UTILISATEUR_USR
       ORDER  BY USR_ID
    FOR UPDATE OF USR_NOM
 DO
    IF MOD(N, 2) = 0
    THEN
       UPDATE T_UTILISATEUR_USR
...

 

Manipulation de données

 

Le Langage de manipulation de données LMD, soit Data Manipulation Language, DML, en anglais, est un sous-ensemble du SQL utilisé pour ajouter, modifier, et supprimer des données :

 

  • INSERT insère des lignes, (aussi appelés tuples) dans une table existante, exemple :

 

INSERT INTO a_table (field1, field2, field3)
    VALUES ('test', 'N', NULL);

 

  • UPDATE Modifie un ensemble de tuples existant dans une table, exemple :

 

UPDATE a_table
    SET field1 = 'updated value'
WHERE field2 = 'N';

 

  • DELETE Supprime un ensemble de tuples existant dans une table, exemple :

 

DELETE FROM a_table
    WHERE field2 = 'N';

 

  • MERGE Combine les données de plusieurs tables. C'est la combinaison de INSERT et UPDATE . Il peut être nommé UPSERT, INSERT OR REPLACE INTO, ou encore INSERT ON DUPLICATE KEY UPDATE dans certains moteur de base de donnée.

 

 MERGE INTO TABLE_NAME USING table_reference ON (condition)
   WHEN MATCHED THEN
   UPDATE SET column1 = value1 [, column2 = value2 ...]
   WHEN NOT MATCHED THEN
   INSERT (column1 [, column2 ...]) VALUES (value1 [, value2 ...

 

Null et la logique ternaire

 

Le mot-clé Null fut introduit dans SQL pour exprimer les informations manquantes dans le modèle relationnel. L'introduction de Null, avec True et False est le fondement de la logique ternaire. Null n'a pas de valeur (et n'est membre d'aucun type de donnée), c'est un mot-clé réservé, indiquant qu'une information est manquante. Par conséquent, la comparaison avec Null, même avec Null lui-même, ne peut ni être True ni être False, elle est obligatoirement inconnue (Unknown). En effet, Null ne peut pas être considéré égal à Null, puisque les deux informations manquantes, que ces deux Null distincts représentent, peuvent s'avérer différentes.On dit généralement que NULL est un « marqueur ».

 

Langages apparentés

 

  • Créé par Extension de SQL, Transact-SQL est un langage de programmation des SGBD SQL Adaptive Server Anywhere (ASA), SQL Adaptive Server Enterprise (ASE), SQL IQ de Sybase ainsi que SQL Server de Microsoft.

 

  • PL/SQL est un langage de programmation du SGBD Oracle Database de Oracle Corporation. PL/pgSQL est un langage de programmation du SGBD PostgreSQL. Ce sont des langages de programmation procédurale dans lesquels peuvent être ajoutées des instructions en langage SQL. Le code source écrit dans ce type de langage est compilé par le SGBD, puis enregistré dans la base de données et exécuté au besoin.

 

  • OQL est un langage similaire à SQL, pour les demander des opérations aux bases de données orientées objet et obtenir les résultats sous forme d'objets. Le langage est normalisé par le Object Data Management Group - un consortium d'industriels informatiques qui a cessé toute activité en 2001.

 

Langages concurrents

 

Parmi les autres langages de requêtes, citons les ancêtres de SQL comme QUEL (QUery English Language) ou SEQUEL (Structured English QUEry Language) ou encore le langage QBE (Query By Example). Cependant le langage QBE, très différent de SQL, est encore en vigueur dans le SGBDR de type « fichier » qu'est Paradox (Ansa Software/Borland/Corel).

 

Alternative

 

  • Le langage Tutorial D est présenté comme étant plus cohérent et plus simple d'emploi par ses inventeurs. Il permet, de surcroît, pour alléger le libellé des requêtes, l'emploi d'une clause WITH inspirée du langage Pascal, bien que WITH ne contribue pas à faciliter la lecture du code.

 

À noter que la technique du WITH a été en partie reprise dans la norme SQL:1999 pour réaliser des "Common Table Expression" (CTE ou Table d'Expression Partagées en français), c'est-à-dire des vues non instanciées utilisables par la requête dans laquelle elles figurent, et ce afin de factoriser des expressions ou encore de permettre l'écriture de requêtes récursives de manière à résoudre élégamment des parcours d'arbres ou de graphes.

 

Parmi les autres candidats, on compte :

 

  • BS12, qui lui aussi s'est attaqué à ce problème de l'enchâssement et de la perte de lisibilité qu'il entraîne.

 

Systèmes de gestion de base de données avec SQL

 

  • 4e Dimension (4D)
  • Microsoft Access
  • OpenOffice Base
  • DB2
  • Firebird
  • Visual FoxPro
  • HyperFileSQL
  • Informix
  • Ingres
  • MariaDB
  • MaxDB (anciennement SAP db)
  • Microsoft SQL Server
  • Mimer
  • MySQL
  • Ocelot
  • Oracle
  • Paradox
  • PostgreSQL
  • SQLite
  • SQL/MM
  • Sybase
  • Teradata

 

Tous ces systèmes présentent certaines particularités dont certaines ne se retrouvent pas chez d'autres. Il est d'ailleurs toujours intéressant de se référer au manuel de référence du SGDBR, lors de requêtes particulières ou complexes, ainsi que pour leur optimisation.

 

Ouvrages sur le langage SQL

 

En français

 

  • SQL Synthèse de cours et exercices - 4e édition (2 chapitres supplémentaires sur l'indexation et l'administration) - Frédéric Brouard, Christian Soutou, Rudi Bruchez - Pearson Education, 2012
  • Bases de données - de la modélisation au SQL - Laurent Audibert - Ellipses, 2009
  • SQL Synthèse de cours et exercices - 2e édition - Frédéric Brouard, Christian Soutou, Rudi Bruchez - Pearson Education, 2008
  • SQL par l'exemple - Antony Molinaro - O'Reilly, 2007
  • SQL en concentré - Kevin Kline - O'Reilly, 2005
  • SQL pour les nuls - Allen G. Taylor - First Interactive, 2001
  • SQL développement - Frédéric Brouard - Campus Press, 2001
  • SQL avancé (2e édition) - Joe Celko - Vuibert, 2000

 

En anglais

 

  • The Art of SQL - Stéphane Faroult - O'Reilly, 2006
  • Advanced SQL:1999 - Jim Melton - Morgan Kaufmann, 2003
  • SQL bible - A. Kriegel, B. M. Trukhnov - John Wiley, 2003
  • SQL:1999, Understanding Relational Language Components - Jim Melton, Alan R. Simon - Morgan Kauffman, 2002
  • SQL2 - SQL3, Applications à Oracle (3e édition) - Pierre Delmal - De Boeck Université, 2001
  • SQL in a nutshell - Kevin Kline, Daniel Kline - O'Reilly, 2001
  • SQL 3, Implementing the SQL Foundation Standard - Paul Fortier - McGraw-Hill, 1999
  • SQL-99 complete really - Peter Gulutzan, Trudy Pelzer - R&D Books, 1999
  • The Complete Reference SQL - J. R. Groff, P. N. Weinberg - Osborne, 1999
  • A guide to the SQL standard - Chris J. Date, Hugh Darwen - Addison Wesley - USA, 1997
  • Understanding the new SQL - Jim Melton, Alan R. Simon - Morgan Kaufmann, 1993
Publicité
Commentaires
mli07 Terminographie
  • Terminographie. Recensement et étude des termes appartenant aux nomenclatures scientifiques et techniques d'une langue. Terminotique. Terminologie informatisée. Dictionnairique. Discipline traitant de la conception des dictionnaires
  • Accueil du blog
  • Créer un blog avec CanalBlog
Publicité
Publicité