La redondance des données est un terme utilisé à propos des bases de données et signifie simplement que certains champs de données apparaissent plus d'une fois dans la base de données. La redondance des données est inutile et inefficace pour plusieurs raisons et les concepteurs de bases de données tentent de l'éliminer autant que possible en utilisant une technique appelée normalisation des données.
Les données peuvent apparaître plusieurs fois dans une base de données pour diverses raisons, selon le type d'organisation d'entreprise pour laquelle la base de données est conçue. Par exemple, une entreprise en ligne peut avoir le même nom de client apparaissant plusieurs fois si ce client a acheté plusieurs produits différents à des moments différents.
Cette redondance pose des problèmes au service informatique en charge de la maintenance de la base de données car il doit mettre à jour les coordonnées de ce client dans de nombreux endroits différents. Cela signifie également que beaucoup de capacité de stockage est gaspillée, stockant les mêmes données plusieurs fois. Pire encore, si une ou plusieurs instances du nom du client ne sont pas mises à jour, la base de données contiendra des données incohérentes et personne ne saura quel ensemble de données est le bon.
La solution à ce problème a été développée pour la première fois en 1970 par Edgar Codd, l'inventeur de la base de données relationnelle. En termes simples, une base de données relationnelle dans laquelle les données importantes, telles que les noms des clients, ne sont stockées qu'une seule fois dans un seul fichier, mais le champ de chaque client est défini par sa relation avec d'autres fichiers - tels que les ventes de produits individuels.
Le processus de conception d'une base de données de manière à ce qu'elle ne soit pas soumise à la duplication ou à la redondance des données avec les problèmes associés de corruption et d'incohérence des données est appelé normalisation.
La normalisation exige que le concepteur de la base de données respecte les règles établies par la communauté des bases de données pour garantir que les données sont organisées efficacement. Ces règles sont appelées règles de forme normale. Il existe un certain nombre de formes normales, chacune plus rigoureuse que la précédente, et contenant chacune les règles de la forme précédente. Actuellement, il existe cinq niveaux de forme normale.