Datenredundanz ist ein Begriff für Datenbanken und bedeutet einfach, dass einige Datenfelder mehr als einmal in der Datenbank vorkommen. Datenredundanz ist aus mehreren Gründen verschwenderisch und ineffizient, und Datenbankentwickler versuchen, sie so weit wie möglich zu eliminieren, indem sie eine Technik namens Datennormalisierung verwenden.
Daten können aus verschiedenen Gründen mehrmals in einer Datenbank erscheinen, abhängig von der Art der Unternehmensorganisation, für die die Datenbank konzipiert ist. Bei einem Online-Unternehmen kann beispielsweise der Name desselben Kunden mehrmals erscheinen, wenn dieser Kunde zu unterschiedlichen Zeiten mehrere unterschiedliche Produkte gekauft hat.
Diese Redundanz führt zu Problemen für die IT-Abteilung, die für die Pflege der Datenbank verantwortlich ist, da sie die Daten dieses Kunden an vielen verschiedenen Orten aktualisieren muss. Es bedeutet auch, dass viel Speicherkapazität verschwendet wird, da dieselben Daten mehrmals gespeichert werden. Am schlimmsten ist, dass die Datenbank inkonsistente Daten enthält, wenn eine oder mehrere Instanzen des Kundennamens nicht aktualisiert werden, und niemand weiß, welcher Datensatz der richtige ist.
Die Lösung für dieses Problem wurde erstmals 1970 von Edgar Codd, dem Erfinder der relationalen Datenbank, entwickelt. Einfach ausgedrückt, eine relationale Datenbank in einer, in der wichtige Daten wie Kundennamen nur einmal in einer einzigen Datei gespeichert werden, aber jedes Kundenfeld durch seine Beziehung zu anderen Dateien definiert wird - wie zum Beispiel einzelne Produktverkäufe.
Der Prozess des Entwerfens einer Datenbank, so dass sie keiner Duplizierung oder Redundanz von Daten mit den damit verbundenen Problemen der Datenkorruption und Inkonsistenz unterliegt, wird als Normalisierung bezeichnet.
Die Normalisierung erfordert, dass sich der Datenbankdesigner an Regeln hält, die von der Datenbank-Community aufgestellt wurden, um sicherzustellen, dass die Daten effizient organisiert werden. Diese Regeln werden Normalformregeln genannt. Es gibt eine Reihe von Normalformen, von denen jede strenger ist als die vorherige, und jede enthält die Regeln der vorherigen Form. Derzeit gibt es fünf Stufen der Normalform.