La redundancia de datos es un término que se usa para las bases de datos y significa simplemente que algunos campos de datos aparecen más de una vez en la base de datos. La redundancia de datos es un desperdicio e ineficaz por varias razones y los diseñadores de bases de datos intentan eliminarla en la medida de lo posible mediante el uso de una técnica llamada normalización de datos.
Los datos pueden aparecer varias veces en una base de datos por diversas razones, según el tipo de organización empresarial para la que está diseñada la base de datos. Por ejemplo, una empresa en línea puede tener el mismo nombre de cliente que aparece varias veces si ese cliente ha comprado varios productos diferentes en diferentes momentos.
Esta redundancia da lugar a problemas para el departamento de TI responsable del mantenimiento de la base de datos porque debe actualizar los datos del cliente en numerosas ubicaciones diferentes. También significa que se desperdicia mucha capacidad de almacenamiento, almacenando los mismos datos varias veces. Lo peor de todo es que si una o más instancias del nombre del cliente no se actualizan, la base de datos contendrá datos inconsistentes y nadie sabrá qué conjunto de datos es el correcto.
La solución a este problema fue desarrollada por primera vez en 1970 por Edgar Codd, el inventor de la base de datos relacional. En pocas palabras, una base de datos relacional en la que los datos importantes, como los nombres de los clientes, se almacenan solo una vez en un solo archivo, pero el campo de cada cliente se define por su relación con otros archivos, como las ventas de productos individuales.
El proceso de diseñar una base de datos para que no esté sujeta a la duplicación o redundancia de datos con los problemas que conlleva de corrupción e inconsistencia de datos, se conoce como normalización.
La normalización requiere que el diseñador de la base de datos se apegue a las reglas, establecidas por la comunidad de la base de datos, para garantizar que los datos se organicen de manera eficiente. Estas reglas se denominan reglas de forma normal. Hay varias formas normales, cada una más rigurosa que la anterior, y cada una contiene las reglas de la forma anterior. Actualmente hay cinco niveles de forma normal.