Garnett
La clasificación de datos es el proceso de determinación de intervalos de clase y límites de clase en los datos. Sobre la base de los intervalos de clase y los límites de clase, los datos se mapean y organizan. Hay cuatro tipos de clasificaciones de datos, incluida
la Clasificación de rupturas naturales, la
Clasificación de cuantiles,
la Clasificación de intervalos iguales y la
Clasificación de desviación estándar. Estoy explicando la clasificación de desviación estándar y la clasificación de
cuantiles
.
En la clasificación de desviación estándar, el valor medio se calcula y luego se colocarupturas de clase por encima y por debajo de la media a intervalos de 0,25 o 0,5. En este método, los valores que están más allá de las tres desviaciones estándar de la media se clasifican en dos clases. En otras palabras, más de tres desviaciones estándar por encima de la media calculada y menos de tres desviaciones estándar por debajo de la media calculada darán como resultado las dos clases de datos. En la clasificación por cuantiles, el conjunto de valores se distribuye en grupos que contienen el mismo número de valores. Se coloca el mismo número de valores de datos en cada clase. Este método también se usa comúnmente para la clasificación de datos.