Garnett
Datenklassifizierung ist der Prozess der Bestimmung von Klassenintervallen und Klassengrenzen in den Daten. Anhand von Klassenintervallen und Klassengrenzen werden die Daten abgebildet und organisiert. Es gibt vier Arten von Datenklassifizierungen, einschließlich
Natural Breaks Classification,
Quantile Classification,
Equal Interval Classification und
Standard Deviation Classification. Ich erkläre die Standardabweichungsklassifikation und die
Quantilklassifikation
.
Bei der Standardabweichungsklassifikation wird der Mittelwert berechnet und dann platziertKlasse bricht über und unter dem Mittelwert in Intervallen von entweder 0,25 oder 0,5. Bei dieser Methode werden die Werte, die über den drei Standardabweichungen vom Mittelwert liegen, in zwei Klassen eingeteilt. Mit anderen Worten, mehr als drei Standardabweichungen über dem berechneten Mittelwert und weniger als drei Standardabweichungen unter dem berechneten Mittelwert führen zu den beiden Datenklassen. Bei der Quantilklassifizierung werden Wertemengen in Gruppen aufgeteilt, die die gleiche Anzahl von Werten enthalten. In jeder Klasse wird die gleiche Anzahl von Datenwerten platziert. Diese Methode wird auch häufig zur Klassifizierung von Daten verwendet.