Wie und warum wird die Ausreißerfunktion in Excel verwendet?

Wie und warum wird die Ausreißerfunktion in Excel verwendet?

 

Wie und warum wird die Ausreißerfunktion in Excel verwendet?

Ein Ausreißer ist ein Wert, der deutlich höher oder niedriger als die meisten Werte in Ihren Daten ist. Wenn Sie Excel zur Analyse von Daten verwenden, können Ausreißer die Ergebnisse verzerren. Der Durchschnittsmittelwert eines Datensatzes kann beispielsweise Ihre Werte wirklich widerspiegeln. Excel bietet einige nützliche Funktionen zum Verwalten von Ausreißern ein Blick.

Ein schnelles Beispiel:

In der Abbildung unten sind die Ausreißer relativ leicht zu erkennen, um den Wert von zwei, der Eric zugewiesen ist, und den Wert von 173, der Ryan zugewiesen ist. In einem Datensatz wie diesem ist es leicht genug, diese Ausreißer manuell zu erkennen und damit umzugehen.

Wie und warum wird die Ausreißerfunktion in Excel verwendet?

In größeren Datenmengen ist dies nicht der Fall. In der Lage zu sein, die Ausreißer zu identifizieren und sie aus statistischen Berechnungen zu entfernen, ist wichtig und das, was wir in diesem Artikel untersuchen werden.

So finden Sie Ausreißer in Ihren Daten

Um Ausreißer in einem Datensatz zu finden, gehen Sie wie folgt vor:

  • Berechnen Sie das 1. und 3. Quartil ( Wir werden darüber reden, worum es sich gerade handelt.
  • Beurteilen Sie den Interquartilsbereich (wir erklären diesen auch etwas weiter unten).
  • Geben Sie die oberen und unteren Grenzen unseres Datenbereichs wieder.
  • Verwenden Sie diese Grenzen, um die äußeren Datenpunkte zu identifizieren.

Der Zellenbereich rechts vom Datensatz, der im Bild unten zu sehen ist, wird zum Speichern dieser Werte verwendet.

Wie und warum wird die Ausreißerfunktion in Excel verwendet?

Lassen Sie uns loslegen.

Schritt 1: Berechnen Sie die Quartile

Wenn Sie Ihre Daten in Quartale unterteilen, wird jedes dieser Sets Quartil genannt. Die niedrigsten 25% Zahlen im Bereich bilden das 1. Quartil, die nächsten 25% das 2. Quartil und so weiter. Wir machen diesen Schritt zuerst, weil die am häufigsten verwendete Definition eines Ausreißers ein Datenpunkt ist, der mehr als 1,5 Interquartilbereiche (IQRs) unterhalb des 1. Quartils und 1,5 Interquartilbereiche oberhalb des 3. Quartils beträgt. Um diese Werte zu bestimmen, müssen wir zuerst herausfinden, was die Quartile sind.

Excel bietet eine QUARTILE-Funktion zum Berechnen von Quartilen. Es werden zwei Informationen benötigt: das Array und das Quart.

=QUARTILE(array, quart)

Das Array ist der Wertebereich, den Sie auswerten. Das Quart ist eine Zahl, die das Quartil darstellt, das Sie zurückgeben möchten (z. B. 1 für das 1. Quartil, 2 für das 2. Quartil usw.).

Hinweis: In Excel 2010 hat Microsoft die Funktionen QUARTILE.INC und QUARTILE.EXC als Verbesserungen der QUARTILE-Funktion veröffentlicht. QUARTILE ist abwärtskompatibel, wenn Sie mehrere Versionen von Excel verwenden.

Kommen wir zu unserer Beispieltabelle zurück.

Wie und warum wird die Ausreißerfunktion in Excel verwendet?

Um das 1. Quartil zu berechnen, können wir die folgende Formel in Zelle F2 verwenden.

=QUARTILE(C2:C14,1)

Bei der Eingabe der Formel bietet Excel eine Liste mit Optionen für das Argument quart.

Wie und warum wird die Ausreißerfunktion in Excel verwendet?

Um das 3. Quartil zu berechnen, können Sie eine Formel wie die vorherige in Zelle F3 eingeben, jedoch eine Drei anstelle einer Eins.

=QUARTILE(C2:C14,3)

Nun haben wir die Quartil-Datenpunkte in den Zellen angezeigt.

Wie und warum wird die Ausreißerfunktion in Excel verwendet?

Schritt zwei: Bewerten Sie den Interquartilbereich

Der Interquartilbereich (oder IQR) ist der mittlere 50% der Werte in deine Daten. Sie wird als Differenz zwischen dem 1. Quartilwert und dem 3. Quartilwert berechnet.

Wir werden eine einfache Formel in Zelle F4 verwenden, die das 1. Quartil vom 3. Quartil subtrahiert:

=F3-F2

Nun, wir kann unseren Interquartilbereich sehen.

Wie und warum wird die Ausreißerfunktion in Excel verwendet?

Schritt 3: Rückgabe der Unter- und Obergrenze

Die Unter- und Obergrenzen sind die kleinsten und größten Werte von der Datenbereich, den wir verwenden möchten. Alle Werte, die kleiner oder größer als diese gebundenen Werte sind, sind die Ausreißer.

Wir berechnen den unteren Grenzwert in Zelle F5, indem wir den IQR-Wert mit 1,5 multiplizieren und ihn dann vom Q1-Datenpunkt abziehen:

=F2-(1.5*F4)

Wie und warum wird die Ausreißerfunktion in Excel verwendet?

Hinweis: Die Klammern in dieser Formel sind nicht erforderlich, da der Multiplikationsteil vor dem Subtraktionsteil berechnet wird. Sie machen die Formel jedoch leichter lesbar.

Um die obere Grenze in Zelle F6 zu berechnen, multiplizieren Sie den IQR erneut mit 1,5, fügen ihn aber diesmal zum Q3-Datenpunkt hinzu:

=F3+(1.5*F4)

Wie und warum wird die Ausreißerfunktion in Excel verwendet?

Schritt 4: Identifizieren der Ausreißer

Nun haben wir alle unsere zugrunde liegenden Daten eingerichtet. Es ist Zeit, unsere äußeren Datenpunkte zu identifizieren, dh diejenigen, die niedriger als der untere Grenzwert oder höher als der obere Grenzwert sind.

Wir verwenden die OR-Funktion, um diesen logischen Test durchzuführen und die Werte anzuzeigen, die diese Kriterien erfüllen, indem Sie die folgende Formel in Zelle C2 eingeben:

=OR(B2<$F$5,B2>$F$6)

Wie und warum wird die Ausreißerfunktion in Excel verwendet?

Wir kopieren diesen Wert in unsere C3-C14-Zellen. Ein TRUE-Wert zeigt einen Ausreißer an, und wie Sie sehen können, haben wir zwei Daten in unseren Daten.

Wie und warum wird die Ausreißerfunktion in Excel verwendet?

Ignorieren der Ausreißer bei der Berechnung des Mittelwerts

Mit der QUARTILE-Funktion berechnen wir den IQR und arbeiten mit dem am häufigsten verwendete Definition eines Ausreißers. Wenn Sie jedoch den Durchschnittsmittelwert für einen Wertebereich berechnen und Ausreißer ignorieren, ist die Verwendung einer schnelleren und einfacheren Funktion möglich. Diese Technik wird einen Ausreißer nicht wie zuvor identifizieren, aber es wird uns erlauben, mit dem, was wir als Ausreißer betrachten, flexibel zu sein.

Die Funktion, die wir brauchen, heißt TRIMMEAN und Sie können die Syntax dafür unten sehen:

=TRIMMEAN(array, percent)

Das Array ist der Wertebereich, den Sie mitteln möchten. Der Prozentsatz ist der Prozentsatz der Datenpunkte, die vom oberen und unteren Rand des Datensatzes ausgeschlossen werden sollen (Sie können ihn als Prozentsatz oder als Dezimalwert eingeben).

Wir haben in unserem Beispiel die unten stehende Formel in Zelle D3 eingegeben, um den Durchschnitt zu berechnen und 20% von Ausreißern auszuschließen.

=TRIMMEAN(B2:B14, 20%)

Wie und warum wird die Ausreißerfunktion in Excel verwendet?

Sie haben zwei verschiedene Funktionen zur Behandlung von Ausreißern. Ob Sie sie für bestimmte Berichtsanforderungen ermitteln oder aus Berechnungen wie Durchschnittswerten ausschließen möchten, Excel verfügt über eine Funktion, die Ihren Anforderungen entspricht.

q , quelle

Zusammenhängende Posts:

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.