E-Learning Boxplot/Lernpfad E-Learning Boxplot: Unterschied zwischen den Versionen

Aus ZUM Projektwiki
Keine Bearbeitungszusammenfassung
Keine Bearbeitungszusammenfassung
Markierung: 2017-Quelltext-Bearbeitung
Zeile 42: Zeile 42:


{{Lösung versteckt|Um herauszufinden, welche Klasse besser ist, könnte der Klassendurchschnitt betrachtet werden. Auch, wenn wir bereits gelernt haben, dass das arithmetische Mittel nur bei metrischen Skalen sinnhaft ist, wird der Klassendurchschnitt häufig mithilfe des arithmetischen Mittels bestimmt, indem alle Noten addiert werden und die Summe anschließend durch die Anzahl der Klassenarbeiten geteilt wird. Was fällt auf, wenn Sie den Klassendurchschnitt beider Klassen miteinander vergleichen?
{{Lösung versteckt|Um herauszufinden, welche Klasse besser ist, könnte der Klassendurchschnitt betrachtet werden. Auch, wenn wir bereits gelernt haben, dass das arithmetische Mittel nur bei metrischen Skalen sinnhaft ist, wird der Klassendurchschnitt häufig mithilfe des arithmetischen Mittels bestimmt, indem alle Noten addiert werden und die Summe anschließend durch die Anzahl der Klassenarbeiten geteilt wird. Was fällt auf, wenn Sie den Klassendurchschnitt beider Klassen miteinander vergleichen?
}}Wir sehen also, dass das arithmetische Mittel das Problem nicht ausreichend beschreibt. Wir brauchen also ein anderes Instrument, um den Unterschied zwischen den Datensätzen darzustellen.
}}
 
Wir brauchen also ein anderes Instrument, das uns einen Vergleich der beiden Klassenarbeitssätze ermmöglicht.


====Der Boxplot====
====Der Boxplot====
Ein Boxplot ist ein Diagramm, das die graphische Darstellung der wichtigsten fünf Lage- und Streuungsmaße anschaulich ermöglicht. Als erstes lernen wir nun diese fünf Maße kennen.
Ein Boxplot ist ein Diagramm, das die graphische Darstellung der wichtigsten fünf Lagemaße anschaulich ermöglicht. Als erstes lernen wir nun diese fünf Maße kennen.


'''Minimum:''' Als Minimum wird der kleinste Wert in einem der Größe nach sortierten Datensatz bezeichnet.  
'''Minimum:''' Als Minimum wird der kleinste Wert in einem der Größe nach sortierten Datensatz bezeichnet.  
Zeile 51: Zeile 53:
'''Maximum:''' Als Maximum wird der größte Wert in einem der Größe nach sortierten Datensatz bezeichnet.  
'''Maximum:''' Als Maximum wird der größte Wert in einem der Größe nach sortierten Datensatz bezeichnet.  


'''Spannweite:''' Als Spannweite wird der Abstand bzw. die Differenz zwischen dem Minimum und dem Maximum bezeichnet.  
Spannweite: Als Spannweite wird der Abstand bzw. die Differenz zwischen dem Minimum und dem Maximum bezeichnet.  


'''Median:''' Der Median (oder Zentralwert) teilt einen Datensatz in zwei gleichgroße Hälften ein. Er ist die Zahl, die bei der Größe nach geordneten Zahlenwerten in der Mitte liegt. Hier können nun zwei Fälle unterschieden werden:
'''Median:''' Der Median (oder Zentralwert) teilt einen Datensatz in zwei gleichgroße Hälften ein. Er ist die Zahl, die bei der Größe nach geordneten Zahlenwerten in der Mitte liegt. Hier können nun zwei Fälle unterschieden werden:
Zeile 58: Zeile 60:
#Ist die Anzahl der Zahlenwerte gerade, dann wird der Durchschnitt der beiden mittleren Werte genommen.
#Ist die Anzahl der Zahlenwerte gerade, dann wird der Durchschnitt der beiden mittleren Werte genommen.


'''Quartile:''' Quartile teilen einen nach der Größe sortierten Datensatz in vier gleichgroße Viertel ein (ähnlich wie beim Median, der es in zwei Hälften unterteilt). Bei Quartilen interessieren uns vor allem das '''erste Quartil (Q1)''' und das '''dritte Quartil (Q3)'''. Das zweite Quartil haben wir bereits kennen gelernt, denn es ist der Median. Zur Bestimmung von Q1 und Q3 werden die durch des Median entstandenen Hälften noch einmal auf die selbe Weise unterteilt, wie wir es bereits beim Median gemacht haben:
'''Quartile:''' Quartile teilen einen nach der Größe sortierten Datensatz in vier gleichgroße Viertel ein (ähnlich wie beim Median, der es in zwei Hälften unterteilt). Bei Quartilen interessieren uns vor allem das '''erste Quartil''' und das '''dritte Quartil'''. Das zweite Quartil haben wir bereits kennen gelernt, denn es ist der Median. Zur Bestimmung vom ersten und dritten Quartil werden die durch des Median entstandenen Hälften noch einmal auf die selbe Weise unterteilt, wie wir es bereits beim Median gemacht haben:


#Ist die Anzahl der Zahlenwerte ungerade, dann wird die mittlere Zahl ausgewählt.
#Ist die Anzahl der Zahlenwerte ungerade, dann wird die mittlere Zahl ausgewählt.
#Ist die Anzahl der Zahlenwerte gerade, dann wird der Durchschnitt der beiden mittleren Werte genommen
#Ist die Anzahl der Zahlenwerte gerade, dann wird der Durchschnitt der beiden mittleren Werte genommen


Q1 wird häufig auch als unteres Quartil und Q3 als oberes Quartil bezeichnet.  
Das erste Quartil wird häufig auch als unteres Quartil und das dritte Quartil als oberes Quartil bezeichnet.  


Der '''Quartilsabstand''' ist der Abstand bzw. die Differenz zwischen Q1 und Q3.
Der Quartilsabstand ist der Abstand bzw. die Differenz zwischen dem ersten und dem dritten Quartil.


Mit einem Boxplot ist es nun möglich, diese Größen anschaulich darzustellen:
Mit einem Boxplot ist es nun möglich, diese Größen anschaulich darzustellen:


<br />[[Datei:Boxplot mit Lage- und Streumaße.png]]
[[Datei:Boxplot mit Lage- und Streumaße.png]]




Puh, das war viel auf einmal und sehr theoretisch. An einem Beispiel wird das ganze klarer.
Puh, das war viel auf einmal und sehr theoretisch. An einem Beispiel wird das Ganze klarer.
====Beispiel 1====
====Beispiel 1: GHR11B====
Schauen wir uns doch einmal den Notenspiegel der GHR11B an.  
Schauen wir uns doch einmal den Notenspiegel der GHR11B an.  
{| class="wikitable"
{| class="wikitable"
Zeile 93: Zeile 95:
|0
|0
|}
|}
Anstatt des Notenspiegels betrachten wir nun die ''<u>Notenliste(?). Zudem nummerieren wir die Zahlenwerte durch</u>''
Anstatt des Notenspiegels betrachten wir nun die Notenliste. Zudem nummerieren wir die Zahlenwerte durch.


Das Minimum und das Maximum können wir schnell ablesen
Das Minimum und das Maximum können wir schnell ablesen
Zeile 153: Zeile 155:
'''Minimum: 2                        Maximum: 4'''
'''Minimum: 2                        Maximum: 4'''


Somit beträgt die '''Spannweite 2''', denn die Differenz zwischen den Maximum (=4) und dem Minimum (=2) ist 2.  
Somit beträgt die Spannweite 2, denn die Differenz zwischen den Maximum (=4) und dem Minimum (=2) ist 2.  


Da die Noten von 24 SchülerInnen angegeben sind, haben die eine gerade Anzahl an Zahlenwerten. Um den Median zu bestimmen, nehmen also den Durchschnitt vom 12. und 13. Zahlenwert.   
Da die Noten von 24 SchülerInnen angegeben sind, haben die eine gerade Anzahl an Zahlenwerten. Um den Median zu bestimmen, nehmen also den Durchschnitt vom 12. und 13. Zahlenwert.   
Zeile 328: Zeile 330:
|}
|}
Das '''erste Quartil''' liegt also bei '''2,5''' und das '''dritte Quartil''' bei '''4'''.  
Das '''erste Quartil''' liegt also bei '''2,5''' und das '''dritte Quartil''' bei '''4'''.  
Der Quartilsabstand liegt also bei 1,5.


Nun haben wir alle notwendigen Größen bestimmt und sind in der Lage, den Boxplot zu diesem Beispiel darzustellen:     
Nun haben wir alle notwendigen Größen bestimmt und sind in der Lage, den Boxplot zu diesem Beispiel darzustellen:     
Zeile 333: Zeile 336:
[[Datei:Grafik bp.png|300x300px]]
[[Datei:Grafik bp.png|300x300px]]


Dies ist nun ein besonderer Boxplot, da sowohl das 3. Quartil als auch das Maximum bei 4 liegen. Aber was genau sagt ein Boxplot nun aus?
Dies ist nun ein besonderer Boxplot, da sowohl das dritte Quartil als auch das Maximum bei 4 liegen. Wie können wir den Boxplot nun deuten?


====Deutung eines Boxplots====
====Deutung eines Boxplots====


Die Quartile sind so definiert, dass zwischen dem ersten und dem viertel Quartil 50% der Zahlenwerte liegen.
Die Quartile sind so definiert, dass zwischen dem ersten und dem viertel Quartil 50% der Zahlenwerte liegen. '''''(...Resi fragen)'''''
 
====Aufgabe: GHR11A====
====Aufgabe: GHR11A====
Wir haben an einem Beispiel gesehen, wie ein Boxplot erstellt wird. Die Aufgabe lautet nun einen Boxplot für die Biologiearbeit der Klasse GHR11A zu erstellen.
Wir haben an einem Beispiel gesehen, wie ein Boxplot erstellt wird. Die Aufgabe lautet nun einen Boxplot für die Biologiearbeit der Klasse GHR11A zu erstellen.

Version vom 17. November 2020, 13:46 Uhr

DIESE SEITE BEFINDET SICH NOCH IN DER ENTWICKLUNG

Die Situation

Die Klassen GHR11A und GHR11B haben eine Klassenarbeit im Fach Biologie geschrieben. Folgendermaßen sind die Klassenarbeiten ausgefallen:

GHR11A
Note 1 2 3 4 5 6
Anzahl 6 5 3 1 6 3
GHR11B
Note 1 2 3 4 5 6
Anzahl 0 6 7 11 0 0

Nun stellt sich die Lehrerin die Frage welche Klasse wohl besser ist. Was meinen Sie? Schauen Sie sich die Notenspiegel an und vergleichen Sie diese. Überlegen Sie kurz, bevor Sie sich den Lösungsvorschlag ansehen.

Um herauszufinden, welche Klasse besser ist, könnte der Klassendurchschnitt betrachtet werden. Auch, wenn wir bereits gelernt haben, dass das arithmetische Mittel nur bei metrischen Skalen sinnhaft ist, wird der Klassendurchschnitt häufig mithilfe des arithmetischen Mittels bestimmt, indem alle Noten addiert werden und die Summe anschließend durch die Anzahl der Klassenarbeiten geteilt wird. Was fällt auf, wenn Sie den Klassendurchschnitt beider Klassen miteinander vergleichen?

Wir brauchen also ein anderes Instrument, das uns einen Vergleich der beiden Klassenarbeitssätze ermmöglicht.

Der Boxplot

Ein Boxplot ist ein Diagramm, das die graphische Darstellung der wichtigsten fünf Lagemaße anschaulich ermöglicht. Als erstes lernen wir nun diese fünf Maße kennen.

Minimum: Als Minimum wird der kleinste Wert in einem der Größe nach sortierten Datensatz bezeichnet.

Maximum: Als Maximum wird der größte Wert in einem der Größe nach sortierten Datensatz bezeichnet.

Spannweite: Als Spannweite wird der Abstand bzw. die Differenz zwischen dem Minimum und dem Maximum bezeichnet.

Median: Der Median (oder Zentralwert) teilt einen Datensatz in zwei gleichgroße Hälften ein. Er ist die Zahl, die bei der Größe nach geordneten Zahlenwerten in der Mitte liegt. Hier können nun zwei Fälle unterschieden werden:

  1. Ist die Anzahl der Zahlenwerte ungerade, dann wird die mittlere Zahl ausgewählt.
  2. Ist die Anzahl der Zahlenwerte gerade, dann wird der Durchschnitt der beiden mittleren Werte genommen.

Quartile: Quartile teilen einen nach der Größe sortierten Datensatz in vier gleichgroße Viertel ein (ähnlich wie beim Median, der es in zwei Hälften unterteilt). Bei Quartilen interessieren uns vor allem das erste Quartil und das dritte Quartil. Das zweite Quartil haben wir bereits kennen gelernt, denn es ist der Median. Zur Bestimmung vom ersten und dritten Quartil werden die durch des Median entstandenen Hälften noch einmal auf die selbe Weise unterteilt, wie wir es bereits beim Median gemacht haben:

  1. Ist die Anzahl der Zahlenwerte ungerade, dann wird die mittlere Zahl ausgewählt.
  2. Ist die Anzahl der Zahlenwerte gerade, dann wird der Durchschnitt der beiden mittleren Werte genommen

Das erste Quartil wird häufig auch als unteres Quartil und das dritte Quartil als oberes Quartil bezeichnet.

Der Quartilsabstand ist der Abstand bzw. die Differenz zwischen dem ersten und dem dritten Quartil.

Mit einem Boxplot ist es nun möglich, diese Größen anschaulich darzustellen:

Boxplot mit Lage- und Streumaße.png


Puh, das war viel auf einmal und sehr theoretisch. An einem Beispiel wird das Ganze klarer.

Beispiel 1: GHR11B

Schauen wir uns doch einmal den Notenspiegel der GHR11B an.

GHR11B
Note 1 2 3 4 5 6
Anzahl 0 6 7 11 0 0

Anstatt des Notenspiegels betrachten wir nun die Notenliste. Zudem nummerieren wir die Zahlenwerte durch.

Das Minimum und das Maximum können wir schnell ablesen

GHR11B
Nr. 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24
Note 2 2 2 2 2 2 3 3 3 3 3 3 3 4 4 4 4 4 4 4 4 4 4 4

Minimum: 2 Maximum: 4

Somit beträgt die Spannweite 2, denn die Differenz zwischen den Maximum (=4) und dem Minimum (=2) ist 2.

Da die Noten von 24 SchülerInnen angegeben sind, haben die eine gerade Anzahl an Zahlenwerten. Um den Median zu bestimmen, nehmen also den Durchschnitt vom 12. und 13. Zahlenwert.

GHR11B
Nr. 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24
Note 2 2 2 2 2 2 3 3 3 3 3 3 3 4 4 4 4 4 4 4 4 4 4 4

Da es sich bei beiden Zahlenwerten um die Zahl 3 handelt, lautet der Median 3.

Durch den Median erhalten wir nun zwei Häften:

GHR11B
Nr. 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24
Note 2 2 2 2 2 2 3 3 3 3 3 3 3 4 4 4 4 4 4 4 4 4 4 4

Um das erste und das dritte Quartil zu bestimmen teilen wir diese Hälften genauso, wie bei der Bestimmung des Medians. Jede Hälfte besteht aus 12 Zahlenwerten. Somit ist das erste Quartil der Durchschnitt vom 6. und 7. Zahlenwert und das 3. Quartil der Durchschnitt vom 18. und 19. Zahlenwert.

GHR11B
Nr. 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24
Note 2 2 2 2 2 2 3 3 3 3 3 3 3 4 4 4 4 4 4 4 4 4 4 4

Das erste Quartil liegt also bei 2,5 und das dritte Quartil bei 4. Der Quartilsabstand liegt also bei 1,5.

Nun haben wir alle notwendigen Größen bestimmt und sind in der Lage, den Boxplot zu diesem Beispiel darzustellen:

Datei:Grafik bp.png

Dies ist nun ein besonderer Boxplot, da sowohl das dritte Quartil als auch das Maximum bei 4 liegen. Wie können wir den Boxplot nun deuten?

Deutung eines Boxplots

Die Quartile sind so definiert, dass zwischen dem ersten und dem viertel Quartil 50% der Zahlenwerte liegen. (...Resi fragen)

Aufgabe: GHR11A

Wir haben an einem Beispiel gesehen, wie ein Boxplot erstellt wird. Die Aufgabe lautet nun einen Boxplot für die Biologiearbeit der Klasse GHR11A zu erstellen.

GHR11A
Note 1 2 3 4 5 6
Anzahl 6 5 3 1 6 3

Geben Sie die folgenden Größen an:

  • Minimum: 1()
  • Maximum: 6()
  • Spannweite: 5()
  • Median: 3()
  • Erstes Quartil: 1,5()
  • Drittes Quartil: 5()
  • Quartilsabstand: 3,5()

Zeichnen Sie den Boxplot auf ein Blatt Papier. Wenn Sie das erledigt haben, können Sie Ihren Boxplot hier mit der Lösung abgleichen.

Nun, wo wir beide Boxplots erstellt haben, möchten wir der Biologielehrerin der Klassen helfen zu beurteilen, welche der beiden Klassen besser ist.


Quellen