MaA 8 Statistik och sannolikhet

15. Korrelation

I arbetet om kurskamraternas längder som Anna, Bertil, Cecilia och Daniel fick de som respons att undersöka om det finns ett samband mellan hur könet påverkar längden. Inom statistik talar vi om att undersöka om det finns en korrelation, samband, mellan två variabler.

Vi undersöker om könet korrelerar med längden.

Men före vi gör det studerar vi följande tre bilder.

Bild 1, Samband mellan längd och ålder?

Bild 2, Samband mellan typ av morgonmål och när man stiger upp?

Bild 2, Samband mellan mängd av sand genom kroppen och ålder?

I bild 1 har vi punkterna fint samlade. Du märker att de nästan lägger sig på en linje. Här har vi ett bra samband mellan ålder och längd. Vi har en positiv korrelation.

I bild 2 märker vi igen att punkterna är spridda över hela grafen. Här finns ingen direkt korrelation mellan när du stiger upp på morgonen och vad du äter till morgonmål. Korrelationen är nära noll.

Bild 3 påminner om bild 1 på så sätt att punkterna är fint samlade. Vi har ett samband mellan ålder och hur mycket sand som far genom kroppen, där mängden sand minska med åldern. Vi har en negativ korrelation.

För att mäta hur bra två variabler korrelerar använder vi oss av Pearsons och Spearmans korrelationskoefficienter. Det viktiga som du skall veta är att värdet för korrelationen, r, ligger mellan -1 och 1. Då \( \mid r \mid > 0,8 \) har vi en stark korrelation.

Värdet på \( r \)Korrelation
0 - 0,30betydelselös
0,30 - 0,60måttlig
0,60 - 0,80märkbar
0,80 - 1stark

Nu är vi färdiga att gå tillbaka till könen och längden. Eftersom vi inte kan pricka in flicka och pojke ger vi dem värdena 1 och 2 (eller 2 och 3. Det är ingen skillnad så länge de har något värde).

Tabellen blir och se ut som följande:

Kön ( 1 = flicka, 2 = pojke)Längd (cm)
1156
1159
1163
1164
1168
1174
2163
2175
2178
2179
2181
2187

Hur vi bestämmer korrelationen med LibreOffice framgår i videon.

På LibreOfficeCalc får du fram korrelationskoefficienten antingen via en graf eller så direkt med kommandot =korrel().

Uppgifter

  1. Daniel som jobbar deltid i sin pappas paraplyaffär gjorde upp följande statistik under en period en höst. Undersök utgående från datan i tabellen nedan om det finns en korrelation mellan regnmängden och antalet sålda paraplyer.
    Total regnmängd för dagen (mm)Antal sålda paraplyn
    3,413
    2,115
    03
    00
    01
    5,617
    1,27
    02
    00
    4,58
    1,24
    00
    1. Bestäm värdet på \( R^2 \).

      0,73

    2. Korrelationen är

      Stark

  2. En lärare gjorde följande observationer över sina elever sina abiturienter som studerade och skrev långa matematiken.
    Medeltal av MaA kurserVitsord i studentexamen
    9,8e
    9,5l
    8,9l
    8,5m
    8,4m
    8,3m
    7,9m
    7,3c
    7,2m
    6,9c
    6,5b
    6,2a
    5,8b
    5,7a

    Korrelerar vitsordet i studentexamen med medeltalet för kurserna? Vitsordsskalan i studentexamen går från l, som högst till, e, m, c, b, a och i som underkänt.

    1. \( R^2 \) har värdet

      0,85

    2. Korrelationen är

      Stark

    3. Finns det ett samband mellan kursvitsorden och vitsordet i studentskrivningarna?

      Ja!

  3. Anna och Bertil gjorde ett statistiskt arbete över om det finns en korrelation mellan längden av skolvägen och tiden som man kommer i tid till första lektionen. De följde med sina klasskamraters tider under en vecka och de fick följande data.
    Avstånd till skolan (km)Minuter man är på plats före lektionen börjar. + är i tid, - är försenad.
    1,55
    1,75
    1,85
    2,05
    3,65
    0,4-2
    1,27
    0,8-4
    5,310
    0,11
    1,3-3
    1,7-15
    0,67
    0,96
    1,14

    Finn det en korrelation mellan avståndet till skolan och vilken tid man är i skolan?

    En graf i LibreOffice ger att \( R^2 = 0,1067\ldots \). Alltså \( R = 0,3266\ldots \).

    Eller kommandot =Korrel() ger \( 0,3266\ldots \).

    Korrelationen är måttlig. Alltså inte direkt.

  4. Cecilia och Daniel gjorde ett statistiskt arbete över om det finns ett samband mellan hur många timmar per dygn som man sover och ålder. De intervjuade personer i sin närmsta krets och fick följande data.
    ÅlderTimmar man sover per dygn.
    177,5
    186,5
    178
    158,5
    478,5
    488,5
    556,5
    577,5
    677,5
    846
    510
    311
    129
    158,5
    118

    Finns det ett samband mellan ålder och hur många timmar man sover per dygn?

    På LibreOfficeCalc får vi korrelationen till \( -0,6407\ldots \).

    Vi har en negativ korrelation. Korrelationen är märkbar. Det betyder att ju äldre man blir destu mindre sover man per dygn.

  5. Följade uppgift är från korta matematikens studentexamensprov från hösten 2020.

    Bedöm på basis av din allmänbildning vilket av alternativen som bäst beskriver korrelationen mellan följande variabler.

    Positiv korrelationKorrelationen är nära 0Negativ korrelation
    Längd och vikt hos finska barn.
    Skonummer och blodtryck hos finländska vuxna.
    Ett lands bruttonationalprodukt per invånare och barndödlighet.
    Lodräta och vågräta koordinater för pilar som träffat en piltavla.

    Den rätta raden är

    Positiv korrelationKorrelationen är nära 0Negativ korrelation
    Längd och vikt hos finska barn.
    Skonummer och blodtryck hos finländska vuxna.
    Ett lands bruttonationalprodukt per invånare och barndödlighet.
    Lodräta och vågräta koordinater för pilar som träffat en piltavla.