handdator

Visa fullständig version : Statistik: Hur räknar man ut standardavvikelsen?


Stoltz
2008-04-18, 20:10
Hej,

Jag ska räkna ut standardavvikelsen på några tester jag gjort, men jag är inte gjord för matte, jag förstår verkligen inte hur jag ska gå till väga. Är det någon barmhärtig själ som kan förklara för mig, på samma sätt som ni hade förklarat för en 5-åring? ;)

jakke
2008-04-18, 20:16
http://sv.wikipedia.org/wiki/Standardavvikelse

lovelysmile
2008-04-19, 09:07
Yo snubbe Stoltz! Räknade du ut det?

Stoltz
2008-04-19, 09:29
Jag tror det, jag fick använda mig av roten ur: Summan av x^2 - [(summan av x)^2 / n] / n-1.

Jävla omständigt säkert, men jag är inte gjord för mattelogik, den saken är säker.

Jacksatan
2008-04-19, 11:17
Jag tror det, jag fick använda mig av roten ur: Summan av x^2 - [(summan av x)^2 / n] / n-1.

Jävla omständigt säkert, men jag är inte gjord för mattelogik, den saken är säker.

Nu fattar jag inte riktigt hur du räknat. Men ponera att du har ett antal pojkar som vi väger och sen ska räkna ut standardavvikelsen för deras vikt. Då räknar man först ut genomsnittsvikten y*. n är antal pojkar. Formeln för variansen blir då

s^2=1/(n-1)gånger summan av(yi-y*)^2. Där yi är vikten för varje enskild pojke.
Får att få standardavvikelsen tar du bara roten ur s^2.

Stoltz
2008-04-19, 11:39
Nu fattar jag inte riktigt hur du räknat. Men ponera att du har ett antal pojkar som vi väger och sen ska räkna ut standardavvikelsen för deras vikt. Då räknar man först ut genomsnittsvikten y*. n är antal pojkar. Formeln för variansen blir då

s^2=1/(n-1)gånger summan av(yi-y*)^2. Där yi är vikten för varje enskild pojke.
Får att få standardavvikelsen tar du bara roten ur s^2.

Hm, jag är inte helt säker på om jag förstår dig rätt, men om min summa är 17 (De sex testpersonernas resultat sammanlagt) så blir väl standardavvikelsen 0,98?

Det var så jag fick det när jag räknade ut det. Skulle vara skönt ifall någon kunde verifiera det eller berätta för mig att jag är helt fel ute.

Prankie
2008-04-19, 11:39
Själv brukar jag använda shortcut metod.

(Summan av Xi^2 - (Summan av Xi) ^2 / n ) / (n-1)

Sen roten ur.
Lite mindre knappande med miniräknare allafall. :)

Jacksatan
2008-04-19, 11:41
Hm, jag är inte helt säker på om jag förstår dig rätt, men om min summa är 17 (De sex testpersonernas resultat sammanlagt) så blir väl standardavvikelsen 0,98?

Det var så jag fick det när jag räknade ut det. Skulle vara skönt ifall någon kunde verifiera det eller berätta för mig att jag är helt fel ute.

Det kan jag omöjligen svara på utan att veta vad dina 6 personer hade för värden. Lägg ut dem här kan jag räkna ut det åt dig. Enklast så.

Stoltz
2008-04-19, 11:44
Det kan jag omöjligen svara på utan att veta vad dina 6 personer hade för värden. Lägg ut dem här kan jag räkna ut det åt dig. Enklast så.

TestPerson1: 3
TP2: 4
TP3: 3
TP4: 1
TP5: 3
TP6: 3

Detta är bara en liten bråkdel av allt jag ska räkna ut, så jag hoppas att modsen kan ha överseende och förstå att detta endast handlar om att jag vill kunna se logiken/systemet i hur jag ska räkna ut resten.

Jacksatan
2008-04-19, 11:45
Själv brukar jag använda shortcut metod.

(Summan av Xi^2 - (Summan av Xi) ^2 / n ) / (n-1)

Sen roten ur.
Lite mindre knappande med miniräknare allafall. :)

Det blir inte korrekt. Xi^2 - (Summan av Xi) ^2 / n ) är inte samma sak som att ta (Xi- X*)^2 där X* är genomsnittet av X eller summan av Xi/n

Allan
2008-04-19, 11:51
Den här tråden är OK. Den är intressant för fler än den som startade den

Jacksatan
2008-04-19, 11:52
TP1: 3
TP2: 4
TP3: 3
TP4: 1
TP5: 3
TP6: 3

Detta är bara en liten bråkdel av allt jag ska räkna ut, så jag hoppas att modsen kan ha överseende och förstå att detta endast handlar om att jag vill kunna se logiken/systemet i hur jag ska räkna ut resten.

Ok då fixar vi det.

(4+3+1+3+3)/5=2.8 är alltså medelvärdet

s^2= 1/(5-1) x (((4-2.8)^2)+((3-2.8)^2)+((1-2.8)^2)+((3-2.8)^2)+((3-2.8)^2))

Svar: 1.2 är variansen. Roten ur 1.2 är 1.095 vilket är din standardavvikelse.

Edit: Äh, vafan missade TP1. Men för de övriga stämmer det. Dvs om det bara var Tp2-Tp6

Prankie
2008-04-19, 11:53
TP1: 3
TP2: 4
TP3: 3
TP4: 1
TP5: 3
TP6: 3

Detta är bara en liten bråkdel av allt jag ska räkna ut, så jag hoppas att modsen kan ha överseende och förstå att detta endast handlar om att jag vill kunna se logiken/systemet i hur jag ska räkna ut resten.

Med shortcut
(Summan av Xi^2 - (Summan av Xi) ^2 / n ) / (n-1)
Summan av Xi^2 = 9+16+9+1+9+9=53
(Summan av Xi)^2 = 17^2=289
( 53-289/6 ) / 5 = 0,96667
Standardavilkelse är då roten ur 0,96667 = 0,9831

Prankie
2008-04-19, 12:01
Det blir inte korrekt. Xi^2 - (Summan av Xi) ^2 / n ) är inte samma sak som att ta (Xi- X*)^2 där X* är genomsnittet av X eller summan av Xi/n

TP1: 3
TP2: 4
TP3: 3
TP4: 1
TP5: 3
TP6: 3

Det är samma sak. Bara färre uträkningar.

(3+4+3+1+3+3)/6=2.833 är alltså medelvärdet

(3-2.833) ^2 = 0.0277
(4-2.833) ^2 = 1,3611
(3-2.833) ^2 = 0.0277
(1-2.833) ^2 = 3.3611
(3-2.833) ^2 = 0.0277
(3-2.833) ^2 = 0.0277

Tillsammas blir de 4.8333 / 5 = 0,96667
Standardavilkelse blir då 0,9831...

Stoltz
2008-04-19, 12:03
Den här tråden är OK. Den är intressant för fler än den som startade den
Tack så mycket!

Ok då fixar vi det.

(4+3+1+3+3)/5=2.8 är alltså medelvärdet

s^2= 1/(5-1) x (((4-2.8)^2)+((3-2.8)^2)+((1-2.8)^2)+((3-2.8)^2)+((3-2.8)^2))

Svar: 1.2 är variansen. Roten ur 1.2 är 1.095 vilket är din standardavvikelse.

Edit: Äh, vafan missade TP1. Men för de övriga stämmer det. Dvs om det bara var Tp2-Tp6

Med shortcut
(Summan av Xi^2 - (Summan av Xi) ^2 / n ) / (n-1)
Summan av Xi^2 = 9+16+9+1+9+9=53
(Summan av Xi)^2 = 17^2=289
( 53-289/6 ) / 5 = 0,96667
Standardavilkelse är då roten ur 0,96667 = 0,9831

Jag har nu testat bägge formlerna, och bägges standardavvikelse (0,98) stämmer överens med min egen uträkning, likaså med övriga uträkningar. Verkar som om det stämmer.

Tack!

Muskelbyggaren
2008-04-19, 13:09
Standardavvikelse är en rätt fiffig grej som är mycket rimlig om man funderar lite på den, lättare att komma ihåg det också då. Man räknar ju ut hur mycket varje värde skiljer sig från genomsnittet, och räknar sedan ut ett nytt genomsnitt för kvadraten av dessa avvikelser. Varför man tar kvadraten är för att bli av med eventuella minustecken, alla tal i kvadrat blir ju positiva, oavsett om de är negativa eller positiva från början.

Mental
2008-04-19, 14:04
Men standardavvikelsen är ju bara intressant om man kan anta att resultaten är normalfördelade

Torwald
2008-04-19, 14:17
Men standardavvikelsen är ju bara intressant om man kan anta att resultaten är normalfördelade
Njae, men det är mest relevant om det finns en symmetri i fördelningen. Inte nödvändigtvis att det är normalfördelat. Eller hur tänker du?

Prankie
2008-04-19, 14:24
Njae, men det är mest relevant om det finns en symmetri i fördelningen. Inte nödvändigtvis att det är normalfördelat. Eller hur tänker du?

Man brukar ju använda standardavikelse för att räkna ut sannolikhet. Är det inte normalfördelad så säger standardavikelse inte så mycket.
http://www.etfos.hr/~akolundzic/slika-normalna-razdioba-ses.gif

Torwald
2008-04-19, 14:35
Man brukar ju använda standardavikelse för att räkna ut sannolikhet. Är det inte normalfördelad så säger standardavikelse inte så mycket.
http://www.etfos.hr/~akolundzic/slika-normalna-razdioba-ses.gif

Jag vet vad normalfördelning är, men det finns ju andra vanliga symmetriska fördelningar! t-fördelningen, till exempel.

Normalfördelningen är ju bara över huvud taget aktuell när populationens varians är känd. Vad ska du då räkna ut sitckprovsstandardavvikelsen för? Låter som slöseri med tid i mina öron.

Prankie
2008-04-19, 14:41
Då är symmertrisk kanske fel ord. En uniform fördelning är också symmertrisk.

Prankie
2008-04-19, 14:47
Jag vet vad normalfördelning är, men det finns ju andra vanliga symmetriska fördelningar! t-fördelningen, till exempel.

Normalfördelningen är ju bara över huvud taget aktuell när populationens varians är känd. Vad ska du då räkna ut sitckprovsstandardavvikelsen för? Låter som slöseri med tid i mina öron.

men sant som du säger, t-fördelning är nog mer användbart än Z-fördelning i det verkliga livet. Vet man sigma så har man nog redan data för hela populationen. Lite onödig att göra en sampling då.

Torwald
2008-04-19, 14:56
Ja, det är exakt vad min poäng är. Därför är ju stickprovsvarianten i allra högsta grad intressant även om det inte förligger någon normalfördelning. Särskilt då! Det var därför jag inte förstod vad Mental menade. Förstår fortfarande inte, faktiskt :)

Prankie
2008-04-19, 15:17
Men är det inte så att det är populationen som måste vara normalfördelad? Vi använder väl bara T-distribution för att räkna sannolikhet för våran stickprov.

Cilia
2008-04-19, 15:30
Låter som en tuppfight det här.

Jag måste säga att jag håller med Prankie.
Det normala är att använda standardavvikelsen vid normalfördelning.

Torwald
2008-04-19, 15:30
Men är det inte så att det är populationen som måste vara normalfördelad? Vi använder väl bara T-distribution för att räkna sannolikhet för våran stickprov.

Om populationen är normalfördelad är stickproven det också, och med samma varians. Stickproven föjler samma fördelning som populationen de tas ifrån.

Uppenbarligen pratar ju trådskaparen om stickprovsvariansen, och alla andra också. Ingen har ju föreslagit något annat än division med n-1.

Populations data antas (oftast, det finns ju flera omständigheter man kan tänka sig) följa en t-fördelning (inte stora T, det är en annan sak ;)) när variansen är okänd. t-fördelningn är mycket lik normalfördelningen, den är bara något plattare. Den blir mer och mer lik normalfördelningen ju större urval man har.

EDIT: Jag förstår inte Ciliga heller. Det är väl klart att det normala är att använda standardavvikelsen även när det inte föreligger normalfördelning? Min poäng är ju precis det att det är mycket ovanligt att data kan antas följa en normalfördelning. I verkligheten.

EDIT2: Jag tycker att det är intressant, jag försöker inte tuppfajtas :P

Prankie
2008-04-19, 15:39
Ahh, jag tänkte nog fel. För mig så utgår vi oftast från att population redan är normalfördelad men eftersom vi inte har variansen för populationen använder vi variansen från stickprovet. Detta gör att vi kan inte vara lika säker på våra "gissning" vilket i sin tur gör att vi använder t-distributionen istället för Z.

Torwald
2008-04-19, 15:47
Ok, då förstår jag hur du tänker!