Hej, idag är det några småfrågor och lite tips i en salig blandning, nämligen dessa:
Centrala gränsvärdessatsen, problem att lägga in en variabel i ickeparametriskt test, regressionsfråga och tips på variabelinformation inne i dialogrutan.
Fråga:
Kan man hänvisa till centrala gränsvärdessatsen för jämförelse mellan 2 grupper i en utarbetat livskvalitets-index? Det är andra studier som använt parametriska tester.
Svar:
Wikipedia om centrala gränsvärdessatsen
Fråga:
Jag kan inte lägga in min variabel (Company rank) i det ickeparametriska testet (har inte använt testet från legacy-delen utan från de nya testerna).
Fråga:
Kan jag använda kön som x-variabel i min regression (skulle ha gått regressionskursen, men den blev inställd pga pandemin)?
Svar:
Ja om du ser till att kön är 0/1 kodad och noterar ner om det är man eller kvinna som har koden 1 - för att kunna tolka resultatet sen. Tips är att döpa variabelns namn till det som du kodat som 1, så variabeln skulle heta kvinna om koden 1 betyder kvinna.
När du kodar om eller gör selekteringar behöver du veta koderna på dina variabler, du kan få information om vad koderna betyder genom att högerklicka på variabeln du undrar över och välja "variable information" från popup menyn (se nedan):
Liten kommentar till första frågan om CGS och t-test: visst är det så att t-test bygger på att variablerna bakom kan beskrivas med normalfördelningar. Samtidigt är det så att metoderna är hyfsat robusta mot avvikelser mot detta. I en nu lite ålderstigen bok av David Moore, "The Basic Practice of Statistics", som jag har i bokhyllan beskrivs detta i ett avsnitt "Robustness of t procedures" (min bok är upplaga 3, det finns senare upplagor). Där skriver han att med stikprovstorlekar på mindre än 15 så saka man ha goda grunder för normalfördelningsntagandet; för storlekar på mellan 15 och 40 räcker det bra om variablerna är någorlunda symmetriksa, och för stickprov större än 40 så fungerar t-test t o m för variabler som är snedfördelade. Referenser ges också. Som jag ser det är det ett bättre sätt att motivera användning av t-test än CGS.
SvaraRaderaEn kommentar till regressionsfrågan också: för egen del tycker jag i de flesta fall att ingången kallad General Linear Model är att föredra före Regression/Linear.... Där kan man ange en kategorisk variabel som en "faktor" och så sköter programmet om att skapa de binära 0/1-kodade variablerna utan att det märks, dvs då behövs ingen omkodning. Mindre kringarbete, samma resultat.
Stort tack för ditt svar Robert, så bra att det finns en referens som du anger där, som ett alternativ till CGS (Centrala Gränsvärdessatsen).
RaderaBra tips med GLM också. Samma fördel finns för logistisk regression där man slipper skapa binära 0/1-kodade variabler.