Gå til innhold

Problemer med samfunnsvitenskapelig metode (Regresjonsanalyse).


Uheldigtype

Anbefalte innlegg

Hei alle sammen,

Eksamen nærmer seg i samfunnsvitenskapelig metode og jeg føler at jeg klarer meg greit når det kommer til å forklare de forskjellige metodene og lignende, hvilke styrker og svakheter de forskjellige oppleggene har. Det er virkelig en ting jeg sliter med, og det er å lese av tabeller - spesielt når det kommer til regresjonsanalyser. Det er snakk om forklart varians (R2), justert forklart varians, F-tester, T-tester ,konfidensintervaller korrelasjonsanalyser, Z-verdier og regresjonsanalyser. Skjønner virkelig ingenting av de.

Disse spørsmålene går igjen hvert eneste år på eksamen, jeg klarer alt annet fint, men dette her skjønner jeg virkelig ingenting av.

Er det noen som kunne hjulpet meg litt med å forstå dette? Setter enormt pris på hjelp!

Lenke til kommentar
Del på andre sider

Fortsetter under...

Jeg skal ha eksamen i noe av det det jeg også.

Kan ikke hjelpe deg noe særlig, siden jeg sliter litt med det selv.

Men du burde søke litt på youtube-videoer. Syns det hjelper å få det forklart på litt forskjellige måter :)

Lenke til kommentar
Del på andre sider

En regresjonslinje er slik at samlet kvadratavstand mellom hver observasjon og regresjonslinja skal være minst mulig.

Du må nesten spesifisere litt hvilke spørsmål du får som du sliter med!

Anonymous poster hash: b9e15...729

  • Liker 1
Lenke til kommentar
Del på andre sider

For å spesifisere nærmere: Problematikken er med SPSS. Det vil si å lese av tabellene med stor sikkerhet. Ett eksempel på dette er følgende oppgave:

I følge en teori fra valgforskningen i USA er det amerikanske presidentvalget først og
fremst en folkeavstemming om prestasjonen til den sittende presidenten. Teorien sier
at dersom velgerne er fornøyde med presidentens innsats, vil velgerne støtte
kandidaten som representerer presidentens parti i valget. Dersom de er misfornøyd
med presidentens innsats, vil de stemme på kandidaten fra opposisjonspartiet (alle
andre parti enn Det republikanske partiet og Det demokratiske partiet er holdt utenfor
i denne sammenhengen).
Den multivariate regresjonsmodellen som her presenteres legger vekt på tre variabler
som kan forklare prosentandelen stemmer partiet til den sittende presidenten får på
valgdagen. Modellen er basert på de amerikanske presidentvalgene mellom 1948-
2004, og er estimert ved hjelp av minste kvadratsums metode (OLS). De tre
forklaringsvariablene er:
1.BNP: Årlig vekst i bruttonasjonalprodukt.
Målt som prosentendring i det andre kvartalet av valgåret fra andre kvartal
året før.
2. Pres. pop.: Populariteten til den sittende presidenten
Målt som presidentens prosentmessige netto popularitet (approval ratings)
halvveis ut i valgåret. Netto popularitet betyr prosentandelen som liker
presidenten minus prosentandelen som ikke gjør det. Eksempel: Hos 60%
av befolkningen er presidenten populær, mens han er upopulær hos 40%
av befolkningen. Da blir netto popularitet 60% - 40% = 20%
3. Slitasje: Hvor lenge den sittende presidentens parti sammenhengende har hatt
sin kandidat i Det hvite hus.
Denne variabelen er en dummy som får verdien 0 dersom lengden er fire
år eller mindre, og verdien 1 dersom lengden er mer enn fire år.
Ps: husk på at selv om presidenten bare kan sitte i åtte år i strekk, så kan
partiet få valgt inn sin nye kandidat, og dermed beholde presidentposisjonen.
Avhengig variabel: Stemmeandelen til den sittende presidentens parti i amerikanske presidentvalg.
Basert på presidentvalgene i perioden 1948-2004. N=15
Tabellen:
Ustandardiserte Koeffisienter
Modell: B
Konstant 51,417
BNP: 0,604
Pres.Pop 0,109
Slitasje (Dummy): -4,265
Utdrag fra tabellen. Er en del mer, men denne biten synes jeg er litt ekkel. Jeg vet at forandringen i de uavhengige variablene påvirker den avhengige variabelen. Problemet mitt er at jeg sliter med å forstå "HVA" som faktisk skjer. Er det slik at i dette tilfellet så er forskjellen i BNP fra fjorårets til dette årets BNP er 6%?
Når det kommer til Pres.Pop: Betyr 0,109 at han har 55% oppslutning?
Den aller ekleste i disse oppgaven er uten tvil den siste (Det vil si hvor de går i minus på uforståelig måte)
Slitasje: I oppgaven står det at man får verdien 0, dersom lengden på oppholdet er fire år eller mindre. Verdien 1 blir gitt dersom lengden er mer enn fire år. Hvorfor i all verden står det -4,265 her? Bør ikke det være et tall mellom 0 og 1? Hvorfor er det -4,265? Har sett denne varianten i flere oppgaver og stusser veldig på dette. Hvordan skal jeg tolke det?
Lenke til kommentar
Del på andre sider

En regresjonslinje er slik at samlet kvadratavstand mellom hver observasjon og regresjonslinja skal være minst mulig.

Du må nesten spesifisere litt hvilke spørsmål du får som du sliter med!

Anonymous poster hash: b9e15...729

Eksempel i innlegget over :)

Lenke til kommentar
Del på andre sider

Annonse

Hvordan overlevde du innleveringene hvis du ikke forstår det?

Har dere fått tips om hva som kan komme på eksamen? Høst 2013 var det ikke tabeller på eksamen i hvert fall.

Lenke til kommentar
Del på andre sider

Du tenker helt feil. Koeffisienten angir ikke nivået på noen variabel, men viser hvordan den avhengige variablen endres når den uavhengige variablen endres med én enhet. Det ser du nok bedre hvis du skriver regresjonsligningen ut:

Sittende presidents stemmeandel i prosent = 51,417 + 0,604*BNP-endring + 0.109*presidentens popularitet + (-4,265)*presidentens parti har hatt makten i mer enn fire år

Koeffisienten for BNP viser altså hvordan presidentens stemmeandel endres når BNP går én enhet opp, så hvis BNP har økt med 1%, vil stemmeandelen øke med 0,604*1 prosent. Har BNP gått opp med 2%, øker stemmeandelen med 0,604*2 prosent.

En negativ koeffisient betyr dermed bare at effekten av at den uavhengige variablen går opp, er negativ, det vil si at stemmeandelen synker. Bruken av binære variabler med verdi 1 eller 0, påvirker ikke hvordan koeffisienten kan være, det betyr bare at det er en enten/eller-variabel, altså noe som er sant eller usant. Hvis presidentens parti har sittet i mer enn fire år (og vilkåret for variablen er oppfylt) har variablen verdi 1, og effekten på stemmeandelen er -4,265*1 prosent. Hvis partiet ikke har sittet i mer enn fire år, har variablen verdi 0 og effekten er -4,265*0 prosent (altså ingenting).

Man bruker binære variabler for å korrigere for faste effekter, for eksempel om noen tilhører et gitt kjønn, har en viss alder, kommer fra et spesielt land osv. Hvis man for eksempel skal analysere hvordan lønn avhenger av alder, kunne man for eksempel tenke seg en veldig forenklet formel av typen:

Lønn = 0.25*alder + (-0.75)*er over 65 år

Første ledd i formelen viser at jo eldre man er, jo mer tjener man, men at det har en sterk negativ effekt å være over 65 år. Det gir jo mening, fordi da pensjonerer mange seg og tjener ikke mer, selv om man er eldre.



Anonymous poster hash: 11afd...57c
Lenke til kommentar
Del på andre sider

Du tenker helt feil. Koeffisienten angir ikke nivået på noen variabel, men viser hvordan den avhengige variablen endres når den uavhengige variablen endres med én enhet. Det ser du nok bedre hvis du skriver regresjonsligningen ut:

Sittende presidents stemmeandel i prosent = 51,417 + 0,604*BNP-endring + 0.109*presidentens popularitet + (-4,265)*presidentens parti har hatt makten i mer enn fire år

Koeffisienten for BNP viser altså hvordan presidentens stemmeandel endres når BNP går én enhet opp, så hvis BNP har økt med 1%, vil stemmeandelen øke med 0,604*1 prosent. Har BNP gått opp med 2%, øker stemmeandelen med 0,604*2 prosent.

En negativ koeffisient betyr dermed bare at effekten av at den uavhengige variablen går opp, er negativ, det vil si at stemmeandelen synker. Bruken av binære variabler med verdi 1 eller 0, påvirker ikke hvordan koeffisienten kan være, det betyr bare at det er en enten/eller-variabel, altså noe som er sant eller usant. Hvis presidentens parti har sittet i mer enn fire år (og vilkåret for variablen er oppfylt) har variablen verdi 1, og effekten på stemmeandelen er -4,265*1 prosent. Hvis partiet ikke har sittet i mer enn fire år, har variablen verdi 0 og effekten er -4,265*0 prosent (altså ingenting).

Man bruker binære variabler for å korrigere for faste effekter, for eksempel om noen tilhører et gitt kjønn, har en viss alder, kommer fra et spesielt land osv. Hvis man for eksempel skal analysere hvordan lønn avhenger av alder, kunne man for eksempel tenke seg en veldig forenklet formel av typen:

Lønn = 0.25*alder + (-0.75)*er over 65 år

Første ledd i formelen viser at jo eldre man er, jo mer tjener man, men at det har en sterk negativ effekt å være over 65 år. Det gir jo mening, fordi da pensjonerer mange seg og tjener ikke mer, selv om man er eldre.

Anonymous poster hash: 11afd...57c

Tusen hjertelig takk for et langt, godt og velformulert svar. Jobber du innenfor utdanningssektoren? Du forklarer på en veldig god måte!

Jeg har forstått tidligere at de uavhengige variablene påvirker den avhengige variabelen. Det eneste som er nødvendig er å regne forskjellen hvis man tar utgangspunkt i at den endres med en(1) enhet?Riktig?

Så det vil si at hvis vi har den konstante (som er den avhengige variabelen), som i dette tilfellet er presidentens stemmeandel på 51,417 og BNP øker med 2%, så blir det 0,604*2= 1,208. Økningen i stemmeandel er 1,2%.

Pres.Pop: Samme som over. Vi endrer enheten med 3. 3*0,109= 0,327. Endringen hadde vært 0,327.

Spørsmål: Den konstante: Er alle de uavhengige variablene årsaken til at den er på 51,417, eller er det bare et tall som vi har fått, og det eneste vi skal forholde oss til er de uavhengige variablene sin påvirkning på den avhengige variabelen?

Føler jeg skjønte det meste etter innlegget ditt, setter stor pris på svarene :)

Hvordan overlevde du innleveringene hvis du ikke forstår det?

Har dere fått tips om hva som kan komme på eksamen? Høst 2013 var det ikke tabeller på eksamen i hvert fall.

Leverte de i vår, men tar eksamen dette halvåret her.

Endret av Uheldigtype
Lenke til kommentar
Del på andre sider

Gjest Meglerfrøken

Hei alle sammen,

Eksamen nærmer seg i samfunnsvitenskapelig metode og jeg føler at jeg klarer meg greit når det kommer til å forklare de forskjellige metodene og lignende, hvilke styrker og svakheter de forskjellige oppleggene har. Det er virkelig en ting jeg sliter med, og det er å lese av tabeller - spesielt når det kommer til regresjonsanalyser. Det er snakk om forklart varians (R2), justert forklart varians, F-tester, T-tester ,konfidensintervaller korrelasjonsanalyser, Z-verdier og regresjonsanalyser. Skjønner virkelig ingenting av de.

Disse spørsmålene går igjen hvert eneste år på eksamen, jeg klarer alt annet fint, men dette her skjønner jeg virkelig ingenting av.

Er det noen som kunne hjulpet meg litt med å forstå dette? Setter enormt pris på hjelp!

Hei!

Søk opp Njål Foldnes på youtube. dette gjelder dog statistikk for økonomer, men mye av det du nevner, ( t test, regresjon etc) er det samme!

Ellers ønsker jeg deg lykke lykke til;)

Hilsen noen i nøyaktig samme båt... Damn you regresjon....!

Lenke til kommentar
Del på andre sider

Jeg lærte meg slik han går frem i denne videoen til eksamen:

https://m.youtube.com/watch?v=pFueeUdod0Y

Stod til en A på høgskolen min. :)

Hei!

Søk opp Njål Foldnes på youtube. dette gjelder dog statistikk for økonomer, men mye av det du nevner, ( t test, regresjon etc) er det samme!

Ellers ønsker jeg deg lykke lykke til;)

Hilsen noen i nøyaktig samme båt... Damn you regresjon....!

Morsomt at dere nevner han! Syntes han var kjempedyktig når jeg så på han i går, dyktig fyr :) Masse lykke til!

Lenke til kommentar
Del på andre sider

Gjest Meglerfrøken

Morsomt at dere nevner han! Syntes han var kjempedyktig når jeg så på han i går, dyktig fyr :) Masse lykke til!

Dette var en del av et prøveprosjekt ved BI Stavanger, om å prøve få opp forståelsen i matte for økonomer og statistikk. Såvidt jeg husker, så har disse videoene hans økt snittet ganske betraktelig!

Hva skal du opp i?:)

Lenke til kommentar
Del på andre sider

Annonse

Dette var en del av et prøveprosjekt ved BI Stavanger, om å prøve få opp forståelsen i matte for økonomer og statistikk. Såvidt jeg husker, så har disse videoene hans økt snittet ganske betraktelig!

Hva skal du opp i? :)

Metode102 på SV. Skal innrømme at forståelsen økte betraktelig i motsetning til å sitte og flipre seg gjennom "Den store SPSS-Håndboken" fra tidlig 2000. Hva med deg?

Lenke til kommentar
Del på andre sider

Tusen hjertelig takk for et langt, godt og velformulert svar. Jobber du innenfor utdanningssektoren? Du forklarer på en veldig god måte!

Jeg har forstått tidligere at de uavhengige variablene påvirker den avhengige variabelen. Det eneste som er nødvendig er å regne forskjellen hvis man tar utgangspunkt i at den endres med en(1) enhet?Riktig?

Så det vil si at hvis vi har den konstante (som er den avhengige variabelen), som i dette tilfellet er presidentens stemmeandel på 51,417 og BNP øker med 2%, så blir det 0,604*2= 1,208. Økningen i stemmeandel er 1,2%.

Pres.Pop: Samme som over. Vi endrer enheten med 3. 3*0,109= 0,327. Endringen hadde vært 0,327.

Spørsmål: Den konstante: Er alle de uavhengige variablene årsaken til at den er på 51,417, eller er det bare et tall som vi har fått, og det eneste vi skal forholde oss til er de uavhengige variablene sin påvirkning på den avhengige variabelen?

Føler jeg skjønte det meste etter innlegget ditt, setter stor pris på svarene :)

Leverte de i vår, men tar eksamen dette halvåret her.

Haha nei, jeg er bare økonom :) Men bra du forstod mer! Du har forstått hvordan du regner koeffisientene også! Konstanten kan du se som den forventede verdien hvis alle de uavhengige variablene er null, eller som et mentalt startpunkt før man tar de uavhengige variablene i betraktning. Når du har regnet ut effekten av alle variabelendringene, skal de jo legges sammen med koeffisienten for å finne det endelige nivået på den avhengige variablen.

Merk at konstanten også inkluderer effekten av andre variabler som kunne tenkes å påvirke den avhengige variablen, men som ikke er spesifisert i regresjonsligningen. Hvis du definerte en ny uavhengig variabel, for eksempel "presidenten er over seksti år", ville konstanten og sannsynligvis også de andre variablene endre seg fordi man ble mer detaljert. Det er dette som er det vanskelige med regresjon: på den ene side vil man ha så høy forklaringsgrad som mulig (R2), noe som gjerne krever flere parametre, på den andre side får man også et problem hvis man har altfor mange variabler. Men det siste er nok ikke på pensum i kurset ditt.

Anonymous poster hash: 11afd...57c

Lenke til kommentar
Del på andre sider

Gjest Meglerfrøken

Metode102 på SV. Skal innrømme at forståelsen økte betraktelig i motsetning til å sitte og flipre seg gjennom "Den store SPSS-Håndboken" fra tidlig 2000. Hva med deg?

Jeg skal opp i Statistikk, MET 29201. Kan ikke si jeg ser frem til det;) Men slik er det.

Lykke til!

Lenke til kommentar
Del på andre sider

Annonse

[1] Category widget

Haha nei, jeg er bare økonom :) Men bra du forstod mer! Du har forstått hvordan du regner koeffisientene også! Konstanten kan du se som den forventede verdien hvis alle de uavhengige variablene er null, eller som et mentalt startpunkt før man tar de uavhengige variablene i betraktning. Når du har regnet ut effekten av alle variabelendringene, skal de jo legges sammen med koeffisienten for å finne det endelige nivået på den avhengige variablen.

Merk at konstanten også inkluderer effekten av andre variabler som kunne tenkes å påvirke den avhengige variablen, men som ikke er spesifisert i regresjonsligningen. Hvis du definerte en ny uavhengig variabel, for eksempel "presidenten er over seksti år", ville konstanten og sannsynligvis også de andre variablene endre seg fordi man ble mer detaljert. Det er dette som er det vanskelige med regresjon: på den ene side vil man ha så høy forklaringsgrad som mulig (R2), noe som gjerne krever flere parametre, på den andre side får man også et problem hvis man har altfor mange variabler. Men det siste er nok ikke på pensum i kurset ditt.

Anonymous poster hash: 11afd...57c

Skjønner. Synes det er greit å få oppklart slike ting. Liker å ha forståelse for det jeg skal lære, i stedet for å bare vite reglene :) Har hatt en oppgave jeg har stusset litt på i dag. Kunne du forklart den, muligens? Den har en binær verdi som i oppgaven over, men i dette tilfellet synes jeg det var dårlig ordlegging. Har eksamen i morgen tidlig, så kan godt hende du ser dette når jeg allerede er ferdig. Hehe.

Tabellen nedenfor er et utdrag fra en utskrift i SPSS, og er en analyse av valgdeltakelsen ved
det norske kommunestyrevalget i 2007 for landets 19 fylker. Variablene er definert som følger:
Valgdeltakelse: Antall som har stemt som andel av de stemmeberettigede.
Nord-Norge: Har verdien 1 for fylkene Nordland, Troms og Finnmark, og null
for de andre fylkene.
Sysselsatte: Andel som har jobb som prosentandel av befolkningen i fylket.
Ustandarisert Koeffisient Standardisert Koeffisient
B Std.Error Beta Sig
(Constant): 36,966 8,839 ,001
Nord-Norge: -1,543 ,856 -,339 ,090
Sysselsatte : ,345 ,124 ,523 ,013
Det jeg forstår fra denne, er at i tabellen er det bare 1( Nord-Norge) som har blitt tatt med, og ikke 0 (Resten av fylkene). Antall personer som har stemt er 36966 personer (Virker lavt?). Når jeg endrer èn enhet vil mengden stemmer reduseres med 1543 hvis det er Nord-Norge jeg forandrer. Hvis jeg endrer sysselsatte øker den med 345. Problemet er, at jeg ikke helt ser relevansen? Hva innebærer det å øke en enhet innenfor Nord-Norge? Synes det er logisk når man endrer èn enhet i BNP, lønn og lignende. Men den der forvirret meg. Er det noe i denne oppgaven jeg fundamentalt ikke har fått med meg? Beklager hvis det er et dumt spørsmål. Lurer bare veldig på hvordan du tolker denne, siden ingen andre jeg har hørt med har funnet ut av det heller. Takk for svar :)
Endret av Uheldigtype
Lenke til kommentar
Del på andre sider

Gjest hva som helst

Valgdeltagelsen måles i prosent, om jeg ikke misforstår helt. Så i dette tilfellet vil konstanten tolkes som at i et fylke som ikke er i Nord-Norge, med 0% sysselsatte, så vil valgoppslutningen være 36,966%.

Nord-Norge er en dummyvariabel som tar verdiene 0 eller 1. Den er lik 1 hvis vi ser på et fylke i Nord-Norge, og koeffisienten vil dermed tolkes som at valgoppslutningen i Nord-Norge er 1,543%-poeng lavere enn i de andre fylkene.

Sysselsatte-koeffisienten tolkes som at en 1%-poengs økning i sysselsettingen i et fylke, øker valgoppslutningen i fylket med 0,345%-poeng.

Muligens litt dårlig fortklart. Et tips er å se nøye på måleenheten for hver av variablene, og tenke hvilke verdier de kan ta.

Lenke til kommentar
Del på andre sider

Valgdeltagelsen måles i prosent, om jeg ikke misforstår helt. Så i dette tilfellet vil konstanten tolkes som at i et fylke som ikke er i Nord-Norge, med 0% sysselsatte, så vil valgoppslutningen være 36,966%.

Nord-Norge er en dummyvariabel som tar verdiene 0 eller 1. Den er lik 1 hvis vi ser på et fylke i Nord-Norge, og koeffisienten vil dermed tolkes som at valgoppslutningen i Nord-Norge er 1,543%-poeng lavere enn i de andre fylkene.

Sysselsatte-koeffisienten tolkes som at en 1%-poengs økning i sysselsettingen i et fylke, øker valgoppslutningen i fylket med 0,345%-poeng.

Muligens litt dårlig fortklart. Et tips er å se nøye på måleenheten for hver av variablene, og tenke hvilke verdier de kan ta.

Dette er det mest logiske svaret jeg har fått i dag når det kommer til denne oppgaven. Synes det hørtes fornuftig ut. Tusen takk Herr Flyndre :)!

Lenke til kommentar
Del på andre sider

Dette er det mest logiske svaret jeg har fått i dag når det kommer til denne oppgaven. Synes det hørtes fornuftig ut. Tusen takk Herr Flyndre :)!

Det kan kanskje hjelpe deg å huske at når man bruker binære variabler, skyldes det at det er forskjeller mellom de to gruppene variablen skiller mellom, og at det ikke er snakk om nivåer. Her har man altså skilt ut de tre fylkene fordi man ser at velgeroppførselen er annerledes enn i de andre fylkene, og på en måte som ikke lar seg forklare bare ved bruk av sysselsettingsvariablen. Med samme sysselsettingsnivå vil nord-Norge ha en lavere valgdeltagelse enn resten av landet, som Flyndrefisken sier.

Anonymous poster hash: 11afd...57c

Lenke til kommentar
Del på andre sider

Opprett en konto eller logg inn for å kommentere

Du må være et medlem for å kunne skrive en kommentar

Opprett konto

Det er enkelt å melde seg inn for å starte en ny konto!

Start en konto

Logg inn

Har du allerede en konto? Logg inn her.

Logg inn nå
×
×
  • Opprett ny...