1 / 61

Managerial Decision Modeling

Managerial Decision Modeling. Cliff Ragsdale 6. edition. Chapter 9 Regression Analysis. Introduksjon til Regresjonsanalyse .

eve
Download Presentation

Managerial Decision Modeling

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. ManagerialDecisionModeling Cliff Ragsdale 6. edition Chapter 9 Regression Analysis BØK350 OPERASJONSANALYSE

  2. Introduksjon til Regresjonsanalyse • Regresjonsanalyse brukes for å estimere en funksjon f( ) som beskriver sammenhengen mellom en kontinuerlig avhengig variabel (Y) og en eller flere uavhengige variabler (X). Y = f(X1, X2, X3,…, Xn)+e Merk: • f( ) beskriver densystematiskevariasjonen i sammenhengen. • eangirdenusystematiskevariasjonen(eller stokastisk avvik) i sammenhengen. BØK350 OPERASJONSANALYSE

  3. Et eksempel • Betrakt forholdet mellom reklame (X1) og salg (Y) for et selskap. • Det eksisterer sannsynligvis en sammenheng... ...når reklamen øker, bør også salget øke. • Men hvordan kan vi måle og kvantifisere denne sammenhengen ? BØK350 OPERASJONSANALYSE

  4. Data BØK350 OPERASJONSANALYSE

  5. Et scatterdiagram over dataene BØK350 OPERASJONSANALYSE

  6. Y Regresjonskurve Sannsynlighetsfordelinger for Y ved forskjellige nivåer av X X Karakteristika for statistiske sammenhenger BØK350 OPERASJONSANALYSE

  7. En enkel regresjonsanalysemodell Scatterdiagrammetindikerer en lineær sammenheng mellom reklame og salg. Dataene antyder derfor følgende regresjonsmodell, Denne modellen representerer den sanne sammenhengen mellom hele populasjonen av reklame- og salgs-verdier. Den estimerte regresjonsfunksjonen (basert på vårt data-utvalg) angis som følger, BØK350 OPERASJONSANALYSE

  8. Finne beste tilpassing (best fit) Vi må tildele numeriske verdiertilb0ogb1 Minste kvadraters metode(“least squares”)finner de verdiene som minimerer: HvisESS=0 så passer vår estimerte funksjon perfekt til dataene. ESS = Error Sum of Squares, dvs. sum kvadrerte avvik. Vi kan løse problemet ved hjelp av Solver… BØK350 OPERASJONSANALYSE

  9. Modellen i regneark BØK350 OPERASJONSANALYSE

  10. Tilpassing av funksjonen BØK350 OPERASJONSANALYSE

  11. Den estimerte regresjonsfunksjonen Den estimerte regresjonsfunksjonen er : BØK350 OPERASJONSANALYSE

  12. Legge til add-ins i Excel Klikk på Start-knappen Klikk på Add-Ins Velg Excel Options Velg Excel Add-ins og klikk på Go… BØK350 OPERASJONSANALYSE

  13. Legge til add-ins i Excel Velg Analysis ToolPak Dukker opp sist under Data BØK350 OPERASJONSANALYSE

  14. Bruk av regresjonshjelpemidler • Excel har også innebygde funksjoner for regresjonsanalyse som : • Er enklere å bruke • Gir mye mere informasjon om problemet BØK350 OPERASJONSANALYSE

  15. Regresjonsanalyse i Excel BØK350 OPERASJONSANALYSE

  16. Regresjonsresultat BØK350 OPERASJONSANALYSE

  17. TREND() funksjonen TREND(Y-område; X-område; X-verdi for prediksjon) der: Y-områdeer området i regnearket som inneholderverdiene for den avhengige Y variabelen, X-områdeer området i regnearket som inneholder verdiene for de(n) uavhengige X variablene, X-verdi for prediksjoner en celle (eller celler) som inneholder verdier for X variabelen(e)som vi ønsker å bruke til å estimereverdier for Y. Merk: TREND( ) funksjonenblirdynamiskoppdaterthver gangdataene tilfunksjonen endres. Imidlertid gir den ikke den statistiske informasjonen som regresjonsanalysen gir. BØK350 OPERASJONSANALYSE

  18. Evaluere “tilpassingen” Høyre-klikk på punktene i scatter-diagrammet: BØK350 OPERASJONSANALYSE

  19. R2 Determinasjonskoeffisienten R2indikerer hvor godt den estimerte regresjonsfunksjonen passer dataene. 0 ≤ R2≤ 1 Den måler andelen av den totale variasjonen i Y rundt gjennomsnittet, som kan forklares med den estimerte regresjonsfunksjonen. For å forstå dette bedre, betrakt følgende figur... BØK350 OPERASJONSANALYSE

  20. Yi(faktisk verdi) { Y * } ^ Yi - Yi ^ Yi - Y Yi (estimert verdi) } ^ Yi - Y Y ^ Y = b0 + b1X X Dekomponering av estimeringsfeil Uforklarte avvik ESS Totalavvik TSS Forklarte avvik RSS BØK350 OPERASJONSANALYSE

  21. Den totale sum av kvadrerte avvik(omkring gjennomsnittet) TSS = ESS + RSS TSS = Total Sum ofSquares ESS = Error Sum ofSquares RSS = Regression Sum ofSquares BØK350 OPERASJONSANALYSE

  22. Prediksjoner for markedsføring Anta at vi er interessert i å estimere forventet salgsnivå hvis $65 000 brukes påreklame. Estimert salg = 36,342 + 5,550 * 65= 397,092 Så hvis $65000 brukes på reklame, vil vi forvente at omsetningen i gjennomsnitt vil ligge på $397 092.(Husk: Alle tall er i tusen.) BØK350 OPERASJONSANALYSE

  23. Regresjonens standardavvik Regresjonens standardavvik måler spredningen av de faktiske data omkring den estimerte regresjonslinjen. derk = antall uavhengige variabler I vårt eksempel erSe= 20,421 Dette er nyttig hvis vi skal lage prediksjoner... BØK350 OPERASJONSANALYSE

  24. Et tilnærmet prediksjonsintervall • Et tilnærmet 95% prediksjonsintervall for en ny verdi til Y nårX1=X1hkan finnes ved : der: • Eksempel: Hvis $65(000) brukes på reklame: • 95% nedre prediksjonsintervall = 397,092 - 2*20,421 = 356,250 • 95% øvre prediksjonsintervall = 397,092 + 2*20,421 = 437,934 • Hvis vi bruker $65 000 i reklame kan vi være omtrent 95% sikre på at virkelig omsetning vil ligge mellom $356 250 og $437 934. BØK350 OPERASJONSANALYSE

  25. Et eksakt prediksjonsintervall Et (1-a)% prediksjonsintervallfor en ny verdi påYnårX1=X1hfinnes ved : der: BØK350 OPERASJONSANALYSE

  26. t-Tabell BØK350 OPERASJONSANALYSE

  27. Et eksempel • Hvis $65(000) brukes til reklame: 95% nedre prediksjonsintervall = 397,092 - 2,306*21,489 = 347,556 95% øvre prediksjonsintervall = 397,092 + 2,306*21,489 = 446,666 • Hvis vi bruker $65 000 på reklame kan vi være 95% sikrepå at faktisk omsetning vil være mellom $347 556 og $446 666. • Dette intervallet er bare omtrent $20 000 størreenn det tilnærmedeberegnet tidligere,men er mye vanskeligere å beregne. • Den ekstra nøyaktigheten er ikke bestandig verd bryet. BØK350 OPERASJONSANALYSE

  28. Sammenligning av prediksjonsintervall-teknikker BØK350 OPERASJONSANALYSE

  29. Prediksjonsintervall i Excel BØK350 OPERASJONSANALYSE

  30. Konfidensintervall for gjennomsnittet Et (1-a)% konfidensintervall for det virkeligegjennomsnittet forYnårX1=X1her gitt ved : der: BØK350 OPERASJONSANALYSE

  31. En kommentar til ekstrapolering Prediksjoner basert på en estimert regresjonsligning vil ha liten eller ingen gyldighet hvisverdier til den uavhengige variabelen er langt utenfor det intervall som regresjonsanalysen er basert på. (Dvs. Når X gis en verdi som er mye mindre eller større enn de verdier som finnes i datasettet.) BØK350 OPERASJONSANALYSE

  32. Regresjonens gyldighetsområde Y Konfidensintervall Regresjonslinje X BØK350 OPERASJONSANALYSE

  33. Regresjonsresultatene i Excel BØK350 OPERASJONSANALYSE

  34. Multippel Regresjonsanalyse Mange regresjonsanalyser omfatter mer enn én uavhengig variabel (dvs. har mange forklaringsvariabler). Hvis hver uavhengig variabel varierer lineært med Y,så vil den estimerte regresjonsfunksjonen være : De optimale verdienebj kan fortsatt finnes ved å minimere ESS. Resultatet er en funksjon som tilpasserethyperplantil datautvalget. BØK350 OPERASJONSANALYSE

  35. Eksempel på regresjonsplan for to uavhengige variabler Y * * * * * * * * * * * * * * * * * * * * * * * X2 X1 BØK350 OPERASJONSANALYSE

  36. Multippel regresjonsanalyse: Eiendomstakst • En eiendomsmegler ønsker å lage en modell til hjelp ved fastsettelsen av en nøytral markedsverdi av eneboliger. • Tre uavhengige variabler vil bli brukt for å estimere salgsverdien på et hus : • Totalt flateinnhold • Antall soverom • Størrelse på garasjen BØK350 OPERASJONSANALYSE

  37. Datagrunnlag BØK350 OPERASJONSANALYSE

  38. Scatter plots BØK350 OPERASJONSANALYSE

  39. Valg av regresjonsmodell • Vi ønsker å finne den enkleste modellen som gir tilstrekkelig forklaring av den systematiske variasjonen i Y variabelen. • Vilkårlig bruk av alle uavhengige variabler kan resultere i overtilpassing. • Et utvalg gjenspeiler karakteristika: • Representative for populasjonen • Spesifikk for utvalget • Vi ønsker å unngå å tilpasse regresjonen til utvalgsspesifikke karakteristika – dvs. overtilpasse modellen. BØK350 OPERASJONSANALYSE

  40. Modeller med én uavhengig variabel Med tanke på enkelhet, kan vi foreta regresjonsanalyse av følgende tre modeller: FlateinnholdGarasjerSoverom De viktigste regresjonsresultatene er: Modellen basert på X1forklarer 87% av variasjonen i Y, resterende 13% er uforklart. BØK350 OPERASJONSANALYSE

  41. Evaluering av modellen Større enn 5%. Ikkesignifikant forskjellig fra 0. BØK350 OPERASJONSANALYSE

  42. Viktig programvarebegrensing Ved bruk av mer enn én uavhengig variabel, må alle X-variablene være plassert i ett sammenhengende område av celler. Dvs. X-variablene må ligge i tilgrensende kolonner. BØK350 OPERASJONSANALYSE

  43. Modeller med to forklaringsvariabler Anta at vi kjører regresjonsanalysen for følgende to modeller: Flateinnhold + GarasjerFlateinnhold + Soverom De viktigste regresjonsresultatene er: Modellen basert på X1og X2forklarer93,9% av variasjonen i Y, resterende6,1% er uforklart. BØK350 OPERASJONSANALYSE

  44. Justert R2 • Etter hvert som nye uavhengige variabler tilføyes i modellen: • R2(determinasjonskoeffisienten) kan bare øke. • Justert-R2kan økeellerminke. • R2kan økes kunstig ved å legge til enhvilken som helstny uavhengig variabel. • Vi kan sammenlignejustert-R2verdiersom en heuristikk(brukbar forenkling) for å avgjøre om en ny uavhengig variabel har vært til hjelp i å forbedre regresjonsmodellen. BØK350 OPERASJONSANALYSE

  45. Multikolineæritet Det bør ikke overraske at å legge til X3(antall soverom)til modellen med X1(total grunnflate)ikke utgjorde noen signifikant forbedring. Begge variablene representerer det samme (eller lignende forhold) – størrelsen på huset. Disse X-variablene er sterkt korrelert (kolineære). Multikolineæritet bør unngås. BØK350 OPERASJONSANALYSE

  46. Modell med tre forklaringsvariabler • Anta at vi foretar regresjonsanalyse med følgende modell med tre forklaringsvariabler: Flateinnhold + Garasjer + Soverom • De viktigste regresjonsresultatene er: • Modellen basert på X1og X2synes å være best: - Størst justert-R2- LavestSe(mest presise prediksjonsintervall) BØK350 OPERASJONSANALYSE

  47. Evaluering av modellen Skifter fortegn. Ikkesignifikant forskjellig fra 0. BØK350 OPERASJONSANALYSE

  48. Residual Plots BØK350 OPERASJONSANALYSE

  49. Foreta prediksjoner La oss estimere salgsprisen for et hus på 2100 m2og med 2garasjer (husk tall i 1000, unntatt garasje og soverom): Estimert gjennomsnittlig salgspriser $134 444. Et 95% prediksjonsintervall for faktisk salgspris er omtrent: 95% nedre prediksjonsintervall = 134,444 - 2*7,471 = $119,502 95% øvre prediksjonsintervall = 134,444 + 2*7,471 = $149,386 BØK350 OPERASJONSANALYSE

  50. Binære forklaringsvariabler Andre typer ikke-kvantifiserbare faktorer kan inkluderes i analysen ved å bruke binærvariabler. Eksempel: Om det finneset svømmebasseng: Eksempel: Hvorvidt taket er i god, gjennomsnittligeller dårlig forfatning, BØK350 OPERASJONSANALYSE

More Related