300 likes | 469 Views
Wprowadzenie do analizy regresji. Wykład 10. Model kategoryczny ( categorical model ). W 1993 r. inwestor zastanawia się jak sklasyfikować Amazon : Część ekonomii informacji Dostawca książek W zależności od sklasyfikowania, podejmie różne decyzje Stąd sposób klasyfikacji jest istotny.
E N D
Wprowadzenie do analizy regresji Wykład 10
Model kategoryczny (categorical model) • W 1993 r. inwestor zastanawia się jak sklasyfikować Amazon: • Część ekonomii informacji • Dostawca książek • W zależności od sklasyfikowania, podejmie różne decyzje • Stąd sposób klasyfikacji jest istotny
Kategorie NIEZIELONE ZIELONE
Zmienność R2 = (53200-5200)/53200 = 90,2%
Poprzez sklasyfikowanie na deser i owoce wyjaśniliśmy ponad 90% zmienności liczby kalorii obiektów
Regresja • Korelacja vs przyczynowość • Obecność sekcji golfa i prestiż szkoły • W modelu regresji zakładamy, że Y zależy od X Y = F(X) • W modelu regresji liniowej zakładamy, że zależność jest liniowa Y = mX +b Na przykład X – długość przekątnej odbiornika, Y cena telewizora: Cena = 15X + $100 • 30 calowy: Cena = 15(30)+100 = 550? • 100 calowy: Cena = 15(100)+100 = 1600?
Regresja liniowa Minimalizujemy: Warunki pierwszego rzędu: 42m + 14b -94 = 0 14m + 6b -30 = 0 |*3 SUMA = 21m2 + 14mb + 3b2 – 94m – 30b + 107 = 8/7 R2 = (32-8/7)/32 = 96,4% • (42m + 14b -94 = 0) • +(42m + 18b -90 = 0) • ---------------------------- • 4b + 4 = 0 • b = -1 • m = 18/7
Ilustracja Y’ = 18/7*X-1 Y’ = 2X Y’ = E(Y)
Dopasowanie vs przeuczenie R2=0,7942
Przykład – wzrost i waga +8,1 +11,3 -6,7 +6,1
Studium przypadku – ŁorsołFlaj • Firmy lotnicza, która obsługuje trasę Warszawa-Kraków • Na razie interesuje nas tylko klasa ekonomiczna • Sprzedajemy miejsca w klasie biznes, ale mało • Funkcja popytu wynosi Q = f (P, Pk, Y) • Liczba sprzedanych biletów na jeden przelot w zależy od ceny biletu (P), ceny biletu konkurenta (Pk), oraz poziomu dochodu w danym regionie • Dział prognoz udostępnił nam równanie: Q = 25 + 3Y + Pk– 2P Łorsoł FLAJ
ŁorsołFlaj • Załóżmy, że P = Pk= 240 PLN. Obecny wskaźnik zagregowanego dochodu* jest równy 105. • Zatem Q = 25 + 3(105) + 1(240) – 2(240) = 100 miejsc • I rzeczywiście w ciągu ostatnich 3 miesięcy przeciętna liczba sprzedanych biletów była w przedziale (90,105) • Całkowita liczba miejsc wynosi 180, czyli obłożenie wynosiło 55,5% Łorsoł FLAJ * zysków z działalności gospodarczej oraz dochodów osobistych w Warszawie oraz Krakowie w ujęciu realnym, rok bazowy 2010 = 100
ŁorsołFlaj – krzywa popytu • Załóżmy, że w najbliższej przyszłości Y i Pk pozostaną niezmienione. • Wówczas Q = 25 + 3(105) + 1(240) – 2P = 580 - 2P, czyli P = 290 – Q/2 • Gdy Y lub Pksię zmieni, ta krzywa popytu się przesunie, np. załóżmy, że Y=105 Y=119 • Wtedy Q = 622 – 2P, czyli P = 311 – Q/2 Łorsoł FLAJ
ŁorsołFlaj (max zysku) • Jeśli pominiemy dodatkowy koszt dodatkowego pasażera (bardzo mały), to firma będzie chciała zmaksymalizować utarg P = 290 – Q/2 R = P*Q = 290Q – Q2/2 MR = 290 – Q • Czyli nawet przy pełnym obłożeniu utarg krańcowy jest dodatni MR = 290 – 180 = 110 • Czyli firma powinna zmniejszyć cenę z 240 na 200, co spowoduje wzrost utargu za jeden rejs z 24000 (240*100) na 36000 (200*180) Łorsoł FLAJ
Zróżnicowanie cenowe • Załóżmy, że są dwie grupy pasażerów • Biznesmeni • Turyści • Popyt dla nich się różni • Biznesmeni QB = 330 – PB • Turyści QT = 250 – PT • Zatem Q = QB + QT = 580 – 2P • Aby utarg był zmaksymalizowany, krańcowy utarg z miejsc biznesowych i krańcowy utarg z miejsc ekonomicznych musi się równać 330 – 2QB = 250 – 2QT • Po uproszczeniu: QB = 40 + QT. • Dodatkowo jesteśmy ograniczeni równaniem QB + QT = 180 • Zatem optymalne wielkości to: QB = 110, QT = 70, PB = 220 zł, PT = 180 zł • Utarg z jednego lotu wynosi 220*110 + 180*70 = 36800 zł, czyli więcej o 800 zł niż bez zróżnicowania cen. Łorsoł FLAJ
Ocena popytu • Aby dokonywać analiz takich, jak na poprzednich slajdach, trzeba wyznaczyć krzywą popytu • Źródła informacji: • Wywiady i badania ankietowe • Kontrolowane badania rynku • Wytypowanie kilku podobnych rynków i sprzedawanie na nich danego wyrobu przy różnych wartościach kluczowych zmiennych • Badania porównawcze różnych rynków dostarczają danych przekrojowych • Badania w czasie jednego rynku dostarczają szeregu czasowego • Połączenie obu rodzajów danych daje dane panelowe • Nie kontrolowane dane rynkowe • Techniki drążenia danych
Łorsołflaj Łorsoł FLAJ
Metoda najmniejszych kwadratów • Tworzymy macierz X złożonej z: • Wektora jedynek • Wektora przeciętnych cen • Wektor y to wektor przeciętnej liczby sprzedanych biletów • Liczymy współczynniki równania Y = a + bX
Krzywe popytu porównanie • Suma kwadratów odchyleń dla Q = 330 – P równa się 6027,5 • Suma kwadratów odchyleń dla Q = 478,6 – 1,63P równa się 4847,2 Krzywa popytu Q = 478,6 – 1,63P R2=0,586 Krzywa popytu Q = 330 – P R2=0,485
Regresja wieloraka • Cena nie jest jedynym czynnikiem określającym wielkość sprzedaży • Przypuśćmy, że mamy również dane o przeciętnej cenie biletów linii konkurencyjnej oraz o wysokości dochodu w danym regionie • Należy wykorzystać te dane do oszacowania równania regresji wielorakiej o postaci Q = a + bP +cPk+ dY
Obliczanie współczynników • Tworzymy macierz X oraz wektor y Q = 28,84 - 2,12P + 1,03Pk + 3,09Y I otrzymujemy wektor współczynników regresji