Dariusz Kieszkowski, Marcin Wudarczyk

Porównanie skuteczności metod klasycznych oraz nieklasycznych w szacowaniu zdolności kredytowej i kondycji finansowej przedsiebiorstw Dariusz Kieszkowski, Marcin Wudarczyk

Plan prezentacji • Wstęp • Dane wejściowe • Pozyskane dane • Zestawy wskaźników • Badania • Porównanie analizy dyskryminacyjnej i sieci neuronowych • Porównanie różnych typów sieci • Wnioski • Wyniki badań • Próba oceny wyników pod względem kosztów błędów predykcji dla instytucji bankowych • Zakończenie

Wstęp • Predykcja bankructw w kontekście: • zdolności kredytowej • kondycji finansowej • Cele badań • Porównanie metod klasycznych (analiza dyskryminacyjna, genetyczny dobór współczynników liniowej kombinacji) z sieciami neuronowymi • Porównanie osiąganych wyników przez różne sieci neuronowe

Dane wejściowe • Spółki akcyjne Warszawskiej GPW • 23 bankrutów oraz 45 niebankrutów • Dane pochodzące z Komitetu Badań Naukowych • 23 bankrutów oraz 23 niebankrutów • Dane amerykańskiek Komisji Papierów Wartościowych (SEC) • 58 bankrutów oraz 59 niebankrutów

Dane wejściowe Wskaźniki • Wskaźniki Altmana – 1968 • X1 -(bieżące aktywa - bieżące zobowiązania)/suma aktywów • X2 - zysk zatrzymany/suma aktywów • X3 - Zysk przed opodatkowaniem i spłatą odsetek / suma aktywów • X4 - wartość rynkowa kapitału własnego/wartość księgowa zobowiązań • X5 - przychody ze sprzedaży / suma aktywów • Wskaźniki ogólnie stosowane (14) • płynność • rentowność (zyskowność) • zadłużenie • aktywność (obrotowość) • efektywność rynkowa • Podstawowe pozycje raportów finansowych

Dane wejścioweWskaźniki • Porównanie kilku systemów wczesnego ostrzegania • Altman (68r i 77r) • Springate • Baetge • Gajdki, Stoda • Hołda

BadaniaAnaliza dyskryminacyjna KBN

BadaniaAnaliza dyskryminacyjna SEC

BadaniaGenetyczny dobór współczynników • Osiągnięto błąd 0,00% na danych KBN (wskaźniki Altmana) • Optymalizacja – błąd MSE czy CFE? • Brak możliwości weryfikacji wyniku

BadaniaSieci neuronowe KBN

BadaniaSieci neuronowe SEC

Badaniaporównanie sieci neuronowych • Metodyka • Badane sieci: MLP, SOM (Kohonen, gaz neuronowy), RBF • Badany wpływ parametrów uczenia (rodzaj błędu, wagi początkowe, ilość warstw, neuronów, współczynnik uczenia, momentum, warunki stopu • Badanie wielokrotnych trenowań (cross validation, 100 powtórzeń) • Kryterium ostateczne: błąd klasyfikacji

Badaniaporównanie sieci neuronowych

WnioskiBadania • Najlepsze wyniki uzyskują sieci używające optymalizacji genetycznej; wyniki mogą być lepsze nawet kilka razy. • Zgodnie z oczekiwaniami, sieci działające na starszych danych uzyskiwały gorsze wyniki • Oprócz jednego przypadku, sieci MLP górowały nad pozostałymi typami sieci; przyczyną tego mogą być zakrojone na mniejszą skalę próby dobierania optymalnych parametrów dla sieci SOM i RBF • Wśród sieci SOM i RBF, a także wśród metod nauczania nie można wskazać jednoznacznego zwycięzcy, generalnie jednak sieci RBF zachowywały się lepiej niż sieci SOM. Zwykle lepsze efekty przynosiło zastosowanie uczenia gazu neuronowego niż standardowego uczenia Kohonena • Uzycie wszystkich wskaźników ogólnych, jak również wskaźników do oceny zdolności kredytowej prowadziło do jednych z najgorszych wyników. Niespodziewanie dobrze wypadły wskaźniki opracowane przez Altmana, które były opracowane w zupełnie innych warunkach ekonomicznych i dla innego systemu księgowości. • Okazuje się, że bardzo duże znaczenie ma dobór wejść. Dodatkowe, nadmiarowe wejścia bardzo pogarszają uzyskane wyniki, co dobrze widać na przykładzie wskaźników Altmana, które uzyskały dobre wyniki same, ale w połączeniu z innymi wskaźnikami dużo gorsze. • Nie zawsze podawanie danych z dwóch lat poprawia jakość predykcji. Jednak wszystkie zestawy wskaźników optymalizowane genetycznie zawierają wskaźniki także z poprzedniego okresu.

WnioskiOcena kosztów bankowych KBN

WnioskiOcena kosztów bankowych SEC

Wnioski • LDA znacznie gorsze niż sieci neuronowe • Systemy wczesnego ostrzegania mają charakter preselekcji. (błąd I rodzaju) • W MLP • BackProp i RProp najlepsze • QuickProp słabiej • Sieci neuronowo-rozmyte • Bardzo dobre wyniki lepsze od MLP • Sieci Kohonena • generalnie słabsze • dla zastosowań bankowych dla dobrych danych b. skuteczne

Zakończenie • Najważniejszym czynnikiem jakość danych • Ilość próbek w zestawie danych KBN jest skrajnie mała – w sumie 46 przedsiębiorstw; choć uzyskane wyniki są bardzo dobre, nie ma możliwości dogłębnego ich sprawdzenia. • Przy optymalizacji genetycznej istnieje niebezpieczeństwo, iż wejścia sieci zostały dopasowane do danych • Dla zestawu danych ze 117 próbkami wyniki nie są zadawalające. Przyczyny: niejednorodność danych, duża rozpiętość badanych firm, dane z różnych lat, definicja bankructwa (chapter 11) • Duża zależność od danych wejściowych • Dobór w toku analizy teoretycznej lub optymalizacji genetycznej

Dariusz Kieszkowski, Marcin Wudarczyk