380 likes | 641 Views
TECHNICKÁ UNIVERZITA V KOŠICIACH FAKULTA ELEKTROTECHNIKY A INFORMATIKY KATEDRA KYBERNETIKY A UMELEJ INTELIGENCIE. Predikcia výsledkov futbalových zápasov pomocou neurónových sietí. Július Kočiš Diplomová práca 2006. ABSTRAKT.
E N D
TECHNICKÁ UNIVERZITA V KOŠICIACH FAKULTA ELEKTROTECHNIKY A INFORMATIKY KATEDRA KYBERNETIKY A UMELEJ INTELIGENCIE Predikcia výsledkov futbalových zápasov pomocou neurónových sietí Július Kočiš Diplomová práca 2006
ABSTRAKT • Diplomová práca sa zaoberá predikciou výsledkov futbalových zápasov. Na predikciu sa používajú neurónové siete. • Cieľom práce je • vytvoriť prostredie pre predikciu výsledkov futbalových zápasov, • vykonať konkrétne experimenty s rôznou konfiguráciou trénovacích dát, • porovnať výsledky experimentov s reálnymi dátami.
Úvod • zameranie na 1.českú futbalovú ligu • získavanie dát http://www.betexplorer.com/soccer/czech-republic/ • tabuľky, výsledky, dátum, kurzy vyše 40 európskych stávkových kancelárií • 1.7.1999 – 12.12.2005 • 1567 zápasov – trénovacích vzoriek
Úvod do stávkovania • druhy kurzov – • „1“ - výhra domácich, • „0“ - remíza, • „2“ - výhra hostí. • dvoj-kombinácia – „10“, „02“, „12“ • výber 1 tipu výsledku (kurzu) • výber ľubovoľného počtu zápasov (n) • správny tip všetkých n vybraných zápasov • výhra = vklad . kurz1 . kurz2 . ... . kurz n
Úvod do stávkovania Jablonec – Liberec tip „1“ kurz 2,71 1.FC Slovacko – Brno tip „0“ kurz 3,25 Teplice – Sparta tip „1“ kurz 2,37 Vklad 100 Sk. Výhra 100 . 2,71 . 3,25 . 2,37 = 2087 Sk.
Získavanie dát • výber údajov z web stránky – jazyk Perl • vstup – html, výstup – txt
Úprava dát • spojenie dát z viacerých sezón • informácia o počte zápasov (vzoriek) • počítanie štatistík - skóre a počtu bodov pre každé mužstvo • transformácia vstupov a výstupov do formy vhodnej pre NN
Vstupy NN Názov mužstva • od roku 1999 hralo v českej lige 22 mužstiev: 1. Blšany 2. Mladá Boleslav 3. Brno 4. Jablonec 5. Jihlava 6. Liberec 7. Most 8. Olomouc 9. Ostrava Baník 10. Plzeň Viktória 11. Příbram 12. Slavia Praha 13. 1.FC Slovácko 14. Sparta Praha 15. Teplice 16. Zlín 17. Č. Budějovice 18. Opava 19. Drnovice 20. Žižkov Viktória 21. Bohemians Praha 22. Hradec Králové
Vstupy NN • Názov jedného mužstva reprezentuje 22 neurónov. • Pr. 15. Teplice 1. neurón -6 2. neurón -6 ... 15. neurón 6 ... 21. neurón -6 22. neurón -6
Vstupy NN Dátum zápasu - mesiac • Pr. zápas odohraný v septembri 1. neurón -6 január 2. neurón -6 február ... ... 9. neurón 6 september ... ... 11. neurón -6 november 12. neurón -6 december
Vstupy NN Dátum zápasu - rok • Pr. zápas odohraný v roku 2002 1. neurón -6 1999 2. neurón -6 2000 ... ... 4. neurón 6 2002 ... ... 7. neurón -6 2005 8. neurón -6 2006
Vstupy NN Štatistiky - skóre a počet bodov • Skóre – pomer počtu strelených a prijatých gólov • skóre 56 : 20 = 2,8 • Počet bodov – pomer počtu získaných bodov a počtu bodov, ktoré mohlo mužstvo maximálne získať • počet bodov 35 z 20 zápasov (zo 60 bodov) • = 35 : 60 = 0,58
Výstupy NN • výsledok, 3 typy : Výhra domácich Remíza Výhra hostí 1 0 0 0 1 0 0 0 1
Parametre siete • spätné šírenie chyby • sigmoidálna funkcia • , , počet cyklov – zadáva užívateľ • trénovacia a testovacia množina • predikcia zápasov 12. kola ligy (8 zápasov)
Typy konfigurácie trénovacích dát • bez použitia štatistík • názvy mužstiev, dátum, výsledok • s použitím štatistík • + štatistiky (skóre a počet bodov) • s použitím štatistík a kurzov • + kurzy stávkovej kancelárie
Typy experimentov • Analýza presnosti predikcie • trénovacia a testovacia množina • 24 experimentov • Použitie metódy krosvalidácie • 5-násobná krosvalidácia • 18 experimentov • Učenie s postupným striedaním trénovacích a testovacích množín • zmena trénovacej a testovacej množiny po 500 cykloch • 18 experimentov
hodnoty výstupných neurónov hodnoty v percentách • Ukážka výsledku predikcie – experimentu
Priemerné úspešnosti predikcie analýza presnosti predikcie 28,64% použitie krosvalidácie 42,36% postupné striedanie množín 44,44% dáta z 3 sezón 18,75% dáta z 5 sezón 37,64% dáta z 6 sezón 44,58% dáta z 7 sezón 44,31% bez použitia štatistík 32,26% s použitím štatistík 39,13% s použitím štatistík a kurzov 34,05% Vyhodnotenie experimentov
Najlepšia predikcia učenie s postupným striedaním trénovacích a testovacích množín, dáta zo 7 sezón, konfigurácia dát s použitím štatistík a kurzov, hodnota úspešnosti predikcie =75,00%. Vyhodnotenie experimentov
Tipovacie menu výsledky predikcie v percentách kurzy stávkovej kancelárie
Cieľ systému • Na základe predchádzajúcich tipov hráča odporučiť zvoliť resp. nezvoliť typ výsledku
Vstupy a výstupy NN • Vstupy NN • názvy všetkých mužstiev na tikete • názvy 2 mužstiev, ktoré odohrali daný zápas • kurzy pre daný zápas • hodnoty predikcie pre daný zápas • Výstupy NN • zvoliť (nezvoliť) typ výsledku
Vizualizácia miery odporúčania • zafarbenie kurzových políčok zvoliť tip ... nezvoliť tip
Interakcia - farebné políčka kurzov zafarbené políčka podľa miery odporúčania tipu
Záver • Náročnosť predikcie výsledkov • Zvýšenie úspešnosti predikcie • použitím dát zo 6 sezón, • s použitím štatistík, • pri postupnom striedaní množín,
Priebeh chyby učenia na trénovacej množine • Rôzne typy normovania názvu mužstiev
Priebeh chyby učenia na testovacej množine • Rôzne typy normovania názvu mužstiev
Priebeh chyby učenia na testovacej množine experimenty typu – Postupné striedanie množín