1 / 14

Semi-supervised learning ( SSL )

Semi-supervised learning ( SSL ). Obhajoba závěrečné práce Autor : Bc. Karel Burda Vedoucí : doc. Ing. Jan Žižka, CSc. Úvod. Částečně řízené učení algoritmů strojového učení ( SSL ). Převzato z http:// www.eng.utah.edu. Cíl práce. Seznámení s algoritmy Empirické otestování SSL

miya
Download Presentation

Semi-supervised learning ( SSL )

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Semi-supervised learning (SSL) Obhajoba závěrečné práce Autor: Bc. Karel BurdaVedoucí: doc. Ing. Jan Žižka, CSc.

  2. Úvod • Částečně řízenéučení algoritmůstrojového učení(SSL) Převzato z http://www.eng.utah.edu

  3. Cíl práce • Seznámení s algoritmy • Empirické otestováníSSL • Porovnání učících algoritmů • Supervised • Semi-supervised (SSL) • Unsupervised • Vyhodnocení

  4. Částečně řízené učení • = Semi-supervised learning • Důvod vzniku − posílení neřízeného učení • Myšlenka použití neoznačených dat • Hlavní metody • Self-training • Co-training

  5. Self-training

  6. Co-training

  7. Zdrojová data • 2 třídy − positivní, negativní

  8. Metodika • Série experimentů • Náhodný výběr dat • Trénovací a testovací množina | trénovací | <| testovací | • Příprava dat • Učící proces • Vyhodnocení

  9. Technologie • Klasifikační algoritmy • Naivní Bayes, MNB, k-NN, Support Vector Machines, k-means • C++ • Perl • Systém Cluto

  10. Výsledky experimentů • Srovnání všech přístupů • Na reálných datech v přirozeném jazyce • SSL dává prakticky totožné výsledky jako řízené učení (klasifikace) • Vyplatí se vůbec SSL? • Propagace chybných rozhodnutí

  11. Příklad grafu 500 trénovacích, 32 191 testovacích dokumentů

  12. Schéma systému

  13. Přínos práce a závěr (1/2) • Progresivní metoda SSL na rozsáhlejších datech • Implementován Self-training i Co-training • Programový systém • Supervised i semi-supervised learning • Rozšiřitelnost • Originální implementace Co-training

  14. Přínos práce a závěr (2/2) • Metodika přípravy textových dat, podpůrné skripty • Poskytuje úvod do relevantní teorie • Základ pro další (připravované) akademické práce • Cíle splněny

More Related