1 / 11

Παπακώστας Μιχάλης ΑΜ:2007030001

ΑΥΤΟΝΟΜΟΙ ΠΡΑΚΤΟΡΕΣ 2012-2013 ΑΚΡΙΒΗΣ ΣΥΜΠΕΡΑΣΜΟΣ ΔΙΚΤΥΟΥ BAYES ΣΕ ΑΡΘΡΑ ΕΦΗΜΕΡΙΔΑΣ. Παπακώστας Μιχάλης ΑΜ:2007030001. πΕΡΙΛΗΨΗ. Τι υλοποιήσαμε: Δίκτυο Bayes που μοντελοποίει την αρθρογραφία της εφημερίδας Ελευθεροτυπίας για το διάστημα 1/5/2000-31/12/2000

hedva
Download Presentation

Παπακώστας Μιχάλης ΑΜ:2007030001

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. ΑΥΤΟΝΟΜΟΙ ΠΡΑΚΤΟΡΕΣ 2012-2013ΑΚΡΙΒΗΣ ΣΥΜΠΕΡΑΣΜΟΣ ΔΙΚΤΥΟΥ BAYES ΣΕ ΑΡΘΡΑ ΕΦΗΜΕΡΙΔΑΣ Παπακώστας Μιχάλης ΑΜ:2007030001

  2. πΕΡΙΛΗΨΗ • Τι υλοποιήσαμε: • Δίκτυο Bayes που μοντελοποίει την αρθρογραφία της εφημερίδας Ελευθεροτυπίας για το διάστημα 1/5/2000-31/12/2000 • Άλγορίθμο που πραγματοποιεί Ακριβή Συμπερασμό με τη μέθοδο της Απαρίθμησης στο συγκεκριμένο δίκτυο • Στόχοι: • Τι απασχολούσε την επικαιρότητα το διάστημα που εξετάζουμε • Που επικεντρώθηκε η αρθογραφία της συγκεκριμένης εφημερίδας • Εξαγωγή πληροφοριών για τη δομή των άρθρων • Περιορισμοί: • Περιορισμένο dataset • Δυσκολία εξαγωγής μεταβλητών από το συγκεκριμένο dataset επίτευξη στόχων στα πλαίσια του δικού μας μικρόκοσμου

  3. εΙΣΑΓΩΓΙΚΑ • Τι είναι ένα δίκτυο Bayes: • Μέθοδος αντιπροσώευσης ενός συνόλου τυχαίων μεταβλητών και των μεταξύ τους εξαρτήσεων, μέσω ενός κατευθυνόμενου ακυκλικού γράφου

  4. εΙΣΑΓΩΓΙΚΑ • Ακριβής Συμπερασμός σε δίκτυα Bayes • Υπολογισμός της εκ των υστέρων κατανομής ενός ερωτήματος, έχοντας ως δεδομένο κάποιο συμβάν • Πιθανότητα του ερωτήματος Xδοθέντος του συμβάντος e • Xοι μεταβλητή ερωτήματος • Eοι μεταβλητές μαρτυρίας • Yοι κρυφές μεταβλητές • ,όπουα=P(e) (παράγοντας κανονικοποίησης)

  5. εΙΣΑΓΩΓΙΚΑ • Mέθοδος της Απαρίθμησης • Άθροιση των πιθανοτήτων όλων των ατομικών συμβάντων για ένα ερώτημα δοθέντος ενός συμβάντος • Ατομικά συμβάντα Όλοι οι πιθανοί συνδυασμοί των κρυφών μεταβλητών • Βάση γνώσης • Yπολογισμόςσυνδυασμένωνκαταχωρήσεωνμεπολλαπλασιασμό • Μαθηματική έκφραση: • Δίκτυο Bayes • CPTs

  6. εΙΣΑΓΩΓΙΚΑ • Το δίκτυό Bayes που υλοποιήθηκε στο συγκεκριμένο project

  7. ΥΛΟΠΟΙΗΣΗ • Dataset • Δείγματά Άρθρα της εφημερίδας Ελευθεροτυπίας από το χρονικό διάστημα 1/5/2000-31/12/2000 • 214 ημερομηνίες • Κάθε ημ/νία περιέχει τουλάχιστον ένα άρθρο από κάθε θεματική • Η θεματική υποδηλώνεται από τον τίτλο του εκάστοτε άρθρου

  8. ΥΛΟΠΟΙΗΣΗ • Μεταβλητές • πλήθος των ήμερών ενός μήνα • όλες οι ημερομηνίες του dataset(214) • πλήθος των άρθρων που αφορούν μία θεματικήγια ένα μήνα • σύνολο των άρθρων που γράφτηκαν τον μήνα

  9. ΥΛΟΠΟΙΗΣΗ • Μεταβλητές • πλήθος άρθρων που ανήκουν σε ένα TOPIC και ικανοποιούν τα κριτήρια μίας κατηγορίας • σύνολο των άρθρων που ανήκουν στο συγκεκριμένο TOPIC

  10. ΥΛΟΠΟΙΗΣΗ • Μεταβλητές πλήθος εμφάνισης λέξης δεδομένης μίας θεματικής σύνολο εμφανίσεων αυτής της λέξης σε όλα τα άρθρα της συγκεκριμένης θεματικής

  11. ΥΛΟΠΟΙΗΣΗ ενδείκνυται για την επεξεργασία μεγάλου όγκου πληροφορίας σε μορφή κειμένου • Κώδικας • Yλοποίηση σε PERL • Ένα PERL-scrιptγια για τον υπολογισμό του CPT κάθε μεταβλητής • Υπολογισμός των CPTs γίνεται με βάση: • Υλοποιήσαμε κώδικα που υπολογίζει τον ακριβή συμπερασμό με τη μέθοδο της απαρίθμησης στα ερωτήματα που θέτει ο χρήστης με βάση το δίκτυο που περιγράψαμε δομή του δικτύου Bayes με τον τύπο της εκάστοτε μεταβλητής

More Related