280 likes | 440 Views
Problem Solving Methods. sartori@disco.unimib.it. Problem solving method (psm). Algoritmo che determina come la conoscenza specifica del dominio (csd) è usata per risolvere i problemi .
E N D
Problem Solving Methods sartori@disco.unimib.it
Problem solving method (psm) Algoritmo che determina come la conoscenza specifica del dominio (csd) è usata per risolvere i problemi. Oss. il psm e la rappresentazione della conoscenza sono due facce della stessa medaglia, poiché i psm richiedono una particolare rappresentazione della conoscenza, e la rappresentazione dellaconoscenza è significativa solo guardando l’esecuzione delle procedure. La specificazione di un psm deve anche includere informazioni circa la rappresentazione della conoscenza La csd consiste di: - caratteristiche dei problemi; - soluzione di problemi; - oggetti ausiliari; - conoscenza relazionare.
psm deboli (base) Aperti a grandi varietà di rappresentazione della conoscenza e/o funzioni. Hanno molte applicazioni ma per questa ragione non sono di grande aiuto nell’acquisizione della conoscenza. Esempi di psm di base: 1- rappresentazione della conoscenza base con le sue corrispondenti strategie di inferenza: - regole (forward o backward chaining) - frames (eredità) - vincoli (propagazione locale) 2- procedure generali come i differenti metodi del planning o le strategie hipotesize-and-test (in cui si possono combinare diversi tipi di conoscenza).
psm forti La rappresentazione della csd è più o meno fissata. I psm forti sono meno flessibili ma offrono assistenza nella acquisizione di conoscenza. Possono essere visti come specializzazioni, restrizioni dei metodi deboli. I più importanti tipi di restrizione sono: - restrizione dell’uso di variabili; - definizione di tipi di oggetto per determinare gli attributi della loro struttura; - determinazione del percorso di comunicazione tra gli oggetti attraverso la rappresentazione delle regole come procedure allegate degli oggetti - controllo globale - input alla conoscenza principalmente istanziando gli oggetti dati e specificando le relazioni
Principali tipi di psm - classificazione: soluzione selezionata da un insieme di alternative date; - costruzione: soluzione assemblata da componenti primitive date - simulazione: è determinato come un dato modello di sistema reagisce a certi input I tre raggruppamenti non hanno lo stesso peso. Nel gruppo classificazione la suddivisione è meglio elaborata e i metodi sono più forti. Per il gruppo costruzione sono dati solo i psm per la costruzione euristica. Il gruppo simulazione ha una suddivisione molto frammentaria.
classificazione Classificazione certa Alberi di decisione Tabelle di decisione Classificazione euristica Classificazione model-based Classificazione set-covering Classificazione funzionale Classificazione statistica Classificazione case-based
costruzione Costruzione euristica Skeletal Construction Strategia propose-and-revise Strategia propose-and-exchange Strategia least-commitment Costruzione model-based Costruzione case-based
simulazione Simulazione one-step Simulazione multiple-step Simulazioni numeriche multiple-step Simulazioni qualitative multiple-step
Parte IV Classificazione
Sguardo generale al tipo di problem-solving classificazione Il termine classificazione è dato a procedure che risolvono problemi con le seguenti proprietà: 1- Il dominio è costituito da 2 insiemi finiti e disgiunti (osservazioni O e soluzioni S). La relazione tra i due insiemi è incerta e complessa. 2- il problema è definito da un dato sotto insieme di osservazioni. 3- Il risultato della classificazione è la selezione di una o più soluzioni del problema. 4- Se la qualità della soluzione può essere migliorata, il compito della classificazione è di determinare quali osservazioni aggiuntive sono necessarie.
Domini Per testare se un dominio di un problema appartiene alla classificazione i due insiemi (osservazioni e soluzioni) devono essere dati esplicitamente. Questo sembra complicato ma l’esperienza ha dimostrato che una volta che un dominio è ben capito si trovano delle soluzioni stereotipate spesso ricorrenti, il problem solving quindi si riduce al loro riconoscimento.
Applicazioni tecniche - controllo della qualità (diagnostica dei motori e degli ingranaggi) - diagnostica dei processi di produzione (di circuiti, di processi diagnostici nella verniciatura di automobili) - diagnostica per la riparazione (dell’automobile o dell’hardware de computer...) - monitoraggio (delle turbine dei macchinari e delle power stations) - diagnostica delle reti (di computer, elettriche, del telefono....) - applicazione di altre tecnologie (selezione di strumenti, modifica di data base)
Applicazioni in medicina e ecologia - diagnosi medica in senso stretto (di sclerosi multipla, medicina interna..) - scelta di terapie in medicina (determinare la terapia antibiotica...) - interpretazione dei dati di laboratorio - sorveglianza di pazienti - diagnosi di malattie di animali o piante - diagnosi di danni ambientali
Applicazione ai servizi - bancarie (prestiti, controllo crediti) - in campo legale - selezione di cataloghi (scelta di un data base, di un libro...) - product marketing
Riconoscimento di immagini e oggetti - identificazione di piante (funghi...) - riconoscimento di oggetti su un nastro trasportatore - riconoscimento di particolari aspetti nel processo di immagini
Altre applicazioni - riconoscimento di formazioni geologiche (ricerca di depositi minerari) - selezione di oggetti adatti a luoghi dati (selezione della stanza dove mettere le piante) - diagnosi di una sfilata di moda
Tipi di problemi Esempi per ogni tipo di problema dal punto di vista dell’utente. - ricerca degli errori statici (indipendenti dal tempo): O: sintomi e misurazioni osservate S: cause di errore e possibili suggerimenti per correggerli - ricerca degli errori dinamici (dipendenti dal tempo): O: sintomi e misurazioni oggettive, dove in entrambi i casi i valori sono determinati in diversi tempi S: componenti difettose e/o possibili correzioni di influenze esterne
- valutazioni: O: proprietà di un oggetto o di un processo S: in principio solo due categorie di decisione “positivo” o “negativo”, le decisioni sono prese sulle basi di criteri individuali - valutazioni multiple: O: proprietà di un oggetto o di un processo S: definizioni di diversi criterio di valutazioni - selezioni di precedenze: O: desideri dell’utente S: prodotti disponibili
Analisi delle caratteristiche dei problemi Il più semplice psm per la classificazione è una diretta corrispondenza tra osservazioni e soluzioni, ma potrebbero sussistere i seguenti problemi: - conoscenza incerta - osservazioni inattendibili - osservazioni incerte - osservazioni soggettive - osservazioni false - osservazioni dipendenti dal tempo - osservazioni incomplete - controllo del dialogo - revisione delle supposizioni - astrazione di osservazioni a soluzioni attraverso passi intermedi - parametrizzazione di osservazioni e soluzioni - soluzioni multiple - raccomandazioni combinate per diverse soluzioni
psm Si hanno i seguenti metodi base: - forward chaining (strategia di inferenza) - backward chaining (strategia di inferenza) - strategie establish-refine (strategia di inferenza molto generale) - strategie hypothesize-and-test (più specifico, flessibile) la strategia hypothesize-and-test, grazie alle sue caratteristiche, può essere usata per simulare le altre, è il metodo standard per la classificazione con conoscenza incerta
Classificazione semplice Intendiamo la valutazione di conoscenza certa e dati certi. I due tipi principali di rappresentazione della conoscenza sono: - alberi di decisione - tabelle di decisione
Alberi di decisione Domanda 1 si no Damanda 4 no si Domanda 2 si no ... Altro albero di decisione Diagnosi 1 domanda3 si no Diagnosi 2 - rappresentazione della conoscenza La più semplice rappresentazione sono le istruzioni if-then-else annidate di un normale linguaggio di programmazione. Una forma di rappresentazione strutturate ha oggetti e regole. - manipolazione della conoscenza Un albero di decisione è processato ponendo domande e valutando le regole per determinare le successive domande alternativamente.
Tabelle di decisione Possono essere viste come una forma de-sequenzializzata degli alberi. Le loro regole sono indipendenti l’una dall’altra e perciò non danno un controllo del dialogo. La rappresentazione e la manipolazione della conoscenza corrispondono a quelle di un interprete di regole commutativo, dove le regole rappresentano le implicazioni
Classificazione euristica La classificazione euristica è adatta a problemi di classificazione in cui è noto dall’esperienza che osservazioni, o combinazioni di osservazione, indicano soluzioni intermedie o finali. Differisce dalla classificazione semplice nell’uso di conoscenza incerta e da quella statistica dal fatto che i fattori di certezza sono stimati dall’esperto e non calcolati. I fattori di certezza sono anche chiamati evidenze. Se la derivazione di una classe di soluzioni è incerta si deve considerare come si propaga questa incertezza. Nei domini in cui tutte le osservazioni sono date inizialmente il forward chained è una strategia di valutazione sufficientemente buona. Se esiste la possibilità di richiedere altri dati, lo scopo deve essere di ottenere massima certezza con meno domande.
Le più importanti strategie di questioning sono: - backward chaining: sono valutate tutte le regole che possono contribuire a raggiungere il goal globale - establish-refine: in una stretta gerarchia di soluzioni una categoria di soluzioni è prima stabilita tramite il backward chaining e poi raffinata, tale operazione è iterata. - hypothesize-and-test: dalle osservazioni date sono generate le ipotesi con il forward chaining e successivamente testate con il backward chaining, il ciclo è ripetuto finché in un caso tipico un’ipotesi non è stabilita. N.B. queste strategie differiscono nel modo di scegliere la successiva soluzione da testare. Una volta che un’ipotesi è scelta è testata completamente in tutti i casi
Classificazione set-covering Adatta per problemi di classificazioni in cui le soluzioni (cause) evocano particolari sintomi (effetti), possibilmente attraverso stati intermedi con realizzabilità relativamente alta. rappresentazione della conoscenza Una rappresentazione semplice ha un solo tipo d’oggetto con gli attributi “causa” e “effetto”. Partendo dagli stati finali osservati, viene cercato un insieme di stati iniziali che spieghi gli stati finali attraverso i loro effetti.Una rappresentazione più complessa è ottenuta se le relazioni includono anche combinazioni di stati. In più, può essere considerata l’incertezza per esprimere il fatto che uno stato potrebbe avere un effetto solito, ma non sempre realizzato. E’ necessario distinguere tra “effetto” potenziale di uno stato e quelli che realmente si verificano. La rappresentazione deve essere estesa includendo gli attributi “fattore di certezza” e “effetto attuale” e le procedure allegate “significato” e “derivazione” che contengono le regole connesse allo stato.
Classificazione statistica Adatta per problemi di classificazione per cui esiste un’ampia collezione rappresentativa di casi risolti. rappresentazione della conoscenza Nel caso più semplice ha la forma di una tabella, in cui le colonne sono etichettate con le soluzioni, la prima riga contiene le probabilità a priori e le rimanenti sono etichettate con le osservazioni manipolazione della conoscenza Consiste di un semplice calcolo in accordo con una variante del teorema di Bayes usando le osservazioni come input. La formula dà le relative probabilità delle soluzioni alternative dalle loro probabilità a priori P(S) e da quelle condizionali P(O/S).
Classificazione per confronto di casi (case comparison) Adatta a problemi di classificazione per cui esiste una grande collezione di casi generici o immaginari con le corrette soluzioni e conoscenza aggiuntiva. Un nuovo caso è risolto prima cercando il caso nel data base le cui caratteristiche (osservazioni) maggiormente concordano con quelle del nuovo caso rappresentazione della conoscenza Per la forma più semplice del case comparison senza conoscenza addizionale è sufficiente rappresentare le osservazioni e le soluzioni con gli attributi “nome” e “valore” corrente. In più richiediamo i tipi di oggetti “caso” con gli attributi “osservazioni” e “soluzioni”. La conoscenza aggiuntiva può essere riassunta così: - livello di astrazione; - pesi; - dati simili.