1 / 109

1.1

1.1. annata. Possono essere a loro volta considerate : variabili dipendenti (contesto ANOVA, MANOVA, etc.) o variabili di risposta (contesto m.d. regressione) o variabili di analisi (contesto m.d. classificazione) (o specifiche di prodotto) (contesto produttivo/economico/S.Q.).

liam
Download Presentation

1.1

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. 1.1

  2. annata

  3. Possono essere a loro volta considerate: • variabili dipendenti(contesto ANOVA, MANOVA, etc.) • o variabili di risposta(contesto m.d. regressione) • o variabili di analisi (contesto m.d. classificazione) • (o specifiche di prodotto) (contesto produttivo/economico/S.Q.) Se una fonte di variazione viene definita in termini qualitativi o ordinali, le modalità che la caratterizzano possono prendere il nome di livelli.

  4. 1.2

  5. Ma è poi assolutamente necessario isolare le variabili ?

  6. NO Talvolta è addirittura impossibile L’importante è definire con chiarezza e rigore l’oggetto di studio anche nel quadro di un approccio meno atomistico e più sistemico al problema e pianificare di conseguenza il campionamento

  7. Esempio di un tentativo ... (Alessandri, S.; 2000; "Qualita' e variabilita' degli oli vergini di oliva della Toscana e modelli di classificazione: una discussione metodologica"; Bollettino dei Chimici Igienisti parte scientifica, Vol. 52 1S/2001, pp31-44.)

  8. 1.3 Io era tra color che son sospesi, e donna mi chiamò beata e bella, tal che di comandare io la richiesi.

  9. E’ qui che il pensiero razionale si perde facilmente

  10. 1.4

  11. E’ necessario che un parametro di dispersione divenga unità di misura nella scala delle posizioni, e quindi unità di misura della distanza-diversità. Particolarmente conveniente risulta essere la varianza

  12. Se consideriamo che la differenza (distanza, diversità) tra medie può essere misurata a sua volta come dispersione delle medie stesse attorno alla media delle medie, e quindi associata ad una varianza, allora possiamo interpretare la differenza tra medie come rapporto tra varianze: Varianza tra i gruppi / Varianza entro i gruppi

  13. 1.5 m u l t i v a r i a t o

  14. Numerosità , dispersioni posizioni uguali, struttura interna (co-dispersione) diversa L'informazione multivariata è maggiore della somma delle informazioni univariate singolarmente prese

  15. L'informazione multivariata può rivelare una direzione preferenziale lungo la quale la dispersione (separazione) delle osservazioni è maggiore di quella lungo le direzioni delle variabili considerate separatamente, direzioni coincidenti con quelle degli assi del sistema di riferimento.

  16. L'informazione multivariata può rivelare una direzione preferenziale lungo la quale la dispersione (separazione) dei gruppi di osservazioni è maggiore di quella lungo le direzioni delle variabili considerate separatamente, direzioni coincidenti con quelle degli assi del sistema di riferimento.

  17. 1.6

  18. ANOVA

  19. E’ sempre qui che il pensiero razionale si perde facilmente Stime per intervalli, prova delle ipotesi e concetto di significatività costituiscono gli strumenti per formulare ed affrontare un (il?) problema di fondo: Qual’é la probabilità di ottenere: • questo risultato (campionario) • questo/i insieme/i di risultati (campionari) • questa/e configurazione/i di risultati (campionari) • questa/e relazione/i tra risultati (campionari) • questa/e variazione/i nei risultati (campionari) • … per puro caso ?

  20. Stime per intervalli, prova delle ipotesi e concetto di significatività costituiscono gli strumenti per stimare e valutare la diversità-distanza fra popolazioni partendo dalle corrispondenti statistiche campionarie. (Per i problemi di classificazione sono necessari ANCHE altri strumenti di validazione, per incrementare la rappresentatività )

  21. critico La numerosità campionaria gioca sempre un ruolo per la rappresentatività

  22. In altri termini, fino a che punto E’ possibile trascurare o “accorpare” l’ ”effetto-anno” ? INOLTRE: il “sapere” metodologico maturato in campo agronomico da Fisher in poi, per quanto riguarda in particolare le produzioni agrarie, ed in special modo quelle da colture arboree, fornisce gli strumenti per impostare ed affrontare un problema specifico: Qual’é l’incidenza della variabilità annuale su: • questo risultato • questo/i insieme/i di risultati • questa/e configurazione/i di risultati • questa/e relazione/i tra risultati • questa/e variazione/i nei risultati • … ? Anche questo è un problema di rappresentatività

  23. 1.7

  24. critico E’ un argomento molto discusso, che presenta aspetti estremamente contraddittori sintetizzati da espressioni molto suggestive ... La “numerosità” delle variabili di analisi gioca anch’essa un ruolo per la rappresentatività per la computabilità per la possibilità stessa di fare inferenze nel senso della statistica classica per la predittività

  25. The blessings of Dimensionality E’un fatto che le tecniche di data analisys: • hanno molto successo • aumentano i loro campi di applicazione Tecniche di data analisys applicate a problemi di riconoscimento, basate su “poche” osservazioni descritte da moltissime variabili The curses of Dimensionality Intrattabilità di stime ed inferenze davanti alla proliferazione delle variabili di analisi

  26. 2.1

  27. Uno strumento importante per il calcolo di modelli di classificazione è costituito da un insieme di tecniche statistiche genericamente denominate Analisi Discriminante Il termine non ha lo stesso univoco significato per tutti gli autori.

  28. L' Analisi Discriminante tratta insiemi di osservazioni in cui: -sono definiti dei gruppi o classi -sono definite una o piu' variabili quantitative Si distinguono almeno tre tipologie di Analisi Discriminante: • l'Analisi Discriminante classificatoria orientata alla produzione di modelli di classificazione, • l'Analisi Discriminante Canonica • l'Analisi Discriminante Step-Wise orientate alla preventiva riduzione della dimensionalità dei modelli. Hand, (1981); Lachenbruch e collaboratori (1968); Lachenbruch (1975); Seber (1984),

  29. L'analisi discriminante classificatoria (da ora in avanti "Analisi Discriminante") • sviluppa una regola matematica (funzione discriminante), • basata sulle (funzione delle) variabili quantitative prese in considerazione, • che permette di attribuire un'osservazione ad una delle classi (restituisce una probabilità di attribuzione per ciascuna classe), • con la minima possibilità di errore.

  30. L' analisi discriminante classificatoria Si articola in numerosi metodi, parametrici e non: funzione discriminante lineare => LDA, da Linear Discriminant Analysis funzione discriminante quadratica => QDA, da Quadratic Discriminant Analysis non sono necessarie assunzioni circa l'omogeneità delle matrici di covarianze entro le classi metodi non parametrici => (kernel, KNN, …) non sono necessarie assunzioni circa la normalita' delle distribuzioni entro le classi.

  31. Analisi discriminante canonica (CDA, da Canonical Discriminant Analysis ") Obiettivi: • determinarele combinazioni lineari (definite Variabili Canoniche, Canonical variables, Canonical variates) delle variabili quantitative considerate, che meglio sintetizzano la variabilità tra le classi • selezionare un insieme di poche variabili canoniche, che possano vantaggiosamente sostituire, ai fini della classificazione dei dati, le molte (relativamente a quelle canoniche) variabili quantitative di partenza; Le variabili canoniche hanno la caratteristica di essere tra loro incorrelate. Klecka (1980); Seber (1984).

  32. Analisi discriminante step-wise Obiettivi: • determinarele variabili quantitative più efficaci per una corretta classificazione delle osservazioni • selezionare un insieme di poche variabili (originalinoncanoniche), che possano vantaggiosamente sostituire, ai fini della classificazione dei dati, le molte variabili quantitative di partenza • L'analisi discriminante step-wise persegue direttamente questo obiettivo con eliminazioni e/o immissioni progressive (passo-passo) di una variabile alla volta nel modello, per mezzo di diversi possibili criteri di valutazione. • I metodi step-wise NON garantiscono LA selezione della combinazione OTTIMALE di variabili originali in senso assoluto, ma solamente in senso relativo.

More Related