470 likes | 613 Views
INFORMATICA UMANISTICA B. MODELLARE LA CONOSCENZA: BASI DI DATI. USO DI STRUMENTI INFORMATICI PER LA GESTIONE DI INFORMAZIONI. Forse la piu’ importante applicazione di metodi informatici nelle materie umanistiche e’ per gestire grandi quantita’ di dati STRUTTURATI (in basi di dati)
E N D
INFORMATICA UMANISTICA B MODELLARE LA CONOSCENZA: BASI DI DATI
USO DI STRUMENTI INFORMATICI PER LA GESTIONE DI INFORMAZIONI • Forse la piu’ importante applicazione di metodi informatici nelle materie umanistiche e’ per gestire grandi quantita’ di dati • STRUTTURATI (in basi di dati) • NON STRUTTURATI (archivi di testi)
PROSOPOGRAFIA DELL’IMPERO BIZANTINO Basilios 7 Sex MFloruit E/L IXDates 813 (n.) / 886 (ob.)PmbZ No. 832Variant Names BasileiosEthnicity Macedonian;ArmenianLocations: Kepoi (Thrakesioi); Macedonia (property); Peloponnesos; Hagios Diomedes (Monastery of, Constantinople) (topographical); Constantinople (officeplace); Adrianoupolis (Macedonia) (residence); Bulgaria (residence); Constantinople (residence); Adrianoupolis (Macedonia); Bulgaria; Constantinople; Adrianoupolis (Macedonia) (birthplace)Occupation FarmerTitles Patrikios (dignity); Augustus (office); Basilikos protostrator (office); Basilikos strator (office); Emperor (office); Parakoimomenos (office); Protostrator (office)Textual SourcesBar Hebraeus, Chronographia, tr. E. A. W. Budge, The Chronography of Abu 'l-Faraj (London, 1932; repr. Amsterdam, 1976) (history); Chronicon Anonymi ad annum 1234 pertinens, ed. and tr. J.-B. Chabot, I = CSCO 81-82 (Paris, 1916-20), II = CSCO 109 (Louvain, 1937) (chronicle); Genesii, Josephi, Regum Libri Quattuor, eds. A. Lesmüller-Werner and I. Thurn, CFHB 14 (Berlin, 1978) (history); Georgius Monachus Continuatus, in Theophanes Continuatus, ed I Bekker (Bonn, 1839), pp. 761-924 (history); Leo Grammaticus, Chronographia, ed. I. Bekker (Bonn, 1842) (chronicle); Pseudo-Symeon, Chronographia, ed. I. Bekker (Bonn, 1838), pp. 603-760 (history); Theophanes Continuatus, ed. I. Bekker (Bonn, 1838) (history); Vita Ignatii Patriarchae, by Nicetas (BHG 817), PG 105.488-574) (hagiography); Vita Irenae Chrysobalanton, The Life of St Irene Abbess of Chrysobalanton, ed. with introd., tr., notes and indices, J. O. Rosenqvist, Acta Universitatis Upsaliensis (hagiography); Vita Nicolai Studitae (BHG 1365), PG 105. 863-925 (hagiography); Zonaras = Ioannis Zonarae Epitome Historiarum, libri XIII-XVIII, ed. Th. Büttner-Wobst, (Bonn, 1897) (history)Basilios 7 is the emperor Basil I (867-886). The history of his life and reign was written by his grandson, the emperor Constantine VII Porphyrogenitus (= Theophanes Continuatus, Book V); Constantine described him as of great benefit to the empire and composed his history in order to inform posterity of the origins of the ruling dynasty and to provide a model of conduct to be followed by future descendants of Basilios 7 (in particular, no doubt, Constantine's own son, the future emperor Romanos II): Theoph. Cont. V 1.
DATABASE STORICI:PROSOPOGRAPHY OF THE BIZANTYNE EMPIRE • Prosopografia: un registro di tutti gli individui vissuti in un certo periodo • In questo caso: tutti gli individui vissuti a Bisanzio tra il 641 ed il 1261 • Costruita a partire dalle loro menzioni in documenti dell’epoca • Informazioni su 8500 individui, dimensioni equivalenti a 11 000 pagine di testo
STRUTTURE DATI TEMPORANEE E PERMANENTI • Per potere rappresentare informazioni in modo duraturo occorre sviluppare delle tecniche per mantenerle in memoria secondaria • Lo strumento informatico utilizzato per questo scopo sono le BASI DI DATI
BASI DI DATI • Una base di dati e’ una collezione di dati immagazzinati in modo PERMANENTE su disco • Una base di dati permette di • DEFINIRE DEGLI OGGETTI (‘CONCETTI’) E DELLE RELAZIONI • INSERIRE NUOVI DATI • RITROVARE QUESTI DATI ANCHE COMBINANDOLI CON ALTRI • Il tipo di base di dati piu’ comune sono le basi di dati RELAZIONALI
PROGETTAZIONE DI UNA BASE DATI • MODELLAZIONE CONCETTUALE • Progetto dello SCHEMA • MODELLAZIONE LOGICA • Scelta della rappresentazione: TABELLE, ALBERI, etc • PROGETTAZIONE FISICA • Utilizzando il DBMS scelto
MODELLI CONCETTUALI • Un modello concettuale e’ un’analisi dei dati che si vogliono rappresentare nella base di dati indipendente dalla realizzazione fisica • Tipicamente, questa analisi si articola attorno ad una definizione de • Gli OGGETTI che si vogliono rappresentare • I loro ATTRIBUTI • Le RELAZIONI tra questi oggetti
UN SEMPLICE MODELLO CONCETTUALE STUDENTE MatricolaCognome, NomeData di Nascita RISULTATI_ESAMI MatricolaMateriaDataVoto
MODELLAZIONE LOGICA • Una volta decisi quali sono i concetti importanti da rappresentare e quali sono i loro attributi, occorre pensare come e’ possibile rappresentare questa informazione usando una base di dati
MODELLI DI RAPPRESENTAZIONE DATI • A partire dagli anni Settanta il modello dominante e’ stato il modello RELAZIONALE • Sono anche in sviluppo modelli di rappresentazione basati sulla struttura ad OGGETTI e GERARCHICA tipica di linguaggi di programmazione come Java, ma non hanno ancora preso piede • Per certi tipi di applicazioni (in particolare per basi di dati accessibili via Web) si fa molto uso di XML (Laboratori Modulo C)
IL MODELLO RELAZIONALE • L’informazione e’ rappresentata nelle basi di dati sotto forma di RELAZIONI r(x,y,z,w) • Due tipi di relazioni rappresentate • Relazioni rappresentate con TABELLE che rappresentano un OGGETTO ed i suoi attributi risultato_esame(IUB,4/2/2008,112233,29) • Relazioni tra le tabelle • Per esempio, tra tabella studente e tabella risultato_esame
TABELLE CHE RAPPRESENTANO RELAZIONI RECORD ATTRIBUTO
RECORDS • I records sono strutture dati usate per rappresentare oggetti che hanno ATTRIBUTI
esame.materia ESEMPIO DI RECORD ED ATTRIBUTI: RISULTATO ESAME RISULTATO_ESAME risultato_esame(IUB,4/2/2008,112233,29)
ESEMPIO DI TABELLA CHE RAPPRESENTA RELAZIONE RISULTATO_ESAME
UN ALTRO ESEMPIO STUDENTE studente(112233,Rossi,Mario,11/11/1973)
VALORI CHIAVE • Ogni riga di ogni tabella (cioe’ ogni rappresentazione di un oggetto) deve avere almeno un campo che permetta di identificare quella riga in modo univoco • Campo chiamato CHIAVE
VALORI CHIAVE STUDENTE
VALORI CHIAVE ARTIFICIALI RISULTATO_ESAME
RELAZIONI TRA TABELLE • Una base di dati relazionale permette di specificare, oltre che informazioni su attributi di oggetti, informazioni sulle relazioni tra oggetti • Per esempio, che un particolare risultato di esame e’ stato ottenuto dallo studente Mario Rossi
DATABASE MANAGEMENT SYSTEMS RELAZIONALI • Praticamente tutti i DATABASE MANAGEMENT SYSTEMS (DBMS) moderni sono basati sul modello relazionale • E.g., Oracle, Access • Sta anche diventando frequente l’uso di XML • Discuteremo in seguito
OPERAZIONI SU UN DATABASE RELAZIONALE • Operazioni tipiche su un database relazionale • RITROVARE un sottoinsieme delle righe • Possibilmente restringendo il ritrovamento ad un sottoinsieme delle colonne • AGGIUNGERE dati • DEFINIRE nuove tabelle e nuove relazioni
RITROVAMENTO INFORMAZIONI ED SQL • Le informazioni in una base di dati possono essere ritrovate mediante INTERROGAZIONI • In un database relazionale moderno le interrogazioni sono fatte utilizzando un linguaggio di interrogazione chiamato SQL
SINTASSI DI SQL • Diversi tipi di comandi: • INTERROGAZIONE • UPDATE • Comando di interrogazione: SELECT • Clausole piu’ usate: • FROM (specifica la tabella) • WHERE (specifica restrizioni)
INTERROGAZIONE SELECT Materia, Data, Matricola FROM Esami;
SQL: ESEMPIO DI USO DI ATTRIBUTI SELECT Nome, Cognome FROM Studenti WHERE Matricola=‘112233’;
SQL: ESEMPIO DI INTERROGAZIONE DA TABELLE LINKATE SELECT Studenti.Nome, Studenti.Cognome FROM Studenti INNER JOIN Esami ON Studenti.Matricola=Esami.Matricola WHERE Esami.Materia='IUB' And Esami.Voto>25;
CREARE UNA BASE DATI • Creare una base di dati realizza un modello concettuale • Richiede tradurre oggetti e relazioni in tabelle e legami tra tabelle
CREARE UNA BASE DI DATI IN ACCESS • Creare le tabelle usando ‘Create Table in Design View’ • Salvare • Cambiare a Datasheet view per inserire i dati • Continuare a creare altre tabelle • Linkare le tabelle
PASSI SUCCESSIVI • Dati non strutturati • XML e TEI • ONTOLOGIE e SEMANTIC WEB
DATI NON STRUTTURATI • Molto spesso i dati da gestire non sono organizzati in tabelle: • Archivi di testi ed immagini • Discuteremo di archivi di testi ed immagini e del ritrovamento in questo caso la prossima lezione
DARE STRUTTURA A DATI NON STRUTTURATI • I linguaggi di markup come SGML o XML permettono di ‘imporre una struttura’ su documenti non strutturati • Vedremo la lezione successiva
RAPPRESENTAZIONE DELLA CONOSCENZA ED ONTOLOGIE • La ricerca sul modo ‘ideale’ per rappresentare le informazioni ha portato alla nascita di ricerca sulla KNOWLEDGE ENGINEERING o rappresentazione della conoscenza anche in senso non applicato • Particolarmente interessante per domini piu’ complessi che ‘studenti’ e gli ‘esami’? • L’area della KNOWLEDGE ENGINEERING raggruppa ricercatori da database, Intelligenza Artificiale, e nell’area del SEMANTIC WEB • Un area molto legata allo studio delle ONTOLOGIE
LETTURE • Tomasi, capitolo 3 • Wikipedia: • http://it.wikipedia.org/wiki/Database • http://it.wikipedia.org/wiki/Modello_relazionale • ACCESS: http://office.microsoft.com/