260 likes | 398 Views
Edizione digitale di testi epigrafici classici e medievali. Daniele Fusi http://www.fusisoft.it/. Edizione digitale. Obiettivi. Molteplici media e pubblici. cd-rom o dvd. sito web. unica banca dati. libri elettronici. chiosco museale. libri. Vari livelli di specializzazione. epigrafia.
E N D
Edizione digitale di testi epigrafici classici e medievali Daniele Fusi http://www.fusisoft.it/
Edizione digitale Obiettivi
Molteplici media e pubblici cd-rom o dvd sito web unica banca dati libri elettronici chiosco museale libri
Vari livelli di specializzazione epigrafia archeologia unica banca dati livelli di fruizione filologia e linguistica paleografia
Longevità • uso di tecnologie standard • indipendenza da qualsiasi particolare forma e medium di pubblicazione dei dati • elevata capacità di trasformazione dei dati, intrinseca al progetto editoriale
Esempi di uso specialistico: sistemi esperti • linguistico: software di flessione morfologica diacronica e sincronica; lemmatizzazione automatica • metrico: software di analisi e scansione metrica di versi greci e latini; corpus metrico • paleografico: algoritmi di riconoscimento neurale, corpora paleografici interattivi
Realizzazione ed espansione Principi generali
Semantizzazione dei contenuti lemma morfologia etimo traducente fraseologia opera etc ...
Semantizzazione: usi lemma elenco alfabetico dei lemmi, diretto o inverso morfologia elenco dei lemmi per categoria grammaticale etimo dizionario etimologico (elenco lemmi per radicale) traducente vocabolario bilingue (italiano <> greco) fraseologia ricerca per fraseologia opera elenco dei luoghi citati, elenco dei lemmi per occorrenza etc ... lemma morfologia ricerche combinate etimo opera etc ...
Peculiarità del documento epigrafico • supporto: • monumento e funzione • contesto storico e materiale • materiale, tecnica, forme • testo: • lingua o dialetto • ortografia ed ‘errori’
Ortografia e prassi editoriali Διονύσις 1. Ἀντώνιος 2. Ἀντώνις η = ι (= υ, ει, οι, υι, ηι) 3. Ἀντώνης (m. -ης)
Livelli di semantizzazione del testo • minimo: puro testo A • FABIO • A • F • FABI- ANO • EQVITI ROMANO • DECV- D RIONI • OST M QVI • VIXIT • ANNIS • XXII • M • XI • D • XX • A • FABIVS • TROPHIMVS PATER • FECIT
<x>A</x> • <y>FABIO</y> • A • F • FABI- ANO • <z>EQVITI</z> ROMANO • DECV- D RIONI • OST M QVI • VIXIT • ANNIS • XXII • M • XI • D • <n>XX</n> • A • FABIVS • TROPHIMVS PATER • FECIT Livelli di semantizzazione del testo • medio: testo continuo marcato (es. XML) abbreviazione = Aulo A • FABIO • A • F • FABI- ANO • EQVITI ROMANO • DECV- D RIONI • OST M QVI • VIXIT • ANNIS • XXII • M • XI • D • XX • A • FABIVS • TROPHIMVS PATER • FECIT titolo numerale nomen
Testo continuo marcato: vantaggi • semantizzazione • standardizzazione (es. XML, Unicode) • testo continuo interpretabile e fungibile a diversi livelli • piattaforma di scambio, trasformabilità
Testo continuo marcato: svantaggi <ln><x>A</x> • <y>FABIO<y> • A • F • FABI-</ln> <ln>ANO • <z>EQVITI</z></ln> • nidificazione e complicazione della struttura • limite alla sovrapposizione di tag • costrizione del dato metatestuale patronimico abbreviazione = Aulo abbreviazione = Auli nomen cognomen praenomen abbreviazione = filio titolo nome completo = Aulo Fabio Auli filio Fabiano etc. ...
Banca dati non semplice testo marcato ma banca dati altamente strutturata luogo data etc. etc. apparato: [...] dati di scavo testo: [...] testo bibliogr.: [...] bibliografia dati scavo: [...] data: [......] apparato luogo: [......]
abcdefg hijkl mno pqrstuv wxy z ... Dal testo continuo alla banca dati dati identificativi classificazione luogo intestazione data corpus bibliografia gruppi di testi iscrizioni dati di scavo descr. fisica descr. paleografica media associati commento testo apparato etc. ...
Banca dati XML • testo ‘amorfo’ e decomposto, massima separazione forme / contenuto • struttura slegata dal testo e dettata da soli criteri semantici • dato metatestuale libero di espandersi e strutturarsi secondo le sue specificità • struttura aperta: espansione in pubblicazione (media e pubblici) e redazione (aggiunta di materiale e specializzazione)
Edizione elettronica diversi output per vari media e pubblici unica banca dati (repertorio) XML trasformazione incluso testo XML continuo (es. TEI) media associati indicizzazione automatica in database relazionali
Banca dati (repertorio) XML • conservazione dei vantaggi di XML: • standardizzazione (XML, Unicode, etc.) • formato di scambio • flessibilità e apertura a espansione • eliminazione degli svantaggi di XML: • semplificazione delle strutture (nidificazione) • no limitazioni intrinseche (sovrapposizione) • velocità di accesso nella pubblicazione tramite indicizzazioni automatiche in database relazionali
Trasformazione testuale (1) repertorio strutturato (2) preprocessing
Trasformazione testuale (1) repertorio strutturato (2) preprocessing • (3) conversione e pubblicazione: • medium e formati (HTML, PDF, DOC, SQL, TEI, etc.) • risorse tipografiche (es. font) • impaginazione tipografica
Esempi di realizzazione Stratigrafia testuale e ramificazione
... altri strati ... “in pace” la pace qui va intesa... EN EIPHNH edd. EIPHNH HPHNH Stratificazione del testo strato di traduzione strato di commento strato di apparato strato ortografico: istruzione H > EI testo di base come sulla pietra
Strato ortografico: indici e ricerca • doppio testo: ortografia storica (KATAKITE) e normativa (KATAKEITAI) • ricerche intelligenti: • effettuabili su ogni strato: KATAKITE = KATAKEITAI, EPYHSEN = EPOIHSEN • parametri avanzati (es. tutte le parole con I per EI, tutte le forme di KEITAI con E per AI, tutti gli errori nelle forme di KEITAI [KITE: I=EI, E=AI], ...) • creazione automatica di indici: • linguistici • di errori paleografici
Esempi di espansione • unica struttura di banca dati, unico software distribuito (web) di data entry e trasformazione • nuovi strati: • nessi e legature • prosopografia • citazioni letterarie • nuovi rami (specializzazione): • paleografia • descrizione fisica