320 likes | 599 Views
Publishing Platform. Presentazione: Cinzia Colacicco Support Account Manager. Agenda. Publishing – Cosa è Processo di Publishing Esportazione Dati Pubblicati Informazioni Tecniche per il Publishing. Publishing cosa è.
E N D
Publishing Platform Presentazione: Cinzia Colacicco Support Account Manager
Agenda • Publishing – Cosa è • Processo di Publishing • Esportazione Dati Pubblicati • Informazioni Tecniche per il Publishing
Publishing cosa è • Le biblioteche hanno aumentato la loro presenza nel Web per esporre online i propri cataloghi. • L’esigenza ha portato alla pubblicazione dei record nel Web. • Questo però richiede una preparazione dei dati presenti nei cataloghi, sia dati descrittivi che amministrativi, sia i dati di posseduto • I dati non sono essere pubblicati immediatamente ma devono essere preparati tenendo conto dei concetti di gestione di sistemi del Web
Publishing da ALEPH • Un semplice meccanismo - publishing platform – permette ai siti di estrarre record dal catalogo ALEPH • Publishing platform estrae i record appartenenti ad un set che è popolato dai record del catalogo in un repository separato • Il repository è costantemente aggiornato • Il recupero di record dal repository è permesso per sistemi esterni quali Primo
Processo Publishing Estrazione dal repository: Include dati pubblicati per ogni set nel formato configurato • Creazione record pubblicati (Z00P) per: • Completa popolamento dei set (processo unico iniziale) • Creazione/Aggironamento/Cancellazione record (processo continuo) • Configurazione popolamento set: • Base Logica • Manipolazione Dati • Layout dati
Workflow • Il processo di estrazione ha due differenti flussi: • Processo iniziale - estrazione iniziale • Può essere fatto su tutto il database o su basi logiche creando diversi set. Questo viene fatto attraverso la procedura p-publish-04. • Processo di continuazione - estrazione continua Interessa record nuovi/aggiornati e cancellati. Viene eseguita attraverso la ue_21.
Workflow Entrambi i processi di pubblicazione (iniziale e continua) pongono il documento nel data repository, una directory definita localmente. I record estratti possono essere modificati per includere informazioni aggiunte dalle procedure standard di ALEPH come FIX ed EXPAND.
Processo Estrazione Iniziale Il processo di estrazione iniziale è attivato attraverso la procedura Processo di Pubblicazione Iniziale (publish-04). Questo servizio si trova nel sottomenu Publishing del menu Servizi nel modulo Catalogazione.
Processo Estrazione Iniziale L’estrazione (iniziale o continua) è eseguita in accordo con la tabella tab_publish nella directory tab della library che contiene i record che si vogliono estrarre (ad es.: UNI01,USM01).
tab_publish Queste due linee sono presenti in $alephe_tab/tab_base.lng: ! 1 2 3 4 5 6 7 8 9 !!!!!!!!!!!!!!!!!!!!-!-!!!!!!!!!!!!!!!!!!!!-!!!!!-!!!!!-!!!!!-!!!!!-!-!!!!!!!!!> EDUCATION Education USM01 USM01 Y wti=education HISTORY History USM01 USM01 Y wti=history queste linee appaiono in $data_tab/tab_publish: ! 1 2 3 4 5 6 !!!!!!!!!!!!!!!!!!!!-!!!!!!!!!!!!!!!!!!!!-!-!!!!!-!!!!!!!!!!!!!!!-!!!!!!!!!!!!!!! PERFORMANCE USM01 N AVAIL MARC_XML EDUCATION EDUCATION N AVAIL MARC_XML HISTORY HISTORY N AVAIL MARC_XML Nome della base o library bibliografica Codice Fix ed Expand dei record pubblicati Nome del set
Processo Iniziale Pubblicazione (publish-04) La lista dei set di pubblicazione deriva dalla colonna 1 della tab_publish Nota: Una volta che il record viene pubblicato non verrà pubblicato nuovamente. Per “unpublish” un record si deve attivare il servizio “Cancella Record Pubblicati di ALEPH (publish-05)”
Processo Iniziale Pubblicazione (publish-04) • Il Servizio “publish-04” è utilizzato per eseguire l’estrazione iniziale dei record del catalogo ALEPH a scopo pubblicazione. I record estratti sono conservati nella tabella Oracle Z00P. • Il servizio non deve essere rilanciato a meno di cambiamenti in $alephe_tab/tab_base.eng • Per stampare realmente i record dovrà essere attivato il servizio“Creazione di un file TAR per record ALEPH pubblicati (publish-06)”
Processo Publishing in continuazione • Record processati che hanno avuto modifiche nel database della libray • Le modifiche possono essere originate da aggiornamento del record bibliografico, di holding o dei record di authority così come le copie o i dati della circolazione • Il record Z07P indica i cambiamenti nel record pubblicato • Sulla base del record Z07, che indica gli aggiornamenti del record BIB e i cambiamenti nello status della Circolazione (necessari per le informazioni sulla disponibilità), il processo deamon ue_21 è responsabile della raccolta delle modifiche e aggiornamenti nel repository
Esportazione dei dati Pubblicati • I record nel repository pronti per l’esportazione e i set popolati possono essere trasferiti ad altre applicazioni • L’Export può essere fatto in diversi modi: • file tar • protocollo OAI • indicizzazione in Google
File Tar • Contiene dati di set popolati del repository; si basa su date, numero record o file di input • Creato attraverso il servizio Crea file Tar per record ALEPH Pubblicati (publish-06) • Può essere catturato da diverse applicazioni quali Primo
Creare file TAR per record ALEPH Pubblicati (publish-06) Flag Aggiorna data configurato con No Nota: Flag Aggiorna Data – normalmente dovrebbe essere Si – per essere in grado di inviare solo gli ultimi record aggiornati.
Creare un file TAR per record ALEPH Pubblicati (publish-06) Il file di output viene inviato a /tmp/publish per esempio il-aleph02-18(1) USM01-YOELK>>cd /tmp/publish/ il-aleph02-18(1) USM01-YOELK>>ls -lrt total 8 drwxrwxr-x 3 aleph exlibris 4096 Nov 13 08:39 usm01_all/ drwxrwxr-x 2 aleph exlibris 4096 Nov 13 09:24 usm01_education/ La directory viene definita dal campo Percorso della procedura
Creare un file TAR (publish-06) Se in publish-06 flag il Aggiorna data è Si, allora i record non verrano più stampati fino a quando non verranno aggiornati. Quindi, un record viene stampato solo una volta attraverso la publish-06 quando il flag Aggiorna dato è su Si. Quando il flag Aggiorna Data è Si ogni record risulta “flagged” che indica che è già stato stampato e non deve essere stampato di nuovo. Per “cancellare” tutti i flag deve essere attivato il servizio publish-05. Nota: flag Aggirona Data – Il flag è conneso alla data. Se una timestemp di uno z00p è successiva a questa data allora il record è pubblicato
Creare un file TAR per record ALEPH Pubblicati (publish-06) Quando attiviamo nuovamente la publish-06 con il campo “crea file tar per”“Dalla data dell'ultima attività” verranno stampati solo i record nuovi o aggiornati.
Protocollo OAI • OAI (Open Archive Initiative) Data Provider implementa il protocollo OAI, Version 2.0 • Record Z00P in formato OAI_DC_XML e OAI_MARC21_XML usati per esportare le informazioni con il protocollo OAI • ALEPH OAI Data Provider parte di ALEPH www_server – lavora in modalità richiesta/risposta
Pubblicazione con OAI Catalogo Publishing platform server OAI client OAI Browser
Indicizzazione Google • Il processo di pubblicazione permette l’estrazione di dati dal repository in formato HTML • Usando uno script fornito da Ex Libris, i dati vengono trasferiti e ristrutturati in formato adatto all’indicizzazione in Google • I dati possono ora essere indicizzati attraverso il crawler ed esposto per ricerche Google
Pubblicazione in Google Ricerca in Google Google crawling/indexing Data Repository di Google File per indicizzazione in Google firewall Il risultato della ricerca contiene in link back ad ALEPH Publishing / Estrazione Dati
Agenda Publishing – Che cosa, Perché, Dove? Processo di Publishing Esportazione Dati Published Informazioni Tecniche per il Publishing
Definizione Processo • Tutti i formati del repository richiedono la configurazione della tab_publish: • Si trova nella tab directory della library pubblicata • Definisce i set popolati • Per ogni set, definisce la sua base logica (o l’intero catalogo), formato di output, manipolazione dati e routine di arricchimento
Definizione Processo • Per Google, ci sono due ulteriori tabelle: • tab_doc_publish • Si trova nella tab directory della library pubblicata • Definisce quali campi estrarre e quali campi caricare • tab_font_publish • Si trova nella tab directory della library pubblicata • Definisce gli stili dei font del record Z00P HTML
Informazioni Tecniche della Pubblicazione • Il calcolo dello spazio disco richiesto si basa su: • Numero set di pubblicazione • Numero record Z00P • Espansione informazioni nei record estratti
Google Browser PRIMO server OAI file TAR USR Library (Set di entità) Sommario della Piattaforma di Pubblicazione cleint OAI Catalogo
In conclusione… • Publishing in formato MARC XML • Interoperabilità con Primo • Personalizzazione output usando routine di expand • Include informazioni disponibilità • Publishing per Google • Le pagine HTML devono essere indicizzate da Google • Back link ad ALEPH