330 likes | 441 Views
BERLIN-BRANDENBURGISCHE AKADEMIE DER WISSENSCHAFTEN. DAS PERSONENDATEN- REPOSITORIUM. ÜBERBLICK. I EINFÜHRUNG Ziele, Projektstruktur, Kooperationen, Arbeitsablauf II DATENMODELL Personen, Aspekte, Quellen, Identifikatoren III ANWENDUNG Quellenvergleich, Chronologien,
E N D
ÜBERBLICK I EINFÜHRUNG Ziele, Projektstruktur, Kooperationen, Arbeitsablauf II DATENMODELL Personen, Aspekte, Quellen, Identifikatoren III ANWENDUNG Quellenvergleich, Chronologien, Geographische Darstellung, Netzwerke
ZIELE Aufbau einer Architektur zur Vereinigung heterogener Datenbestände – Erstes Szenario: Repositorium zu Personen des 19. Jahrhunderts – Datenbestände: aus Forschungsvorhaben der Akademie und von Kooperationspartnern Freie Verfügbarmachung (Open Source / Open Access) – Erfassungs-Werkzeug (Archiv-Editor) – Strukturierungs-Werkzeuge (Datumserkennung, Namenerkennung, PND-Abgleich) – Repositorien-Software (basierend auf Fedora Commons) – Daten Integration in das Wissenschaftsnetzwerk – Aufbau von Schwester-Repositorien (DHI in Rom, Universität Bamberg) – Vernetzung mit anderen Datenquellen
Berlin-Brandenburgische Akademie der Wissenschaften TELOTA Initiative „The Electronic Life of the Academy“ Personendaten-Repositorium DFG-Projekt 3 Mitarbeiter, 3 Hilfskräfte 07/2009 – 06/2011 PROJEKTSTRUKTUR
KOOPERATIONEN Datenaustausch mit Forschungsvorhaben der Akademie – Marx-Engels-Gesamtausgabe – Alexander-von-Humboldt-Forschungsstelle – Archiv – Berliner Klassik – Acta Borussica – Wilhelm-von-Humboldt-Briefwechsel – Schleiermacher-Ausgabe – Magazin zur Erfahrungsseelenkunde Datenaustausch mit anderen Institutionen in Vorbereitung (individuell zu verhandeln: Schnittstellen, Rechte) Schwester-Repositorien – Deutsches Historisches Institut in Rom / École française de Rome – Universität Bamberg – weitere Kooperationen sind in Vorbereitung
unstrukturierteDaten Strukturierung Repositorium Schwester-Repositorien strukturierte Daten(XML) offeneSchnittstellen Kooperations-Partner Recherche Archiv-Editor Veröffentlichung(www) ARBEITSABLAUF
DB DB Forscher Forscher PDR 3 ? Forscher PDR 1 BBAW Forscher Forscher Forscher Forscher PDR 2 Musici DB DB Forscher Forscher Forscher ARBEITSABLAUFIntegration in das Wissensnetzwerk
ARBEITSABLAUFRepositorien-System Vorteile eines Repositoriums – Publikationskontext – integriertes Produkt – Schnittstellen, Administration, Workflow, Oberflächen i.d.R. vorhanden – Grid-Fähigkeit durch SOAP- und REST-Schnittstellen Evaluation mehrerer Systeme – DSpace – EPrints – Fedora Commons – Greenstone publiziert unter: http://edoc.bbaw.de/volltexte/2010/1506/
ARBEITSABLAUFSchnittstellen Fedora-Schnittstellen – Gfind – REST Domainspezifische Exportformate – PND-BEACON – … nicht unterstützt – OAI – /.39.50
Personen Aspekte IDs DATENMODELL Das Datenmodell soll folgende Anforderungen erfüllen: – Personen als Haupteinstiegspunkt – Erfassung unterschiedlicher Beschreibungssysteme – Koordination verschiedener Datenquellen Das Datenmodell umschließt daher drei zentrale Elemente: die zu beschreibenden Objekte → Personen die Beschreibungen selbst → Aspekte die Quellen der Beschreibungen → Referenzen Zusätzlich: zum Abgleich verschiedener Quellen → Identifikatoren
Person 1 Aspekt 3 Aspekt 1 Aspekt 2 DATENMODELLPersonen Personen werden anhand von Aussagen erfasst, die über sie getroffen werden. Personen tragen ausschließlich die Eigenschaften, die ihr von außen zugeschrieben werden. Diese Eigenschaften sind in Form von Aussagen zusammengefasst, die hier Aspekte genannt werden.
Person 1 lebte von1821 bis 1902 Rudolf Virchow wurde 1849Professorin Würzburg DATENMODELLPersonen: Beispiel Die Person 1 wird hier mit drei Aspekten beschrieben. Die Aussagen betreffen alle dieselbe Person, jedoch erfassen sie sehr unterschiedliche Eigenschaften. Ein Aspekte kann also eine fast beliebige Form annehmen. Sein Zweck ist die Beschreibung einer Person.
Referenzen Aspekt Quelltext Ort Klassifikation Zeit Beziehungen DATENMODELLAspekte Ein Aspekt ist eine einzelne Aussage zu einer Person. Ein Aspekt kann verschiedenste Informationen beinhalten. Die Einheit aus diesen Informationen ergibt zusammen einen Aspekt.
Person 1 lebte von1821 bis 1902 Rudolf Virchow wurde 1849Professorin Würzburg Referenzen Aspekt Quelltext Ort Klassifikation Zeit Beziehungen DATENMODELLAspekte: Beispiel Aspekt 1 → Beziehung = Person 1 → Quelltext = Virchow, Rudolf → Klassifikation = Name, normiert Aspekt 2 → Beziehung = Person 1 → Quelltext = 1849 Professor in Würzburg → Klassifikation = Beruf → Zeit = 1849 → Ort = Würzburg Aspekt 3 → Beziehung = Person 1 → Quelltext = 1821–1902 → Klassifikation = Lebensdaten → Zeit = von 1821 bis 1902
DATENMODELLAspekte: Beispiel Beispiel: Aspekt in XML-Ansicht
DATENMODELLIdentifikatoren Identifikatoren ... – geben jeder Person eine eindeutige Nummer – werden von Institutionen festgelegt (in der Regel von Nationalbibliotheken) – wurden zunächst nur im Zusammenhang mit Publikationen vergeben – werden zusammen mit Personeninformationen geführt (Namen, Lebensdaten, etcetera) Verbreitete Identifikationssysteme – BNF (Bibliothèque nationale de France) – LCCN (Library of Congress Control Number) – ICCU (Istituto Centrale per il Catalogo Unico) – PeEnDe (Wikipedia) – PND (Personennormdatei) Beispiele – http://errol.oclc.org/laf/n%20%2080158647.html – http://d-nb.info/gnd/11861116X – http://d-nb.info/gnd/140116176 – http://catalogue.bnf.fr/ark:/12148/cb14564447j/PUBLIC
ID 1 ID 1 P1 P2 P3 DATENMODELLIdentifikatoren Wenn Informationen zu einer Person aus verschiedenen Quellen stammen, kann die Identität dieser Personenobjekte mithilfe von Identifikatoren festgehalten werden. In der Skizze sind drei Personenobjekte zu sehen. Zwei davon sind über die ID 1 als identisch erkennbar.
ID 1 ID 1 ID 1 ID 1 P1 P2 P3 DATENMODELLIdentifikatoren Durch die Integration verschiedener Systeme (z.B. PND, LCCN, VIAF) können Identitäten erschlossen werden. In der Skizze wird durch einen Identifikator aus einem anderen System die Identität der Personenobjekte P2 und P3 hergestellt – und dadurch auch die Identität von P1 und P3.
ANWENDUNGBeispiel Quelle 1: Acta Borussica (AB), Band 8 Virchow, Rudolf (1821–1902), Dr. med. Berlin, 1846 Priv.-Doz. Berlin, 1849 Prof. Würzburg, 1856 Berlin, Leiter Patholog. Institut der Charité, Begründer der path. Anatomie u. der Zellularpathologie, einflußreich in Hygiene- und Sozialpolitik, zeitw. Berliner Stadtverordneter, 1880–93 MdR (DFP, DFsP), 1862–1902 MdA (DFP, DFsP, FsVP), 1891 große Goldene Medaille für Wissenschaft u. Berliner Ehrenbürger, 1895 Kommandeurkreuz der franz. Ehrenlegion. Quelle 2: Marx-Engels-Gesamtausgabe (MEGA), Band III/11 Virchow, Rudolf (1821–1902) deutscher Pathologe und Anthropologe; 1861 ein Gründer und Führer der Deutschen Fortschrittspartei; Mitglied des preußischen Abgeordnetenhauses (1862–1902) und des Deutschen Reichstags (1880–1893). Quelle 3: Altmitgliederverzeichnis der BBAW (Archiv der BBAW) Rudolf Virchow, *13.10.1821 Schievelbein/Pomm., +05.09.1902 Berlin. 1846 Prosektor an der Charité in Berlin. 1849 Professor an der Universität in Würzburg. 1856 Professor für Anatomie und Pathologie an der Universität in Berlin und Direktor des Pathologischen Instituts. 1892-1893 Rektor. 1898 Helmholtz-Medaille der Akademie. Geh. Medizinalrat.
ANWENDUNGBeispiel: Zerlegung in Aspekte Aspekt 1 Klassifikation = Name Text = Rudolf Virchow Quelle= AB 8 Aspekt 2 Klassifikation = Beruf Text = Leiter Patholog. Institut d. Charité Quelle = AB 8 Aspekt 3 Klassifikation = Name Text = Rudolf Virchow Quelle = MEGA III/11 Aspekt 4 Klassifikation = Tätigkeit Text = deutscher Pathologe und Anthropologe Quelle = MEGA III/11 Aspekt 5 ...
ANWENDUNGQuellenvergleich Abfrage: „Alle Berufe oder Tätigkeiten einer Person mit dem Namen Rudolf Virchow“ Ergebnis: # Text Quelle 1. Begründer d. patholog. Anatomie u. d. Zellularpathologie AB 8 2. Begründer der Zellularpathologie MEGA III/11 3. deutscher Pathologe und Anthropologe MEGA III/11 4. Direktor des Pathologischen Instituts Archiv 5. Leiter Patholog. Institut d. Charité AB 8 6. Prosektor an der Charité in Berlin Archiv ...
ANWENDUNGChronologien Abfrage: „Alle Aspekte mit einer Zeitangabe zu einer Person mit dem Namen Rudolf Virchow“ Ergebnis (Seite 2): AB 8 1856 Berlin, Leiter Patholog. Institut der Charité Begründer der path. Anatomie u. der Zellularpathologie einflußreich in Hygiene- und Sozialpolitik zeitw. Berliner Stadtverordneter Archiv 1856 Professor für Anatomie und Pathologie an der Universität in Berlin Direktor des Pathologischen Instituts MEGA III/11 1861 ein Gründer und Führer der Deutschen Fortschrittspartei AB 8 1862–1902 MdA (DFP, DFsP, FsVP) MEGA III/11 1862–1902 Mitglied des preußischen Abgeordnetenhauses [...] Aufgrund von Divergenz und unterschiedlicher Schärfe eröffnen sich aber auch neue Fragen.
ANWENDUNGChronologien: Similie Timeline Visualisierung mithilfe von Simile Timeline – frei verfügbares Produkt des Massachusetts Institute of Technology – Abbildung von Zeitpunkten und Zeiträumen auf einer Zeitleiste – individuell konfigurierbar
ANWENDUNGGeographische Darstellung Abbildung der Niederlassungen bestimmter Berufszweige auf historischen Stadtplänen Nutzung von interaktiven Karten Abbildung von Reisewegen und Migrationsströmen auf historischen Gebietskarten Verknüpfung mit historischen Karten
ANWENDUNGGeographische Darstellung Durch Kombination von Landkarte und Zeitleiste können Aspekte gleichzeitig in ihren zeitlichen und in ihren räumlichen Dimensionen visualisiert werden. Auch die Kombination mit historischen Karten ist möglich.
ANWENDUNGGeographische Darstellung: Google timemap Visualisierung mit Google timemap Beispiel: Fallmerayer-Briefwechsel
P2 Brief an P3 Brief an P2 einseitiger Kontakt P1 sporadischer Kontakt Brief an P2 Brief an P3 intensiver Kontakt P3 Brief an P3 Brief an P1 Brief an P3 Brief an P1 ANWENDUNGNetzwerk-Visualisierung Die Auswertung von Beziehungs- aspekten ermöglicht die Untersuchung von Netzwerken. Für die Erforschung von Wissenschafts- netzwerken sind z.B. Briefkontakte eine besonders ergiebige Quelle(wer schrieb wie häufig worüber an wen). Aber auch die Auswertung von z.B. Kontenbüchern ist denkbar, um Handelsnetzwerke sichtbar zu machen. Die Daten können sowohl qualitativ als auch quantitativ ausgewertet werden.
ANWENDUNGNetzwerk-Visualisierung: Protovis Visualisierung mit Protovis Beispiel: Physiker-Netzwerk
ABSCHLIEßENDE HINWEISE weitere Informationen Projektwebsite http://pdr.bbaw.de Nachrichtendienst Twitter http://twitter.com/persdatrep Ansprechpartner Torsten Roeder roeder@bbaw.de Termine 2010 2.–6. November Jahrestagung der GfM 2010 Deutsches Historisches Institut in Rom École française de Rome