140 likes | 206 Views
M&D- Status Seminar Datenanfragen. Verfügbare Datensätze Nachfrage zu den Datensätzen Metadaten Benutzer-Anfragen Information/Schulung Probleme To Do Liste. Verfügbare Daten. M&D betreute Daten umfassen gegenwärtig:
E N D
M&D- Status SeminarDatenanfragen • Verfügbare Datensätze • Nachfrage zu den Datensätzen • Metadaten • Benutzer-Anfragen • Information/Schulung • Probleme • To Do Liste
Verfügbare Daten M&D betreute Daten umfassen gegenwärtig: Ergebnisse von Simulationsläufen (Klima, Regional-Szenerien) Reanalysen (ERA15, ERA40, NCEP) Abgeleitete Satellitendaten (HOAPS) Modell-basierte Datensätze für intern. Projekte (IPCC-DDC, CEOP) Beobachtungs-basierte Datensätze für intern. Projekte (CARIBIC, BALTEX)
Verfügbare Daten Umfang der Daten (19.4.2004): Experimente in der Datenbank: 323 Datensätze in der Datenbank: 33,380 Dateneinheiten (Rekords) 1,845,005,110 Größe : 31.5765 TByte Pointer auf 'externe' Files (Unitree) 8147 Vergebene Benutzeraccounts : 390 ‘Anonyme Nutzer : ca. 1000
Metadaten Metadaten sind Basis für das Retrieval der Daten ! ==> Aufgaben: Beschaffung und Erstellung der Metadaten Qualitätskontrolle der Informationen Vollständigkeit Aktualität Konsistenz mit den Daten Sichtbarkeit der Metadaten (Internet Access/Browser)
Nachfrage nach Datensätzen Datensätze werden nicht gleichmäßig intensiv angefragt: häufig: Reanalyse, IPCC-DDC, HOAPS, aktuelle ECHAM4 (IPCC-) Läufe Regionalscenarien Downloads pro Monat : ca. 1000 - 3000 Files
Benutzeranfragen Benutzerkreis ist sehr heterogen ! Benutzeranfragen umfassen folgende Inhalte: Datensuche für spezielle Anwendungen (insbes. Antriebsdaten, Beobachtungsdaten) Installation/Betrieb des aktuellen CERA2-Browsers (Installation, Firewall-Probleme) Ergänzende Informationen zu den Metadaten (z.B. GRIB-Format, Interpretation des Gitters, ...) Postprozessing (spez. räumliche Reduktion von globalen Feldern) Fragen nach weiteren Datenquellen
Benutzeranfragen Weitere nachgefragte Datensätze: Beobachtungs-(Stations-)daten Klimadatensätze auf Beobachtungsbasis Topographien etc. …
Schulung / Dokumentation Schulungsaktivitäten (“Datenverarbeitung”) IMPRS : Introduction into Programming (jährlich) Uni-HH : Praktikum Datenverarbeitung (regelmäßig) FU-Berlin : Datenverarbeitung in der Meteorologie (Herbst 2004)
Schulung / Dokumentation Schulungs-/Dokumentations-Bedarf (Datenaspekt) : Nutzung der Datenbank / des Browsers Schnittstellen zur Datenbank : Import/Export (Metadaten, Datensätze) Einführung in die Postprocessing Tools (PINGO, cdo, ...) Datenformate (GRIB, NetCDF, ... ) Visualisierung der Daten (grads, ncview, ...) Tools zum Arbeiten mit den Daten HLRE-Umfeld ... Kurse : lokal oder bei User-Gruppen Dokumentation : WWW-basiert
Probleme Probleme: Metadaten oft nur unvollständig verfügbar Daten nicht adäquat aufbereitet ('Rohdaten‘, Formate) Datensätze für Benutzer teilweise noch schwer handhabbar (Größe, Format) kontinuierliche Datenbankverfügbarkeit beim Einfüllen großer Datenmengen ...
Todo „muss“ : Einbindung des netCDF-Formats in das Archivierungs-/Prozessing Umfeld Einbindung eines Postprocessings in den Retrieval Prozess Weiterentwicklung des Einfüll-Mechanismus (Metadaten/Daten) Weiterentwicklung der Zugriffsmöglichkeiten Dokumentation der Datenbank (+Umfeld) und ihrer Möglichkeiten Bedarfsermittlung im Nutzerumfeld (z.B. ERA40-Bedarf) Kontinuierliche Qualitätskontrolle der Daten-/Metadaten
„soll“ : Einbindung erweiterter Funktionalitäten in den Retrieval Prozess (z.B. quicklook, statistische Aufbereitung, ...) FAQ-Datenbank (im WWW-Bereich) Promotion (Darstellung in Fachzeitschriften und auf Tagungen) Einbindung weiterer Projektdaten ... To do