210 likes | 295 Views
10 millió publikált oldal az Interneten. Biszak Sándor ARCANUM Adatbázis. –– Alapítva 1989 –– Alapító Magyar Szabadalmi Hivatal Cél a CD-ROM magyarországi bevezetése Első CD-ROM 1991Nemzetközi Szabadalmi Osztályozás Első DVD-ROM 2000 150 CD-ROM and DVD-ROM az elmúlt 20 évben:
E N D
10 millió publikált oldal az Interneten Biszak SándorARCANUM Adatbázis
–– Alapítva 1989 –– • Alapító Magyar Szabadalmi Hivatal • Cél a CD-ROM magyarországi bevezetése • Első CD-ROM 1991Nemzetközi Szabadalmi Osztályozás • Első DVD-ROM 2000 • 150 CD-ROM and DVD-ROM az elmúlt 20 évben: • Bibla, versek, lexikonok, stb. és nagy számban levéltári és könyvtári adatbázisok
— Régmúlt — Technológia: 10-15 adatrögzítő, szedő, ugyanennyi korrektor • Előny: • igen jó szövegminőség (99.95-99.99%): 10.000 betűnként 1-5 hiba • Hátrány: • havonta maximum 4-5000 oldal feldolgozása • nagyon drága Kiadványok: • iparjogvédelmi adatbázisok (védjegy, szabadalom, osztályozási rendszer), • VersTár, Biblia, Pallas Nagy Lexikon, Miszáth, Jókai összes, stb.
— Közelmúlt — • A világ megváltozott, elsősorban a Google Books megjelenésével. • A digitalizálás a tömeges feldolgozás irányába indult el. • (Patents!, Books) • Technológia: nagy tömegű digitalizálás (szkennelés), automatikus szövegfelismerés (OCR) • Előny: nagy mennyiség, olcsó • Hátrány: szövegminőség (98-99%), 10.000 betűnként 100-200 hiba • Publikálás: kétrétegű PDF • Szkennelt, hiteles kép • Alatta az automatikusan felismert szöveg • Saját fejlesztésű internetes kereső – Betekintés az indexbe - Csonkolás jobbról, balról - Szomszédossági keresés -Találat kivilágítása - Tetszőleges méretű adatbázis (akár több millió oldal) – Nagy sebesség
— A JELEN. Mindent digitalizálunk — • Oklevelek, egyedi iratok, régi könyvek könyvszkennerrelBookEye 3 A1 color és Zeutschel OMNISCAN 12000 • Kapacitásunk: 2000 felvétel / nap • A1 (60×80 cm) és A2 dokumentum méret • 36 bit színmélység, 100-600 DPI felbontás • Sebesség: szürke 1 mp, szines 4 mp • Beépített, 100 mm-es tartományban állítható motoros könyvtartó • UV-mentes nagy fényerejű fehér LED • Tökéletes, tükrözésmentes megvilágítás • Könyv-görbület korrekció • Kíméletes, csak a szkennelés ideje alatti fényterhelés
— A JELEN. Mindent digitalizálunk — Qidenus RBS Pro TT robotszkenner legfontosabb jellemzői • könyvszkennelő robot a minőségi nagytömegű digitalizáláshoz • 2 az 1-ben eszköz: teljesen automata mód (2000 oldal/óra teljesítmény); manuális, félautomata mód (900 oldal/óra) • Szabadalmaztatott lapozó megoldás: „bionikus ujj” • Gyökeresen új könyvtartó rendszer • Hatékony dupla-lapozás ellenőrzés • A legújabb Canon DSLR kamerák használata, 300-400 dpi felbontás • A borítólapok, a kötésből kiszakadt oldalak digitalizálása • QiSoft programcsomag: képfeldolgozás, formátum-konverzió, munkafolyamat irányítás, OCR, metaadatok • Asztali kivitel: kompakt, hordozható, gazdaságos
— A JELEN. Mindent digitalizálunk — • Könyvek, folyóiratok, képeslapok • 2 Canon X10C nagysebességű szkenner Kapacitásunk: 20.000 oldal / nap2009-ben 3 millió oldalt digitalizáltunk • Canon imageFORMULA DR-X10C • Maximális felbontás 600 DPI • Maximumális méret A3 (1m) • Kétoldalas szines szkennelés • Ultrahangos duplalap-behúzás érzékelő, kapocs detektálás • Por mentes szkennelőrendszer • „Újra-próbáló” lapbehúzás • Szkennelési sebesség: szines 128 lap/min; szürke vagy FF 128 lap/min • Nagyvolumenű terhelhetőség: 60,000 oldal/nap • Sima, begyűrődésmentes adagoló- és görgőmechanizmus fotók és régi újságok esetén is!
— A JELEN. Mindent digitalizálunk — • Térképek, tervek, plakátok nagy formátumú szkennerrel • Három VIDAR szkenner • Kapacitás: 1000 térkép / nap • VIDAR SELECT P42 PLUS • Maximumális felbontás: 600 DPI • Max. dokumentum szélesség: 106 cm • Max. dokumentum hossz: korlátlan • Max. dokumentum vastagság: 15 mm • Színmélység: 42 bit/24 bit • Tripla 4-soros CCD (RGB Triplets + Panchromatic B/W) • Precíz színkalibráció, kiváló színhűség, zaj nélküli képek • nagyfrekvenciás, hideg fényű megvilágítás • Computer-vezérelt sima görgőmechanizmus • 400 megabit/sec sebességű adatátvitel
——— Specialitásunk a régi térkép ——— - Digitalizáltuk a Habsburg Birodalom katonai felméréseit (1., 2. és 3.) - Magyarország történeti a kataszteri térképeit XIX. század (100,000 szelvény) - Horvátország történeti kataszteri térképeit (30,000 szelvény)
—— Specialitásunk a régi térkép —— Térkép a képből: - georeferálás: GPS koordináta minden pixelre - nagyméretű mozaik a szelvényekből - publikálás DVD-ROM-on vagy Interneten (Google maps)
–– Internetes adatbázisaink –– 10 millió oldal Magyar Távirati Iroda (MTI) 1920-1950: 850.000 oldal
–– Internetes adatbázisaink — 10 millió oldal Magyar Szabadalmi Adatbázis 1896-2009: szabadalmak, védjegyek
–– Internetes adatbázisaink –– 10 millió oldal Parlamenti Napló 1861-1990: 700.000 oldal
–– Internetes adatbázisaink –– 10 millió oldal • Magyar Országos Levéltár • Középkori oklevelek adatbázis: 110.000 oklevél 500.000 kép • A MOL összes kiadványa: 200.000 oldal • Királyi Könyvek 1526-1918: 100.000 kép • Kataszteri térképek (50.000 szelvény); Kéziratos térképek (120.000 szelvény)
— Internetes adatbázisaink — 10 millió oldal Önkormányzati levéltárak közös adatbázisa: - Levéltári kiadványok: 500.000 oldal - MSZMP vezető testületi jegyzőkönyvek 1956-1990: 250.000 oldal - Kataszteri térképek: 100.000 térképszelvény
–– Internetes adatbázisaink –– 10 millió oldal Múzeumi kiadványok: 48 múzeum 900.000 oldal
–– Internetes adatbázisaink –– 10 millió oldal Képeslapok: 4 múzeum 150.000 képeslap
— Helyi lapok tömeges digitalizálása — • Digitalizálás lapadagolós szkennerrel? • Előnye: igen jó minőségű szkennelés, jó minőségű OCR • Hátránya: a köteteket lapokra kell bontani • Döntés: a kötetek szétszedése, visszakötés nélküli tárolása, szolgáltatás digitálisan • Digitalizálás mikrofilmről? • Előnye: viszonylag egyszerű, gyors, teljes • Hátránya: igen rossz minőségű, szövegfelismerésre (OCR) alkalmatlan • Nem biztosítható az elfogadható színvonalú keresés
— A jövő — • Országos együttműködés lehetősége, közös publikálás • Tudományos periodikumok: ADT (Arcanum Digitális Tudománytár) • Helyi lapok • Napilapok • Lexikonok, könyvritkaságok • Helytörténeti gyűjtemények — Felajánlás a közgyűjteményeknek — • 2011 kötet térítés mentes digitalizálása 2011-ben • Partnerintézményeket keresünk • Helyszíni kitelepülés, mini digitalizálási konferenciák • Tartalmak közös kiválasztása • Digitális tartalmak átadása, igény esetén publikálása
Köszönöm a figyelmet! ——— www.arcanum.hu ———