90 likes | 341 Views
Documentverwerking P00 Inleiding Prof.Dr.ir. Patrick P. Bergmans Faculteit IngenieursWetenschappen Universiteit Gent. Inleiding: Lesgeven (1). Eerste les vrijdag: 13 februari 2009, 10:00 u Hoofdzakelijk kennismaking, inleiding en inhoud
E N D
Documentverwerking P00 Inleiding Prof.Dr.ir. Patrick P. Bergmans Faculteit IngenieursWetenschappen Universiteit Gent
Inleiding: Lesgeven (1) • Eerste les vrijdag: 13 februari 2009, 10:00 u • Hoofdzakelijk kennismaking, inleiding en inhoud • Presentaties worden op Minerva geplaatst (pps, ppt, pdf), indien mogelijk, enkele dagen vóór de les • http://minerva.ugent.be/index.php • Alle mededelingen gebeuren ad valvas op Minerva • Alle vragen van algemene aard worden gesteld en beantwoord via twee forums op Minerva • Lessenforum • Oefeningenforum • E-mail wordt alleen gebruikt voor persoonlijke vragen • Mijn adres: patrick.bergmans@ugent.be • Mijn telefoonnummer: 0475-234 735
Inleiding: Lesgeven (2) • Assistent op het Laboratorium (TELIN) • Dieter Fiems, dieter.fiems@ugent.be • Dieter Fiems zal alle lessen over XML geven
Inleiding: Jaaroefeningen • Accent op oefeningen • Jaaroefeningen zijn programmeeroefeningen • Twee programmeerprojecten + één XML project • Programmeertaal willekeurig • Maar moeten ofwel “.exe” taken zijn (sorry, niet op Mac OS, Unix of Linux), ofwel Java source • In te dienen per e-mail, als “attachment” • Formaat, namen, enz. zullen later medegedeeld worden • Eén oefening per mail • Telt voor 1/3 van de jaarpunten • Niet inhaalbaar voor de tweede examenperiode
Inleiding: Examen • Schriftelijk examen, in aanwezigheid van de lesgever • Deel theorie • Gesloten boek • Twee of drie vragen • 1/3 van de jaarpunten • Deel oefeningen • Open boek • Twee of drie oefeningen • Algoritmes moeten niet geprogrammeerd worden • 1/3 van de jaarpunten
Inhoud (1) • Modellen van documenten • Logische en fysische structuur van documenten • Logische structuur naar fysische structuur • Fysische structuur naar logische structuur • Letterstijlen en lettersoorten • Gewone, speciale en complexe alfabetten • Lettersoortfamilies (fonts) • Tekstverwerking binnen documenten • Horizontale verwerking (“paragraafverwerker”) • Verticale verwerking, met en zonder lay-out • Speciale coderingen (bv. wiskundige teksten)
Inhoud (2) • De “markup” talen • SGML, HTML • XML; documentgerichte eigenschappen van XML: DTD, XSL, XLL, XSLT, XSLFO, XPath • De bladzijde-beschrijvingstalen • PostScript • PDF • Documentcollecties • Tekstdatabanken • Beginselen van Documentbeheer • Zoekrobotten • Algemene zoekrobotten • Tekstgerichte zoekrobotten • Speciale zoekrobotten (“meta” zoekrobotten, enz)
Referenties (1) • “Digital Typography,” Donald Knuth, CSLI Publications, 1999 • “Digital Typography, An Introduction to Type and Composition for Computer System design,” Richard Rubinstein, Addison-Wesley, 1988 • “Rookledge’s International Type Finder,” Christopher Perfect and Gordon Rookledge, Moyer Bell Limited, 1991 • “The Concise <SGML> Companion,” Neil Bradley, Addison-Wesley, 1996 • “The XML Schema Companion,” Neil Bradley, Addison-Wesley, 2003 • “XSL Formatting Objects,” Sharon Adler Ed., Sams Publishing, 2003
Referenties (2) • “Document Warehousing and text Mining”, Dan Sullivan, Wiley, 2001 • “Understanding Search Engines”, Michael Berry and Murray Browne, SIAM, 2005 • “Modelling the Internet and the Web”, Pierre Baldi, Paolo Frasconi and PadhraicSwyth, Wiley, 2003 • “Mining the Web: Analysis of Hypertext and Semi-Structured Data”, ChoumenChakrabarti, Morgan Kaufman, 2002 • “Integrative Document & Content Management”, Len Asprey and Michael Middleton, Idea Group Publishing, 2003 • “Text Databases and Document Management: Theory and Practice”, AmitaGoyal Chin, Idea Group Publishing, 2001