80 likes | 182 Views
MMBase Lucene module. Wouter Heijke. Kenmerken Lucene. Apache Software License Snel/Efficient Java API Query Language Maatwerk nodig voor MMBase. Architectuur. Lucene MMBase module. MMBase objecten MMBase security context Instelbaar via XML file (builders/velden)
E N D
MMBase Lucene module Wouter Heijke
Kenmerken Lucene • Apache Software License • Snel/Efficient • Java API • Query Language • Maatwerk nodig voor MMBase
Lucene MMBase module • MMBase objecten • MMBase security context • Instelbaar via XML file (builders/velden) • Velden hernoemen om uniformiteit te waarborgen • Word / PDF parsing en indexering (Attachments) • Resultaat is een lijst met nodes • Indexeren op interval basis
Lucene configuratie <?xml version="1.0" encoding="UTF-8"?> <lucenemodule> <index name="MyNews"> <table name="news"> <field name="title" /> <field name="subtitle" /> <field name="intro">introduction</field> <field name="body" /> <related name="attachments"> <field name="title">rel.title</field> <field name="handle" type="binary">rel.body</field> </related> </table> <table name="mags"> <field name="title" /> <field name="body" /> </table> </index> </lucenemodule>
Todo Lucene module • Taglib voor zoekresultaten • HTML (crawling) • On submit • Scheduler (crontab module Kees Jongenburger) • Ontsluiten meer Lucene functionaliteit (oa sorteren, score)
Ervaring zoeken met MMBase • MMBase: lage performance, query syntax (4en5mei) • Ht://Dig: blackbox, crawler (4en5mei/Leeuwarden) • Lucene: maatwerk, object based (Het KNMI, EGEM)
Einde Voor meer Lucene informatie http://jakarta.apache.org/lucene