1 / 35

Enterprise Suchen in Webapplikationen

Enterprise Suchen in Webapplikationen. Christopher Supnig. Willkommen. Imagine a web without search engines. Was ist eine Enterprisesuche. Was ist eine Enterprisesuche Strukturierte und unstrukturierte Daten Einsatz im Unternehmen Integration in ein Intranet. Suche im Intranet.

chad
Download Presentation

Enterprise Suchen in Webapplikationen

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Enterprise Suchen in Webapplikationen Christopher Supnig

  2. Willkommen Imagine a web without search engines

  3. Was ist eine Enterprisesuche • Was ist eine Enterprisesuche • Strukturierte und unstrukturierte Daten • Einsatz im Unternehmen • Integration in ein Intranet

  4. Suche im Intranet

  5. Unterschiede zur konventionellen WebSuche Mehrere unternehmensinterne Datenquellen

  6. Unterschiede zur konventionellen WebSuche Zugriffsschutz

  7. Unterschiede zur konventionellen WebSuche Unternehmenswortschatz Entwicklungsstraße…

  8. Unterschiede zur konventionellen WebSuche Datenklassifizierung und Dokumententypen

  9. Unterschiede zur konventionellen WebSuche Bewertungssystem

  10. Suchlösungen • Google Search Appliance • Microsoft FAST Search • Apache Lucene/ Solr

  11. Suchlösungen

  12. Suchlösungen

  13. Suchlösungen

  14. Schlüsselfaktoren bei der Planung • Suchkonzept • Was wird durchsucht • Wer verwendet die Suche • Wo wird gesucht • Wie soll gesucht werden

  15. Schlüsselfaktoren bei der Planung • Suche ist nicht nur Suche • Semantische Anreicherung • Anzeige von verwandten Themen

  16. Schlüsselfaktoren bei der Planung

  17. Schlüsselfaktoren bei der Planung • Eingesetztes Framework • Kosten • Features • Erweiterbarkeit

  18. Schlüsselfaktoren bei der Planung • Aufbereitung der Suchergebnisse • Information • Funktion • Design

  19. Schlüsselfaktoren bei der Planung • Luceneisschemaless – Let‘s design a schema! • Mehrsprachig • Wortstammerkennung • N-Grams für Autocompletion • Metadaten • Abrisstext • Boosting • Berechtigunsinformationen

  20. Schlüsselfaktoren bei der Planung • Wortstammerkennung • Sprachabhängig • Welcome => welcom • Welcomming => welcom • Welcomed => welcom

  21. Schlüsselfaktoren bei der Planung • Luceneisschemaless – Let‘s design a schema! • Mehrsprachig • Wortstammerkennung • N-Grams für Autocompletion • Metadaten • Abrisstext • Boosting • Berechtigunsinformationen

  22. Schlüsselfaktoren bei der Planung • N-Grams • „Goodmorning“ => „Goo“, „ood“, „od „, „d m“, „ mo“,… • Autocompletion • Alternative zu Wildcards

  23. Schlüsselfaktoren bei der Planung • Luceneisschemaless – Let‘s design a schema! • Mehrsprachig • Wortstammerkennung • N-Grams für Autocompletion • Metadaten • Abrisstext • Boosting • Berechtigunsinformationen

  24. Unter der Haube • Der Lucene Index besteht aus • Directory • Documents • Fields (Stored/Indexed)

  25. Unter der Haube • Erstellen eines Lucene Index • Crawler • Custom Indexer

  26. Unter der Haube • Umwandlung in Text • PDF => Text • HTML => Text • DOCX => Text • … • Analyzer • Filter • Tokenizer

  27. Unter der Haube • Lucene arbeitet mit Transaktionen. • Gleichzeitiges Suchen und Indizieren • Near-Real-Time Suchen

  28. Unter der Haube • Query Syntax • Terms and Fields content:apache • Boolean Operators (AND, +, OR, NOT, -) • Grouping(apache OR lucene) AND website • Wildcards * / ? • Fuzzylusene~ • Proximity„a phrase“~10 • Ranges [1 TO 100] {a to z} • BoostingI like lucene^4 • http://lucene.apache.org/core/3_6_1/queryparsersyntax.html

  29. Unter der Haube Wie sind wir es gewohnt mit einer Datenbank zu entwickeln?

  30. Unter der Haube • Den Index betrachten • Luke http://code.google.com/p/luke/

  31. Unter der Haube Scoring in Lucene • tf = term frequency in document • idf = number of documents that contain the term • getBoost(t in q) = boost of term in query • getBoost(t.field in d) = boost of field in document • lengthNorm = norm value for a field => number of terms in field • coord = score factor on fraction of query terms contained in document • queryNorms = norm value to make scores of different queries comparable

  32. Unter der Haube Wäre es nicht cool ein so starkes Framework zu verwenden? Java Lucene Lucene.NET Lucene PHP Port byZend Solr via REST

  33. Praktisches Beispiel Solr mit PHP ansprechen http://lucene.apache.org/solr/downloads.html https://github.com/csupnig/Solr-PHP-Example

  34. jQuery Europe Conference 201322. und 23. February 2013 in Vienna Todd Parker jQuery mobile Richard Worth jQuery UI Sebastian Kurfürst TYPO3 Christian Heilmann Mozilla Mike Taylor Opera Doug Neiner jQuery core http://jquery-eu-2013.eventbrite.com code: WEBDEV12 die ersten 10 tickets -15% AddyOsmani Yahoo Theodore Biadala Drupal Web Developer Conference 2012

  35. Noch Fragen? Vielen Dank! Christopher Supnig @csupnig www.supnig.com https://github.com/csupnig/Solr-PHP-Example

More Related