120 likes | 264 Views
Enterprise search. Toteutustekniikka. Mikko Uusitalo Tampereen ammattikorkeakoulu. Sisältö. Enterprise search Google Search Appliance Ylläpito Integrointi Ongelmia ja ratkaisuja. Enterprise search. Yksi hakupalvelu yhdistää useat tietolähteet Yhtenäinen hakukokemus
E N D
Enterprise search Toteutustekniikka Mikko Uusitalo Tampereen ammattikorkeakoulu
Sisältö Enterprise search Google Search Appliance Ylläpito Integrointi Ongelmia ja ratkaisuja
Enterprise search • Yksi hakupalvelu yhdistää useat tietolähteet • Yhtenäinen hakukokemus • Ei ole rajoittunut pelkästään julkisiin www-sivuihin • Esimerkiksi henkilöhaku LDAP-hakemistosta mahdollinen • Pääsynhallinta • Näytetään vain ne dokumentit, joihin käyttäjällä on käyttöoikeus • Haun tarkennus ja rajaus (dynaaminen navigointi) • Epäoleelliset hakutulokset suodattuvat pois käyttäjän valintojen mukaan
Google Search Appliance (GSA) • Oma Google-hakupalvelin • Googlen hakuosaaminen käytettävissä • Crawling, Indexing, Serving, Administration • Lisenssi määrittää, montako dokumenttia indeksiin mahtuu • Yksi URL = yksi dokumentti, vaikka sivu olisi sama. Uuden järjestelmän indeksointia kannattaa seurata, ettei lisenssi tule vahingossa täyteen esimerkiksi HTTP GET -parametrien takia.
Google Search Appliance (GSA) • Googlen tuki nopeaa ja asiantuntevaa • Koodimuutos ohjelmistobugin korjaamiseksi saatiin kymmenessä tunnissa • Tuki ottaa laitteeseen yhteyden SSH:llatukipyyntöjä selvittääkseen • ApuaostettavissaSolitaOy:ltä, ainoa Enterprise Search -partneriSuomessa
Crawl • Yksinkertaisimmillaan jonkin järjestelmän ”crawlaus” aloitetaan kertomalla sen osoite GSA:lle • Muiden kuin www-sivujen läpikäyntiin käytetään connector-lisäosia • Saatavilla ilmaiseksi, ostettavissa ja koodattavissa (Java) • Pääsynhallinta vaatii muutoksia kohdejärjestelmään ja/tai järjestelmään kirjautumisen opettamista GSA:lle • Määritellään miten GSA pääsee kohdejärjestelmään • Määritellään käyttäjän käyttöoikeuksien tarkistus • Helppo huomioida uuden järjestelmän toteutusvaiheessa
Index • Dokumentteja voidaan myös viedä indeksiin XML-syötteenä • Dokumentit joihin ei ole viittauksia muualla • GSA:n ei tarvitse päästä kohdejärjestelmään • Indeksoitavat dokumentit jaetaan kokoelmiin (collection), jolloin esimerkiksi intranetin ja julkisen www-sivuston hakusisältö voidaan erottaa toisistaan • Kattavastitilatietoajalokejalaitteentoiminnasta
Serving Integrointikannattaatoteuttaayhteistyössäindeksoitavanjärjestelmäntoimittajankanssa Hakulause lähetetään GSA:lleHTTP GET -pyyntönä, johon saadaan haluttaessa vastaus myös XML:nä Haku- ja tulossivun ulkoasua voi muokata XSLT-tyylitiedostolla
Serving • Käyttäjän käyttöoikeuksien tarkistukseen useita vaihtoehtoja • Perus HTTP-kirjautuminen • Cookiecracking • Kerberos • SAML • X.509-käyttäjävarmenne • Connector
Ongelmia ja ratkaisuja • GSA:n sisäänrakennettu LDAP connector kaatui, koska se ei saanut LDAP-palvelimelta dataa riittävän nopeasti • Otettiin käyttöön ulkoinen connector-palvelin • Palautehakukokemuksestaollutpääosinhyvää • OpetetaanGSA:llevieläetsityimpienhakutermiensynonyymit (esim. kurssipalaute = opintojaksopalaute)