280 likes | 377 Views
Web – browsere, søking, m.m. Pensum: Olsen, kap. 8-17. Historikk. 1991 – første Browser utviklet av Tim Berners-Lee 1993 Mosaic (NCSA, Marc Andreessen) 1995 Netscape (Andreessen et al) 1995 Internet Explorer (Microsoft, basert på Mosaic). Oppgave. Vise Web sider
E N D
Web – browsere, søking, m.m. Pensum: Olsen, kap. 8-17
Historikk • 1991 – første Browser utviklet av Tim Berners-Lee • 1993 Mosaic (NCSA, Marc Andreessen) • 1995 Netscape (Andreessen et al) • 1995 Internet Explorer (Microsoft, basert på Mosaic)
Oppgave • Vise Web sider • Utfører GET-kommandoer for å hente sidene • Presenterer sidene ut fra tag-informasjonen • Forenkle administrasjon (favoritter, sidehistorikk, oppsett…) • Utføre programmer (script og applets)
Surfing • Kort tid mellom klikkene • Skanner sider mer enn å lese • Følger linker • Mye bilder, lite tekst • Krever kjappe responstider
Skjema - form • Meget viktig funksjon • Vi kan nå bruke HTML også for inndata • Gir muligheter for en lang rekke applikasjoner: • Billettbestilling • Banksystemer • Ordresystemer • m.m. • Data fra forms blir hentet ut på serversiden • Med form-begrepet kan vi altså bruke HTML som et grensesnitt mot andre systemer • Gir standardisering på brukersiden, grunnlaget er nå lagt for B2C applikasjoner
Mer • Script, applets: • En del kontroller kan gjøres i brukergrensesnittet i Browseren • Mer dynamiske brukergrensesnitt • Cookies: • Server kan identifisere bruker • Plug-ins: • Vi kan utvide funksjonaliteten til browseren • Sertifikater: • Browseren kan identifisere serverapplikasjonen (f.eks. et banksystem), serveren kan identifisere bruker (en bankkunde), kryptografert overførsel (HTTPS)
Web • Inhomogene data: • Hjemmesider til personer • Hjemmesider til organisasjoner • Offisielle rapporter • Stiler, kursinnleveringer, øvingsoppgaver • Amatørorganisasjoner • Aviser • Blogger • …
Lavt formaliseringsnivå • Mesteparten av data er formalisert på tegn/layout nivå (HTML, PDF) • Samtidig er noe formalisert på høyt nivå (billettbestillingssystem, banksystem) • Vi må skille mellom systemer: • der data er lagret som tilgjengelig som f.eks. HTML (”ekte Web”) • der data ligger i lukkede databaser og der Web brukes kun for brukergrensesnitt
Tilgjengelig/utilgjengelig • Mye er tilgjengelig for alle, men ikke alt • Mye data er lukket inne bak innloggingsprosedyrer: • Banksystemer • Bibliografiske databaser • Noen avisarkiv • m.m. • Her har en ofte høyere formaliseringsnivå
Enveis linker • Vi kan linke dit vi vil, ingen sentralisering • Men ulempen er at linken kan gå til en side som er fjernet/endret • Toveis linker ville rettet på dette, men ville vært langt vanskeligere å administrere
Søking Precision = # relevant returned # returned Recall = # relevant returned # relevant in total
Web søking • Komplisert ved: • Datamengden • Inhomogen database • Naturlig språk • Forenklet ved: • At vi ofter ute etter å finne noe informasjon, og der mye av det vi finner løser vårt informasjonsbehov
Søkemotorer • Stikkordbasert • Prioritering basert på antall forekomster • Prioritering basert på viktigheten til siden (Google) • Prioritering basert på betaling, annonser
Information overload • No Query # returned • 1. information AND retrieval 80,000 • 2. “information retrieval” 20,000 • 3. full AND text AND information AND retrieval 10,000 • 4. “information retrieval” AND “full text” 2,000 • 5. “full text information retrieval” 40 • 6. information AND overload 10,000 • 7. “information overload” 4,000 • 8. “information retrieval” AND “information overload” 40
Filtrering • Vi ønsker kanskje å fjerne en viss type sider fra søket eller fra eposten (porno, SPAM..) • Kan eliminere ut fra ord i teksten, ut fra farge på bilder (hudfarge) • Kan eliminere sider på visse adresser, epost fra visse avsendere • Kan la noen kategorisere sidene for oss
I praksis • Ingen av metodene fungerer 100% • Et filter kan fjerne mesteparten av SPAM men ikke alt • Fjerner også noen genuine meldinger/sider • Problem: • Formalisering
Kvalitet • Siden alle kan legge inn data på Web får vi et demokratisk system • Til gjengjeld har vi ingen kontroll med kvaliteten av det som blir lagt ut • Derfor må vi vurdere informasjonen ut fra hvem som har generert denne • Det er kanskje en fordel, som vi ser er verken myndigheter eller media ”objektive”.
Portaler • Organiserer informasjonen på Web • Hele Web (Yahoo) • For et firma, bransje, markedsplass, etc. • ”Alt på ett sted” tanke • Data organiseres ofte i menyer, greit om vårt informasjonsbehov kan klassifiseres på samme måte • Kjente organisasjoner i den fysiske verden (f.eks. vg, nrk, tv2) forsøker å utnytte sin posisjon til å etablere portaler
Tilstedeværelse på Web • Mange har sin hjemmeside på nettet • Demokratisk at vi alle kan ha vår side her • Problemet er å skape trafikk – hvordan gjør vi det? • Kan vi gjøre linken kjent? • Kan vi bli ”utvalgt” av søkemotorene? • Lettere for VG enn for Ola Nordmann • Lettere for et hotell i Honningsvåg enn i London • Undersøkelser viser at 75% av trafikken går til noen få Web steder
Mobil databehandling • Relativt nytt – ”hot” tema • Du har kontoret ditt der du er • Fantastisk nyttig for enkelte, mer marginalt for andre • Vi kan snakke mens vi er mobile, ikke like lett å håndtere PC’en • Mange nettløsninger: • Mobiltelefoni (GSM, WAP, GPRS, UMTS) • Radiosamband (Bluetooth, WLAN) • Flere typer av enheter: • mobiltelefon, PDA, PC • Enkle brukergrensesnitt blir viktig: • Talestyrte systemer (du kan be om avgangstider for fly) • Automatiske systemer (henter fram avg. tid for det flyet du er booket på) • Push-teknologi (SAS sender deg informasjon om flyet)
0700 a.m. Thursday 4. October Headline news: New airline merger Blue chips rally on Wall Street Hurricane warning • Weather • Temp: 25 • HUMIDITY: 87% • WIND: WSW at 9mph • SUNRISE: 06:08 am • Forecast: Partly sunny, COLDER, … email (filtered): FROM SUBJECT RECEIVED Joe Meeting 10/04 08:43 09.00 Department meeting 10.00 Lecture 12.00 Lunch with project team 14.30 Airport • Traffic, no delays. • Trains delayed. • Freezer temp. low • Buses on schedule. • Alarms working. Push teknologi
Dynamiske Web sider (server scripts) Eksempel – framhenting av informasjon om ansatte
Kode for skjemaet <FORM> ACTION=”http://www.firm.com/employee.asp” METHOD=post id=userdata name=userdata> <p>To get contact information, give last name of employee: </p> <INPUT type=text name=lastname size=40 maxlength=60> <INPUT name=info type=submit value=”Get info”> </FORM>
Prosedyre • Skjemaet vises av browser • Vi fyller ut navn og trykker knappen • Data fra skjemaet sendes til serveren • Serveren starter applikasjonen (asp) • Applikasjonen plukker ut navnet • Slår opp i databasen • og genererer en Web side med resultatet
<%@ Language=VBScript %> <% set DBObj= Server.CreateObject("ADODB.Connection") DBObj.Open "Employee" %> <HTML> <HEAD> <TITLE>Directory</TITLE> </HEAD> <BODY> <H2>Contact information for <%=Request.Form("name")%> </H2> <% set stdset=dbObj.Execute("SELECT * FROM employeeTable WHERE name = '" & Request.Form("name") & "'") if stdset.eof then Response.Write("<p>No persons fulfilled search request</p>") else Response.Write("<p>Phone:" & stdset("phone") & "</p>") Response.Write("<p>Email:" & stdset("email") & </p><br>") end if stdset.close dbObj.close %> </BODY> </HTML> Script Dette kjøres på serveren Henter fram data om personen med det oppgitte navnet Legger svaret inn i en HTML side
Viktig • Med dette kan vi bruke Web som et standardisert grensesnitt til andre applikasjoner • Vi kan tilby bank, billett, og andre tjenester uten å måtte installere egne programmer hos brukerne • Serveren kan holde orden på hva brukeren har gjort, så nå frir vi oss fra den tilstandsfrie standard Web-løsningen • Basis for B2C applikasjoner
Script i browser • Kan gjøre det mulig å utføre enkle valg og kontroller i browseren • Små programmer som browseren kan utføre uavhengig av server • Øker funksjonaliteten i Web grensesnitt
Peer to Peer computing • Utnytter at datamaskiner står i nett • Programmer som administrerer nettverket • Med eller uten en sentral maskin • Robuste systemer, uavhengig av enkeltkomponenter i systemet • Eksempler: • Fildeling (musikk, video, …) • Store beregninger (mange PC er erstatter en supercomputer)