810 likes | 958 Views
La misura dell’audience nel web Prof. Sergio Brasini. Dipartimento di Scienze statistiche Alma Mater Studiorum - Università di Bologna brasini@stat.unibo.it. I contenuti dell’intervento. Introduzione La diffusione di Internet in Italia
E N D
La misura dell’audience nel web Prof. Sergio Brasini Dipartimento di Scienze statistiche Alma Mater Studiorum - Università di Bologna brasini@stat.unibo.it
I contenuti dell’intervento • Introduzione • La diffusione di Internet in Italia • Le metodologie di rilevazione dell’audience sulla Rete • L’architettura client-server • L’indirizzo IP e i cookies • La misurazione site-centric • La misurazione ad-centric • La misurazione user-centric • Le tendenze future • Considerazioni finali
La relazione tra pubblicità e risposta del consumatore • Le campagne di comunicazione pubblicitaria diffuse attraverso i mass media determinano nei consumatori/utenti risposte che si articolano su tre distinti livelli: a) risposta cognitiva; b) risposta affettiva; c) risposta comportamentale.
Le misurazioni sui mezzi di diffusione della pubblicità • Nell’attività di pianificazione di queste campagne è di importanza fondamentale la conoscenza delle informazioni rilevate tramite le principali indagini statistiche sui profili di fruizione dei mezzi di diffusione della pubblicità.
Le misurazioni sui mezzi di diffusione della pubblicità • Gli uomini di marketing e gli esperti di comunicazione hanno bisogno di dati attendibili, e quindi di sistemi di misurazione affidabili, per poter prendere al meglio le loro decisioni. • Conoscere lo stato di un mercato significa anche conoscere il modo in cui le informazioni vengono generate ed elaborate.
Le misurazioni sui mezzi di diffusione della pubblicità • Tra gli elementi fondamentali per chi deve decidere un investimento pubblicitario vi è l’accertamentodell’audience. • Questo accertamento è essenziale per la messa a punto delle campagne pubblicitarie in ragione del pubblico al quale il messaggio è rivolto e degli obiettivi della comunicazione. • Ogni mezzo ha il suo sistema di rilevazione.
Le misurazioni sui mezzi di diffusione della pubblicità • Audience televisiva (AUDITEL) • Audience radiofonica (AUDIRADIO) • Audience di quotidiani e periodici (AUDIPRESS) • Audience di cartellonistica e affissioni (AUDIPOSTER) • Audience di Internet (?)
Che cos’è Internet? Internet può essere considerato in molti modi diversi. • Come un mezzo di comunicazione e di scambio interpersonale: • one to one (mail, sms, cartoline, chat private, instant messanging, ecc.); • one to many (bacheche, forum, chat, ecc.); • many to one (newsletter, streaming broadcast, ecc.); • many to many (chat, gruppi di discussione, gruppi di acquisto, ecc.). • Come un mass medium interattivo: • diffusione di contenuti e di servizi; • piattaforma di trasporto per produzioni multimediali (audio, video, dati, ecc.); • enciclopedia universale (motori di ricerca, directories, ecc.). • Come un canale commerciale: • mezzo per informarsi, vedere e provare in vista di acquisti off-line; • mezzo per effettuare acquisti on-line di beni e servizi. • Come un veicolo di marketing diretto: • comunicazione diretta con i propri clienti e raccolta di informazioni; • invio mirato di messaggi (anche pubblicitari).
La diffusione di Internet in Italia • La situazione del numero di utenti Internet italiani a novembre 2001, in relazione al luogo di accesso, era la seguente (dati in milioni): Fonte: Onetone Research, dicembre 2001 • Per utente Internet si intende un individuo di almeno 15 anni di età che accede alla Rete autonomamente almeno una volta al mese. • Dunque ormai l’85 per cento degli utenti Internet dispone di una connessione da casa, il 37 per cento dall’ufficio.
La diffusione di Internet in Italia Andamento del numero di utenti Internet residenziali in Italia dal febbraio 2000 al novembre 2001 7,71 milioni di utenti Internet residenziali in Italia al novembre 2001 Fonte: Onetone Research, dicembre 2001
La diffusione di Internet in Italia • A partire dalla primavera del 2001 si è registrata una brusca frenata nel tasso di crescita degli utenti residenziali che oggi prosegue ad un ritmo inferiore ad un punto percentuale al mese. • Nonostante si parli spesso del free Internet, in realtà esso non è mai esistito perché il tempo speso on-line dagli utenti è sempre stato pagato agli Internet Service Provider (ISP). Il free Internet è una leggenda (e un’ottima trovata di marketing) nata dal fatto che fino al 1998 per collegarsi a Internet bisognava acquistare una password da un provider e quindi pagare a Telecom l’importo basato sul consumo telefonico ad ogni accesso alla Rete.
La diffusione di Internet in Italia • Con la liberalizzazione del mercato telefonico e la definizione delle tariffe di interconnessione, lo scenario del mercato è cambiato in modo radicale nel giro di pochi mesi. • Grazie alla forza dell’offerta di Tiscali, il primo ISP a credere nell’idea del “pay as you go”, il precedente modello è stato sostituito da un sistema nel quale la password di accesso diveniva gratuita e l’unica spesa da sostenere era quella di connessione (destinata, in parte, allo stesso ISP grazie all’interconnessione degli operatori). Di qui l’introduzione del termine free, relativo in realtà ad una sola parte del servizio di connettività, cioè quella dell’iscrizione ad uno specifico ISP.
La diffusione di Internet in Italia • All’introduzione del “pay as you go” hanno fatto seguito due anni di fortissima crescita del numero dei sottoscrittori. Tiscali ha forzato gli altri grandi ISP ad adottare in brevissimo tempo lo stesso modello e il numero di famiglie connesse è pressoché triplicato. • Il “pay as you go” ha avuto un grande effetto di accelerazione nella penetrazione residenziale della Rete e nel giro di due anni ha consolidato la posizione dei tre più grandi ISP (Tiscali, Tin.it e Wind-Infostrada). Questi hanno detenuto stabilmente una quota variabile tra l’83 e l’88 per cento del mercato residenziale, ciascuno incrementando notevolmente la propria base di utenti.
La diffusione di Internet in Italia • Il “pay as you go” è un modello che ha dimostrato di funzionare. Tiscali sta per raggiungere il pareggio operativo grazie ai ricavi derivanti dalla connettività. Altre realtà che non possono contare sui ricavi dell’accesso (ad es. Virgilio, Kataweb, ecc.) hanno registrato invece forti perdite e sono ancora alla ricerca di un modello economico sostenibile. • Eppure sono proprio i servizi e i contenuti erogati in Rete a spingere gli utenti a collegarsi. Qui emerge con evidenza l’asimmetria: chi spende per offrire i contenuti e i servizi on-line generalmente non è colui che riscuote il pagamento della loro fruizione da parte degli utenti.
La diffusione di Internet in Italia • Il rallentamento della crescita degli utenti residenziali sta facendo sì che da alcuni mesi il mercato sia sostanzialmente saturo. Per gli ISP acquisire nuovi utenti può avvenire solo a scapito dei concorrenti. • La penetrazione del pc nelle famiglie italiane ha superato ormai il 30 per cento. Se tutte queste famiglie fossero connesse alla Rete, potremmo avere 11 milioni di utenti Internet da casa (si ha infatti una media di 1,5 utenti attivi mensili per nucleo familiare connesso). • Ancora oggi però il 30 per cento dei pc presenti nelle case italiane non dispone di una connessione alla Rete.
La diffusione di Internet in Italia • A sua volta il numero di utenti attivi per famiglia continua a rimanere stabile, segnalando l’assenza di un effetto formativo che la presenza di un individuo connesso in famiglia potrebbe esercitare sugli altri familiari, educandoli all’uso di Internet. • Esiste tuttora una barriera culturale nell’approccio al pc che costituisce un fattore di forte inibizione all’accesso a Internet.
La diffusione di Internet in Italia • L’accesso ai servizi on-line non si limita al web: vi sono diverse attività che gli utenti svolgono quando sono connessi a Internet. Volumi di consumo di banda (assoluti e per utente) delle diverse applicazioni (protocolli) Internet nel caso dell’utenza residenziale Fonte: Onetone Research, dicembre 2001
La dimensione del mercato pubblicitario sulla Rete • Secondo le rilevazioni dell’Osservatorio Internet Advertising di IAB (InternetAdvertising Bureau - sigla che raggruppa i più importanti editori e concessionarie pubblicitarie che promuovono e vendono pubblicità interattiva su Internet, wireless e altri media) e di PricewaterhouseCoopers, il mercato della web advertising ha generato in Italia nel corso del 2000 267 miliardi di lire di entrate, con una crescita che si avvicinava al 400 per cento rispetto all’anno precedente.
La dimensione del mercato pubblicitario sulla Rete • L’andamento del 2001, per il quale non sono ancora disponibili i dati definitivi, ha fatto segnare al contrario una flessione. • Nel corso del 2000 i settori che hanno investito maggiormente in pubblicità on-line sono le telecomunicazioni (51 miliardi) e i servizifinanziari (45 miliardi). Al terzo posto segue il comparto dei New Media (37 miliardi).
La dimensione del mercato pubblicitario sulla Rete • Lo strumento più diffuso è il banner (63 per cento del totale del fatturato pubblicitario on-line), seguito dai progetti di sponsorship di vario genere (19 per cento) e da e-mail,interstitiale altre tipologie (18 per cento).
Strumenti e informazioni per la pianificazione pubblicitaria • Lo sviluppo della comunicazione e della pubblicità on-line necessita di maggiori informazioni quantitative e qualitative sui target e sull’audience dei siti web. • Le imprese hanno sempre più bisogno di nuovi strumenti per misurare il ritorno sugli investimenti.
Strumenti e informazioni per la pianificazione pubblicitaria Internet è per sua natura un mezzo misurabile. Non esiste tuttavia un unico sistema di misurazione per la valutazione dell’audience di Internet. Le indagini disponibili attualmente si avvalgono di tre diversi sistemi di rilevazione.
Le metodologie di misurazione dell’audience sulla Rete • Elementi propedeutici: • l’architettura client-server; • il codice HTML; • l’indirizzo IP e i cookie; • i log-file. • Le tre tipologie di misurazione quantitativa: • la misurazione site-centric; • la misurazione ad-centric; • la misurazione user-centric.
L’architettura client-server • Il computer client effettua la richiesta di una pagina. • Il server risponde, invia la pagina e registra l’attività. • Il client può visualizzare o meno l’informazione richiesta …
L’architettura client-server … di conseguenza ciò che viene registrato sul server non è l’effettiva visualizzazione della pagina ma la suasola richiesta (hit).
Il codice HTML fa riferimento a diversi file e a diversi formati. Una pagina HTML può essere composta di: testo; immagini; file multimediali di diverso tipo; altre pagine HTML (frame). Il codice HTML
Il codice HTML • Ogni singolo oggetto, immagine o testo inserito in una pagina HTML equivale ad un hit. Perciò non può esistere una relazione precisa tra il numero delle pagine viste da un utente e il numero degli hit generati dal server web a fronte delle richieste del client.
L’indirizzo IP • Ad ogni computer connesso a Internet è associato un numero come questo: • In base a tale numero si possono identificare alcune informazioni: • la nazione di collegamento; • l’Internet Provider o l’azienda; • il singolo computer (ma solo in condizioni di indirizzo IP statico). • Se l’indirizzo IP è statico, diventa possibile riconoscere lo stesso utente quando torna a visitare un dato sito. 193 . 45 . 45 . 1
I cookie • I cookie sono dei file di testo che il server web rilascia automaticamente al browser del client collegato: • il cookie consiste in una specie di codice che viene salvato sul pc dell’utente (se impostato per accettarlo): alla visita successiva, il server controlla la presenza di un suo cookie su quello stesso pc al fine di riconoscerlo;
I cookie • un esempio di cookie è il seguente: RMID#d42d6252399c1080#ilsole24ore.it/#0#3567004032#30124358#668302416#29362279#* • esistono diversi tipi di cookie (permanente o di sessione); • il contenuto informativo del cookie varia da sito a sito, ed è conservato nella maggior parte dei casi sul server, dove i software più evoluti provvedono ad elaborarlo assieme alle altre statistiche di traffico.
I log-file • Si tratta di file di registrazione dell’attività del server che ospita il sito web preso in esame. Esistono quattro tipi di log-file che esprimono diversi stati e tipologie di richieste: • il transfer-log registra tutti i file trasferiti dal server web all’utente; • l’error-log registra gli errori che si sono presentati durante il trasferimento; • l’agent-log descrive lo user/agent che ha effettuato una richiesta al server (ad es. un tipo di browser o un motore di ricerca); • il refer-log registra la provenienza dei visitatori.
I log-file 194.244.79.133 - - [15/Apr/2002:16:28:22 +0100] "GET /pic/titolo.gif HTTP/1.0" 200 7224 "http://www.stat.unibo.it/" "Mozilla/4.5 [en] (Win98; I)” 194.244.79.133 - - [15/Apr/2002:16:28:22 +0100] "GET /pic/news.gif HTTP/1.0" 200 3549 "http://www.stat.unibo.it/" "Mozilla/4.5 [en] (Win98; I)" 194.244.79.133 - - [15/Apr/2002:16:28:22 +0100] "GET /pic/freccia.gif HTTP/1.0" 200 262 "http://www.stat.unibo.it/" "Mozilla/4.5 [en] (Win98; I)" 194.244.79.133 - - [15/Apr/2002:16:28:22 +0100] "GET /pic/separatore.gif HTTP/1.0" 200 273 "http://www.stat.unibo.it/" "Mozilla/4.5 [en] (Win98; I)" 194.244.79.133 - - [15/Apr/2002:16:28:22 +0100] "GET /pic/titolosotto.gif HTTP/1.0" 200 1373 "http://www.stat.unibo.it/" "Mozilla/4.5 [en] (Win98; I)" 194.244.79.133 - - [15/Apr/2002:16:28:30 +0100] "GET /download/pic/download.gif HTTP/1.0" 200 6820 "http://www.stat.unibo.it/download/index.html" "Mozilla/4.5 [en] (Win98; I)"
I log-file http://www.stat.unibo.it CLIENT SERVER WEB LOG-FILE • HIT =unità di base che rappresenta la singola informazione registrata dai log-file di un server web. Ogni singolo oggetto, immagine o testo inserito in una pagina equivale a un hit.
Metodi di misurazione • La misurazione site-centric: • si basa sull’analisi dei dati contenuti nei log-file; • provvede all’identificazione dei computer tramite l’indirizzo IP o i cookie. • La misurazione ad-centric: • pone al centro dell’attenzione i dati provenienti da un ad-server ed è concettualmente identica a quella site-centric; • per ad-server si intende un insieme di hardware e software dedicato all’invio di banner (ma anche di bottoni ed interstitial) ai diversi siti web secondo parametri predefiniti. In pratica, ogni volta che un utente si collega ad una pagina web, l’ad-server intercetta la richiesta e in base ai parametri più vari (casualità, dominio di partenza dell’utente, tipologia della pagina di provenienza, parola ricercata, ecc.) invia il banner più appropriato.
Metodi di misurazione • La misurazione user-centric: • si basa sulla registrazione dell’attività di navigazione di un campione statistico rappresentativo (panel) di utenti di Internet tramite pc meter; • determina l’interazione di un utente con la Rete e non con un solo sito, offrendo una visione più completa; • fornisce dati uniformi e comparabili per i diversi siti; • consente l’identificazione degli utenti tramite dati socio-demografici e psicografici.
La misurazione site-centric • Attraverso l’analisi dei log-file si conteggiano le pagine di un sito web inviate in seguito alle richieste degli utenti, ma non quelle effettivamente visualizzate dai browser o visualizzate attraverso un serverproxy (una specie di server fotocopia che ha la funzione di alleggerire il traffico in arrivo a un sito, per problemi di affollamento o di dislocazione geografica) o registrate sulla cache memory del computer client. • Offre un quadro completo sulle performance di un sito, ma non fornisce alcun dato sugli altri siti presenti in Rete.
Il problema delle duplicazioni • Tramite la metodologia site-centric non è sempre possibile riconoscere il singolo utente, se lo stesso accede alla Rete da pc differenti (da casa, dall’ufficio, dall’università o da altri luoghi). Identico problema si ha se l’identificazione avviene tramite un indirizzo IP dinamico anziché statico. • L’uso di cookie, in alcuni casi, può rappresentare una soluzione, ma anch’essa non è esente da limiti.
La misurazione site-centric • Nei log-file di un server web sono registrati in maniera censuaria tutti gli eventi relativi al sito in esame. Poiché misurano richieste di pagine, non sono oggetto di errori statistici o di distorsioni campionarie. • Hanno però lo svantaggio di non offrire una misura uniforme: tecnologie diverse utilizzate da siti diversi spesso danno informazioni diverse pregiudicando analisi comparate tra siti.
La misurazione site-centric • Gli indicatori fondamentali sul flusso di traffico di un sito web. • Hits qualificati: il numero di richieste dei singoli file che compongono la pagina web, al netto degli errori e delle richieste abortite durante il trasferimento della pagina da parte dell’utente. Il numero degli hits qualificati registrati da un sito è utile per definire grossolanamente il volume di traffico di un sito, ma non il numero di persone che lo hanno visitato.
La misurazione site-centric • Gli indicatori fondamentali sul flusso di traffico di un sito web. • Page views (visualizzazioni delle pagine): il numero di pagine HTML richieste al server web. • Visits (visite): il numero di sessioni di visita al sito in un certo periodo di tempo; una visita inizia con il primo hit e termina dopo la scadenza del time out (di solito venti minuti o mezz’ora) dall’ultimo hit registrato. • Visitors (visitatori): il numero di singole persone che visitano il sito in un certo periodo di tempo.
E’ essenziale produrre conoscenze sui visitatori del sito. Perché Internet è diverso dagli altri media? Perché consente di indirizzare messaggi personalizzati e di interagire con gli utenti.
Visitatore non identificato ( o di sessione): di lui non sappiamo nulla se non l’attribuzione di un indirizzo IP in un dato periodo di tempo dell’analisi. Visitatore rintracciato: ? di lui conosciamo solo un codice numerico (ad es. un cookie). Visitatore identificato: di lui sappiamo molte cose (ad es. si è registrato sul sito, utilizza servizi, acquista prodotti on-line, ecc.) Le tipologie di visitatore
Le tipologie di visitatore • Per i visitatori non identificati si rendono disponibili solo informazioni quantitative sul loro: • numero; • tempo di permanenza; • provenienza. • Per i visitatori identificati si hanno a disposizione informazioni qualitative e di efficacia in termini di: • personalizzazione dei banner; • copertura; • frequenza; • duplicazione di esposizione; • flussi di navigazione.
Il comportamento di navigazione all’interno del sito costituisce uno degli aspetti di analisi più importanti. • Le variabili più rilevanti prese in considerazione sono: • dettaglio pagine di ingresso/uscita; • dettaglio pagine viste singolarmente; • dettaglio Url (uniform resource locator) di provenienza; • dettaglio keyword di ricerca; • frequenza delle visite; • durata delle visite; • tempi di permanenza per pagina. La misurazione site-centric
La misurazione site-centric L’analisi della provenienza del traffico consente di valutare in prima istanza l’efficacia della pianificazione pubblicitaria on-line. I dati che si rendono disponibili sono particolarmente utili per un’analisi diagnostica del sito web e sono indispensabili per le funzioni di verifica della qualità dei contenuti editoriali.
I software di log-analysis • Principali funzioni dei software • Elaborano i dati contenuti nei log-file. • Procedono al conteggio degli indicatori fondamentali (hits, pageviews, visits, visitors, ecc.). • Producono report più o meno dettagliati a seconda del prodotto relativamente a: • sito di provenienza dei visitatori; • flusso del traffico nel sito; • aggregazioni dei dati per sezione/sottosezione/pagina. • Consentono la creazione di database per l’archiviazione dei dati sotto forma di serie temporali e per facilitare analisi di datawebhousing. • Sono assolutamente indispensabili per le funzioni di internalaudit di quei siti che basano sul traffico il proprio modello di business.
I software di log-analysis • L’uso di questi programmi è dunque prevalentemente interno: i publisher li acquistano per controllare il traffico nelle diverse sezioni di un sito, in modo da stabilire quali sono quelle maggiormente frequentate e quelle che denotano invece uno scarso successo. • I report tecnici che si ottengono possono aiutare i webmaster a risolvere eventuali problemi in tempi rapidi.
La misurazione ad-centric: una variante di quella site-centric • Tecnologia di ad-serving • L’ad-server (una evoluzione del log-analyzer) è un insieme di hardware e software che gestisce l’invio di banner, bottoni e interstitial ai diversi siti ogni volta che l’utente richiede una pagina web. • Se il visitatore è rintracciato o identificato diventa possibile inviargli banner personalizzati in base alle sue abitudini di navigazione. • Le concessionarie di pubblicità on-line lo utilizzano anche per certificare l’andamento delle campagne. • Alcune Internet Solution Companies hanno iniziato ad usarlo per gestire autonomamente le attività di reportistica e di certificazione.
La misurazione ad-centric • Come funziona • Il set-top box (server) è un sistema a scatola chiusa ed impedisce che i log-file vengano alterati dagli editori dei siti. • I software di log-analysis leggono i log-file ed elaborano le statistiche di accesso. • Le società di certificazione producono le statistiche di base avvalendosi dei software di log-analysis e del set-top box. • L’InternetAdvertising Bureau ha definito i criteri di misurazione delle grandezze base più importanti dal punto di vista pubblicitario.