1.24k likes | 1.6k Views
BIBLIOMETRIA E ANALISI DELLE CITAZIONI Nicola De Bellis (debellis.nicola@gmail.com). Università Ca' Foscari, Venezia, 1/12/2009. 2. L’ATTREZZO DI LAVORO: SCIENCE CITATION INDEX. INDICE ARGOMENTI. 1. DEFINIZIONE DELLA DISCIPLINA E UN PO’ DI STORIA. 3. BASI FILOSOFICHE. 4.
E N D
BIBLIOMETRIA E ANALISI DELLE CITAZIONI Nicola De Bellis (debellis.nicola@gmail.com) Università Ca' Foscari, Venezia, 1/12/2009
2 L’ATTREZZO DI LAVORO: SCIENCE CITATION INDEX INDICE ARGOMENTI 1 DEFINIZIONE DELLA DISCIPLINA E UN PO’ DI STORIA 3 BASI FILOSOFICHE 4 BASI MATEMATICHE
8 CONCLUSIONI 5 APPLICAZIONI [1] CARTOGRAFIA DELLA SCIENZA 6 APPLICAZIONI [2] VALUTAZIONE DELLA RICERCA 7 APPLICAZIONI [3] WEBMETRICA
DI COSA PARLIAMO Una metodologia d’indagine storico-sociale che, al pari di tante altre, si basa su documenti (cartacei o digitali) ma, a differenza delle altre: [1] non guarda al contenuto (significato, messaggio, interpretazione); [2] punta ad estrapolare le relazioni quantitative tra i documenti e tra gli elementi che li compongono (parole, link bibliografici, autori, istituzioni, etc.).
DI COSA PARLIAMO [3]si concentra in prevalenza sull’analisi quantitativa delle citazioni bibliografiche ricavate dagli articoli di riviste scientifiche (scienze naturali e biomediche), quindi perviene a conclusioni che si suppone valide solo per le discipline che utilizzano l’articolo (scientific paper) come strumento principale di comunicazione scientifica (non è il caso delle discipline umanistiche e storico-sociali).
REFERENCE & CITATION L’attenzione accordata alle citazioni bibliografiche a scapito di altri aspetti quantificabili presuppone che si abbia ben chiara la differenza tra riferimento bibliografico (reference) e citazione bibliografica (citation).
ESEMPIO [1] A cita B in un riferimento bibliografico R Dal punto di vista di A, l’entità R è un riferimento bibliografico (reference) Dal punto di vista di B, l’entità R è una citazione bibliografica (citation)
ESEMPIO [2] Il documento (quindi l’autore) B riceve 4 citazioni, ovvero 4 riferimenti bibliografici di autori diversi puntano a B
ESEMPIO [3] Se aggiungo altri link citazionali ottengo una retebibliografica che può essere analizzata con metodi matematici
IPOTESI Se si assume che A, A1, A2, A3,... non stiano barando, ovvero citano B in bibliografia perché B ha fornito un supporto (di qualsiasi tipo: concetto, argomento, risultato sperimentale, equazione, etc.) alle loro scoperte, allora si può affermare che ...
INDICATORI ... le citazioni documentano delle connessioni intellettuali tra documenti (e autori) ed il conteggio delle citazioni rivela l’intensità di tali connessioni intellettuali. In termini equivalenti: il numero di citazioni ricevute da un documento fornisce un indicatore del suo impatto cognitivo.
CONFUSIONE TERMINOLOGICA Esistono molti termini riferiti alle aree di ricerca che utilizzano questa metodologia: bibliometria, scientometria, informetrica, webmetrica, cybermetrica, netmetrica ...
BIBLIOMETRIA SCIENTOMETRIA • BIBLIOMETRIA: applicazione della matematica e di metodi statistici ai prodotti della comunicazione (testi, libri, articoli, bibliografie). • SCIENTOMETRIA: applicazione della matematica e dei metodi statistici ai prodotti della comunicazione scientifica e tecnologica finalizzata ad accertare il contributo relativo di scienziati, istituzioni, nazioni al progresso delle conoscenze.
INFORMETRICA WEBMETRICA • INFORMETRICA: studio degli aspetti quantitativi dell’informazione in qualunque forma (non solo informazione registrata in libri, articoli, etc.) e presso qualunque gruppo sociale (non solo scienziati). • WEBMETRICA (CYBERMETRICA, NETMETRICA): estensione dei metodi biblio-sciento-informetrici ai flussi informativi che si materializzano sulla rete Internet (non solo Web, ma anche posta elettronica, ftp, reti p2p).
ORIGINI • TEORIA MATEMATICA DEL CALCOLO DELLE PROBABILITA’ (metà XVII secolo): forma il nucleo della statistica inferenziale che, a partire dalla seconda metà del XIX secolo, viene applicata anche al di fuori delle scienze esatte (biologia, studi sociologici, etc.) • BIBLIOGRAFIA STATISTICA (fine XIX secolo): analisi quantitativa delle bibliografie finalizzata a documentare il progresso scientifico o ad assistere i bibliotecari nelle politiche di sviluppo delle collezioni.
DOCUMENTARE IL PROGRESSO • 1917: i britannici Francis J. Cole e Nellie B. Eales applicano l’analisi quantitativa alla letteratura prodotta, tra il 1543 ed il 1860, nel campo dell’anatomia comparata. Ci sono già le premesse di ogni futura indagine bibliometrica: • RIDUZIONISMO: lo studio del progresso scientifico si riduce allo studio delle pubblicazioni. • CONSAPEVOLEZZA DEI LIMITI: la qualità della ricerca non va confusa con la quantità di pubblicazioni.
ASSISTERE I BIBLIOTECARI • 1927: presso il college di Pomona, i coniugi Gross stilano una classifica di periodici sulla base del numero di citazioni ricevute in un’annata del Journal of the American Chemical Society: • EQUIVALENZA QUALITA’ = NUMERO DI CITAZIONI; • FATTORE “IMMEDIATEZZA”: a parità di punteggio, sono preferibili le riviste che ricevono più citazioni per gli articoli più recenti.
LA SVOLTA L’analisi quantitativa dei documenti e delle bibliografie è rimasta un’attività estemporanea fino a quando ... ... non si sono create le condizioni storiche che hanno reso le misure della comunicazione scientifica desiderabili da un punto di vista politico. Ciò è accaduto, a partire dalla fine della II Guerra Mondiale, in America ed in Europa (ma non in Italia).
BIG SCIENCE • Consapevolezza che scienza e tecnologia possono essere controllate, manipolate e orientate verso obiettivi specifici per favorire la crescita economica. • La scienza diventa “Big Science”: il governo e l’industria finanziano la ricerca pura e applicata nell’ambito di progetti internazionali su larga scala (Manhattan, Hubble, Human Genome Project, etc..). • Necessità di strumenti più raffinati di controllo della letteratura scientifica e al tempo stesso di sistemi di valutazione della ricerca meno legati a gruppi di interesse locali.
LA SOLUZIONE Nei primi anni ’60, EUGENE GARFIELD, fondatore dell’Institute for Scientific Information (ISI) a Filadelfia, rende popolare tra i genetisti del National Institutes of Health un oggetto nato per facilitare le ricerche bibliografiche: lo SCIENCE CITATION INDEX (SCI). Si tratta di un indice citazionale, ovvero di un repertorio costruito attraverso due operazioni concettualmente semplici ...
SCIENCE CITATION INDEX (1964-) [1] Si sceglie un certo numero di riviste internazionali e si catalogano in modo analitico, articolo per articolo, tutti i documenti citati nelle note e nelle bibliografie finali; [2] si inverte la lista così ottenuta in modo da poter risalire da un particolare documento a tutti gli articoli delle riviste di partenza che lo hanno citato. Diventano così possibili tre operazioni (di interesse non solo bibliografico).
[1] INFORMATION RETRIEVAL Utilizzare un documento rilevante “per me” allo scopo di recuperare altri documenti scritti da autori che, al pari di me, hanno giudicato rilevante lo stesso contributo e perciò hanno deciso di citarlo in bibliografia (citazione bibliografica come strumento di information retrieval).
[2] LEGAMI INTELLETTUALI Identificare i legami intellettuali tra autori citanti ed autori citati, quindi identificare documenti e autori chiave di un settore d’indagine e costruire una mappa bibliometrica dei confini tra discipline, specialità, fronti di ricerca (citazione bibliografica come strumento di analisi sociologica e di mappatura della scienza).
[3] IMPATTO Stimare, in termini di numero di citazioni ricevute, l’impatto esercitato da documenti, autori, istituzioni su un’area di ricerca (citazione bibliografica come strumento di valutazione della ricerca). Ecco perché lo SCI è diventato il principale attrezzo di lavoro della bibliometria.
ISI THOMSON Nel 1992 l’ISI è acquistata dalla multinazionale canadese Thomson Reuters e lo Science Citation Index, assieme alle altre creature di Garfield ovvero Social Sciences Citation Index (SSCI), Arts & Humanities Citation Index (A&HCI), Current Contents (CC), entra a far parte della piattaforma commerciale ISI Web of Knowledge (www.isiwebofknowledge.com/).
RICERCHE PER CITAZIONE Partendo dal record di un documento (libro, articolo, relazione di convegno, etc.) ... ... risalgo a tutti gli articoli di un certo numero di riviste internazionali preselezionate... CHE LO HANNO CITATO IN BIBLIOGRAFIA
Ricerca tradizionale per parola chiave Ricerca per citazione (Cited Reference Search) Indice di citazioni Database bibliografico 2004 paper 2003 paper 2002 1957 paper 1987 paper 1993 paper 2002 1996 paper 1982 paper 1996 paper 1957 paper 1982 paper
ESEMPIO In questo caso il titolo e le parole chiave non servono. I canali di ricerca sono: Autore, Rivista, Anno Proviamo a cercare gli articoli che hanno citato: Freemantle N, Cleland J, Young P, Mason J, Harrison J. Beta Blockade after myocardial infarction: systematic review and meta regression analysis. BMJ. 1999 Jun 26;318(7200):1730-7.
Inserisco i termini corrispondenti ai tre canali di ricerca negli appositi campi della Cited Reference Search (attenzione alle abbreviazioni)
Dal numero di pagina iniziale dell’articolo risalgo al record da visualizzare
Il pannello sulla destra mi dà un quadro riassuntivo del numero di citazioni. Cliccando su VIEW ALL 406 CITING ARTICLES visualizzo l’elenco completo degli articoli citanti
Ottengo infine la lista degli articoli (pubblicati in riviste indicizzate dallo SCI) che hanno citato l’articolo di partenza
BIBLIOGRAFIA PER CITAZIONI • Molti dei titoli trovati con questo sistema avranno affinità di contenuto con l'articolo di partenza (nel nostro esempio la percentuale è alta perché … si tratta di un argomento molto ben definito …ma anche perché … [lo vedremo in seguito]). • Alcuni dei titoli invece avranno scarsa o nessuna affinità di contenuto con l'articolo iniziale in quanto esistono diversi motivi per citare (non tutti prevedibili: spesso si cita senza aver letto).
DIFETTO Una ricerca per citazioni è in genere meno precisa di una ricerca per soggetti e parole chiave (esistono tante ragioni per citare e la citazione può riferirsi anche ad un concetto marginale trattato nel documento citato), tuttavia può rivelarsi molto utile quando ...
QUANDO USARE LO SCI • si ha in mano un articolo perfettamente centrato sull'argomento della propria ricerca e si vuole risalire velocemente ad altri articoli più recenti di argomento affine; • per la particolarità dell'argomento, la bibliografia ricavata da database non-citazionali è scarsa o nulla; • la ricerca ha un'impostazione interdisciplinare e le fonti potrebbero essere indicizzate in database di area diversa.
SPESSO SI DIMENTICA CHE... A differenza di un database convenzionale, un indice di citazioni non ha limiti cronologici prestabiliti: trovo anche le opere di Copernico e Galilei (se qualcuno li ha citati).
IL VERO PROBLEMA Il vero problema è la quantità e qualità delle fonti (riviste) selezionate per costruire il repertorio. Quando decido di indicizzare solo articoli di un certo numero di riviste internazionali faccio una scelta di campo molto precisa dando per scontato che: • le riviste selezionate sono un campione rappresentativo della produzione scientifica della comunità di studiosi; • l’articolo di rivista è il principale strumento di comunicazione adottato dagli studiosi (chiaramente falso per le scienze sociali e umane ma non solo).
DOMANDA Come vengono selezionate le fonti (riviste) per l’indicizzazione delle citazioni? Come faccio ad essere sicuro che il conteggio rispecchi fedelmente l’impatto citazionale complessivo di un autore sulla comunità scientifica? Si possono utilizzare database diversi dallo SCI?
CRITERI DI SELEZIONE • QUALITATIVI: giudizio di un comitato di esperti, reputazione scientifica dell'editore e del comitato di redazione; formato dei dati bibliografici predisposto alla codifica e all'elaborazione computerizzata; rispetto di alcuni standard editoriali di base (puntualità dei fascicoli, accuratezza e completezza dei dati bibliografici, inclusione di indici e abstract in lingua inglese); • QUANTITATIVI: impatto citazionale della rivista lungo un certo arco di tempo (Impact Factor).
NON-ISI JOURNALS Fonti alternative (o complementari) allo SCI per il conteggio delle citazioni: • SCOPUS di Elsevier; • GOOGLE SCHOLAR; • INDICI CITAZIONALI DISCIPLINARI: ad es. Chemical Abstract Service (CAS); SPIRES HEP database; MathSciNet; • SISTEMI SPERIMENTALI DI HARVESTING DELLA LETTERATURA SCIENTIFICA ONLINE: CiteBase, CiteSeer.
CONTRIBUTI FONDAMENTALI • JOHN DESMOND BERNAL (1901-1971) e la scienza come sistema materiale di relazioni sociali e simboliche. • ROBERT K. MERTON (1910-2003) e la concezione normativa della scienza. • EUGENE GARFIELD (1925-) & HENRY SMALL (1941-) e le citazioni bibliografiche come simboli di concetti (concept symbols). • DEREK J. DE SOLLA PRICE (1922-1983) e la scienza come sistema “termodinamico” governato da leggi matematiche.
BERNAL La scienza ed il metodo scientifico, sebbene rappresentino il fondamento di ogni conoscenza umana valida, non sono il frutto di “pura speculazione” ma attività sociali e socialmente controllabili. E’ possibile pertanto monitorare (e accelerare) il progresso scientifico mediante un’analisi quantitativa dei prodotti dell’attività di ricerca (letteratura scientifica) ed una pianificazione accurata degli obiettivi MA …
RIVOLUZIONE … MA per fare questo serve una rivoluzione nel sistema della comunicazione scientifica: • ABOLIZIONE DEI PERIODICI: troppi, mal gestiti in funzione di interessi privati (da editori e società scientifiche), e male indicizzati (dai servizi di abstracting & indexing); • CREAZIONE DI UN UNICO CENTRO o di una rete di centri interconnessi (clearinghouses)per la raccolta, catalogazione e disseminazione “mirata” della letteratura tecnico-scientifica (oggi si chiamerebbero repositories).
MERTON L’attività di ricerca scientifica è governata da norme universali di condotta che guidano lo scienziato nella scoperta di verità ... • ... non soggettive ma ispirate da criteri universali e impersonali di valutazione (universalism); • ... non destinate a rimanere segrete ma a diventare beni “pubblici”, fatto salvo il diritto del ricercatore ad essere ricompensato (communism).
L’ETICA DELLO SCIENZIATO • ... non viziate da interessi economici o personali ma disinteressate (disinterestedness); • ... logicamente coerenti e verificate o verificabili sulla base dell’esperienza dalla comunità dei pari (organized skepticism). Queste norme consentono di raffigurare la ricerca scientifica come un’attività lineare, perfettamente coerente ed omogenea in tutte le sue fasi …
Ricompensa Verifica e approvazione Comunicazione dei risultati Ricerca Onoreficenze, premi, carriera Peer Reviewing e citazioni (“atomi di peer reviewing”) Articoli, report, relazioni Fase “creativa” della scoperta
GARFIELD & SMALL Al di là della motivazione psicologica per citare un dato documento, nel momento in cui lo cito mi riferisco implicitamente ad un concettoin esso contenuto (idea, esperimento, metodo, formula, equazione, etc.). In questo senso la citazione è il simbolo di quel concetto per l’autore che la effettua.