290 likes | 394 Views
BIBLIOMETRIE PRO MĚŘENÍ KVALITY INFORMACÍ. J. Potomková Knihovna LF UP v Olomouci potomkov@tunw.upol.cz Programové vybavení ordinace zubního lékaře. Definice bibliometrie.
E N D
BIBLIOMETRIE PRO MĚŘENÍ KVALITY INFORMACÍ J. Potomková Knihovna LF UP v Olomouci potomkov@tunw.upol.cz Programové vybavení ordinace zubního lékaře
Definice bibliometrie • Bibliometrie je vědní disciplína, založená na kvantitativní analýze a měření dokumentů určených na zaznamenání a komunikaci vědeckých poznatků. • Bibliometrické metody vycházejí z předpokladu, že dokumenty jsou odrazem stavu vědeckého poznání, myšlení a komunikace znalostí.
BIBLIOMETRIE a příbuzné vědní obory • Infometrie • kvantitativní a kvalitativní hodnoty informací získané z různých komunikačních médií • Scientometrie • zákonitosti vědecké produktivity a její výsledná prospěšnost • Kybermetrie • funkce a efektivita počítačových systémů a internetového prostoru.
Historie bibliometrie • 1917 - F.J.Cole a N.B. Eales publikovali práci pro výzkum oboru anatomie “Statistická analýza literatury”. Snažili se dokázat vývoj zájmu o tento obor v jednotlivých zemích pomocí metod statistického rozložení. • 1923 - Knihovník britského patentového úřadu E. W. Hume vytvořil statistickou analýzu vývoje vědy. Vycházel z bibliografických záznamů v časopisech ze 17 sekcí Mezinárodního katalogu vědecké literatury. • 1927 - Vznikla první analýza citací. Její autoři P.L.K.Gross a E.M.Gross spočítali a analyzovali citace článků v chemických časopisech. Poté nastal prudký nárůst aplikování citační analýzy.
Bibliometrické zákony Zákonitosti růstu, rozptylu a stárnutí publikací. • Bradfordův - rozptyl informací • Lotkův - měření autorské produktivity • Zipfův – lingvistická frekvenční analýza, indexace a vyhledávání v Internetu
Bradfordův zákonZÁKON ROZPTYLU INFORMACÍ S. C. Bradford - americký knihovník, jeden ze zakladatelů bibliometrie • zkoumal rozptyl relevantních článků v časopisech vůči konkrétnímu oboru • maximální počet relevantních článků je soustředěn v minimálním počtu časopisů tvořících tzv. jádro oboru. • vědecké časopisy je možno rozdělit podle klesající produktivity článků o daném tématu takto: jádro – články výhradně o příslušném tématu zóny, které mají stejný počet článků jako jádro Počet časopisů v jádru a sestupných zónách je v poměru 1:n:n2 Zákon byl formulován 1934 při řešení rešeršního problému v oblasti geofyziky.
Bradfordův zákonAlgoritmus • Všechny články lze rozdělit na jádro a 2 zóny • jádro i každá zóna obsahují přibližně 1/3 všech článků. • články z jádra jsou publikovány v časopisech, specializovaných na danou tématiku • články 1. zóny jsou publikovány v n-krát větším počtu průřezových časopisů a časopisů hraničních oborů. • články z 2. zóny jsou rozptýleny v přibližně n2 časopisech.
Bradfordův zákonJak to zjistil? • Bibliografie z oboru geofyziky • 326 časopisů • 9 časopisů = 429 článků • 59 časopisů = 499 článků • 258 časopisů = 404 článků • Použití v knihovnách při tvorbě časopiseckých fondů
Bradfordův zákon – příklad: Celkový počet článků = 690 Počet titulů časopisů = 26 Jádro = 2 (23O) Zóna1 = 6 (230) Zóna2 = 18 (230) Algoritmus: 1:n:n2 1 : 3 : 9 n=3 (číslo získáme vydělením počtu titulů v 1. zóně počtem titulů obsažených v jádru)
Lotkův zákonMĚŘENÍ VĚDECKÉ PRODUKTIVITY A. Lotka (1880 – 1949), americký matematik, fyzikální chemik a statistik • oblast fyziky a chemie • produktivita autorů - rozložení autorů podle produkce • 1926 - srovnávání publikační činnosti chemiků a fyziků • pokud a1 autorů publikuje jeden článek, pak an bude počet autorů, kteří publikují n článků. an = a1 / n2 • podle Lotky můžeme předem stanovit, kolik autorů publikuje více článků v případě, že známe počet autorů, kteří publikovali 1 článek v dané tématické oblasti. • počet autorů s n tituly (např. knihami, články) činí cca 1/n2 z počtu těch, kteří jsou autory pouze 1 titulu. • podíl autorů pouze 1 titulu je cca 60%, podíl autorů většího počtu titulů exponenciálně klesá. • na každých 100 autorů/1 článek připadá • 25 autorů/2 články • 11 autorů/3 články • 6 autorů/4 články
Aplikace Lotkova zákona Objektivní kritéria hodnocení pracovníků a pracovišť akademických institucí. • Publikace Masarykovy univerzity 1994 – 2004 • 4179 autorů • 70 936 publikací • Jaký počet autorů napsalo kolik publikací
Zipfův zákon FREKVENČNÍ ANALÝZA, LINGVISTICKÁ STATISTIKA • G.K. Zipf (1902-1950) americký filolog a statistik, profesor lingvistiky na Harvardské univerzitě • Slova uspořádal podle frekvence ( f ) výskytu a slovo s hodnotou nejvyššího výskytu dostalo „rank 1 ( r =1), další slovo „rank 2“ atd. • Zipfův zákon vyjadřuje skutečnost, že základ lexiky (slovní zásoby) vytváří relativně malý počet silně frekventovaných slov • Jsou-li slova delšího textu seřazena podle pořadí klesající četnosti výskytu, potom součin pořadí ( r ) a četnosti ( f ) pro každé slovo v textu bude přibližně = konstanta ( C ), která závisí na délce textu. r x f = c • Na základě Zipfova zákona se konstruovaly slovníky rešeršních slov a nevýznamových (stop) slov, které jsou základem pro automatické vyhledávání a uspořádání výsledků podle relevance. • Využití při koncipování základních funkcí Internetu včetně rozvoje vyhledávacích služeb.
Povrchový web volně přístupný pro vyhledávací stroje obsahuje cca 1 miliardu webových stránek Hluboký web nepřístupný pro vyhledávací stroje dokumenty profesionálních databází 500x obsáhlejší než povrchový 550 miliard dokumentů 7 500 terabytů informací 100 000 webových sídel (www.completeplanet.com) 60 největších sídel obsahuje cca 750 terabytů informací nejrychleji rostoucí webová kategorie s novými informacemi kvalita obsahu (pode jeho autorů) 1000- až 2000-x vyšší. Povrchový a hluboký web
Kybermetrie hlubokého webu 1 Scirus http://www.scirus.com • 2001 firma Elsevier Science • Vyčlenění informací relevantních pro vědu, výzkum a vzdělávání • Ocenění WebAward 2004 • Pokrytí cca 167 milionů webových stránek univerzit, vědeckých, výzkumných a vládních organizací, odborných společností, konferencí aj. • Používá pokročilé vyhledávání a operátory • Uveřejňuje své zdroje • Možnost porovnání výsledků s Googlem
Kybermetrie hlubokého webu 2 Google Scholar http://www.scholar.google.com • Vyhledávání vědeckých textů • Citační ohlasy („Cited by“) • Indexace • dokumenty ze všech významných databázových center kromě Elsevier Science • volně přístupné archivy s garantovaným obsahem, • „Pagerank“ – vyhodnocení relevance vyhledaných dokumentů • Vydavatelé, agregátoři, profesních organizace, repozitáře preprintů • Prolinkování vvyhledaných výsledků s plnými texty v databázích (např. EBSCO, Proquest, JSTOR) podle institucionálních licencí.
Institute for Scientific Information • Philadelphia, Penn. • 1960, E. Garfield • chemik, lingvista, informatik • Science Citation Index • Impact Factor
Citační rejstříkyWeb of Knowledge http://isiknowledge.com • Science Citation Index • Social Sciences Citation Index • Art & Humanities Citation Index
Citační analýza 1 • Metoda hodnocení kvality a významu vědeckých publikací • sledování četnosti citování • Optimalizace informačních toků • Profilování knihovních fondů • Citační mapování vědy pomocí konstrukce citační sítě.
Citační analýza 2 • Které prameny jsou v dokumentu citovány • Ve kterých dokumentech je pramen citován • Které dokumenty jsou citovány hodně / málo /vůbec • Které citace se objevují často spolu • Kteří autoři se objevují často spolu / se navzájem citují • Které prameny jsou klíčové pro určitý obor / téma
Impakt faktor časopisů • Faktor dopadu publikovaných výsledků na jejich praktické využití a rozvoj oboru • Stupeň vědeckého uznání autora • Ohlas publikací u odborné veřejnosti • Stav a vývoj různých vědních disciplín • ve světě • v jednotlivých zemích • na pracovištích.
Oblasti aplikace bibliometrického výzkumu 1 • Zkoumání citačních vazeb dokumentů • Citační analýza vědeckých časopisů • Analýza publikační činnosti vědeckých pracovníků • Zkoumání mezinárodních publikačních trendů • Počítačová analýza publikací tvůrčích pracovníků • Rozložení tvůrčí výkonnosti
Oblasti aplikace bibliometrického výzkumu 2 • Zkoumání informačních potřeb • Zjišťování tématického rozptylu literatury v časopisech • Vyhledávání informací včetně hodnocení kvality • Hodnocení vědců, publikací a vědeckých institucí
Problémy bibliometrie • Nekompletnost údajů ISI • citovanost i z jiných zdrojů (Scholar Google, Scopus) • Autocitace • rozumná míra, cykličnost vědy • Vícenásobné autorství • hodnocení pracoviště • Kolísání v čase • vědecké projekty (začátek – průběh – konec) • Zvláštnosti vědních disciplín • Různé možnosti publikovat • Jazykové bariéry • Chyby v citování • Nadřazenost multidisciplinárních časopisů • Impakt faktor časopisů • monopol ISI, časová náročnost
Autorství Podíl vědců na • Výzkumných projektech • Vedení výzkumných skupin • nemělo by se zapomínat na ty členy týmu, kteří sice nepřispívají aktivně k výzkumu, ale jsou důležití pro zajišťování prostředků na výzkum • většinou jsou málo citovaní • Účelové vzájemné citování • Citování negativních výsledků.
Cíle informačních analýz • Sledování úrovně a trendů rozvoje • oborů, států, regionů … • Hodnocení výsledků a přínosu vědy • obory, týmy… • Profilování a optimalizace informačních fondů • vytipování nejvhodnějších zdrojů informací • inovace fondu vzhledem k rozvoji oboru • vytipování a odstranění zbytečných zdrojů informací • rozbory spokojenosti uživatelů.
Závěr • Citační analýza a její prostředky jsou doposud nejspolehlivějším nástrojem hodnocení vědeckého výzkumu, publikací, vědců a vědeckých institucí. • Je nepostradatelná v modelování rozvoje výzkumu, vědy a technologie • Je jedním z hodnotících kritérií vědeckého výkonu.
Literatura • Na požádání u autorky přednášky potomkov@tunw.upol.cz