100 likes | 264 Views
ANALIZA DANYCH BIBLIOMETRYCZNYCH Z CZASOPISM Z ZAKRESU NAUK EKONOMICZNYCH. Krzysztof Osiewalski , Beata Zając. Bibliometria.
E N D
ANALIZA DANYCH BIBLIOMETRYCZNYCH Z CZASOPISM Z ZAKRESU NAUK EKONOMICZNYCH Krzysztof Osiewalski, Beata Zając
Bibliometria • „badanie stanu ilościowego i tendencji rozwoju piśmiennictwa metodą statystyczną na podstawie spisów bibliograficznych lub statystyki wydawnictw” [Słownik terminologiczny informacji naukowej, 1979]. • Początki bibliometrii to wprowadzone przez E.W. Hulme’a [1923] określenie „statystyczna bibliografia” (statisticalbibliography), jako połączenie statystyki (metody analizy) i bibliografii (przedmiotu analizy).
Indeksy cytowań • Science CitationIndex (SCI) • ISI Web of Knowledge • Scopus • Google Scholar • Citeseer • RePEc
Co nam daje bibliometria? • poznanie wpływowych w danym środowisku czasopism naukowych • które z czasopism zagranicznych inspirują najsilniej • czy sięgnięcie do analizy cytowań pozwoli wyłonić nowe, specjalistyczne zagadnienia podejmowane na łamach czasopisma
Gromadzenie danych w BG UEK • Baza GOSPODARKA • Baza CYTOWANIA
Możliwe błędy w danych • Ten sam autor w różnych pracach umieszcza swoje nazwisko z różną liczbą swoich imion • Ten sam autor ma różne nazwisko w zależności od sposobu transliteracji alfabetów nie łacińskich (np. liter alfabetu rosyjskiego) • Niewłaściwa kolejność autorów • Przyznanie roli autora redaktorowi • Pominięcie autora (jeśli praca ma autorów osobowych, to powinni być wymienieni oni, a nie instytucja sprawcza – tzw. autor korporatywny) • Podawanie polskiego tłumaczenia tytułu artykułu • Różny stopień szczegółowości przypisu: podawanie tylko tytułu głównego, lub tytułu głównego wraz z podtytułem • Nie to czasopismo • Wprowadzenie skrótów w nazwie czasopisma • Zagadki edytorskie i literówki
Czyszczenie danych • Eliminacja autocytowań • Korekty w/w błędów • Przykład Nature
Statystyki opisowe w bibliometrii • Liczba cytowań • Liczba cytowanych prac • Indeks Hirsha: współczynnik h równy jest liczbie publikacji cytowanych co najmniej h razy • ImpactFactor • Indeks Egghe (indeks g)
Macierze odległości • Macierz 0-1 • Macierz ważona liczbą cytowań
Analiza skupień – algorytm Warda tworzenia dendrogramu • Wyznaczenie macierzy odległości taksonomicznych o wymiarach n·n, która zawiera odległość każdej pary obiektów. Macierz ta jest symetryczna względem głównej przekątnej, którą stanowią same zera. • Wyszukanie par obiektów (a w dalszej części skupień), dla których wzajemna odległość jest najmniejsza. Przyjąć należy, że obiekty te mają numery "p" i "q", przy czym p<q. • Złączenie "p" i "q" w jedno nowe skupienie, które zajmuje pozycję o numerze "p". Jednocześnie usuwa się obiekt (skupienie) o numerze "q", zaś numery skupień o numerze od niego wyższym zmniejsza się o jeden. W ten sposób wymiar macierzy zmniejsza się o 1. • Wyznacza się odległość nowego skupienia od każdego pozostałego według wzoru