1 / 21

Владимир Владимирович Писляков

РАСПРЕДЕЛЕНИЕ БРЭДФОРДА И ПОДОБНЫЕ ЕМУ ИНФОМЕТР ИЧЕСКИЕ ЗАКОНЫ на примере статистики использования электронных ресурсов в университетской библиотеке. Владимир Владимирович Писляков нач. отдела информационных систем и электронных ресурсов библиотеки ГУ-ВШЭ, Москва

corin
Download Presentation

Владимир Владимирович Писляков

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. РАСПРЕДЕЛЕНИЕ БРЭДФОРДАИ ПОДОБНЫЕ ЕМУИНФОМЕТРИЧЕСКИЕ ЗАКОНЫна примере статистики использованияэлектронных ресурсов в университетской библиотеке Владимир Владимирович Писляков нач. отдела информационных системи электронных ресурсов библиотеки ГУ-ВШЭ, Москва http://library.hse.rupislyakov@hse.ru SCIENCE ONLINE: электронные информационные ресурсы для науки и образованияТурция, 2005

  2. Ресурсы, включенные в статистику использования-2004 Academic Search PremierBusiness Source PremierHealthSourceMasterFILE PremierNewspaper Source EBSCOhost: Arts & Sciences IArts & Sciences IIBusiness CollectionLanguage & Literature Collection JSTOR: ABI/INFORM GlobalAcademic Research LibraryProQuest ComputingProQuest Education CompleteProQuest Psychology JournalsSocial Science Plus ProQuest: Business, Management and AccountingEconomics, Econometrics and FinanceSocial Sciences ScienceDirect:

  3. Электронные журналы:статистика использования в ГУ-ВШЭ, 2004 г.

  4. Электронные журналы:статистика использования в ГУ-ВШЭ, 2004 г.

  5. Статистика использования эл. журналов: представление

  6. Закон Брэдфорда: формулировка Lawani S. M. Bradford’s Law and the Literature of agriculture // International Library Review. 1973. Vol. 5. P. 341–350. Bradford S. C. Sources of information on specific subjects // Engineering. 1934. Vol. 137. P. 85–86. Bradford S. C. Documentation. London: Crosley Lockwood, 1948 (Washington: Public Affairs Press, 1950). 429 статейв 9 журналах 499 статейв 59 журналах 404статьив 258 журналах

  7. Закон Брэдфорда: проверка на статистике ГУ-ВШЭ 26 журналов — 13987 статей 139 журналов — 13975 статей 2427 журналов — 13998 статей 139 : 26 = 5,3 2427 : 139 = 17,5  3,5  33 журнала в «ядре»

  8. Закон Брэдфорда: проверка на статистике ГУ-ВШЭ  4,36  78 журналов в «ядре» y = –159x3 + 2081x2 – 1461x + 2332 y'' = – 954x + 4162 y'' = 0 при x = 4,36

  9. Ядро из 78-ми журналов: анализ по базам данных

  10. Закон Леймкулера: формулировка Leimkuhler F. F. The Bradford Distribution // Journal of Documentation. 1967. Vol. 23. P. 197–207. 42000 Y = A ln(1 + BN) Y — число статей в N наиболее продуктивных журналах;A и B — некоторые коэффициенты статьи 0 журналы 2500 кривая Леймкулера: Для нормированных величин:Y = ln(1 + βx) / ln(1 + β) Y — доляот общего числа статей в доле x наиболее продуктивных журналов;β — «коэффициент концентрации» 1 долястатей 1 0 доляжурналов

  11. Закон Леймкулера: проверка на статистике ГУ-ВШЭ β 5860 Найдем площадь под кривой Леймкулера:S =  Y(x) dx = =  [ln(1 + βx) / ln(1 + β)] dx = = 1 + 1/β – 1/ln(β+1) S(β) возрастающая функция и S(β0)  0,5 S(β)  1 Для нашего случаяS(5860) = 0,885. Используем нелинейную регрессию и пытаемся, подбирая коэффициент β, приблизить наш график кривой, которая подчиняется закону Леймкулера. исходные данные нелинейная регрессия

  12. Закон Лотки: формулировка Lotka A. J.The Frequency Distribution of Scientific Productivity // Journal of the Washington Academy of Sciences. 1926. Vol. 16. P. 317–323. ученые n = A /xa , a2 n — количество учёных, опубликовавших xстатей;A— некоторый коэффициент статьи В логарифмическом виде:ln n = – a lnx + K ln (ученые) ln (статьи)

  13. Закон Лотки: проверка на статистике ГУ-ВШЭ Приложение закона к статистике использования электронных ресурсов: Найдем, из скольких журналов n было прочитано пользователями ровно xстатей. скорректированные данные нескорректированные данные Закон Лотки выполняется, причем a = 1,7 n = A / xa = A / x1,7 ln (журналов) ln (статей)

  14. Закон Ципфа: формулировка Zipf G. K.The Psycho-biology of Language. Boston: Houghton, 1935. Zipf G. K. Human Behaviour and the Principle of Least Effort. Reading: Addison-Wesley, 1949. rxf = constr — порядковый номер слова (в порядке убывания частоты);f— количество употреблений слова В обобщенном виде:a ln r+ lnf = const, a  1 (обычно закон Ципфа плохо выполняется для верхних позиций рейтинга слов)

  15. Закон Ципфа: проверка на статистике ГУ-ВШЭ Приложение закона к статистике использования электронных ресурсов: Найдем зависимость между рангом журнала в упорядоченном списке востребованности изданий и количеством прочитанных из него статей. ln (статей) Закон Ципфа выполняется удовлетворительно и a =1,3 fxr1,3 = const ln (место в рейтинге)

  16. Принцип Парето, кривая Лоренца, индекс Джини — беднейшие 20% населения получают 7% общего национального дохода — беднейшие 40% населения получают 18% общего национального дохода — беднейшие 60% населения получают 32% общего национального дохода — беднейшие 80% населения получают 52% общего национального дохода — беднейшие 100% населения (т.е. всё население) получают 100% общего национального дохода (весь доход) ParetoV.Cours d’Économie Politique. Vol. 2. Lausanne: 1 Universitéde Lausanne, 1897. Lorenz M. O. Methods of measuring the concentration of wealth // Publications of the American Statisical Association. 1905. Vol. 9. P. 209–219«Plot along one axis cumulated percents of the population from poorest to richest, and along the other the percent of the total wealth held by these percents» (p. 217) Gini C.Variabilità e mutabilità // Memori di Metodologia Statistica. Vol. 1. Rome, 1912. P. 211–382.

  17. Кривая Лоренца–Леймкулера

  18. Принцип Парето: проверка на статистике ГУ-ВШЭ Приложение закона к статистике использования электронных ресурсов: на 20% электронных журналов приходится 80% всех загрузок полнотекстовых статей

  19. Кривая Лоренца-Леймкулера и индекс Джинипо статистике ГУ-ВШЭ % прочитанныхстатей G= (Sобщ – 0,5) : 0,5 = 0,8 Sобщ = 0,902 Sобщ % журналов

  20. Библиография Bookstein A. Informetric Distributions, part I: Unified Overview // Journal of the American Society for Information Science. 1990. Vol. 41. P. 368–375. Garfield E. Bradford’s Law and Realted Statistical Patterns // Current Contents. 1980. No. 19, 12 May. Egghe L. Type/Token-Taken Informetrics // Journal of the American Society for Information Science and Technology. 2003. Vol. 54. P. 603–610. Egghe L., RousseauR. A proposal to define a core of a scientific subject: A definition using concentration and fuzzy sets // Scientometrics. 2002. Vol. 54. No. 1. P. 51–62. Burrell Q. Defining a core: Theoretical observations on the Egghe-Rousseau proposal // Scientometrics. 2003. Vol. 57. No. 1. P. 75–92.

  21. РАСПРЕДЕЛЕНИЕ БРЭДФОРДАИ ПОДОБНЫЕ ЕМУИНФОМЕТРИЧЕСКИЕ ЗАКОНЫна примере статистики использованияэлектронных ресурсов в университетской библиотеке Владимир Владимирович Писляков нач. отдела информационных системи электронных ресурсов библиотеки ГУ-ВШЭ, Москва http://library.hse.rupislyakov@hse.ru SCIENCE ONLINE: электронные информационные ресурсы для науки и образованияТурция, 2005

More Related