240 likes | 445 Views
часть проекта « Conceptions of Global Inequality in World Society ». Неравенство в мировом экспертном дискурсе. Концепция методологии проекта. Цели проекта. http://sfb882.uni-bielefeld.de/projects/Teilprojekt_C5.php.en.
E N D
часть проекта «Conceptions of Global Inequality in World Society» Неравенство в мировом экспертном дискурсе Концепция методологии проекта
Цели проекта http://sfb882.uni-bielefeld.de/projects/Teilprojekt_C5.php.en The main project goal is to describe shifts in semantics of inequality in world society and to map this shift in a detailed fashion in the context of the case studies. In particular, these case studies focus on reports, statistics, and policy statements of three international organizations (World Bank, UNDP, OECD). Changes in notions of inequality, which are reflected in semantics have effects on how ‘progress’ in development is quantified, and it has a tangible effect on the projects and measures of international organizations. These semantics emerge within a cycle of communication between national and international, public and private actors concerning problems in economic and social development. Потенциальные источники данных могут быть разнообразны: официальные отчеты, сайты исследовательских организаций и экспертов, социальные сети. В этой презентации мы рассмотрим только возможности обработки массива данных из официальных отчетов.
Уровни анализа и единицы исследования Проявления неравенства(на разных уровнях) Ожидаемый результат преодоления неравенства Способы преодоления неравенства Неравенство Речевые маркеры Социальные группы Социальное действие Ценности Социальные модели Правительства Содержатель-ные концепты Программы Страны Экономические модели Организации Структуры концептов Индикаторы, индексы, рейтинги Мировые игроки
Структура данных по отчетам 1 часть базы данных 2 часть базы данных Частотная обработка речевых маркеров текстов, готовится автоматически Характеристики текстов, заполняются вручную Частота встречаемости слов в тексте Характеристики текстов – в столбцах • Авторы, • Организации, • Отрасли • Источники информации, • Страны • … (см. следующий слайд) Тексты – в строках
Поля 1 части базы данных • N записи • коды файлов • название файла • путь к файлу в базе данных • ссылки на файл в Интернете • название отчета • код отчета • тема отчета • подтемы отчета • регион мира • страна, которой посвящен отчет • организация - собственник отчета • организация, опубликовавшая отчет • организация, проводящая исследование • Автор (авторы) отчета • язык отчета • день публикации • месяц публикации • год публикации отчета • дата начала исследований • дата окончания исследований • отрасль • объем всего отчета, знаков • объем содержательной части отчета (без приложений), знаков • объем аннотации • Источники данных, на основании которых сделан вывод (собственное исследование, другие исследования, международные индексы) • Какие организации упоминаются в отчете • Какие программы упоминаются в отчете • Какие индикаторы и показатели упоминаются в отчете • Какие социальные группы упоминаются в отчете • Уровень аналитики (социальные группы, региональный, межстрановой) • Тип отчета (описательный, стратегический…) • ….
Порядок действий – подготовительный этап Следующий этап - обработка данных Технический этап Содержательный этап Сбор массива данных - отчетов Поиск ключевых речевых маркеров, словосочетаний и концептов Перевод отчетов в формат .txt Кодирование названий файлов Разделение файлов: Выделение абзацев, носящих ключевые речевые маркеры Полные отчеты Резюме отчетов
Порядок действий – обработка данных Представление результатов Полные отчеты Резюме отчетов Абзацы, носящих ключевые речевые маркеры Подсчет частот упоминания видов неравенство, их признаков, а так же индексов, рейтингов, организаций, персон, авторов и т.п. Дискурс-анализ структуры концептов и речевых маркеров: постановка задачи и ожидаемый результат Выявление групп слов, окружающих ключевые речевые маркеры Группировка текстов по сходству методом многомерного шкалирования Структура смысловых концептов, окружающих понятие неравенства, или заменяющих его
Порядок действий – представление результатов Структура концептов – неравенства и других понятий По каждой стране и ее регионам Группы авторов и организаций, готовящих отчеты и стратегии По социальным группам Структура аргументов, обосновывающих наличие неравенства и борьбу с ней X По отраслям и направлениям Группировка текстов по содержательному сходству По стратегиям борьбы с неравенством Выявление групп действующих организаций – игроков на территории данной страны/региона
Общие статистические характеристики текстов некоторые результаты анализа Было подготовлено к обработке 369 файлов из папок «GLIN I», «UNDP». Всего – репертуар, словарный запас отчетов - 65536 слов
Общие статистические характеристики текстов некоторые результаты анализа
число слов в корпусе текстов зона неравномерного распределения содержательных слов по текстам зона равномерного распределения слов по текстам количество текстов, в которых встречаются слова
Группировка речевых маркеров* методом многомерного шкалирования ядро отчетов - индикаторы * по всем 369 текстам Многомерный статистический анализ показывает:Речевые маркеры группируются неравномерно по корпусу текстов - по каким-то содержательным законам, которые необходимо понять в исследовании
Группировка текстов* методом многомерного шкалирования * по аннотациям отчетов по 300 самых часто употребляемых слов аннотации отчетов Многомерный статистический анализ показывает:аннотации отчетов группируются по определенным закономерностям т нуждаются в дальнейшем исследовании оси группировок аннотаций группы аннотаций
government economy ensure … 0,46 0,39 0,46 services growth 0,71 0,47 health 0,61 … inequality 0,53 0,48 needs 0,68 0,52 capacity 0,5 income 0,58 0,51 … 0,60 poor 0,60 access levels policy … Связи концепта «неравенство»* методом корреляций Пирсона Можно выстроить цепочки статистических связей между концептами – по принципу кольцевых уровней * по аннотациям отчетов 1 уровень 2 уровень
Выявление групп речевых маркеров некоторые результаты анализа На основе частотного анализа всему массиву текстов (369) были выделены 315 содержательных речевых маркеров, характеризующих неравенство:
Выявление групп речевых маркеров (Египет) некоторые результаты анализа Для анализа аннотаций была выбрана страна Египет, которую представляли 9 текстов. Они представляли разные уровни описания неравенства в стране, способов его преодоления и ожидаемых результатов Эти содержательные высказывания могут быть представлены более дробно, с выделением речевых маркеров (см. следующий слайд)
Выявление групп речевых маркеров (Египет) некоторые результаты анализа Сектор - неравенство социальных групп, региональные и молодежь Сектор - государственное управление local level decision-making processes needs and problems local communities young men and women between the ages of 18 to 29 years social inequalities decentralization modern democracy new “social contracts” express their needs and interests fragile understanding of citizenship and its responsibilities regionally balanced development economic and political activities Слова-посредники, обеспечивающие переход между уровнями decentralized planning markets, health, education and employment local development projects the liberalization of the economic regime social capital information led globalization highly centralized civil society Financial Sector Assessment Program (FSAP). human capital human development index (BHDI) globalization financial restructuring o f state-owned banks Financial Sector Reform and Strengthening (FIRST) Сектор – отраслевое консультирование
Выявление групп речевых маркеров (Египет) некоторые результаты анализа Представление ключевой схемы (см. слайд 3) в виде понятий и речевых маркеров
Сектор – государственное управление (Египет)* cтруктура концептов по аннотациям В центре сети находятся концепты децентрализация, развитие, местное, правительство, Египет Концепт «неравенство» находится на периферии семантической сети ** размер актора и сила связи соответствует частоте * построена в программах ORA, Automap
Сектор – государственное управление (Египет)* cтруктура концептов по аннотациям Подробно рассмотрим окружение термина «неравентство» в семантической сети * Egypt Human Development Report 2004, Choosing Decentralizationfor Good Governance
Сектор – государственное управление (Египет)* cтруктура концептов по аннотациям Семантическая цепочка вокруг концепта «неравенство» * Egypt Human Development Report 2004, Choosing Decentralizationfor Good Governance
Сектор – государственное управление (Египет)* cтруктура концептов по аннотациям «неравенство» * EGYPT, HUMAN DEVELOPMENTREPORT 2000/2001
Сектор – государственное управление (Египет)* cтруктура концептов по аннотациям Семантическая цепочка вокруг концепта «неравенство» * EGYPT, HUMAN DEVELOPMENTREPORT 2000/2001
Промежуточные выводы • Концепт «неравенство» зачастую находится на периферии семантической структуры текста и его связи весьма слабы. • Необходимо провести предварительный содержательно-концептуальный анализ текстов, и группировать их по уровню анализа, целям текстов и центральным концептам. А уже потом анализировать местоположение термина «неравенство» в структуре других концептов. • Речевые маркеры группируются неравномерно по корпусу текстов - по каким-то содержательным законам, которые необходимо понять в исследовании. • Ядро выводов о неравенстве в тех или иных странах составляют международные индексы и другие индикаторы. • Можно выстроить структуру связей между концептами (в том числе и «неравенством») как по семантическим, так и по статистическим основаниям. • Можно выявить основные факторы, влияющие на группировку отчетов (как семантические, так и другие причины).