350 likes | 569 Views
Интеллектуализация процессов обработки потоков данных. БГУ РФиЭ Кафедра Интеллектуальных Систем Адуцкевич Иван Анатольевич. Введение.
E N D
Интеллектуализация процессов обработки потоков данных БГУ РФиЭ Кафедра Интеллектуальных Систем Адуцкевич Иван Анатольевич
Введение • На современном этапе развития научно-технического деятельности характерно нарастание неформализуемых или плохо формализуемых проблем, алгоритмического решения которых не существует или не может быть реализовано на базе существующих программно-аппаратных средств. • При попытках реализации некоторых проблем часто приходится сталкиваться с необходимостью взаимодействия с пользователями, не являющимися профессиональными программистами или математиками. • Приходится также организовывать их взаимодействие с самого различного рода системами на понятном им языке. Следовательно, нужно знать самые общие закономерности обработки нечисловой информации и организации знаний.
Цели курса • Осветить самые общие закономерности обработки нечисловой информации и организации знаний. Исходя из этих соображений построен состав учебного материала и цели курсов – «Интеллектуализация процессов обработки потоков данных» и «Интеллектуальные системы обработки потоков данных». Они определяются двумя описанными выше факторами: • наличием пользователей, не являющимися профессионалами в информатике, • необходимостью решать плохо формализуемые проблемы, корректно выражая их решение в виде различного рода знаковых когнитивных структур.
Состав курса • В состав курса входят достаточно сложные понятия из разных наук, которые надо освоить для построения эффективных информационных систем. • Материалы лекций содержат живые примеры для облегчения понимания теоретической части курса. • Лабораторные работы по проектированию онтологий – простейших структур описывающих знания и бизнес моделированию. • Предполагается подготовка рефератов по практической части курса.
Знаки и знаковыесистемы. Семиотика – наука о знаках.
Знаки и знаковые системы • Определение знака. Если мы видим объект S, то у нас в сознании возникает его зрительный образ S1. Если мы видим другой объект D, то возникает образ этого объекта D1. S1 ---> D1 • Знак (S) - это то, что замещает в нашем сознании другой объект (D). • В этом случае мы говорим, что S - это знак, а D - это его денотат.
Синтактика, семантика и прагматика. • Основатель современной науки о знаках - семиотики Чарльз Пирс считал, что она делится на три части - синтактика (правила, как корректно складывать знаки), семантика (как знаки и знаковые структуры связываются со своими денотатами). А также прагматика - наука об отношении (например, использовании) создателей и получателей знаков к своим знаковым произведениям. • Пример. Есливыслышитеслово "Пожар", томожетепройтимимоилиброситьсяпожартушить. Приодинаковойсемантике (человекпонялслово «Пожар») можетреализоватьсяразноепрагматическоеотношениеполучателя к полученному и понятомуимзнаковомусообщению.
Знаки и культура • Семиотика - интересная наука. • Например, костюм - самообозначение человека. Костюм – это то, как он хочет, чтобы его воспринимали. Джинсовый костюм и пиджак с галстуком - разные знаки. Человек в соответствующем костюме явно или неосознанно обозначает им себя и задает прагматическую реакцию на себя окружающих. • В культуре существует огромное количество знаковых систем – приметы, знамения, живопись, музыка, танец и многое другое. Пренебрежение незначимостью какой-либо из них плохо только для того, кто это делает.
Синтагма и парадигма • Синтагма - это знаковая структура, образованная по правилам синтактики • Парадигма - на основании каких правил отобран знак для каждой знаковой позиции в этой структуре. • Например: синтагма - этоединствотого, чтосейчасначеловекеодето - какиетуфли, брюки, пиджак, рубашка. Можносказать, чтопарадигманаходится в гардеробе, т.е.изкакогонаборарубашек, пиджаков и т.д. и наосновекакихсоображенийбылаобразованаданнаясинтагма (одетыйначеловекакостюм).
Типысвязеймеждузнаком и денотатом • Однозначнаясвязь «один к одному». • Одинзнаксвязан с двумя и болееденотатами (D1<--S-->D2) –этополисемияилимногозначностьзнака. • Два и болеезнакассылаютсянаодинденотат - этосинонимия (S1-->D<--S2). • Омонимия - это когда знаки означают совсем разное, но случайно совпадают по начертанию или звучанию.
Знак – егозначение и смысл • Значениезнакаестьнаборденотатов, которыйможетбытьреализован в тойилиинойкоммуникации. • Смысл – этоживая и конкретнаяреализациязнака (егозначенияилиденотата) в живой и реальнойкоммуникации. • Никакихслов и словарейнехватитдляперечислениявсехвозможныхденотатов, встречающихся в реальнойкоммуникативнойпрактике. Иногдасмыслысловпонимаютсянеправильнотеми, к комуониобращены.
Знаковое пространство. Парадигма трех миров • Существуюттрифундаметальныхклассаобъектов – материальные, идеальные (ментальные) и знаковые. • В информационной практике приходится оперировать с объектами материального мира или реальной действительности, окружающей нас, и идеальными объектами – продуктами нашего мышления, существующими только в нашем сознании. Удобно обозначить первое множество объектов буквой R (от английского слова reality), а второе множество буквой М (от английского слова mind). Однако, будучи объектами материального мира, знаки имеют свою специфическую природу. Они замещают в нашем сознании другие объекты, реальные и воображаемые. Поэтому часто бывает удобно оперировать со знаками как с отдельным множеством. Назовем это множество S (от латинского слова signum – знак).
Знаковые системы и типы знаков. • Язык - самаяразвитаязнаковаясистема (ЗС). Однакоэтонезначит, чтоеюможнозаменитьдругие ЗС. • Различают знаки трех типов. Знаки типа иконы (похожие на денотат), символы (непохожие на денотат) и индексы-признаки (часть денотата становится его знаком).
Понятиеконнотата • Коннотаты- вторичныеилисопутствующиезначения (лицо, физиономия, морда, рожа – общий денотат). • Коннотатымогутбытькакобщезначимыми, так и индивидуальнымиилиобщимитолькодлякаких-тоопределенныхсоциальныхгрупп. • S ---> D + K1 + K2 + ... где К1, К2 и т.д. естьконнотаты. • Вторичнымизнаковымиассоциациями (коннотатами) пользуютсяприсозданииразличныхзнаковыхконструкций, умелоиспользуявозникающие у ихполучателейассоциации-коннотаты.
Проблема похожести знака на денотат - ономатопея • Насколькознактипаиконаможетбытьпохожнасвойденотат?Например, присозданииоченьважныхдлялюдейдорожныхзнаковэтообстоятельствоихсоздателистаралисьучесть. Знак «извилистаядорога», «пешеходы» и многиедругиепохожинасвоиденотаты, насколькоэтовозможно. • Например. Зрителиищут и находят (возможно, невсегда) чертысходствамеждуперсонажами и исполнителями. Нетолькововнешнихчертах, ночасто и в судьбе. Присутствиепохожести, тоестьявлениеономатопеирезкоувеличиваетстепеньвоздействияигрыартистаназрителя.
Случайность и закономерность в знаках и знаковых системах • Узуальность – общепринятое повсеместное использование знака • Окказиональность – случайное, одноразовое употребление знака. • Необходимо учитывать и число людей использующих знак, т.е. членов речевого коллектива. • Удобно представить данные свойтсва в виде графика, где ось X – окказиональность и узуальность, а ось Y – число членов речевого коллектива. • (1,1) – узелок на платке(акт коммуникации с самим собой, чтобы не забыть) • (1,2) – два человека условилось сообщить одним знаком о каком-либо событии • (много, много) – современные профессиональные языки
Прагматика – частьсемиотики • К прагматике относится две группы проблем – то, как относится к своему знаковому произведению его создатель, и то, как к полученному знаковому произведению относится его получатель. • Например, очень часто важно не только создать корректный текст с точки зрения синтактики и семантики. Важно также и то, какой эффект этот текст произведет на получателя. Создатели многих песен отмечают, что хорошие (с их точки зрения) песни, на которые ушло много труда, не стали популярными. И наоборот.
Словари и слова • Язык – самаяразвитая и совершеннаязнаковаясистема. • Заключает в себе две функции: • Коммуникативная • Кумулятивная • Первые научные сообщества занимались прежде всего составлением словарей национальных языков. Составителей словарей чтут и помнят, например, Владимир Даль в России или Братья Гримм в Германии. • Несколько примеров типов словарей: • Толковый словарь • Словари омонимов, синонимов • Разрешение омонимии – огромная проблема современной информатики.
Актыименования. Семиотические универсалии. • Словари учат как правильно управляться с уже готовыми словами, не путаться в их значениях, правильно их употреблять. • Слова образовались в результате массовых актов именования. Однако, имя своему ребенку можно придумать самому. • Длятого, чтобыуспешнореализовыватьсемиотическуюдеятельность, надознатьеезаконы. Этизаконы в семиотикеудобнееназыватьуниверсалиями. Универсалии, в отличиеотзаконовфизикиилиматематики, необладаютобязательнымдействием. • Например, реноминация–периодическиеволныстилевыхпереименований. Теперьвсечащевелосипедыназываютбайками, песни из фильмов – саундтреками. • В английском нет слов «полтора» или «сутки», а у выражения «круглый квадрат» вообще нет денотата.
Треугольник Фреге. Связь между знаком, денотатом и понятием. • Треугольникзнак-денотат-понятие (концепт) называетсятреугольникомФреге. • ЧастоТФ можетслужитьхорошеймодельюдлямногихсемиотических и философскихрассуждений. ТФ легковписывается в парадигмутрехмиров. • Припомощи ТФ можнопостроитьпонятную и эффектнуюмоделькоммуникации • еслимызадумаличто-тосказать, (скажем, простолнашемусобеседнику), томыначинаем с мысли о столе, затемконкретизируемее в денотатетем, чтопорождаемзнак. • нашсобеседникполучаетзнак, отождествляетего с денотатом, а затемпонимаетнашумысль.
Тезаурус – просхождение • Двуязычныесловариустанавливаютотношениязнак-знак в разныхязыка • Толковыесловариописываютотношениезнак-денотат. • Тезауруспо-латински и естьбогатство. • От классификации (посути - отденотата) намтребуетсянайтинужныйзнак. Мы можем, двигаясьпопонятнойнамклассификации, найтилюбоенужноенамслово (хотябылатинскогоязыка), незнаяего.
Тезаурус - определение • словарь, в котором максимально полно представлены все слова языка с исчерпывающим перечнем примеров их употребления в текстах; • идеографическийсловарь, в которомпоказанысемантическиеотношения (родо-видовые, синонимические и др.) междулексическимиединицами, тоестьотношениямеждуденотатами, которыеониобозначают. • обеспечивающий поиск от смыслов к лексическим единицам, т.е. поиск слов, исходя из понятия.
Теория тезауруса и семиотика • в толковомсловаремыдвижемсяотзнака к денотатуS ---> D • денотат у нас есть функция от знака: D = f(S) • В тезаурусе же реализуется обратная функция - D---> S • знак есть функция денотата: S= F(D) • Для создания тезауруса необходимо предоставить пользователю структурированную картину мира: • Илюстрации популярных видов человеческой деятельности • Иерархическое структурирование. От общего к частному. От изначальныхпонятиймир-человек, живая-неживаяприрода, миртехники и т.д. читательспускается к нужномуемуденотату, послечегонаходитегоназвание
Теория тезауруса и информатика • Во-первых – этоинформационныйпоиск (ИП). • Во-вторых – это интеграциязнаний и повышениеэффективноститрудовойдеятельностизасчетоптимизациипроцессакоммуникации.
Тезаурус - парадигматика • длялюбойсловарнойстатьитезаурусанужноуказать в какиеболееобщиепонятия, конструкции и т.п. интегрируетсяописываемыйеюобъект (денотат) - т.е. гдевышестоящаяобобщающаястатья. • Эта стройная иерархическая классификация дополняется перекрестными связями самого разного рода - чаще всего синонимическими или антонимическими, различного рода ассоциативными связями. Так реализуются тезаурусные функции, описывающие семантические связи между денотатами.
Тезауруснаятерминология • вышестоящийтерминпоотношению к текущейсловарнойстатьеназываетсягиперонимом (hyperonym). • Дляденотата «дерево» гиперонимомбудет «растение». • нижележащийтермин - соответственно - гипоним (hyponym) • Длянашегопримера с деревомэтобудутденотаты «ель», «береза»
Популярныетезаурусы и ихособенности • Немецкий тезаурус DUDEN • Накаждойегостраниценарисованкакой-либовидчеловеческойдеятельности в картинках. • Например, железнаядорога. Откаждойкартинки, изображающей ж-д пути, вокзалы, вагоны и т.п. отходятстрелочки с номерами. Насоседнейстраницеоколокаждогономерапрописаноегоназваниенанемецком, русском, английскомязыке. • Дляоптимизациипроцессоводнозначного понимания терминовв областиаэрокосмическихисследованийбылсоздантезаурус НАСА. • Вмедицинеэтотезаурус SNOMED
Эволюциязнаковыхсистем. Законысуществованиятекстов в обществе.
Парадигматика или правила обращения с текстами. • Существует пять групп правил: • отношения«слова» и «дела», тоестьмысли, речи и действия, уместно здесь вспомнить треугольник Фреге • правиладляговорящего • правилаобращения с текстомдляслушающего (правилречевогоэтикета) • правила о свойствах слова, как знакового произведения • организация речевых отношений, то есть правил ведения речи и устройства диалога
Парадигматика или правила обращения с текстами. • Соотношение слова и дела, то есть слова как знака и денотата как деятельности человека также подробно описывается паремиями всех народов. Единодушно осуждаются люди, не реализующие сказанное ими в деле. Конечно, реализация этой группы правил зависит от конкретных обстоятельств и культурных традиций. Например, в американской деловой жизни устное слово бизнесмена оценивается практически наравне с письменным. Для подтверждения этого факта существуют особые речевые штампы (знаки, сигнализирующие о факте делового обещания). Незнание этой традиции может привести к досадным ошибкам. • Говорящему предписывается ни в коем случае не строить свою речь с таким содержанием, которое может нанести ущерб слушающему (слушающим). • Обращенная к слушающему речь должна быть выслушана и осмыслена как действие, наивысшее по приоритету. Если слушающий был занят другими делами, он должен их прервать и выслушать обращенную к нему речь, никакими действиями не мешая ее передаче. Всякое нарушение этого правила трактуется как крайняя невоспитанность или сознательная грубость, если слушающего не побудили к этому крайние обстоятельства. • Свойства слова. Приведем для примера только одну немецкую пословицу, довольно четко формулирующую эту группу универсалий. “SharfeSchwerteschneidensehr – scharfeZunge – nochvielmehr.” – «Острые мечи ранят больно – острые языки – еще больнее». • И, наконец, пятая группа касается правил устройства речи – то есть правил, которые регулируют процессы речевой коммуникации. Эти правила наиболее важны и интересны для специалистов по ИТ (информационным технологиям). Далее эти правила будут подробно изложены отдельно.
Материализация знака. Фактура речи. • Фактура речи(ФР) –этоорудияречиплюсматериалписьма • устнаяречь (УР), • письменнаяречь, • печатнаяречь, • речьмассовойкоммуникации и Интернета(F4) • Сейчаспроисходитпереход к новойфактуреречи.
Переход от одной фактуры речи к другой • По мере развития технических средств для записи текстов на материальные носители происходит переход от одной фактуры речи к другой. • Каждая новая фактура речи не уничтожает другие, более ранние, а дополняет ее и сосуществует вместе с ними. • Каждая новая фактура речи модифицирует предыдущие, более ранние фактуры речи. • При переходе на новую фактуру речи происходит модификация и перестройка правил обращения с речью в этой новой фактуре. • Как правило, при этом не создаются новые универсалии, они просто адаптируются к новым условиям существования текстов в обществе (новой фактуре). • Переход на новую фактуру речи и адаптация старых универсалий к новым реалиям происходит одновременно и зачастую стихийно. • Новые правила фиксируются юридически или в формах традиций и обычаев, в обоих случаях с запозданием. • Отсутствие явных правил обращения с речью в новой, уже массово использующейся фактуре речи может вызвать в обществе конфликтные ситуации, иногда в массовом масштабе. • Образование новых жанров и родов словесности в новых фактурах речи, а также правил обращения с этими текстами можно уподобить тому, что происходит в рамках парадигмы наследования ООП (объектно-ориентированного программирования) - ничего не теряется и не уничтожается, а только дробится, развивается из старого с включением новых "констант" и "методов".