760 likes | 1.11k Views
발표 초점. 소개: 언어분석의 필요성 LIWC: 심리학 연구의 종속 측정치로서의 가능성; 기존연구 KLIWC 개발 : KLIWC 개발과정과 한국어적 특성 연습: 실제 데이터 소개 및 분석절차 Discussion: 질문/쟁점/ 비판. 인간과 언어의 영역. 대부분의 대인 상호작용. 연설, 강의등의 정보전달. 인간과 언어의 영역. 인터넷, TV 등의 미디어. 글쓰기와 인쇄물. 심리학 연구의 종속변인. “ 대부분의 인간 인지활동 포함 ”. 심리학 연구의 종속변인으로서의
E N D
발표 초점 • 소개: 언어분석의 필요성 • LIWC:심리학 연구의 종속 측정치로서의 가능성; 기존연구 • KLIWC 개발: KLIWC 개발과정과 한국어적 특성 • 연습: 실제 데이터 소개 및 분석절차 • Discussion:질문/쟁점/ 비판
인간과 언어의 영역 대부분의 대인 상호작용 연설, 강의등의 정보전달
인간과 언어의 영역 인터넷, TV 등의 미디어 글쓰기와 인쇄물
심리학 연구의 종속변인 “대부분의 인간 인지활동 포함” 심리학 연구의 종속변인으로서의 가능성 (어느 영역부터 연구용이?)
기존 글분석 기법들 1. 담화분석 기법들 2.Thematic Content Analysis (McClelland)3.Judge-based traditions (Gottschalk, Weintraub)4.Computer-based approaches: Word CountGeneral Inquirer(Stone et al.)Regressive Imagery Dictionary(Martindale)DICTION(Hart)Pennebaker et al, LIWC5. Computer-based approaches: Word Pattern Landauer et al., Latent Semantic Analysis
글쓰기 예 : 명사 1: In the aforementioned picture an elderly woman is about to speak to a middle aged woman who looks condescending and calculating. 2: I see an old woman looking back on her years remembering how it was to be beautiful and young. 3: The old woman is a witch or something. She looks kinda like she is coaxing the young one to do something.
글쓰기 예: 동사 1: In the aforementioned picture an elderly womanis about to speak to a middle aged woman who looks condescending and calculating. 2: I see an old womanlooking back on her yearsremembering how it was to be beautiful and young. 3: The old womanis a witch or something. She looks kinda like she is coaxing the young one to do something.
글쓰기 예: 기능어 • In theaforementionedpictureanelderlywomanisabout tospeakto amiddle agedwomanwholookscondescendingandcalculating. • Iseeanoldwomanlookingback on heryearsrememberinghow itwastobebeautifuland young. • Theoldwomanisawitch or something. Shelookskinda like sheis coaxingtheyoungonetodosomething.
글 분석 • 사람들이 쓴 글을 분석: 임상, 사회, 성격, 건강 심리와 관련된 개인차 변인, 다른 인지과정과의 관계 등을 연구 • 글 분석기법: LIWC (Linguistic Inquiry and Word Count, Pennebaker, 1997) • 단어구성비율에 근거 • 일반사전과 심리학사전의 단어들을 72개의 “언어학적” 변인들과 내용 변인들로 분류
LIWC 변인들의 예 • 언어학적 차원 • 전체 및 문장 내 단어의 수, 대명사(예: I, We, He), 관사, 전치사 등 • 심리학적 차원 • 정서(예: happy, joy, love), 인지적 과정(예: 판단, 인과관계), 사회적 과정(예: 대인, 대화; 예: talk, share, friend) • 상대성 차원 • 시간, 공간, 동작 • 개인적 관심사 차원 • 직업, 성취, 생리적욕구, 금전, 종교관련 표
변인: 우울,불안등과 관계되는 임상변인, 성격, 건강, 심리상태 등의 일반 개인차변인, 사회상황 변인, 대화변인, 인지변인 등 글 분석 특정주제로 작문 글 분석 글분석 절차
감정적 글쓰기 일반적 글쓰기 글 분석 절차: Traumatic Event Writing 6 – 12 주 간격 분석
기존연구 결과 • 임상 심리 • 임상 집단간의 차이 • 건강 대 비건강 비교 • 성전환, 호르몬의 효과 (남 -> 여; 여 -> 남) • 자살의 징후 • 감정적 주제 글쓰기: 건강 증진, 작업기억의 양 증가
임상집단 (우울증) 대명사: 1인칭 대명사(I, My) 접사: 관계대명사, 전치사등 사용적음 단어: 짧은 단어 문장: 문장 당 단어 수 적음, 문장수 적음 인지적 단어(원인, 이해) 적음 사회적 단어 적음 부적정서단어 정상집단 대명사: 2,3인칭 대명사(You, He, She, We) 접사: 많음 단어: 긴단어 문장: 문장 당 단어 수 많음 인지적 단어(원인, 이해) 많음 사회적 단어 사용 긍정적정서단어
실제글 Ican recallas a small boyIwas always afraid of the dark. No matter how hardItried not to beIjust couldn't helpmyself. Iwould go tomymother and father's room looking for love and comfort. Only to be beaten and thrown into a dark closet.But sometimes ifIstayed quiet just long enoughIcould crawl out and sleep at the end oftheirbed.Iwould feel safe there.I’mnot sure Iwas always so afraid.Ido know there are things inmypast thatIcan remember up to a point andIfreak out and loseit. Ican remember being real smallIwas in a dark room laying face down on the floor,Iremember the floor being made of wood andIwas scared.Ilaid real still hoping the person in the room withmewould go away but as the other person came up behindme Iturn to look back andIjust loseit. Iremember being happy most whenIwould run away from home, there was always fighting and arguing going on atmyhouse, eitherIwas being beat or one ofmybrothers and sisters ormymom would be getting jumped on.Mydad would always be drunk whenhecame home and most of the timewewent hungry becausehewould spendhischeck on booze or loseitat a card table. There was even times whenmymother would tellusto leave the house just sowewouldn't get beat on.Weall hatedhimtohisorherown level.Itwas likeI’dalways getitthe worst though,Ifought back,I’dstep in when one ofmysisters or mother was being beaten which meantIgotitjust that much worse.Iput a fork inhisleg once whenIwas about six just trying to gethimoffmymother, thenmymother would always turn around and threatenmewithhim. 기존 임상
우울증과 언어 Depression and Language
자살과 언어 Suicidal Language in Poetry Emotion Words Personal Pronouns
기존 연구 결과 • 사회 심리 • 다양한 사회적상황 • 글의 진위여부 (태도일치 연구, 허위 진술문 판독) • 대화상황에서 대화자 조합 (나이, 성별, 지위등) • 인터넷에서의 언어 사용
기존 연구 결과 • 성격 심리 • 내향성, 공격성, 지배성 등 • 발달 심리 • 연령별 성별 언어사용 연구 • 개인의 커리어상의 변화 (뉴욕시장 연구)
기존 연구 결과 • 인지 심리 • 작업기억 량 간의 관계 • 말하기 등 다른 언어 유형간의 비교 • 글의 주제에 따른 언어 변화 • 감정적 주제 글쓰기: 건강 증진, 작업기억의 양 증가 • 기타 • 문화간 차이, 글쓰기/이중언어 교육, 역사서적 분석, 연설
Electronically Activated Recorder (EAR) The EAR … your unobtrusive companion
데이터 수집 상황 • Digital tape recorder with external microphone • Switches on for 30 sec every 12.5 min (< 4% of the day) • Records ambient sounds • ≈ 70 sound files per day
EAR의 개인차 Mehl & Pennebaker, JPSP, 2003
EAR의 신뢰도 Mehl & Pennebaker, JPSP, 2003
Language Use in Natural Conversations Daily Social Environments Interactions Activities Locations GrammaticalFeatures PsychologicalFeatures With whom is the person? What is the person doing? Where is the person? Pronouns, articles, etc. Emotion words, cognitive words, social words, etc. EAR 를 통한 측정 EverydaySocial Life
EAR 연구예: 사회상황에 근거한 성격판단 관찰자간 신뢰도? 3자관찰 정확? 사회상황이 성격반영?
.27 .67 .30 .67 -.21 -.23 .29 .12 관찰자 평정치 .21 .09 .42 .07 자기 평정치 .21 .03 외향성과의 관계 With others Talking Self talk Group talk Entertainment Laughing Self-references … r = .43
.42 .46 -.29 -.61 -.21 -.23 -.41 .00 -.35 -.13 .37 .12 관찰자 평정치 자기 평정치 .23 .19 도덕성과의 관계 In class Swear words Anger words Watching TV Entertainment Reading Alone … r = .52
건강 성격 임상 정서 심리상태 인지변인 듣기 말하기 글분석 사회상황 언어능력 읽기 언어장애 발달 대화 교육 주요관심주제 지능 인구학적변인 글분석 관련 변인 분석
한국어 분석 프로그램 개발 • LIWC의 단순차용으로 해결 안되는 문제들: 영어와 한국어 간의 언어적 이질성 • 여러 개의 형태소가 교착: 선어말 어미, 격조사, 양태(modality) 표현, 부정 표현, 접속어 등이 모두 어간에 붙어 음절이나 음소 단위 • 논항의 삭제 빈번: 1,2 인칭 대명사 명시 안함 • 기본형과 활용형 사전 구축: 1개 어간이 갖는 활용형의 수가 매우 많음 • 동형이의어가 많음 • 영어와 한국어의 어휘가 사용하는 의미장 다름; 심리학 사전 없음 • 지능적 개발자용 프로그램 없음: 자료의 갱신이 자주 이루어져야 하고, 다양한 자료 간 상호 관계가 복잡하게 연결되어 있는데 이를 제어할 시스템 없음. ( 1차 본 구동: WWW.K-LIWC.NET )
언어적 이질성 해결 방향 • 기존 LIWC 의 요소 + 한국어 특이성 최대한 해결 • 한국어 품사 자동태깅 시스템개발: 9개의 범주를 단계별로 세분화하여 의미-통사적(semantico-syntactic) 특성에 따라 47개의 범주로 구분 • 기본형과 활용형 규칙사전 구축: 언어학에서 구축된 사전 프로그램을 적용 • 동형이의형 문제: 좌우 문맥의 의미-통사 정보를 이용한 규칙 및 특정 어휘와의 연어 관계를 이용한 휴리스틱스 • 심리학 사전 구성 작업: 문화관련 변인 추가, 개념 및 어휘 리스트를 작성할 뿐 아니라 이 변인 간의 다면적인 관계를 표시 • K-LIWC MANAGER V 필요: 새로운 변인의 추가, 기존 변인의 삭제, 변인 간 논리 구조와 상호 관련성의 변경필요; Thesaurus Builder, Post-processing system 구축 순서도 47
K-LIWC 1차 본 구동 • 1차 본 구동: WWW.K-LIWC.NET • 한국어 품사 자동태깅 시스템개발: 9개의 범주를 단계별로 세분화하여 의미-통사적(semantico-syntactic) 특성에 따라 47개의 범주로 구분 • 기본형과 활용형 규칙사전 구축: 언어학에서 구축된 사전 프로그램에 적용 • 동형이의형 문제: 좌우 문맥의 의미-통사 정보를 이용한 규칙 및 특정 어휘와의 연어 관계를 이용한 휴리스틱스 • 심리학 사전 구성 작업: 개념 및 어휘 리스트를 작성할 뿐 아니라 이 변인 간의 다면적인 관계를 표시 • K-LIWC MANAGER V 필요: 새로운 변인의 추가, 기존 변인의 삭제, 변인 간 논리 구조와 상호 관련성의 변경필요; Thesaurus Builder, Post-processing system 구축 47
이론적 함의 • KLIWC 를 통한 이론적 함의 • 심리학 각 분야의 경쟁 이론이나 가설에 대한 언어 분석적 검증 • 심리학 각 분야의 기초적인 언어 데이터 베이스 구축: 기본적인 정보제공 및 연구활용 • Whorf 가설 검증: 언어와 사고의 관계 (언어분석과 다양한 인지 검사간의 관계 검증) 사고 - > 언어 언어 -> 사고 영향 (훈련 실험조건 구성 등; 사고 능력 배양 훈련 후 언어의 변화) • 언어분석을 통한 실시간적 태도 변화 연구 가능 47