660 likes | 867 Views
Case- B ased Reasoning (CBR). Soongsil University, Seoul Intelligent Systems Lab. The Limitations of Rules. The success of rule-based expert systems is due to several factors: They can mimic some human problem-solving strategies
E N D
Case-Based Reasoning (CBR) Soongsil University, Seoul Intelligent Systems Lab.
The Limitations of Rules • The success of rule-based expert systems is due to several factors: • They can mimic some human problem-solving strategies • Rules are a part of everyday life, so people can relate to them • However, a significant limitation is the knowledge elicitation bottleneck • Experts may be unable to articulate their expertise • Heuristic knowledge is particularly difficult • Experts may be too busy…
Another Way We Solve Problems? • By remembering how we solved a similar problem in the past • This is Case Based Reasoning (CBR) • memory-basedproblem-solving • re-using past experiences • Experts often find it easier to relate stories about past cases than to formulate rules
코끼리의 문제해결능력 http://koreatakraw.com/648?srchid=BR1http%3A%2F%2Fkoreatakraw.com%2F648# http://blog.daum.net/hohoheeheegilgil/7749006?srchid=BR1http%3A%2F%2Fblog.daum.net%2Fhohoheeheegilgil%2F7749006
Elephants Never Forget! • Some biologists suggest that elephants’ success in harsh environments may be due to their memories. • A herd of elephants retains a collective memory of problems and their solutions: • E.g., they remember where water can usually be found during a drought. • Elephants can solve problems without using models or rules.
Case-Based Reasoning (CBR) • Case-based reasoning은 귀납법 (Induction)과 유추 (Analogy)와 유사한 개념이다 - 귀납법 (Induction)또는 귀납추론 (inductive reasoning)또는 귀납논리 (inductive logic)는, 주어진 전제 (premise) 를 바탕으로 결론을 추론하는 방법이다. 그 결론 (conclusion) 이 사실일 듯 하지만 사실이 아닐 수도 있다. - 유추 (analogy) 는 "A is to B as C is to what ?" 와 같은 형태를 가진다. 예) 손과 손바닥의 관계는 발과 무엇의 관계와 같나? (Hand is to palm as foot is to ____?) Analogy based reasoning = Case Based Reasoning 전형적인 사례기반 접근 방식인 Case Based Reasoning 과 동의어로서 사용되곤 한다.
Case-Based Reasoning (CBR) • CBR은 유사한 과거 문제의 해결에 기초해서 새로운 문제를 해결하는 과정이다. • 예 1) 자동차 정비사가 차를 수리할 때 유사한 증상을 보였던 자동차를 회상하여 (recall)해결을 시도하는 것은 Case-based reasoning 를 사용하고 있는 것이다. • 예 2) 법적 판례(precedents)에 기초해서 재판에 임하는 변호사나 case law 를 창조하려는 판사는 Case-based reasoning 을 사용하고 있는 것이다. CBR에서는 반복되어 발생되는 자연적인 문제와 그 해답을 모방 혹은 복사하여 (생물모방, biomimicry) 자연의 문제을 해결하고자 하며, 이를 위하여 과거의 사례-그 해답을 DB로 구축하여 재사용한다.
Case-Based Reasoning (CBR) • CBR은 컴퓨터추론을 위한 강력한 방법으로, 일상의 인간의 문제해결에 널리 사용되는 하나의 행동이다. • 근거: 원형이론(prototype theory)-인지과학 (Cognitive Science) 모든 추론 (Reasoning)은 과거에 경험한 것 또는 열심히 연습해서 받아 들여진 과거의 사례에 기초해서이루어진다.
Understanding CBR The CBR-Cycle 1 A Short History of Case-Based Reasoning 2 Case-Based Reasoning Techniques 3 • Case Representation - Indexing - Storage • Retrieval • Adaptation Summary 4
The CBR-Cycle Riesbeck and Schank, 1989 A case-based reasoner solves new problems by adapting solutions that were used to solve old problems. Example 해결 방법 Advise on the suitability of a person for a loan 과거의 대출경험과 새로운 대출 희망자를 비교 과거에 성공적으로 대출을 상환한 사람과 그렇지 못한 사람의 환경 비교
The CBR-Cycle Mental process Four REs • 이전 대출 기억을 조사하고 유사도 평가 가장 유사한 경우를REtrieve • 가장 유사한 대출로부터 해결책 추론 문제를 풀기 위하여 case를 REuse • 수년간의 환경 변화에 대한 조정과 승인 필요하다면 제안된 해결책을REvise • 대출을 해준 경우 다음의 사용을 위해 결과를 관찰하고 기록 새로운 해결책을 REtain
The CBR-Cycle Problem Retrieve Reuse Retain Case-base Revise Proposed solution Confirmed solution
Case Representation A case is a contextualized piece of knowledge representing an experience. The state of the world when the case occurred Problem description Solution description The derived solution to that problem
Case Representation Problem 공간과 Solution 공간의 one-to-one mapping • Case에는 전형적인 database에 저장할 수 있는 대부분 유형의 데이터 저장 가능
Indexing Index • 대부분의 database system에서 data의 검색 속도를 높이기 위해 사용 예) database에 있는 사람들에 대한 record의 family name Case에서 2가지 유형의 정보 Indexed Information 검색을 위해 사용되는 정보 Unindexed Information 사용자에게 문맥상의 정보를 제공하나 검색에 직접적으로 사용되지는 않음
Indexing Indexed and unindexed case features Patient Ref#: 1024 Age: 53 Patient Name: John Doe Sex: Male Address: 12 Elm Street Weight: 225lbs Next of Kin: Jane Doe Height: 5`11`` Photo: Blood Type: A negative … Unindexed features Indexed features
Indexing Index의 조건 은행 직원 예제 이름과 전화번호: 예측적이지 않음 예측적이어야 한다. (predictive) Case-base의 목적을 설명해야 한다. 수입: Index의 조건 모두 만족 미래에 다른 목적을 위해 사용될 수 있어야 한다. (abstract) 쉽게 인식될 수 있어야 한다. (concrete) • Index를 선택하기 위하여 수동적인 방법과 자동적인 방법 사용
Nearest-Neighbor Retrieval • Case의 검색은 사용된 Indexing Method에 종속적이며 밀접한 관련 Nearest-neighbor retrieval Inductive retrieval Index 선택 한달간 실수입 (다른 재정적인 지출계약과 세금을 제한 후 남은 금액) 대출금에 대한 월 상환금액
Nearest-Neighbor Retrieval Monthly loan repayment Net monthly income 상대적으로 높은 월 실수입과 낮은 상환금액을 가지고 있는 사람의 Case
Nearest-Neighbor Retrieval Bad loans Monthly loan repayment Good loans Net monthly income 상대적으로 낮은 월 실수입과 높은 상환금액을 가지고 있는 사람이 높은 월 실수입과 낮은 상환금액을 가지고 있는 사람에 비해 채무를 불이행할 가능성이 높음 의사결정 지원 도구로 사용
Nearest-Neighbor Retrieval Monthly loan repayment New case Net monthly income 새로운 Case 가 나쁜 군집에 가까울 경우 새로운 Case가 좋은 군집에 가까울 경우 대출 승인 대출 거절
Nearest-Neighbor Retrieval Case B YB XB Case A Loan repayment Case T XA Monthly income The distance of T from A: dA = XA + YA = 3+0 = 3 The distance of T from B: dB = XB + YB = 3+1 = 4 대출 승인
Case B YB XB Case A Loan repayment Case T XA Monthly income Nearest-Neighbor Retrieval Wx = 2 Wy = 1 The distance of T from A:dA= (XA*Wx)+(YA*Wy)=(3*2)+(0*1)=6 The distance of T from B:dB= (XB*Wx)+(YB*Wy)=(1*2)+(3*1)=5 대출 거부
Nearest-Neighbor Retrieval 유사도 계산 • 더 많은 속성의 추가 • N-차원 공간 • Value 유형 Symbolic Value Boolean Value i=1,n wi • f(Ti,Si) Similarity(T,S) = T : target case, S : source case (new problem) n : 각 case에서 속성의 개수 i = 1… n , 개별 속성 f : case T와 case S의 속성 i에 대한 유사도 함수 wi: 속성 i의 가중치
Outcome value Inductive Retrieval Induction Algorithm • Case들을 분류하는 Decision Tree를 생성하기 위하여 사용 ID3 Bank loan 예제
No Yes Case 1 Case 3 Case 2 Case 4 Good loans Bad loans Inductive Retrieval ID3 결과를 예측할 수 있는 feature를 찾기 위하여 Case 연구 그러나, 결과는 feature의 조합에 의해 영향을 받을 가능성이 있음 여전히 결과를 예측하며 Case의 집합을 반으로 가장 잘 나눌 수 있는 feature와 value 찾기 Repayment < $400
No Yes Job status Case 1 Case 3 Case 2 Case 4 Good loans Bad loans Waged Salaried Case 1 Case 3 Good loans Inductive Retrieval Repayment < $400
No Yes Job status Income > $1500 Case 1 Case 3 Case 2 Case 4 Good loans Bad loans Waged No Salaried Yes Case 1 Case 2 Case 3 Case 4 Good loans Bad loans Inductive Retrieval 완성된 Decision Tree Repayment < $400
Inductive Retrieval ● 완성된 Tree는 다음과 같이 검색을 위해 사용 Good 1. 대출 상환금이 $400 보다 작은가? YES (왼쪽 가지) 2. Salaried인가? Waged인가? SALARIED (Case 1) Good loans Bad
Retrieval Nearest Neighbor Inductive Retrieval Preindexing에 의존하는 검색 기법 Target Case와 Source Case의 유사도를 측정하는 간단한 기법 Missing, Noisy Case data에 대해 덜 민감 검색속도가 빠름 Case Data가 손실되면 검색이 불가능 검색속도가 느림 일반적으로는 Nearest Neighbor 선호 일치하는 Case들의 집합을 검색하는데 Inductive Retrieval 사용 Target Case와의 유사성에 따라 집합 내에 있는 Case들의 순서를 매길 때 Nearest Neighbor 사용
Summary CBR-cycle의 개념 소개 Process의 주요한 개념과 친숙 CBR-cycle을 따라 각 단계의 중요성 파악 성공적인 CBR의 적용
http://h10025.www1.hp.com/ewfrf/wc/siteHome?dlc=en&lc=en&cc=ushttp://h10025.www1.hp.com/ewfrf/wc/siteHome?dlc=en&lc=en&cc=us
CBR Applications - Conversational CBR • Used question-tree structure 1. Question Solve a problem 2. Question Printing 3. Question Slow Printing SOLUTION … … …
Group Discussion • 2~3명의 그룹으로 • 우리 주변에 CBR로 해결 가능한 문제는 어떤 것이 있는가 ? • 문제해결을 CBR시스템으로 해결 할 경우 어떤 장점과 단점이 있을 수 있는가 ?
Failure prediction ultrasonic NDT of rails for Dutch railways Failure analysis Mercedes cars for DaimlerChrysler semiconductors at National Semiconductor Success Stories for CBR • Maintenance scheduling • Boeing 737 engines • British Airways – plane maintenance • TGV trains • Planning • mission planning for US navy • route planning for DaimlerChrysler cars
e-Commerce sales support for standard products sales support for customised products Personalisation TV listings from Changing Worlds music on demand from Kirch Media news stories via car radios for DaimlerBenz Success Stories for CBR
참고자료: Impact on Business @ Microsoft • Within 9 months of introducing a CBR system @ Microsoft’s call centre in Glasgow • Microsoft reported: • 10% increase in customer satisfaction rating • 28% increase in “first-time-fix” success rate • 13% increase in the “agent is informed” customer survey score • A significant reduction in the time required to train new agents • More consistent responses delivered by agents, regardless of the problem
CBR for email filtering (anti-SPAM) Michael Long, BSc(Hons) 2004, SPAM filtering Amandine Orecchioni, 2005, Email Management CBR for Diagnosis Katya Ponce do Leon, MSc 2005, Fish Diagnosis for Marine Lab Grant Gauld, BSc(Hons) 2005, CBR Helpdesk for Chevron-Texaco CBR for Planning Abhishek Chakraborty, MSc 2005, CBR Healthcare Planning for Partners Research Emergency Nutrition Scott Morrice, BSc(Hons) 2004, “Killer Bunnies” game CBR Honours Project Ideas
A Classification of Applications CBR systems Synthesis tasks Classification tasks Design Planning Configuration Prediction Planning Assessment Process control Diagnosis Medical diagnosis Equipment failure
Classification Tasks Classification Tasks • Application들의 넓은 영역을 포함하며 일상생활에서 매우 일반적 • 새로운 case가 어떤 type이며 class인지를 결정하기 위하여 case-base에 있는 case들에 대하여 matching • 가장 잘 일치하는 case로부터의 solution은 재사용 진단 의료진찰이나 설비 고장 진단 예측 설비 고장의 예측이나 주식시장 시세 평가 은행이나 보험에 대한 위험분석과 프로젝트 비용 추정 공정관리 제조 설비의 관리 계획 여행계획이나 작업 스케쥴의 재사용
Classification Tasks Classification 문제에 CBR 적용 • 대략적으로 유사한 case들의 집합 검색 항생제가 치료제였던 경우 • 집합 내에서 가장 잘 일치하는 것을 검색 특정한 항생제로서 페니실린 제안 • 제안된 해결책을 수정 체중과 나이의 차이에 따라 복용량 변경 • 미래의 사용을 위해 새로운 case의 해결책을 유지 새로운 해결책을 유지
Classification Tasks Classification 작업이 실행하기 쉬운 이유 1 CBR-Cycle과 용이한 일치 2 Case들은 모으기 쉽고 표현도 용이 3 대부분의 CBR tool에 사용되는 검색 알고리즘은 classifier
Diagnosis 경험이 풍부한 의사도 진찰을 할 때 과거의 기억에 크게 의존 MYCIN (박테리아 감염을 진찰하는 전형적인 rule-based 전문가 시스템) 자동차 기계 공학에도 많이 사용 PROTOS (Porter and Bareiss 1986) 임상청각학 분야에서 개발 CASEY (Koton 1989) 심장병을 진단하는 시스템 CASCADE (Simoudis 1992) VMS computer OS의 고장원인을 진단하는 시스템 PAKAR (Watson and Abdullah 1994) 건물의 결함 원인을 확인하고 해당 조치를 제안
Planning Planning 또한 일반적으로 경험에 의존하는 또 다른 분야 London 출장의 예 비행기가 정확하고 호텔이 편했다면 재사용 다른 박물관을 방문하고 쇼에 가는 것으로 예전 계획 변경 BATTLE (Goodman 1989) 육지전의 계획 분야에서 계획평가에 대한 결과 연구 BOLERO (Lopez and Plaza 1993) 환자에 대해 알려진 정보에 의해 진찰 계획 수립 TOTLEC (Costas and Kashyap 1993) 복잡한 제조 계획 문제를 풀기 위해 개발
Legal Reasoning, Design Legal Reasoning : 많은 국각의 법 제도가 판례법의 개념에 기초 JUDGE (Bain 1986) 형 판결에 대한 case-based 모형 HYPO (Ashley 1988) 판례법의 영역에서 case-base legal reasoning, 특허법 관련 KICS (Yang and Robertson 1994) 건물법규 관련에서 운영, 제정법 상의 규약 Design : 건축가부터 소프트웨어 공학자까지 부분 디자인의 재사용 CYCLOPS (Navinchandra 1988) 조경분야에서 디자인 문제 해결 JULIA (Hinrichs 1989) 메뉴 디자인의 분야에서 case-based design CADET (Sycara 1992) 기계 설계에서 디자이너의 지원자로서 역할 ARCHIE (Pearce et al. 1992) 개념설계의 높은 수준 작업에서 건축가 지원 NIRMANI (Perera and Watson 1995) 공장 창고의 개발 지원
Analogous Reasoning, Arbitration Analogous Reasoning (유사추론): 서로 다른 상황에서 유사성 확인 예) 미국의 베트남 전쟁 SWALE (Kass 1989) 낯선 환경에서 죽어가는 동물과 사람에 관련되 case 예) 건강한 어린 경주마와 농구선수의 죽음 : 약물 과다복용과 불법 약물 복용 Arbitration : 중재자의 역할 MEDIATOR (Simpson 1985) 논쟁 해결 분야에서 사용 PERSUADER (Sycara 1987) 노동자와 경영자 사이의 분쟁 해결책 제안