1 / 66

모바일 음성인식 비교

“SIRI , S 보이스 , Q 보이스 ”. 모바일 음성인식 비교. 8 조. 2007015009 박 상 헌 2007015023 임 종 수 2011015034 김 산 2012015004 김 가 영 2012015005 김 경 진 2012015030 조 은 비. “ 목차 ”. 1. 서론 2. 모바일 음성인식 기술 원리 3. 검색엔진 분석 음성인식률 자료검색 시 정보원 우선순위 검색엔진이 질문을 인식하는 방법 검색엔진의 검색결과 제시 방법

brier
Download Presentation

모바일 음성인식 비교

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. “SIRI, S보이스,Q보이스” 모바일 음성인식 비교 8조 2007015009 박 상 헌2007015023 임 종 수2011015034 김 산2012015004 김 가 영2012015005 김 경 진2012015030 조 은 비

  2. “목차” 1. 서론 2. 모바일 음성인식 기술 원리 3. 검색엔진 분석 음성인식률 자료검색 시 정보원 우선순위 검색엔진이 질문을 인식하는 방법 검색엔진의 검색결과 제시 방법 음성인식의 Precision&Recall실험 4. 음성인식의 장점 5. 현재 음성인식의 부족한 점 및 개선방안 6. 결론

  3. 서론

  4. “I'm locked out”

  5. “Looking for locksmiths.... I found three locksmiths fairly close to you.”

  6. “인간에게 있어서가장 간편한 인터페이스” VOICE “오늘 날씨 어때?” “근처에 중국집 어디 있어?” “볼만한 영화 좀 추천해봐” “오늘 내 일정이 어떻게 되지?”

  7. “음성인식 기술의 발전” 상용화 수천 가지의 단어 인식 다중 음성 해석 C A b 3세대 (~2007년) 4세대 (2008년~) 2세대 (1970년대) 1세대 (1950~1960년대)

  8. “음성인식기술과 스마트폰의 결합” “개인 비서” SIRI, S보이스, Q보이스

  9. 모바일 음성인식 기술 원리

  10. “음성인식 기술의 원리” 서버전송 잡음 처리 서버 특징 추출 디바이스 사용자 음성입력 비 교 음성 DB 의미 인식 음성 DB와 인식된 음성을 비교 분석하여 인식 성능을 높인다. 검색엔진 검 색

  11. “SIRI, S보이스는 울프람 알파” “Q보이스는 베르니케라는 자체 엔진을 사용”

  12. 검색 엔진 분석 음성인식률 자료검색 시 정보원 우선순위 검색 엔진이 질문을 인식하는 방법 검색 엔진의 검색결과 제시 방법 음성인식의 Precision & Recall 실험

  13. 음성인식률

  14. “소녀시대” 창에 직접 검색결과 대화 형식의 답변 “소녀시대” 웹브라우저 검색결과

  15. “밖에 추워?”

  16. “내일 아침 7시에 알람설정해줘” Q보이스는 사용자확인을 요구함 S보이스와 SIRI는 바로 설정

  17. “밖에 추워” “밖에 추워” ? ? ? 세 검색엔진 모두 성조를 인식하지 못함. “밖에 추워?”

  18. 자료검색 시 정보원의 우선순위

  19. 연락처에 ‘김태희’가 있는 경우 연락처에 ‘김태희’가 없는 경우 “김태희”

  20. “연락처에 ‘김태희’가 있는 경우” “연락처에 ‘김태희’가 없는 경우” Q보이스와 SIRI는 연락처에 김태희가 있는 경우, 연락처를 검색결과로 결정

  21. “S 보이스” 연락처를 보여주는 경우 다만, “연락처”라는 명령을 붙여서 검색한 경우 일관되게 연락처를 검색해서 보여줌 “강호동” “유재석” “아빠” 대화를 하는 경우 바로 전화를 거는 경우 “엄마”

  22. “정보원의 우선순위는?”

  23. 검색 엔진이 질문을인식하는 방법

  24. ? “오늘 우산 필요해?”

  25. 오늘 오늘 우산이라는 문장이 날씨에 대한 검색결과를 도출 오늘 우산 우산 필요 오늘 우산 필요 우산 필요 해?

  26. 오늘 우산 오늘 우산 가격 ‘오늘 우산’이 붙어서 있으면 뒤에 어떠한 단어가 붙던지 간에 날씨와 관련된 검색결과를 도출 오늘 우산 자동차 + 오늘 자동차 우산 자동차, 가격

  27. 정확한 기준을 제시한 뒤에 날씨에 관련된 단어를 제시하면 나머지 단어는 쓸모 없는 단어로 버리고, 날씨에 대한 검색결과가 도출? !

  28. 오늘 우산 지금 스노우체인 기준 날씨 관련 단어 11시 스노우체인 자동차

  29. “우리 가설이 맞기 위해서는 모든 경우에 대해 날씨에 대한 검색 결과가도출되어야 함” 지금 우산 우리의 가설이 틀렸음을 확인 할 수 있었다. 이에 새로운 가설을 세워보았다. 11시 우산 오늘 스노우 체인 오늘 스노우 체인 자동차

  30. “각 단어들 마다상황에 대한 점수가 존재그 점수의 조합이 일정 값을 넘으며가장 값이 높은 것을 질문의 요지로파악” 오늘 X 우산 X 자동차 = 조합값 날씨 0.7 날씨 0.9 날씨 0.1 = 0.063 일정 0.7 일정 0.1 일정 0.1 = 0.007 오늘 X스노우 체인 X 자동차 = 조합값 날씨 0.7 날씨 0.4 날씨 0.1 = 0.028 일정 0.7 일정 0.1 일정 0.1 = 0.007

  31. “하지만 위의 가설 대로라면앞서 실험한 ‘오늘 자동차 우산’도날씨를 검색 결과로 도출해야 하나그러지 못함” 단어 1 X 단어 2 X 단어 3 = (점수X비중) X (점수X비중) X (점수X비중) = 앞선 모든 경우의 수에 적합한 것을 확인하고 위의 방법이 질문을 인식하는 방법이라고 결론 내렸다. “따라서 우리는 단어의 위치에 따라 점수비중이 달라지는 것이 아닌가라는 새로운 가설을 세우고 실험을 진행”

  32. “다른 두 검색 엔진도 똑같은 방식을사용하는 것으로 확인” “각 검색 엔진마다 사용하는 값에 차이가 있음을 알 수 있었으며, 세부적인 것에서 차이가 있음을 확인”

  33. 검색 엔진의 검색 결과제시 방법

  34. “영화 추천해줘” – 영화 검색 웹 브라우저 검색 결과 영화에 대한 정보를 제시 ‘영화 추천해줘’에 대해 인식 못함

  35. “박근혜” - 인물검색 대화 형식의 답변 웹 브라우저 검색 결과 위키백과 정보를 제시

  36. “경북대학교” - 지도검색 시리는Q보이스, S보이스와 다르게 지도 화면을 띄워주지는 않고 간단한 위치 정보만을 본 화면에 띄워주었다.

  37. 음성인식의Precision & Recall 실험

  38. “대구 달서구 상인 1동 맛집” 검색 결과 중 상인 1동 안에 위치하는 우리가 생각하는 맛집은 얼마나 검색되었는가?

  39. “맛집의 기준은?” 상인 1동에 위치하면서 네이버, 다음, 블로그 등에서 높은 별점과 맛집으로 평가 받은 곳 그리고, 상인 1동에서 26년간 살아온 임종수군의 경험을 통해 20곳을 선정

  40. “SIRI 검색 결과” 현재 위치에서부터 거리순 으로15개의 결과 제시 현재위치

  41. “S보이스, Q보이스 검색 결과” 네이버윙스푼으로부터 15개의 검색 결과를 제공 문의 결과, 네이버 윙스푼은 별점, 클릭 수, 등 다양한 요소를 고려해서 검색 결과를 제공한다고 함.

  42. “Precision & Recall 값” S보이스, Q보이스가 우세 Precision@15 0.47 Recall@15 0.35 Precision@15 0.4 Recall@15 0.3

  43. “상위 5개 Precision & Recall 값” SIRI가 우세 Precision@5 0.6 Recall@5 0.15 Precision@5 0.8 Recall@5 0.2

  44. “결과값 분석” SIRI의 부실한 사용자 정보 검색 결과 중 리뷰와 별점이 있는 곳이 없었음. 다만,S보이스와 Q보이스는 거리를 거의 고려하지 않아 SIRI와 큰 차이점이 없음.

  45. 음성인식의 장점

  46. “손발이 자유롭지 못해도 OK!” before after

  47. “사용의 편리성” 여러 단계를 거쳐서 기능을 조작하고 실행함.

  48. “사용의 편리성” ? 하나의 명령으로 기능을 조작하고 실행 할 수 있음.

More Related