1 / 30

2009 후기 신입생 프로젝트

2009 후기 신입생 프로젝트. About FOAF Crawling & Visualization With Touch graph. 2009. 08. 31 IDB/IDS Seminar 송효진 , 박성은. INDEX. 01 PROJECT OUTLINE 02 PROJECT ARCHITECTURE 03 DEMONSTRATION 04 DISCUTION 05 CONCLUSION. 01 PROJECT OUTLINE. 1.1 프로젝트 개요.

tassos
Download Presentation

2009 후기 신입생 프로젝트

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. 2009 후기신입생 프로젝트 About FOAF Crawling & Visualization With Touch graph 2009. 08. 31 IDB/IDS Seminar 송효진, 박성은

  2. INDEX 01 PROJECT OUTLINE 02 PROJECT ARCHITECTURE 03 DEMONSTRATION 04 DISCUTION 05 CONCLUSION

  3. 01 PROJECT OUTLINE

  4. 1.1 프로젝트 개요 • 일 정 : 2009. 07. 28 ~ 2009. 08. 31 (약 5주) • 취 지 : 신입생 프로젝트의 일환으로 실제 온톨로지를 • 다루어 보는 기회를 갖는다. • 주 제 : 웹 상에 존재하고 있는 FOAF온톨로지를 • Crawling하여 DB에 저장하고, 그 데이터를 • 기반으로 질의 및 시각화 하는 시스템을 • 개발하도록 한다.

  5. 1.2 프로그램 기능명세 • FOAF Crawler를통해 웹 상의 FOAF문서를 수집한다. • Crawling한 데이터를 DB에 저장하고 사용하는 부분은 • 오픈 소스인 Jena를 이용한다. • DB에 넣은 데이터를 기반으로 질의 및 시각화가 • 가능하도록 한다. • 최종 결과물은 웹 상에서 접속이 가능해야 한다.

  6. 1.3 개발환경 및 오픈소스 • JAVA JDK 1.6.0_14 • Eclipse IDE for Java Developers • Apache Tomcat 5.5 • Jena v2.6.0 • TouchGraph • Signed Applet • SubVersion

  7. 02 PROJECT ARCHITECTURE

  8. 2.0 Overall Architecture 웹에서 RDF파일을 가져와서 그 URL을 FILE에 쓰고 FOAF데이터를 TRIPLE 스토어의 형태로 DB에 넘겨줌 rC DBConstructor 1 RDFWebCrawler Crawled URLs.txt RDFSaver Visualizer 2 AppletDriver FOAFManager DB FOAFUI 3 FOAFModelHandler FOAFNode 데이터를 가져와서 그래프로 표현 FOAFVocabulary Touchgraph 검색된 URL을 받아 파싱하여 foaf데이터 추출후 DB에 접근하여 이 데이터를출력 GLPanel, …

  9. 2.1 FOAF Crawler(1) • JAVA 로구현 HTML link만 따라감->xml 도처에 존재하는 무한루프 (login, target link) RDFWebCrawler.java HTML/XML 문서의 link를 따라다니면서 /foaf.rdf 나 .foaf파일을 포함 한 것을 골라 냄 CrawledURLs.txt Too much time for link connection! ->give up the URL 우선순위 없는 링크 따라가기

  10. 2.1 FOAF Crawler(2) 1 5 6 8 … 2 3 4 7

  11. 2.1 FOAF Crawler(2) • JAVA 로구현 “/foaf.rdf” ” .foaf” HighPriorityVector Rdf, people, person, foaf PriorityVector Vector 기타

  12. 2.1 FOAF Crawler(3) 1 5 6 2 8 3 4 7

  13. 2.1 FOAF Crawler(4) ■ 실행화면

  14. 2.1 FOAF Crawler(5) ->Swoogle을 seed page로 이용 ->24시간 약 800개의 URL을 Crawling (개) (hour)

  15. 2.2 DB에 Model 저장 • Jena 와 java 로구현 • FOAF파일을 모델로 만들어 • triple store의 형태로 • DB에 저장 URI존재? yes no Person 추가 Email 존재? yes no DB RDFSaver.java Email로 URI생성 Name 존재? no yes CrawledURLs.txt Name으로 URI생성 추가 안 함

  16. 2.2 DB에 Model 저장 model.listSubjectsWithProperty getSubject() getProperty() getObject() Jena로 DB를 모델로 변환하여 메모리에 올림 Jena로 모델에 쿼리 DB Memory program Model Triplestore ModelMaker RDFSaver.java add addProperty() FOAF 문서

  17. 2.2 DB에 Model 저장 DB Memory FOAF 문서

  18. 2.3 FOAF 정보의 질의 및 시각화 • 오픈소스Touch graph 로 FOAF Node 간의 • Knows 관계구현

  19. 2.4 Browser 접속 • 톰캣 서버를 통해 • 웹으로 접근 가능

  20. 03 Discussion

  21. 4. DISCUSSION(1) FOAF 파일의 양과 질 문제 양적 문제 : Web에 올라와 있는 양도 적지만, internal server error나 접근 제한되어 있는 정보가 많음 ->대부분의 파일은 실험적 수준

  22. 4. DISCUSSION(2) 양적 문제 : 다수의 URI 없는 node ->email로 URI를 만들려고 함 ->email마저 없는 노드들 다수

  23. 3. DISCUSSION(2) 질적 문제 : 다수의 URI 없는 node ->email로 URI를 만들려고 함 ->email마저 없는 노드들 다수 이름대신 Nickname NoEmail!

  24. 3. DISCUSSION(3) 2. FOAF 문서 기술의 다양성 다양한 기술방식으로 인해 Jena에서 불러오지 못하는 FOAF문서가 많음.

  25. 3. DISCUSSION(3) 3. Applet으로 웹 접속 시의 문제점 client에 Java가 설치되어 있어야 함 로딩 될 때 기다려야 하는 문제점

  26. 04 DEMONSTRATION

  27. 04 CONCLUSION

  28. 4. 결론 및 느낀 점 • FOAF의 앞으로의 활용성에 대한 고민 • 추론을 통한 실용적 기능을 통한 확장 가능성 • Semantic Web에 대해 몸으로 공부해 볼 수 있었던 계기 • 대학원 생활에 대해 몸소 느낌

  29. 04 Q&A

  30. THANK YOU… ※ 지도해주신 박성찬, 임혜원 선배님 감사합니다!!

More Related