1 / 23

Nonobot: Hayat Bilgisi Toplama Amaçlı Oyun

Nonobot: Hayat Bilgisi Toplama Amaçlı Oyun. Yunusemre Yener, Selim Serkan KAPLAN, M. Fatih Amasyalı mfatih@ce.yildiz.edu.tr. Sunum içeriği. Hayat Bilgisi (Commonsense) Nedir? Neden ihtiyaç var? Bilgi toplama türleri Türkçe Hayat Bilgisi Veritabanı Nonobot oyunu Gelecek Çalışmalar.

lavina
Download Presentation

Nonobot: Hayat Bilgisi Toplama Amaçlı Oyun

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Nonobot: Hayat Bilgisi Toplama Amaçlı Oyun Yunusemre Yener, Selim Serkan KAPLAN, M. Fatih Amasyalı mfatih@ce.yildiz.edu.tr Yıldız Teknik Üniversitesi Bilgisayar Mühendisliği Bölümü

  2. Sunum içeriği • Hayat Bilgisi (Commonsense) Nedir? • Neden ihtiyaç var? • Bilgi toplama türleri • Türkçe Hayat Bilgisi Veritabanı • Nonobot oyunu • Gelecek Çalışmalar Yıldız Teknik Üniversitesi Bilgisayar Mühendisliği Bölümü

  3. Bir hikayemiz var:Kurt ve Kız • Küçük bir kız, babaannesini ziyaret etmek için ormanda yürümeye başlıyor. Çalılıkların arkasındaki aç bir kurt kızı görüyor. Onu yemeğe karar veriyor. Küçük kıza tam saldıracakken, yakındaki oduncuların seslerini duyuyor. Çalılıkların ardında saklanıp kararından vazgeçiyor. • Problem: Aşağıdakileri açıklayınız. • Kurt kararından neden vazgeçti? • Küçük kız korktu mu? • Contributed by Pat Hayes and Lokendra Shastri  (9th July, 1997) • http://www-formal.stanford.edu/leora/commonsense/

  4. Hayat Bilgisi (Commonsense) Nedir? • Herkesin bildiğini varsaydığımız bilgiler • İnsanlar her gün yemek yer. • İnsanlar geceleri uyur. • Balıklar denizde yaşar. • Elma yuvarlıktır. • Kediler miyavlar. • Ormanda ağaçlar vardır. Yıldız Teknik Üniversitesi Bilgisayar Mühendisliği Bölümü

  5. Hayat Bilgisi Veri tabanlarına Neden ihtiyaç var? • Bilgisayarlara herşeyi söylemek gerekir. Söylediklerimizden söylemediklerimizi anlayamazlar / tahmin edemezler. • Bunu yapabilmenin yolu, bilgisayarlara Hayat Bilgisini vermek. • Bu sayede bilgisayarlar da insanlar gibi “Ali lokantada yemek yedi” cümlesinden “Ali para ödemiştir” bilgisini çıkarabileceklerdir. Yıldız Teknik Üniversitesi Bilgisayar Mühendisliği Bölümü

  6. Hayat Bilgisi Veri Tabanları nasıl oluşturulur?2 yaklaşım, 2 örnek • Bilgileri, az sayıda bilgi mühendisi özenle girsin yaklaşımı (Cyc, 20 yılda 1.5 milyon kaliteli bilgi, www.cycfoundation.org/concepts) • Bilgileri, çok sayıda web kullanıcısı girsin yaklaşımı (OpenMind, 8000 kişi, 3 yılda 1 milyon bilgi, www.openmind.org ) Yıldız Teknik Üniversitesi Bilgisayar Mühendisliği Bölümü

  7. Türkçe Hayat Bilgisi Veritabanı • Literatürdeki çalışmalar genelde ingilizce için • Türkçe için bir ilk • Hangi yaklaşım kullanılmalı: • Cyc, OpenMind? • Mevcutları tercüme etmek / kullanmak • Frekans tabanlı bilgi çıkarımı • Veriler nasıl tutulmalı? • (Kavram - ilişki türü – kavram) üçlüleri Yıldız Teknik Üniversitesi Bilgisayar Mühendisliği Bölümü

  8. Veri Kaynakları Yıldız Teknik Üniversitesi Bilgisayar Mühendisliği Bölümü

  9. CSdb ‘den örnekler Yıldız Teknik Üniversitesi Bilgisayar Mühendisliği Bölümü

  10. Problemler • Otomatik çeviri hataları • Yanlış çeviri • Çeviri yapılamama • Çözüm ? Elle çeviri • Bilgi kalitesi • Çözüm (çok sayıda kişiden geri besleme almak) Yıldız Teknik Üniversitesi Bilgisayar Mühendisliği Bölümü

  11. Nonobot • Amaç: CSdb’deki bilgi sayısını ve kalitesini arttırmak • Bir android uygulaması • Asıl oyun nonogram oyunu • Kullanıcı ipucu istediğinde CSdb’ye katkıda bulunuyor • Kullanıcı girişlerinin güvenirliklerinin ölçümü otomatik olarak yapılıyor. • Kullanıcılar yeni ilişkiler ve kavramlar girebiliyor, bu sayede CSdb’deki bilgi sayısı artıyor. Yıldız Teknik Üniversitesi Bilgisayar Mühendisliği Bölümü

  12. Nonogram (Kare Karalamaca) başlangıç çözüm Yıldız Teknik Üniversitesi Bilgisayar Mühendisliği Bölümü

  13. Neden Nonogram? • Oyunlarını üretmek kolay • Kolaydan zora derecelendirmek kolay • Oyunları depolamak az hafıza gerektiriyor • Bilinen ve popüler bir oyun (kullanıcılara oyunu öğretmeye gerek yok) • Cep telefonunda ekranında oynamak kolay • Başarı hissi (uzun soluklu oyuncular için şart) veriyor Yıldız Teknik Üniversitesi Bilgisayar Mühendisliği Bölümü

  14. Kullanıcı ipucu istediğinde? • Kullanıcıya istediği satır ya da sütunun içeriği verilir. Neyin karşılığında? • Doğru / yanlış cevaplı sorular • Metin girişli sorular • Problemler: • Kullanıcılara saçma sorular sorulmamalı • Kullanıcı cevapları otomatik kontrol edilmeli Yıldız Teknik Üniversitesi Bilgisayar Mühendisliği Bölümü

  15. Doğru/yanlış cevaplı sorular • Soru üretimi: • Doğru cevabın doğru olması gerektiğini bildiğimiz sorular: Önceki bir çalışmamızda elde edilen listeden rastgele seçim • Doğru cevabın yanlış olması gerektiğini bildiğimiz sorular: Doğruluğu bilinen üçlülerde ilişki türünün rastgele değişimi ile . Örneğin “balık- nerede bulunur- nehir” doğru üçlüsü, aradaki ilişki türü değiştirince “balık – neye sebep olur- nehir” yanlış ilişkisine dönüşür. • Doğru cevabını bilmediğimiz sorular: CSdb’deki üçlülerden rastgele seçime Yıldız Teknik Üniversitesi Bilgisayar Mühendisliği Bölümü

  16. Doğru/yanlış cevaplı sorular • Cevap kontrolü: • Kullanıcıya tek ekranda 1 değil 3 soru sorulur. 3 sorudan 2’sinin cevabını sistem zaten bilmektedir. Kullanıcı bu 2’sine doğru cevap verirse 3.süne verdiği cevap doğru kabul edilir (reCaptcha mantığı). Yıldız Teknik Üniversitesi Bilgisayar Mühendisliği Bölümü

  17. Metin girişli sorular • Soru üretimi: • Vikisözlük sitesinde Türkçe isim, sıfat ve eylem listeleri bulunmaktadır. isim türünde 52269, sıfat türünde 10298, eylem türünde 15183 adet kavram var. Kelime türüne özel sorular üretilmiştir. • Örneğin • isim türündeki kavramlar için “nerede bulunur ?, üst kavramı nedir ?, vb. • sıfat türündeki kavramlar için “Neyin sıfatıdır ?” • eylem türündeki kavramlar için “kim/ne yapar ?, ne zaman yapılır ?, nerede yapılır? vb. Yıldız Teknik Üniversitesi Bilgisayar Mühendisliği Bölümü

  18. Metin girişli sorular • Cevap kontrolü: • Kullanıcıya şu kavramla (W1) şu ilişkiye (R1) sahip bir kavram söyle diye sorulmaktadır. Kullanıcının söylediği kavramın (W2) bu ilişki türüne (R1) göre doğruluğunun anlaşılması için Eşitlik kullanılmaktadır. • F(X), X ifadesinin Google arama motorunda aratıldığında döndürülen sonuç sayfası sayısı • Goran, belirlediğimiz bir eşik değerinden büyükse verilen cevap doğru kabul edilmektedir. Yıldız Teknik Üniversitesi Bilgisayar Mühendisliği Bölümü

  19. Metin girişli sorular • Cevap kontrolü: • Goran’ın 10 olarak belirlenmesi Yıldız Teknik Üniversitesi Bilgisayar Mühendisliği Bölümü

  20. Metin girişli sorular • Cevap kontrolü: • Formülün eksiği: Doğru cevabın “okul masa” olması gereken durumda “okul öğretmen” ikilisi içinde kullanıcı cevabının doğru olarak algılar. Kelimeler arası ilişkiyi kontrol etmez. Sadece kelimelerin birlikte kullanıldıklarını kontrol eder. Bu durum için geliştirebildiğimiz bir çözümümüz yoktur. • Önerileriniz ? Yıldız Teknik Üniversitesi Bilgisayar Mühendisliği Bölümü

  21. Gelecek Çalışmalar • Bilgi miktarının arttırılması (mevcut veri tabanı, haber metinlerindeki kelimelerin yaklaşık %50’sini içeriyor) • Bilgi kalitesinin arttırılması (mevcut doğruluk oranı yaklaşık %50) • Bilgileri kullanan uygulamaların gerçeklenmesi Yıldız Teknik Üniversitesi Bilgisayar Mühendisliği Bölümü

  22. Referanslar • Lenat, D. B., Ramanathan V. G., Karen P., Dexter P., ve Shepherd M., “CYC: Toward programs with common sense”, The Communications of the ACM, 33(8):31–49 (1990). • Push Singh, Thomas Lin, Erik T. Mueller, Grace Lim, Travell Perkins ve Wan Li Zhu, “Open Mind Common Sense: Knowledge acquisition from the general public”, Proceedings of the First International Conference on Ontologies, Databases, and Applications of Semantics for Large Scale Information Systems, Irvine, CA, 2002. • Liu, H. ve Singh, P., “ConceptNet: A Practical Commonsense Reasoning Toolkit”, BT Technology Journal, Volume 22. Kluwer Academic Publishers, 2004. • Miller, G. A., Beckwith, R., Fellbaum, C., Gross, D. ve Miller, K., “Introduction to WordNet: An On-line Lexical Database”, 1993. • Bilgin, O., Çetinoğlu, Ö. ve Oflazer, K., “Building a WordNet for Turkish”, Romanian Journal of Information Science and Technology, 7(1-2), 163-172, (2004). • Emre Yazıcı, M.Fatih Amasyalı, “Automatic Extraction of Semantic Relationships Using Turkish Dictionary Definitions”, EMO Bilimsel Dergi, Vol. 1, No. 1, pp. 1-13, 2011. Yıldız Teknik Üniversitesi Bilgisayar Mühendisliği Bölümü

  23. Teşekkürler.Sorularınız ? Kemik Doğal Dil İşleme Grubu: www.kemik.yildiz.edu.tr Yıldız Teknik Üniversitesi Bilgisayar Mühendisliği Bölümü

More Related