1 / 13

Sztuczna Inteligencja Gry i programy oparte na szukaniu

Sztuczna Inteligencja Gry i programy oparte na szukaniu. Włodzisław Duch Katedra Informatyki Stosowanej UMK Google: W. Duch. Inne wczesne projekty oparte na algorytmach szukania. Algorytmy szukania w grach. Szukanie i ludzkie myślenie. Paradoksy kognitywne. Reprezentacja wiedzy ... .

glynis
Download Presentation

Sztuczna Inteligencja Gry i programy oparte na szukaniu

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Sztuczna InteligencjaGry i programy oparte na szukaniu Włodzisław Duch Katedra Informatyki Stosowanej UMK Google: W. Duch

  2. Inne wczesne projekty oparte na algorytmach szukania. Algorytmy szukaniaw grach. Szukanie i ludzkie myślenie. Paradoksy kognitywne. Reprezentacja wiedzy ... Co będzie

  3. Inne wczesne projekty SAINT=Symbolic Automatic INTegrator J. Slagle, 1961, praca doktorska, MIT. Całkowanie symboliczne, przekształcanie wyrażeń. Program napisany w LISPie, konieczne są heurystyki. Reprezentacja redukcji problemów do podproblemów. Rozwiązał 84 z 86 zdańz egzaminu na MIT. Np: całka z (sec2t)/(1+sec2t-3 tan t) dt Po usprawnieniu rozwiązał też i cos(x1/2)dx, x(1+x)1/2 dx SIN, Symbolic Integration, 1967, J. Moses, MIT. SIN rozwiązywał najtrudniejsze całki. Powstała z tego MACSYMA a potem Mathematica.

  4. Inne projekty cd STRIPS (R. Fikes, N. Nilsson, 1971, SRI International) Planowanie ruchów robota w pokoju ze skrzynkami i pudłami. Model świata, plan ruchów. Opis stanu: za pomocą rachunku predykatów. Operatory: akcjerobota. Sprawdzanie wstępnych warunków stosowalności. Wynikiem działania jest zmiana modelu świata. ABSTRIPS (E. Sacerdoti, 1974) Ulepszenia: hierarchiczneplanowanie, czyli najpierw szkic działania, a potem tworzy się plan szczegółowy.

  5. Gry Dobre pole do testów dla prostego podejścia do AI: Szukanie najlepszego ruchu, stany, operatory, strategie szukania. Cechy problemu: • niepewność związana z ruchem przeciwnika; • duża przestrzeń szukania. Mało pieniędzy na badania i rozwój programów do gier, z wyjątkiem szachów i od niedawna gier komputerowych. Symulatory do gry w szachy zyskały popularność. Wyzwaniem AI stało się osiągnięcie mistrzostwa w szachach. Pierwszy program szachowy, 1958, Alex Bernstein - słaby. Na Olimpiadzie Gier Komputerowych 2007 były turnieje 32 różnych gier, od Abalone, do Surakarta. Kompromis pamięć/złożonośćocen.

  6. Strategia Minimaxu Teoria gier: von Neumann, Morgenstern 1944 Oponenci w grze: Min i Max – zaczynający. • Utwórz drzewo dla gry do maksymalnej głębokości, na jaką cię stać. • Oceń wartości f. heurystycznej poczynając od liści. • Cofnij się o jeden poziom i dokonaj ocen znajdujących się tam węzłów. • Po osiągnięciu korzenia wybierz decyzję maksymalizującą zyski. Jest to decyzja min-maks: dla skończonych drzew kompletna, dla racjonalnych oponentów najlepsza.Utwórz tak duże drzewo, na ile starczy czasu. Złożoność t ~ O(bm), pamięć O(bm) przy szukaniu w głąb.

  7. Przykład mini-maxu Którą drogę warto wybrać? Oceniamy liście i cofamy się do góry przenosząc najwyższe lub najniższe oceny na węzły z ruchami dla MAX i MIN. MAX powinien przejść do sytuacji B, skąd ma szansę dotrzeć do węzła Win/+10, ale MIN zredukuje ją do W/+3; wybór przejścia do C daje MIN szansę zredukowania uzyskania przewagi o 1 punkt, czyli L/-1.

  8. Kółko i krzyżyk

  9. Funkcje oceny • Koszty materialne: pionek =1, skoczek=3, goniec=3, wieża =5, hetman=9 ... • Pozycja figur: dla każdej konfiguracji inne oceny, np. pionek w pobliżu końcowego pola jest dużo ważniejszy niż pionek zablokowany. • Ocena następnego ruchu, zagrożeń dla poszczególnych figur. • Złożone oceny konfiguracji wielu figur. • Kombinacja liniowa różnych elementów oceny fi z wagami Wi Współczynniki Widobiera się tak, by maksymalizować zyski. Nieliniowe funkcje oceny mogą dać lepsze rezultaty. Precyzyjne wartości finie mają znaczenia - liczy się tylko względny porządek, jest to więc „porządkowa funkcja kosztu”.

  10. Przykłady ocen • Ludzie oceniają jakościowo, wystarczą względne porównania. • Na podstawie doświadczenia tworzy się złożone funkcje oceny. Ruch czarnych Ruch białych Ruch czarnychPrzewaga białych Czarne wygrywają Białe bliskie przegranej

  11. Obcinanie alfa-beta a - najlepsza wartość dla MAXa dla kolejnych kroków; porzuć V jeśli masz lepsze wartości a w innej części grafu (dla MAX); b - najlepsza wartość dla MINa dla kolejnych kroków; oszczędność w najlepszym razie t ~ O(bm/2) Technika pozwalająca oszczędzać czas w algorytmie min-max, obcinając gałęzie, które nie mają wpływu na końcowy wybór.

  12. Przykład a-b Węzeł 1 ma f=8; węzeł 2 ma f8; po sprawdzeniu=8; węzeł powyżej ma f8, po sprawdzeniu węzła 9 reszta jest pomijana, ale w prawej gałęzi max f=4, więc na tyle może liczyć MIN. Kolejność odwiedzanych węzłów jest w kwadratach, a wartości f. heurystycznej oceny obok.

  13. Gry niedeterministyczne Strategia min-max połączona z oceną probabilistyczną szans na generowanie kolejnego ruchu. Obcinanie a-b można stosować ale staje się znacznie mniej efektywne, wzrasta liczba możliwych rozgałęzień.

More Related