1 / 19

„ Hands Up !”

„ Hands Up !”. Kézmozdulat felismerő rendszer. Bemutatkozás. Jelenlegi iskola: B udapesti M űszaki F őiskola – N eumann János I nformatika K ar - Sz oftver t echnológia I ntézet – I nformatikai A utomatizált R endszerek Szakirány Érdeklődési kör: zene, képfeldolgozás. Célkitűzés.

kelvin
Download Presentation

„ Hands Up !”

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. „HandsUp!” Kézmozdulat felismerő rendszer

  2. Bemutatkozás • Jelenlegi iskola: Budapesti Műszaki Főiskola – Neumann János Informatika Kar - Szoftvertechnológia Intézet – Informatikai Automatizált Rendszerek Szakirány • Érdeklődési kör: zene, képfeldolgozás

  3. Célkitűzés • Valós idejű gitár szimuláció • Szórakoztató, interaktív formában

  4. Kamera kép Előfeldolgozás Előfeldolgozott kép Pengetés esemény Értelmezés Előállt hang Hangelőállítás Rendszer áttekintés

  5. Kamera kép Előfeldolgozás Ablakok pozícionálása Simítás HSV konverzió Előfeldolgozottkép Szegmentálás Pengetés esemény Értelmezés Hang előállítás Előállt hang Előfeldolgozás

  6. Kamera kép Előfeldolgozás Ablakok pozícionálása Simítás HSV konverzió Szegmentált, konvertált kép Szegmentálás Értelmezés Lefogott hang kiszámítása Kéztávolság és pengetés esemény Pengetés esemény felismerése Előállt hang Hang előállítás Képinformáció értelmezése

  7. Kamera kép Előfeldolgozás Ablakok pozícionálása Simítás HSV konverzió Szegmentált, konvertált kép Szegmentálás Értelmezés Lefogott hang kiszámítása Kéz távolság és pengetés esemény Pengetés felismerése Hang előállítás Gitárnyak szimulálás (érintőkre számolás) Kiválasztott gitárnyak, skála, elrendezés Hangmagasság, megfelelő fájl kiválasztása ((())) Hangbank Hang előállítása

  8. Színterek • RGB színtér • HSV színtér Konverzió: V = MAX(R, G, B); delta = MAX(R, G, B) - MIN(R, G, B); S = delta / V; IF (R == MAX(R, G, B)) THEN H = (G - B) / S IF (G == MAX(R, G, B)) THEN H = 2 + (B – R) / S IF (B == MAX(R, G, B)) THEN H = 4 + (R – G) / S H = H / 6

  9. Szegmentálás • Hisztogram alapú szegmentálás • Lokális szegmentálás • Fix küszöb

  10. Objektum keresés • Bőrszín statisztikája • Hisztogramban tároljuk a bőrszínről vett adatokat • Összevetjük a kép pixeleit a hisztogrammal • Statisztikai adatokszürkeárnyalatos kép

  11. Kéz meghatározása • Súlypont számolása CamShift algoritmussal • Így meg lesz egy pontunk, amiből tudunk következtetni a kéz helyzetére • Gradiens hisztogramok használata kutatás alatt

  12. Objektum követés • Képkockánként szegmentálás • Egymást követő képkockák különbsége • Objektum követés konstans háttérrel • Objektum követés megadott régióban

  13. Kéz pozicionálás • A bal kéz pozíciója alapján ki tudjuk számolni, hogy hanyadik érintőnek megfelelő helyen lenne egy gitár nyakán • A jobb kéz mozgása alapján tudunk következtetni a pengetés eseményére

  14. Hangstruktúra • „Hangbank” alkalmazásával • Tömörített wav fájlok, felvéve gitárról • Könnyen bővíthető, kevésbé terheli a CPU-t • 24-36 fájl kell a megfelelő terjedelemhez/hangzás • Ebből beállítások után „keletkezik” az aktuális gitár hangbázisa • Skálák, alaphang

  15. DirectSound • Maga a hang kezelése DirectSoundon keresztül történik • Jobban kihasználja a számítógép erőforrásait • Egyéb funkciókkal további testre szabási lehetőségek (pl. hangerő, panning, effektek...) • Legtöbb gépen megtalálható, mivel a DirectX része

  16. Hangformátum • A hangok tiszta csatornás gitárhangok • Tömörítési eljárások közül többet próbáltunk • MS ADPCM lett a legoptimálisabb • 44 Khz, mono, 180 kbps mintavételezéssel 200 kByte-os file-ok

  17. Tartalomjegyzék • Célkitűzés • Bemutatkozás • Rendszerterv • Rendszer áttekintés • Előfeldolgozás • Képinformáció értelmezése • Hang előállítás • Irodalomkutatás • Szűrés • Színterek • Szegmentálás • Objektum keresés • Objektum követés • Kéz pozicionálás • Hangstruktúra • DirectSound • Összegzés • Tartalomjegyzék • Köszönetnyilvánítás • Készítők

  18. A team nevében köszönöm a figyelmet!

  19. A projektet készítették: Bónis Balázs Gyöngyi Lajos Szabó Attila http://iar.bmfnik.hu/2008_2009/hands_up/

More Related