220 likes | 358 Views
DML. آزمايشگاه تحقيقاتي رسانه ديجيتال دانشکده مهندسي کامپيوتر دانشگاه صنعتي شريف. تشخيص پوست در فضاي رنگ مفهوما يکنواخت با استفاده از مدل بيضوي مسطح. ارائه دهنده: جعفر محمدي. پاييز ۱۳۸۴. کاربردهاي تشخيص نواحي پوست. تشخيص، محليسازي، دنبالکردن و تحليل صورت
E N D
DML آزمايشگاه تحقيقاتي رسانه ديجيتال دانشکده مهندسي کامپيوتر دانشگاه صنعتي شريف
تشخيص پوست در فضاي رنگ مفهوما يکنواخت با استفاده از مدل بيضوي مسطح ارائه دهنده: جعفر محمدي پاييز ۱۳۸۴
کاربردهاي تشخيص نواحي پوست • تشخيص، محليسازي، دنبالکردن و تحليل صورت • جهت تحقيقات رفتارشناسي، لبخواني، پردازش گفتار دونمايي، کنفرانس ويديويي، سنتز گفتار بصري و واسط مفهومي انسان- کامپيوتر • فيلترينگ سايتهاي غيراخلاقي بر اساس محتواي تصوير • فشردهسازي ويديدئي بر پايهي محتوا • و ...
رهيافتهاي موجود براي تشخيص نواحي پوست • بدست آوردن قوانيني براي لومينانس و کرومينانس پوست • روشهاي غير پارامتريک • شامل جدولهاي look-up با استفاده از هيستوگرامهاي کوانتيزه شده • کلاسهبندهاي بيز (MAP) • Self Organizing Mapها • روشهاي مدلسازي پارامتريک • مدل تکگاوسي • مدل چند گاوسي • مدل بيضوي • مدل کرانههاي بيضوي
بدست آوردن قوانيني براي لومينانس و کرومينانس پوست • بدست آوردن آستانهها و محدوديتهاي مناسب براي لومينانس و کرومينانس پوست با آناليز کردن نمونههاي آموزشي رنگ پوستهاي مختلف • بسيار راحت و سريع • در شرايط نوري مختلف (با لومينانسهاي متفاوت) به درستي عمل نميکند (زيرا با يک آستانهي ثابت نميتوان مقادير متغير لومينانس را مدل کرد). • پيدا کردن قوانين دقيق و متعدد براي اين منظور بسيار مشکل ميباشد.
روشهاي غير پارامتريک • هم مرحلهي تست و هم استفاده از آنها سريع است. • وابسته به شکل توزيع پوست نيستند. • فضاي بسيار زيادي نياز دارند. • قادر به درونيابي و تعميم دادههاي آموزشي نيستند. • شديدا وابسته به مجموعهي آموزشي هستند.
روشهاي مدلسازي پارامتريک • استفاده از مدلهاي گاوسي • قادر به تعميم دادههاي آموزشي هستند • به جز ذخيرهي چند پارامتر نياز به هيچ حافظهي ديگري ندارند • استفاده از مدلهاي تک گاوسي، چند گاوسي و کرانههاي بيضوي
روش مدلسازي پارامتريک تک گاوسي • فرض ميشود که تيرگي پوست انسان در زير فضاهاي دوبعدي فضاي رنگ، از يک مدل گاوسي است • سعي در بدست آوردن پارامترهاي اين مدل (ميانگين و کوواريانس) از يک مجموعهي آموزشي تصاوير پوست • بدست آوردن نواحي صورت با يک آستانهگيري بر روي تصوير خاکسترياي که حاصل از احتمال زير براي هر پيکسل ميباشد: • که در آنو پارامترهاي مدل گاوسي (ميانگين و کوواريانس) بوده و cنيز رنگ پيکسل ميباشد. • پارامترهاي مدل ميتوانند از روي مجموعهي دادهها بصورت زير تخمين زده شوند: • بسيار سريع و ساده • در شرايط نوري مختلف به خوبي عمل نميکند • پيدا کردن مقدار آستانهي مناسب، وقتي که داراي پس زمينهي پيچيده هستيم، مشکل است.
مدل رنگ پوست L*a*b* HSV Kodak YCC جامعه آماری مدل گاوسی
روش مدلسازي پارامتريک چندگاوسي • يک حالت عموميتر از مدل تکگاوسي بوده و مجموعهي چند مدل تکگاوسي ميباشد • بدست آوردن مدلهاي چندگاوسي توسط الگوريتم Expectation – Maximization انجام ميپذيرد • يادگيري مدل مشکل بوده و سرعت آن پائين میباشد.
روش مدلسازي بيضوي • معادل منحنيهاي تراز فاصلهي ماهالانوبيس در فواصل مختلف در روش تکگاوسي ميباشد. • ارائه شده جهت بالا بردن هر چه بيشتر سرعت در مدلسازي تک گاوسي و حذف مرحلهي آستانهگيري • از همان پارامترهاي مدل گاوسي استفاده ميشود. • مدل بيضوي پوست: • نشاندهندهي اندازهي شمول دادهها در مدل بيضوي ميباشد . • شرط داخل بودن پيکسل X در داخل بيضي مشخصه اين است که:
روش مدلسازي کرانههاي بيضوي • در مدل گاوسي فرکانس تکرار مقادير پيکسلها، تاثير شديدي بر روي مرکز شکل مدل گاوسي و بالطبع مرکز بيضي مدلکنندهي پوست ميگذارد. • در اين روش مرکز بيضي را به جاي اينکه منطبق بر نقطهي پيک مدل گاوسي در نظر بگيرند، آن را منطبق بر ميانگين دادههاي آموزشي هرس شده، بدون در نظر گرفتن فرکانس تکرار آنها قرار دادهاند. ساير پارامترهاي مدل بيضوي از همان مدل گاوسي حاصل از دادههاي هرس شده، مانند روش قبلي بدست ميآيند. • مطالعات و پيادهسازيها قبلي نشان دادهاند که مدل کرانههاي بيضوي بهتر از مدلهاي تکگاوسي و چند گاوسي عمل ميکند.
مشکل روش کرانههاي بيضوي • در مدلسازي کرانههاي بيضوي مرکز بيضي به دليل تغييرات شديد، مورد تصحيح قرار گرفت ولي براي بدست آوردن ساير پارامترهاي مدل بيضوي از همان ماتريس کوواريانس مدل گاوسي استفاده شد • فرکانسهاي تکرار بالا در يک محدودهي کوچک مي تواند ماتريس کوواريانس را نيز به نحوي تغيير دهد که بدست آوردن قطرهاي مدل بيضوي از آن دقيق نباشد
حل اين مشکل در روش پيشنهادي ما • ابتدا دادههاي کماهميت و نويزي را هرس ميکنيم تا مدل بيضوي بدستآمده بهخوبي منعکس کنندهي چگالي اصلي دادههاي مجموعهي آموزشي باشد • سپس ماتريس کوواريانس دادهها را بدون در نظر گرفتن فرکانسهاي تکرار بدست ميآوريم. • چون از فرکانس تکرار دادهها استفاده نشده است، اين مدل را مدل بيضوي حاصل از دادههاي مسطح ناميدهايم.
ترکيب مدلهاي بيضوي زير فضاها • اگر براي مدلسازي پوست از زيرفضاي کروماتيک فضاي رنگ استفاده کنيم، يعني اينکه اثرات لوما را ناديده گرفتهايم • از طرفي ناديده گرفتن اثرات لوما کارايي را پائين خواهد آورد • بنابراين از مدلهاي بيضوي بدست آمده در هر سه زير فضاي فضاي رنگ استفاده ميکنيم. • نتيجه: • هم اثرات لوما را دخالت داده دادهايم. • هم ضمن بالابردن نرخ تشخيص در مدلهاي بيضوي ميزان False Positiveها را کاهش داده دادهايم.
پايگاه داده مورد استفاده • ۳۰۴ تصوير شامل تمامي رنگ پوستهاي مختلف • بيش از ۷۰۰ صورت • حدود ۳۲۳۰۰۰ پيکسل رنگ پوست • تعداد محدودي عکسهاي شخصي و خانوادگي و بقيه، تصاوير بدست آمده از اينترنت و در شرايط کنترل نشده و عمدتا با کيفيت پائين • جمعآوري شده توسط Jain و همکارانش از افراد با قوميتها و نژادهاي مختلف و از قسمتهاي مختلف پوست (صورت، دستها و پاها) • تصاوير در محيطهاي داخلي و بيروني بوده و شامل سايهها و شرايط نوري مختلف و کنترل نشده
نتايج • بهترين نتايج را در فضاي رنگ مفهوما يکنواخت La*b* داشتيم. • مقايسهي False Positiveها در روش کرانههاي بيضوي و روش پيشنهادي ما براي نرخهاي تشخيص ۹۰ و ۹۵ درصدي:
نتايج • مقايسه نرخ تشخيصهاي اشتباه در مقايسه با تشخيصهاي درست در هر کدام از زير فضاها و ترکيب زير فضاها در فضاي رنگ La*b* (محور افقي نرخ تشخيص درست و محور عمودي نرخ تشخيص اشتباه را نشان مي دهد):
نتايج • نمونهاي از پوستهاي تشخيص داده شده در فضاي رنگ La*b*
نتايج • نمونهاي از پوستهاي تشخيص داده شده در فضاي رنگ La*b*
پايان از همراهی شما سپاسگزارم