دوره 23، شماره 2 - ( 10-1383 )                   جلد 23 شماره 2 صفحات 50-39 | برگشت به فهرست نسخه ها

XML English Abstract Print


چکیده:   (5157 مشاهده)
روشهای مختلفی برای تطبیق گوینده در سیستمهای بازشناسی گفتار معرفی گردیده‌اند. در برخی روشها نظیر تخمین MAP تنها مدلهایی که داده آموزشی متناظرشان موجود باشد تازه سازی می‌شوند و برای بهبود قابل توجه دقت بازشناسی، داده آموزشی نسبتاً زیادی مورد نیاز است. در برخی دیگر نظیر MLLR که تعدادی تبدیلات عمومی بر روی خوشه‌های مدلها اعمال می‌شود، برای دادگان کم آموزشی نتایج مطلوبی حاصل می‌شود، اما با افزایش دادگان، کارایی به حد اشباع می‌رسد. در این مقاله روش جدیدی مطرح می‌شود که از مزایای هر دو روش فوق برای دسترسی به کیفیت بالاتر بهره می‌برد. در این روش مدلهایی که داده آموزشی آنها موجود است به کمک تخمین MAP آموزش می‌بینند و برای مدلهایی که داده آموزشی (کافی) ندارند، با استفاده از روش MLLR مقادیر پیشینه مناسب برای تخمین MAP تأمین می‌شود. این روش، در عمل، بر روی یک سیستم آموزش دیده براساس دادگان فارس دات به نتایج بهتری نسبت به هر یک از دو روش MAP و MLLR دست یافته است.
متن کامل [PDF 256 kb]   (1345 دریافت)    
نوع مطالعه: پژوهشي | موضوع مقاله: عمومى
دریافت: 1393/8/3 | انتشار: 1383/10/26