S. Sharifian and S. M. Ahadi. Speaker Adaptation in Continuous Speech Recognition Using MLLR-Based MAP Estimation. Computational Methods in Engineering 2005; 23 (2) :39-50
URL:
http://jcme.iut.ac.ir/article-1-317-fa.html
چکیده: (3815 مشاهده)
روشهای مختلفی برای تطبیق گوینده در سیستمهای بازشناسی گفتار معرفی گردیدهاند. در برخی روشها نظیر تخمین MAP تنها مدلهایی که داده آموزشی متناظرشان موجود باشد تازه سازی میشوند و برای بهبود قابل توجه دقت بازشناسی، داده آموزشی نسبتاً زیادی مورد نیاز است. در برخی دیگر نظیر MLLR که تعدادی تبدیلات عمومی بر روی خوشههای مدلها اعمال میشود، برای دادگان کم آموزشی نتایج مطلوبی حاصل میشود، اما با افزایش دادگان، کارایی به حد اشباع میرسد. در این مقاله روش جدیدی مطرح میشود که از مزایای هر دو روش فوق برای دسترسی به کیفیت بالاتر بهره میبرد. در این روش مدلهایی که داده آموزشی آنها موجود است به کمک تخمین MAP آموزش میبینند و برای مدلهایی که داده آموزشی (کافی) ندارند، با استفاده از روش MLLR مقادیر پیشینه مناسب برای تخمین MAP تأمین میشود. این روش، در عمل، بر روی یک سیستم آموزش دیده براساس دادگان فارس دات به نتایج بهتری نسبت به هر یک از دو روش MAP و MLLR دست یافته است.
نوع مطالعه:
پژوهشي |
موضوع مقاله:
عمومى دریافت: 1393/8/3 | انتشار: 1383/10/26