۳ نتیجه برای ابوالقاسم صیادیان
ابوالقاسم صیادیان،
دوره ۱۷، شماره ۲ - ( ۱-۱۳۷۷ )
چکیده
ذخیره سازی و یا ارسال سیگنال صحبت با کیفیت بالا با نرخهای بیت خیلی پایین یکی از مسائل تحقیقاتی مورد توجه برای مدمهای پیشرفته (که باید صحبت، تصویر و داده ها را به طور همزمان در یک کانال KHZ ۴ ارسال کند)، سیستمهای پست صوتی و بی-سیمهای HF۳ و ... است. در طی این تحقیق با استفاده از درونیابهای تصادفی بین فریمی۴ و همچنین چندی کننده های برداری درون فریمی۵، قادر به کد کردن سیگنال صحبت با نرخ BPS۱۲۰۰ و با کیفیت خیلی خوب شدیم. کیفیت سیگنال بازسازی شده قابل رقابت با کدکننده های BPS۴۸۰۰ مطرح (مانند CELP ) بوده است. البته کاهش نرخ به BPS۱۲۰۰ همراه با افزایش تأخیر الگوریتم کدینگ از ms۲۰ به ms۴۰ و همچنین افزایش اندکی در بار محاسباتی حاصل شده است.
ابوالقاسم صیادیان،
دوره ۱۸، شماره ۱ - ( ۱-۱۳۷۸ )
چکیده
روشهای تصدیق هویت افراد از طریق بیان کلمات یا جملات مشخص، دارای کاربرد فراوانی اند. وقتی تعداد کلمات یا جملات مورد توافق یا تعداد افراد برای تعیین هویت گفتاری کم باشد، از روشهای بهینه DTW۱ برای این منظور می توان استفاده کرد. چنانچه تعداد کلمات یا جملات زیاد باشد و یا اینکه سیستم برای تعداد افراد زیاد طراحی شود، استفاده از روش DTW مقرون به صرفه نیست (به علت نیاز به بار محاسباتی و حجم حافظۀ بالا). در چنین مواقعی از چندی کننده های برداری یا ماتریسی می توان استفاده کرد. در طی این تحقیق از روش چندی کردن ماتریسی به علت کارایی بالاتر استفاده کرده ایم. همچنین برای افزایش کارایی سیستم از اطلاعات تحریک (شامل کانتورگین و فرکانس پیچ) نیز به نحو مناسبی استفاده کرده ایم. استفاده از اطلاعات تحریک به قسمی انجام پذیرفته که سیستم در مقابل تقلید ماهرانه مقاوم۲ است.
ابوالقاسم صیادیان، کامبیز بدیع، محمد شهرام معین و نصرالله مقدم،
دوره ۲۳، شماره ۲ - ( ۱۰-۱۳۸۳ )
چکیده
مدلسازی آماری HMM رویکردی پرکاربرد در سیستمهای بازشناسی گفتار پیوسته و گسسته است. توزیع احتمال بردارهای مشاهدات هر حالت پنهان مدل، به دو روش پیوسته۳ یا گسسته۴ تخمین زده میشوند. عملکرد توزیع احتمال پیوسته (با مدلسازی GMM۵) بالاتر از عملکرد توزیع احتمال گسسته (با مدلسازی VQ۶) است. ولی چنانچه بخواهیم از رویکرد HMM برای بازشناسی گفتار گسسته با دایره لغات وسیع استفاده کنیم، هزینه محاسباتی مرحله بازشناسی با افزایش تعداد لغات، به نحو چشمگیری افزایش مییابد. بدین لحاظ در بازشناسی گفتار گسسته با دایره لغات وسیع، از توزیع احتمال گسسته به منظور کاهش هزینه محاسباتی و امکان پیادهسازی بی درنگ۷ استفاده میشود. برای جبران کاهش دقت و عملکرد مدلسازی DD-HMM، استفاده از درونیابی فازی FI مرسوم است. در این تحقیق روش درونیابی گوسی که دارای پشتوانه نظری قویتر نسبت به FI است ارائه کردهایم. کارایی دو روش درونیابی KNNGI و FI در بازشناسی ۱۵۰۰ کلمه فارسی مورد تحقیق و بررسی قرار دادیم. نتایج این تحقیق نشان میدهد که دقت و انعطافپذیری درونیابی KNNGI بیشتر از روش FI است.