تعداد نشریات | 39 |
تعداد شمارهها | 1,175 |
تعداد مقالات | 8,460 |
تعداد مشاهده مقاله | 6,348,828 |
تعداد دریافت فایل اصل مقاله | 3,600,001 |
یک روش سریع برای تقطیع گفتار گویندگان بر اساس بسامد گام گفتار (RPSS) | ||
علوم و فناوریهای پدافند نوین | ||
مقاله 4، دوره 3، شماره 1 - شماره پیاپی 7، فروردین 1391، صفحه 29-38 اصل مقاله (3.22 M) | ||
نویسندگان | ||
بهروز عبدالعلی* 1؛ حسین صامتی2؛ محمد حسین قزل ایاغ1 | ||
1دانشگاه امام حسین | ||
2دانشگاه صنعتی شریف | ||
تاریخ دریافت: 10 بهمن 1397، تاریخ بازنگری: 14 اردیبهشت 1403، تاریخ پذیرش: 10 بهمن 1397 | ||
چکیده | ||
تقطیع و خوشه بندی گویندگان فرآیندی است که طی آن قطuه بندی و برچسب گذاری برای گفتار حاصل از یک جلسه که شامل چند گوینده است انجام میشود و دنباله صوتی به بخشهائی تقسیم میشود که هر بخش شامل فقط یک گوینده است و با برچسب گذاری مشخّص میشود که هر بخش مربوط به کدام گوینده است. تشخیص فعالیت گفتاری، تقطیع گفتار و خوشه-بندی گویندگان، حداقل مراحل اصلی سامانه های تقطیع و خوشه بندی گفتار بر اساس گوینده محسوب می شوند. برای مرحله ی تقطیع روش های متعددی وجود دارد که تقطیع بر مبنای BIC یکی از روش های مرسوم است. این روش به دلیل محاسبات آماری آن، نیاز به زمان محاسبات طولانی دارد. هدف اصلی این مقاله ارائه ی روش تقطیع بر اساس بسامد گام گفتار است، که هم دارای دقتی در حدّ روش های مرسوم است و هم دارای سرعت محاسبات بالا است، به طوری که در مقایسه با تقطیع بر اساس BIC به طور میانگین دارای مزیّت 4/2 برابری در سرعت و افزایش یک درصد در دقت است. | ||
کلیدواژهها | ||
تقطیع و خوشه بندی گویندگان؛ تقطیع گفتار؛ بسامد گام گفتار | ||
آمار تعداد مشاهده مقاله: 415 تعداد دریافت فایل اصل مقاله: 99 |