انتخاب ویژگی به کمک روشهای افزایش داده متخاصمی در سیستمهای تشخیص احساس از سیگنال گفتار
تشخیص احساسات ازروی گفتار[1]، برای درک دقیق معانی جملات و همچنین ایجاد واکنش مناسب به گوینده، از سوی ماشین ضروری است. احساس به عوامل متعددی از جمله جنسیت، تن صدا، زبان و برخی ویژگیهای فردی وابسته است که کار تشخیص آن را سخت میکند. هرچه ویژگیهای استخراج شده از گفتار بیشتر باشد، نیاز به داده بیشتری برای آموزش شبکه عصبی و همچنین انتخاب ویژگیهای مؤثر در سیستمهای تشخیص احساس از گفتار میباشد و در صورت وجود داده به تعداد کافی منجر بهدقت بهتر طبقهبندی میشود. در صورت عدم وجود تعداد زیاد داده میتوان از روشهای افزایش داده[2] استفاده کرد.
یکی از عمدهترین مشکلات موجود در سیستمهای تشخیص احساس از گفتار کمبود داده در هر کلاس جهت آموزش شبکه عصبی است. این مقاله با هدف ایجاد یک شبکه افزایش داده متخاصمی[3] جهت افزایش دادهها در یک سیستم تشخیص احساس از گفتار، انتخاب ویژگی را موردبحث و بررسی قرار داده و نشان داده شده است که دادههای مصنوعی تولید شده توسط شبکه افزایش داده متخاصمی نهتنها میتوانند برای افزایش دادهها بلکه برای انتخاب ویژگی به منظور بهبود عملکرد طبقهبندی نیز مورد استفاده قرار گیرند. همچنین تشخیص و انتخاب ویژگیهای مؤثر در بردارهای ویژگی حجم محاسبات و سرعت شبکه عصبی را افزایش میدهد.
آزمایشها، شباهت قابلتوجهی بین توزیع بردارهای ویژگی مصنوعی و هدف را نشان داد و علاوه بر این، مسئله انتخاب ویژگی جهت کاهش ویژگیهایی که در تشخیص احساس از سیگنال گفتار مفید واقع نمیشوند بررسی و نشان داده شد که با ترکیب دادههای مصنوعی و طبیعی میتوان راندمان یک کلاسه بند شبکه عصبی با تفکیک چهار احساس را بهبود داد.
کلمات کلیدی: تشخیص احساس از گفتار، انتخاب ویژگی، افزایش داده، یادگیری عمیق، شبکههای مولد متخاصمی.
[1] Speech Emotion Recognition (SER)
[2] Data Augmentation
[3] Generative Adversarial Network
نقد و بررسیها
هیچ دیدگاهی برای این محصول نوشته نشده است.