شناخت احساسات براساس اطلاعات پارالانژيكي
محققان دانشگاه تگزاس در آرلينگتون به تازگي استفاده از يادگيري ماشيني براي تشخيص احساسات را صرفاً بر اساس اطلاعات فلسفي بررسي كرده اند. Paralinguistics جنبه هاي ارتباط گفتاري است كه شامل كلمات مانند پيچ ، حجم ، intonation و غيره نمي شود.
پيشرفت هاي اخير در يادگيري ماشين منجر به توسعه ابزاري شده است كه مي توانند با تجزيه و تحليل تصاوير ، ضبط صدا ، الكتروانسفالوگرام يا الكتروكارديوگرام حالت هاي عاطفي را تشخيص دهند . اين ابزارها مي توانند چندين برنامه جالب داشته باشند ، به عنوان مثال ، تعامل كارآمد تر انسان و رايانه را قادر مي سازند كه در آن رايانه احساسات كاربر كاربر را تشخيص داده و پاسخ مي دهد.
محققان نوشتند: "به طور كلي ، ممكن است استدلال شود كه گفتار داراي دو نوع اطلاعات مجزا است : اطلاعات صريح يا زباني ، كه مربوط به الگوهاي بيان شده توسط گوينده است ؛ و اطلاعات ضمني يا پارالانژيكي ، كه مربوط به تغيير در تلفظ الگوهاي زباني است." در مقاله خود ، كه در مجموعه كتابهاي پيشرفت در پزشكي تجربي و زيست شناسي منتشر شده است. "با استفاده از هر دو يا هر دو نوع اطلاعات ، ممكن است سعي شود يك بخش صوتي را كه از گفتار تشكيل شده است ، طبقه بندي كنيم ، بر اساس احساسات (ع) خود را تحمل كند. با اين وجود ، تشخيص احساسات از گفتار حتي براي انسان يك كار بسيار دشوار است ، مهم نيست كه وي يك فرد متخصص در اين زمينه باشد (به عنوان مثال يك روانشناس). "
بسياري از رويكردهاي تشخيص خودكار گفتار خودكار (ASR) سعي دارند با تجزيه و تحليل هر دو اطلاعات زباني و پارالانژيكي احساسات را از گفتار تشخيص دهند. با تمركز تا حدودي بر خصوصيات زباني ، اين مدل ها داراي معايب مختلفي هستند ، مانند وابستگي شديد به زبان. محققان از اين رو تصميم به تمركز بر احساسات شناخت تنها در تجزيه و تحليل اطلاعات paralinguistic بر اساس، با اين اميد از رسيدن به تشخيص احساسات چند زبانه.
محققان در مقاله خود نوشتند: "در اين مقاله ، ما به تجزيه و تحليل احساسات گويندگان صرفاً بر اساس اطلاعات فلسفي پرداخته ايم." "ما دو رويكرد يادگيري ماشين را مقايسه مي كنيم ، يعني يك شبكه عصبي حلقوي (CNN) و يك ماشين بردار پشتيباني (SVM)."
محققان يك مدل CNN را در طيف سنجهاي خام و يك مدل SVM در مورد مجموعه اي از ويژگي هاي سطح پايين آموزش دادند. EMOVO ، SAVEE و EMO-DB هر دو مدل با استفاده از سه مجموعه داده گفتار احساسي كه به طور گسترده اي شناخته شده بودند ، آموزش داده شدند. اين مجموعه داده ها شامل عاطفي سخنراني ضبط شده به زبان ايتاليايي مختلف، انگليسي و آلماني است.
دو مدل يادگيري ماشيني براي شناخت چهار كلاس احساسات رايج آموزش داده شدند: خوشبختي ، غم ، عصبانيت و بي طرف. محققان براي هر روش يادگيري ماشين سه آزمايش انجام دادند كه در آن از يك مجموعه داده واحد براي آزمايش و دو مورد ديگر براي آموزش استفاده شده است.
محققان در مقاله خود نوشتند: "يك مشكل عمده ناشي از انتخاب مجموعه داده ها ، تفاوت زياد بين زبانها است ، زيرا علاوه بر تفاوت هاي زباني ، در نحوه بيان هر احساس نيز تفاوت بزرگي وجود دارد."
به طور كلي ، آنها دريافتند كه SVM بسيار بهتر از CNN عمل مي كند ، هنگامي كه روي داده هاي SAVEE و EMOVO آموزش داده ايد ، بهترين نتيجه را كسب مي كند ، اما در EMO-DB تست شده است. اين نتايج اميدواركننده اما بهينه نبود ، نشان مي دهد كه ما هنوز راه طولاني براي دستيابي به شناخت احساسي چند زبانه به طور مداوم مؤثر داريم.
محققان در مقاله خود نوشتند: "برنامه هاي ما براي كارهاي آينده شامل استفاده از مجموعه داده هاي بيشتر براي آموزش و ارزيابي است." وي گفت: "ما همچنين قصد داريم ساير شبكه هاي يادگيري عميق از قبل آموزش ديده را بررسي كنيم ، زيرا احساس مي كنيم يادگيري عميق مي تواند به طور چشمگيري در بروز اين مشكل كمك كند. سرانجام ، در ميان برنامه هاي ما استفاده از چنين رويكردهايي براي مشكلات زندگي واقعي است ، به عنوان مثال شناخت احساسات در آموزش و / يا برنامه هاي آموزشي. "
http://bookmark-dofollow.com/story6991068/پمپ-وكيوم-اصفهان
برچسب: ،