近日,由度小滿博士后科研工作站朱文靜、李祥兩位博士后共同撰寫的GLAM論文:Speech Emotion Recognition with Global-Aware Fusion on Multi-scale Feature Representation(“基于多尺度特征表示的全局感知融合語音情感識別”)入選了國際音頻頂級會議ICASSP。
ICASSP是全球最大、最全面的信號處理及應(yīng)用方面的頂級會議,已經(jīng)擁有幾十年的歷史。作為IEEE(電子技術(shù)與信息科學(xué)工程師協(xié)會) 的一個重要會議,其論文還經(jīng)常被三大檢索工具檢索。該會議對于信號處理方面的學(xué)術(shù)人士有著重要意義。它涵蓋了音頻和聲學(xué)信號處理,圖像、視頻和多維信號處理,物聯(lián)網(wǎng)的信號處理等至少十六個方向。
在本論文中,朱文靜提出了全新的神經(jīng)網(wǎng)絡(luò)GLobal-Aware Multi-scale(GLAM),GLAM網(wǎng)絡(luò)是根據(jù)語音獨(dú)有的特征形式設(shè)計(jì)出的模型,在IEMOCAP基準(zhǔn)數(shù)據(jù)集上,超越了當(dāng)前最新技術(shù)。通過全局感知的融合模塊來學(xué)習(xí)多尺度特征表征,并將此加入到情感信息中,這就解決了以往卷積神經(jīng)網(wǎng)絡(luò)(CNN)方法在SER上的局限性,即不同尺度的豐富情感特征和重要的全局信息無法被很好地捕捉。該模型有望應(yīng)用到客服場景中,降低人工客服的溝通成本的同時,提升用戶體驗(yàn)。
據(jù)悉,朱文靜、李祥兩位博士后在進(jìn)站后的研究均聚焦在情感計(jì)算,探索其在用戶情緒感知、情緒原因溯源和情緒合理應(yīng)對這三個方面的研究價值。
目前,情感計(jì)算在金融領(lǐng)域的應(yīng)用,已經(jīng)起到了保駕護(hù)航、提高效率的作用。例如在動態(tài)對話過程中,觀察出用戶關(guān)鍵標(biāo)簽信息:所處領(lǐng)域、職業(yè),以及借款用途等,在這樣一張用戶畫像之下,預(yù)測出客戶的還款、續(xù)保意愿或者對商品購買意向等。也可以通過對用戶表情、語音、語速、行文、文本等信息,綜合判斷出貸款的客戶是否存在欺詐行為,對減少壞賬提供了不少便利。
【免責(zé)聲明】本文僅代表第三方觀點(diǎn),不代表和訊網(wǎng)立場。投資者據(jù)此操作,風(fēng)險(xiǎn)請自擔(dān)。
最新評論