近日,第十五屆亞洲計算機視覺學術會議ACCV 2020(Asian Conference on Computer Vision)國際細粒度網絡圖像識別賽公布最終成績,網易AI Lab以71.4%的準確率擊敗了來自全球的569個頂尖計算機視覺團隊,從超過1000份方案中脫穎而出,一舉斬獲大賽冠軍。這是網易AI Lab繼語音、自然語言處理(NLP)等領域大賽奪冠之后,在計算機視覺領域的又一突破,彰顯了網易AI Lab在人工智能領域的綜合技術實力。
(網易AI Lab榮獲ACCV 2020國際細粒度網絡圖像識別賽第一名的獎狀)
ACCV是國際計算機視覺領域的重要學術會議之一,每兩年舉辦一次,吸引來自全球的一流學者、研究者和開發(fā)者參與,共同探討計算機視覺領域的前瞻學術研究與應用。本次ACCV 2020國際細粒度網絡圖像識別賽,主要目的在于使用網絡數據訓練細粒度識別模型,減輕細粒度識別任務對大規(guī)模有標簽訓練數據的依賴,以增強模型算法的實用性和擴展性。
此次競賽的數據集規(guī)模巨大,訓練數據集包含557169張圖片,測試數據集包含100000張圖片,涵蓋各類動植物,共計5000個類別。所有數據來自網絡,未經人工標注,因此包含大量噪聲和錯誤數據,且數據存在長尾分布現象,導致不同類別樣本可能同時存在欠擬合和過擬合等問題,對參賽選手提出了巨大挑戰(zhàn)。而網易AI Lab提出了一種基于類別平衡的去噪方法,配合基于BBN的原創(chuàng)模型訓練方案,無需過度依賴高質量的標注數據,能夠直接從網絡數據中獲得更好的模型表達能力。比賽采用準確率(accuracy)作為評測指標,網易AI Lab解決方案的accuracy達到71.4%,遠超過比賽方所提供的基線模型(accuracy=41.905%)。
細粒度圖像識別不同于通用圖像分析任務,需要對屬于同一基礎類別的圖像進行更加細致的子類劃分,因此對模型的要求更高、難度更大。而現有深度學習方法通常需要依賴大規(guī)模高質量標注數據,其獲取難度較高且成本高昂,一定程度上限制了現實場景下的應用。網易AI Lab在此次競賽中使用的原創(chuàng)模型,能夠在面對大量低質量樣本的情況下,快速找到適用于特定場景的解決方案,降低了圖像識別對于人工標注的依賴,為通用物品識別、圖像或視頻標簽等應用場景落地帶來了更多可能性。
成立于2017年的網易AI Lab,目前在計算機視覺研究領域有著豐富的技術累積,在落地應用上也擁有著諸多的實踐經驗。此前,網易AI Lab圖像識別技術已成功應用于敏感內容審核、游戲反外掛、人臉屬性識別、手勢識別等場景。
【免責聲明】本文僅代表合作供稿方觀點,不代表和訊網立場。投資者據此操作,風險請自擔。
最新評論