top of page

感謝訂閱!

商湯CVPR 2022再創佳績 技術創新解决行業痛點

商湯科技及聯合實驗室共71篇論文入選本屆全球人工智能計算機視覺領域頂級國際會議CVPR 2022(Computer Vision and Pattern Recognition),再創歷史新高,鞏固在計算機視覺研究領域的領跑勢頭。

CVPR於6月19日至23日在美國路易斯安那州新奧爾良舉行,並同步舉行線上會議。商湯及聯合實驗室的入選論文中,有接近四分之一獲錄用為口頭報告(Oral Presentation),涵蓋三維視覺、自動駕駛等多個備受關注的前沿研究領域和方向。

商湯及聯合實驗室已在各學術頂會發表論文超過700篇,贏得超過70個世界冠軍。商湯科技聯合創始人、研究院院長王曉剛博士表示:「我們希望通過為科研工作者提供高效科研的良好環境,鼓勵和引導年輕的研究者從解決業界實際問題角度出發,做高水平、高質量的研究。」

商湯科技聯合創始人、研究院院長王曉剛博士


在CVPR上,商湯科技還參與了多項學術競賽,取得矚目的成績。例如,商湯科技與中科院自動化所、上海人工智能實驗室聯合參加Embodied AI 2022,並在RxR-Habitat賽道奪冠。比賽要求用自然語言控制解決室內機器人的導航問題,商湯的方法達到90%以上效果提升,導航準確率從24.08%升至45.82%,導航保真度從37.39%升到55.43%。同時,在視覺編碼技術競賽CLIC(Challenge on Learned Image Compression)中,商湯也獲得圖像編碼賽道冠軍──不僅在全部三個測試碼點上取得了最佳主觀評測分數,還擁有深度學習方案中最快的解碼速度。

推動技術創新賦能產業


商湯科技鼓勵研究團隊關注產業需求和痛點,將研究與實際業務場景結合。依托SenseCore商湯AI大裝置等AI基礎設施的構建,商湯不但在前沿研究領域擁有了更強大的支撐,更進一步推動了與產業協同的深化。

例如在《Bailando: 3D Dance Generation via Actor-Critic GPT with Choreographic Memory》論文中,研究人員提出了一種新的音樂到舞蹈框架Bailando,它可以驅動3D角色跟隨音樂做出舞蹈動作,不僅能保證動作的標準與美感,還能在時間上保持與不同音樂節奏的一致性。當前,在AI、雲計算等技術能力提升的背景下,數碼人在社交、遊戲、直播、虛擬偶像等領域逐漸融入生活,此研究為未來數碼人產業帶來更智能化、具個性的人物塑造。

此外,隨著自動駕駛和激光雷達技術的發展,對點雲的目標跟蹤獲得更多關注。在論文《PTTR: Relational 3D Point Cloud Object Tracking with Transformer》中,商湯研究團隊針對點雲數據特有的挑戰和現有算法的缺陷,提出一個新穎的點雲跟蹤框架PTTR,在多個數據集上顯著提升了目標跟蹤的準確性,為自動駕駛的安全運行打下基礎。

點雲跟蹤框架PTTR示意圖

商湯科技還聯合北京航空航天大學劉祥龍教授團隊,共同舉辦了面向複雜場景的魯棒機器學習大賽—Robust Models towards Open-world Classification。比賽以推動安全可靠AI模型研究為目標,鼓勵打造更安全可靠的AI,支持AI技術可持續地發展。大賽共吸引286只隊伍、416位參賽者參加,並在6月19日於CVPR2022 Art of Robustness Workshop上正式公佈獲獎名單。

建設基礎設施與生態 助力成果落地


商湯科技通過不斷完善以SenseCore商湯AI大裝置為核心的軟硬件基礎設施,為技術研發和落地提供重要基礎支撐。研究人員能夠高效地進行科研,快速實驗並驗證新的想法,加速創新與迭代,由此促進了高水平論文的產生,並解決產業落地中的問題。

商湯還十分重視學術生態建設,2017年以來陸續與上海交通大學、南洋理工大學、浙江大學分別成立聯合研究院或實驗室、與清華大學建立「感知計算」產學研深度融合專項計劃,並推動成立全球人工智能高校學術聯盟。今年6月11日,商湯科技聯合全球高校人工智能學術聯盟成功舉辦「研無止境:商湯論文分享會」活動,匯聚來自商湯科技以及香港中文大學、浙江大學、南洋理工大學、北京大學等高校的研究學者嘉賓,在線解讀在3D視覺、姿態估計、底層視覺、表徵學習、場景理解等領域的8篇CVPR 2022 Oral 論文,分享商湯在實際場景中的研究問題及解決方案,以及交流寶貴學術經驗。

在CVPR期間舉辦了主題為《OpenMMLab:計算機視覺研究和生產基礎平台》的研討會


此外,商湯持續鞏固開源生態建設。基於決策智能的OpenDILab去年在WAIC大會進行了發佈,向學術和工業界開源。在大模型方向,商湯與上海人工智能實驗室及高校聯合發佈了通用視覺技術體系「書生」(INTERN),並開源了OpenGVLab,助力通用人工智能基礎研究和生態構建。今年,OpenMMLab還在CVPR期間舉辦了主題為《OpenMMLab:計算機視覺研究和生產基礎平台》的研討會,與學術界共同分享討論在OpenMMLab幫助下如何推動AI基礎研究,共建開源生態。

商湯憑藉基礎設施進一步完善,培育學術與開源生態,人工智能技術研究的基礎將能更為穩固、寬廣。

Comments


感謝訂閱!

© Quick Media Limited. 2021. All rights reserved.

大灣區商業科技專刊,是中國香港出版的商業科技新聞資訊平台,互連互通,覆蓋粵港澳大灣區市場。

編輯部:benny@gbamag.com

​合作查詢:marketing@gbamag.com

  • Facebook社交圖標
  • wechat logo
  • LinkedIn社交圖標
bottom of page