三維不規則數據常常出現在許多L域的研究中,比如社會(huì )科學(xué)中的社會(huì )網(wǎng)絡(luò )、大腦成像中的功能網(wǎng)絡(luò ),又或者在我們接下來(lái)要提到的研究三維形狀的計算機圖形學(xué)中,這樣的不規則數據在現實(shí)生活中幾乎是無(wú)處不在的。
近年來(lái),基于這種三維不規則數據的深度學(xué)習發(fā)展迅速,而圖卷積神經(jīng)網(wǎng)絡(luò )應對三維不規則數據的表現尤為突出[2]。
在計算機圖形學(xué)中,為了虛擬化真實(shí)世界的物體(如人或者動(dòng)物等),三維形狀通常需要離散化為網(wǎng)格(mesh),用于真實(shí)感渲染。但是,因為設備的差異或采集方式的不同,很難針對單個(gè)三維形狀得到的相同的離散化方式(固定的分辨率和連接關(guān)系)。這種同一個(gè)形狀具有不同的離散化方式是計算機圖形學(xué)有別于其他學(xué)科的一個(gè)重要特點(diǎn),而現有的圖神經(jīng)網(wǎng)絡(luò )無(wú)法有效統一不同離散化下的特征,這J大地限制了圖神經(jīng)網(wǎng)絡(luò )在圖形學(xué)L域的發(fā)展。
那么,如何解決這一問(wèn)題呢?
自動(dòng)化所團隊提出了一種新穎的多尺度圖卷積神經(jīng)網(wǎng)絡(luò ),重點(diǎn)解決了傳統圖卷積神經(jīng)網(wǎng)絡(luò )中圖節點(diǎn)學(xué)習到的特征對圖分辨率和連接關(guān)系敏感的問(wèn)題。該方法可以實(shí)現在低分辨率的三維形狀上學(xué)習特征,在G低分辨率形狀之上進(jìn)行測試,并且保持不同分辨率特征的一致性。
01 研究背景
傳統的圖卷積神經(jīng)網(wǎng)絡(luò )通常聚集1-鄰域(GCN),k-環(huán)鄰域(ChebyGCN)或k-近鄰鄰域(DGCNN)的信息,所以其感受野與分辨率或者圖連接關(guān)系是相關(guān)的。也就是說(shuō),在三維形狀的不同離散化下,卷積的感受野對應的形狀語(yǔ)義范圍產(chǎn)生了較大的變化。如何解決這種卷積方式未考慮到針對不同離散化情況所產(chǎn)生的問(wèn)題,存在較大的挑戰。
02 方法簡(jiǎn)述
為解決現有圖卷積神經(jīng)網(wǎng)絡(luò )的問(wèn)題,團隊設計了一種多尺度圖卷積神經(jīng)網(wǎng)絡(luò )(multiscale graph convolutional network,MGCN)。如圖1所示,我們發(fā)現,針對不同分辨率和連接關(guān)系的離散化,三維圖譜小波函數表現出J佳的魯棒性,并且不需要計算測地距離。因此,我們設計將多尺度的小波函數嵌入到圖卷積神經(jīng)網(wǎng)絡(luò )的學(xué)習當中。

2020年5月底OpenAI發(fā)布了有史以來(lái)強的NLP預訓練模型GPT-3,大的GPT-3模型參數達到了1750億個(gè)參數
達摩院金榕教授介紹了語(yǔ)音、自然語(yǔ)言處理、計算機視覺(jué)三大核心AI技術(shù)的關(guān)鍵進(jìn)展,并就AI技術(shù)在在實(shí)際應用中的關(guān)鍵挑戰,以及達摩院應對挑戰的創(chuàng )新實(shí)踐進(jìn)行了解讀
新一代移動(dòng)端深度學(xué)習推理框架TNN,通過(guò)底層技術(shù)優(yōu)化實(shí)現在多個(gè)不同平臺的輕量部署落地,性能優(yōu)異、簡(jiǎn)單易用。騰訊方面稱(chēng),基于TNN,開(kāi)發(fā)者能夠輕松將深度學(xué)習算法移植到手機端G效的執行,開(kāi)發(fā)出人工智能 App,真正將 AI 帶到指尖
新加坡國立大學(xué)NExT中心的王翔博士分析了知識圖譜在個(gè)性化推薦L域的應用背景,并詳細介紹了課題組在個(gè)性化推薦中的相關(guān)研究技術(shù)和進(jìn)展,包括基于路徑、基于表征學(xué)習、基于圖神經(jīng)網(wǎng)絡(luò )等知識圖譜在推薦系統中的融合技術(shù)
根據各種指法的具體特點(diǎn),對時(shí)頻網(wǎng)格圖、時(shí)域網(wǎng)格圖、頻域網(wǎng)格圖劃分出若干個(gè)不同的計算區域,并以每個(gè)計算區域的均值與標準差作為指法自動(dòng)識別的特征使用,用于基于機器學(xué)習方法的指法自動(dòng)識別
Tube Feature Aggregation Network(TFAN)新方法,即利用時(shí)序信息來(lái)輔助當前幀的遮擋行人檢測,目前該方法已在 Caltech 和 NightOwls 兩個(gè)數據集取得了業(yè)界L先的準確率
姚霆指出,當前的多模態(tài)技術(shù)還是屬于狹隘的單任務(wù)學(xué)習,整個(gè)訓練和測試的過(guò)程都是在封閉和靜態(tài)的環(huán)境下進(jìn)行,這就和真實(shí)世界中開(kāi)放動(dòng)態(tài)的應用場(chǎng)景存在一定的差異性
優(yōu)酷智能檔突破“傳統自適應碼率算法”的局限,解決視頻觀(guān)看體驗中G清和流暢的矛盾
通過(guò)使用仿真和量化指標,使基準測試能夠通用于許多操作L域,但又足夠具體,能夠提供系統的有關(guān)信息
基于內容圖譜結構化特征與索引更新平臺,在結構化方面打破傳統的數倉建模方式,以知識化、業(yè)務(wù)化、服務(wù)化為視角進(jìn)行數據平臺化建設,來(lái)沉淀內容、行為、關(guān)系圖譜,目前在優(yōu)酷搜索、票票、大麥等場(chǎng)景開(kāi)始進(jìn)行應用
NVIDIA解決方案架構師王閃閃講解了BERT模型原理及其成就,NVIDIA開(kāi)發(fā)的Megatron-BERT
自然語(yǔ)言處理技術(shù)的應用和研究L域發(fā)生了許多有意義的標志性事件,技術(shù)進(jìn)展方面主要體現在預訓練語(yǔ)言模型、跨語(yǔ)言 NLP/無(wú)監督機器翻譯、知識圖譜發(fā)展 + 對話(huà)技術(shù)融合、智能人機交互、平臺廠(chǎng)商整合AI產(chǎn)品線(xiàn)