視頻搜索是涉及信息檢索、自然語(yǔ)言處理(NLP)、機器學(xué)習、計算機視覺(jué)(CV)等多L域的綜合應用場(chǎng)景,隨著(zhù)深度學(xué)習在這些L域的長(cháng)足進(jìn)展以及用戶(hù)對視頻生產(chǎn)和消費的廣泛需求,視頻搜索技術(shù)的發(fā)展在學(xué)術(shù)和工業(yè)界都取得了飛速的發(fā)展。
考慮到大家來(lái)自不同的業(yè)務(wù)L域和技術(shù)方向,我會(huì )先簡(jiǎn)單介紹優(yōu)酷視頻搜索的業(yè)務(wù)背景,同時(shí)快速介紹搜索的基本評估指標、搜索系統的算法框架以及相關(guān)性和排序模型,讓大家對視頻搜索有一個(gè)更多面的認識,后面重點(diǎn)介紹多模態(tài)視頻搜索相關(guān)技術(shù)。
驅動(dòng)系統由4個(gè)200W無(wú)刷直流電機構成,通過(guò)50:1的空心軸減速機可以最高達2m/s的速度在玉米、高粱等農作物的地里前進(jìn)
通過(guò)2D激光雷達信息采用Hector SLAM實(shí)現機器人對地圖的感知和自主導航規劃,通過(guò)頂部的RGB-D相機采集目標物體深度和RGB圖像信息
機器人的學(xué)習分為三個(gè)部分的軌跡預測包括示教者的手部運動(dòng)軌跡、示教者的身體移動(dòng)軌跡以及被操作物體的運動(dòng)軌跡
Cosero是德國波恩大學(xué)的Sven Behnke團隊根據家庭環(huán)境中的日常操作任務(wù)而研制的一款仿人操作機器人基于深度學(xué)習方法的目標姿態(tài)估計和RGB-D SLAM等感知測量
機器人、無(wú)人機、自動(dòng)駕駛汽車(chē)等加快落地,智慧城市深入建設,更是為傳感器產(chǎn)業(yè)帶來(lái)了難以估量的龐大機遇
中國移動(dòng)聯(lián)合產(chǎn)業(yè)合作伙伴發(fā)布《室內定位白皮書(shū)》,對室內定位產(chǎn)業(yè)發(fā)展現狀及面臨的挑戰,深入分析了垂直行業(yè)的室內定位需求,并詳細闡述了實(shí)現室內定位的技術(shù)原理, 及室內定位評測體系
下一個(gè)十年,智能人機交互、多模態(tài)融合、結合領(lǐng)域需求的 NLP 解決方案建設、知識圖譜結合落地場(chǎng)景等將會(huì )有突破性變化
自然語(yǔ)言處理技術(shù)的應用和研究領(lǐng)域發(fā)生了許多有意義的標志性事件,技術(shù)進(jìn)展方面主要體現在預訓練語(yǔ)言模型、跨語(yǔ)言 NLP/無(wú)監督機器翻譯、知識圖譜發(fā)展 + 對話(huà)技術(shù)融合、智能人機交互、平臺廠(chǎng)商整合AI產(chǎn)品線(xiàn)
NVIDIA解決方案架構師王閃閃講解了BERT模型原理及其成就,NVIDIA開(kāi)發(fā)的Megatron-BERT
基于內容圖譜結構化特征與索引更新平臺,在結構化方面打破傳統的數倉建模方式,以知識化、業(yè)務(wù)化、服務(wù)化為視角進(jìn)行數據平臺化建設,來(lái)沉淀內容、行為、關(guān)系圖譜,目前在優(yōu)酷搜索、票票、大麥等場(chǎng)景開(kāi)始進(jìn)行應用
通過(guò)使用仿真和量化指標,使基準測試能夠通用于許多操作領(lǐng)域,但又足夠具體,能夠提供系統的有關(guān)信息
優(yōu)酷智能檔突破“傳統自適應碼率算法”的局限,解決視頻觀(guān)看體驗中高清和流暢的矛盾