成人网18视频网站,qvod激情视频在线观看,色国产精品一区在线观看,久久99热国产这有精品,天天舔天天爽,国产日韩视频,伊人久久精品成人网

產(chǎn)品系列

行業(yè)應用

技術(shù)支持

關(guān)于創(chuàng )澤

創(chuàng )澤機器人

CHUANGZE ROBOT

當前位置：首頁(yè) > 新聞資訊 > 機器人開(kāi)發(fā) > 如何更G效地壓縮時(shí)序數據？基于深度強化學(xué)習的探索

如何更G效地壓縮時(shí)序數據？基于深度強化學(xué)習的探索

來(lái)源：阿里機器智能編輯：創(chuàng )澤時(shí)間：2020/6/4 主題：其他 [加盟]

隨著(zhù)移動(dòng)互聯(lián)網(wǎng)、IoT、5G 等的應用和普及，一步一步地我們走進(jìn)了數字經(jīng)濟時(shí)代。隨之而來(lái)的海量數據將是一種客觀(guān)的存在，并發(fā)揮出越來(lái)越重要的作用。時(shí)序數據是海量數據中的一個(gè)重要組成部分，除了挖掘分析預測等，如何G效的壓縮存儲是一個(gè)基礎且重要的課題。同時(shí)，我們也正處在人工智能時(shí)代，深度學(xué)習已經(jīng)有了很多很好的應用，如何在更多更廣的層面發(fā)揮作用？本文總結了當前學(xué)術(shù)界和工業(yè)界數據壓縮的方法，分析了大型商用時(shí)序數據壓縮的特性，提出了一種新的算法，分享用深度強化學(xué)習進(jìn)行數據壓縮的研究探索及取得的成果。

深度學(xué)習的本質(zhì)是做決策，用它解決具體的問(wèn)題時(shí)很重要的是找到契合點(diǎn)，合理建模，然后整理數據優(yōu)化 loss 等終較好地解決問(wèn)題。在過(guò)去的一段時(shí)間，我們在用深度強化學(xué)習進(jìn)行數據壓縮上做了一些研究探索并取得了一些成績(jì)，已經(jīng)在 ICDE 2020 research track 發(fā)表（Two-level Data Compression using Machine Learning in Time Series Database）并做了口頭匯報。在這里做一個(gè)整體粗略介紹，希望對其它的場(chǎng)景，至少是其它數據的壓縮等，帶來(lái)一點(diǎn)借鑒作用。

背景描述

1 時(shí)序數據

時(shí)序數據顧名思義指的是和時(shí)間序列相關(guān)的數據，是日常隨處可見(jiàn)的一種數據形式。下圖羅列了三個(gè)示例：a）心電圖，b）股票指數，c）具體股票交易數據。

關(guān)于時(shí)序數據庫的工作內容，簡(jiǎn)略地，在用戶(hù)的使用層面它需要響應海量的查詢(xún)，分析，預測等；而在底層它則需要處理海量的讀寫(xiě)，壓縮解壓縮，采用聚合等操作，而這些的基本操作單元就是時(shí)序數據 <timestamp, value>，一般（也可以簡(jiǎn)化）用兩個(gè) 8 byte 的值進(jìn)行統一描述。

可以想象，任何電子設備每天都在產(chǎn)生各種各樣海量的時(shí)序數據，需要海量的存儲空間等，對它進(jìn)行壓縮存儲及處理是一個(gè)自然而然的方法。而這里的著(zhù)重點(diǎn)就是如何進(jìn)行更G效的壓縮。

2 強化學(xué)習

機器學(xué)習按照樣本是否有 groundTruth 可分為有監督學(xué)習，無(wú)監督學(xué)習，以及強化學(xué)習等。強化學(xué)習顧名思義是不停地努力地去學(xué)習，不需要 groundTruth，真實(shí)世界很多時(shí)候也沒(méi)有 groundTruth，譬如人的認知很多時(shí)候就是不斷迭代學(xué)習的過(guò)程。從這個(gè)意義上來(lái)說(shuō)，強化學(xué)習是更符合或更多面普遍的一種處理現實(shí)世界問(wèn)題的過(guò)程和方法，所以有個(gè)說(shuō)法是：如果深度學(xué)習慢慢地會(huì )像 C/Python/Java 那樣成為解決具體問(wèn)題的一個(gè)基礎工具的話(huà)，那么強化學(xué)習是深度學(xué)習的一個(gè)基礎工具。

強化學(xué)習的經(jīng)典示意圖如下，基本要素為 State，Action，和 Environment�；具^(guò)程為：Environment 給出 State，Agent 根據 state 做 Action 決策，Action 作用在 Environment 上產(chǎn)生新的 State 及 reward，其中 reward 用來(lái)指導 Agent 做出更好的 Action 決策，循環(huán)往復….

而常見(jiàn)的有監督學(xué)習則簡(jiǎn)單很多，可以認為是強化學(xué)習的一種特殊情況，目標很清晰就是 groudTruth，因此對應的 reward 也比較清晰。

強化學(xué)習按照個(gè)人理解可以歸納為以下三大類(lèi)：

1）DQN

Deep Q network，比較符合人的直觀(guān)感受邏輯的一種類(lèi)型，它會(huì )訓練一個(gè)評估 Q-value 的網(wǎng)絡(luò )，對任一 state 能給出各個(gè) Action 的 reward，然后終選擇 reward 大的那個(gè) action 進(jìn)行操作即可。訓練過(guò)程通過(guò)評估 “估計的 Q-value” 和 “真正得到的 Q-value” 的結果進(jìn)行反向傳遞，終讓網(wǎng)絡(luò )估計 Q-value 越來(lái)越準。

2）Policy Gradient

是更加端到端的一種類(lèi)型，訓練一個(gè)網(wǎng)絡(luò )，對任一 state 直接給出終的 action。DQN 的適用范圍需要連續 state 的 Q-value 也比較連續（下圍棋等不適用這種情況），而 Policy Gradient 由于忽略?xún)炔窟^(guò)程直接給出 action，具有更大的普適性。但它的缺點(diǎn)是更難以評價(jià)及收斂。一般的訓練過(guò)程是：對某一 state，同時(shí)隨機的采取多種 action，評價(jià)各種 action 的結果進(jìn)行反向傳遞，終讓網(wǎng)絡(luò )輸出效果更好的 action。

3）Actor-Critic

試著(zhù)糅合前面兩種網(wǎng)絡(luò )，取長(cháng)補短，一方面用 policy Gradient 網(wǎng)絡(luò )進(jìn)行任一 state 的 action 輸出，另外一方面用 DQN 網(wǎng)絡(luò )對 policy gradient 的 action 輸出進(jìn)行較好的量化評價(jià)并以之來(lái)指導 policy gradient 的更新。如名字所示，就像表演者和評論家的關(guān)系。訓練過(guò)程需要同時(shí)訓練 actor（policy Graident）和 critic（QN）網(wǎng)絡(luò )，但 actor 的訓練只需要 follow critic 的指引就好。它有很多的變種，也是當前 DRL 理論研究上不停發(fā)展的主要方向。

時(shí)序數據的壓縮

對海量的時(shí)序數據進(jìn)行壓縮是顯而易見(jiàn)的一個(gè)事情，因此在學(xué)術(shù)界和工業(yè)界也有很多的研究和探索，一些方法有：

Snappy：對整數或字符串進(jìn)行壓縮，主要用了長(cháng)距離預測和游程編碼（RLE），廣泛的應用包括 Infuxdb。

Simple8b：先對數據進(jìn)行前后 delta 處理，如果相同用RLE編碼；否則根據一張有 16 個(gè) entry 的碼表把 1 到 240 個(gè)數（每個(gè)數的 bits 根據碼表）pack 到 8B 為單位的數據中，有廣泛的應用包括 Infuxdb。

Compression planner：引入了一些 general 的壓縮 tool 如 scale, delta, dictionary, huffman, run length 和 patched constant 等，然后提出了用靜態(tài)的或動(dòng)態(tài)辦法組合嘗試這些工具來(lái)進(jìn)行壓縮；想法挺新穎但實(shí)際性能會(huì )是個(gè)問(wèn)題。

ModelarDB：側重在有損壓縮，基于用戶(hù)給定的可容忍損失進(jìn)行壓縮�；舅枷胧前丫S護一個(gè)小 buff，探測單前數據是否符合某種模式（斜率的直線(xiàn)擬合），如果不成功，切換模式重新開(kāi)始buff等；對支持有損的 IoT L域比較合適。

Sprintz：也是在 IoT L域效果會(huì )比較好，側重在 8/16 bit 的整數處理；主要用了 scale 進(jìn)行預測然后用 RLC 進(jìn)行差值編碼并做 bit-level 的 packing。

Gorilla：應用在 Facebook G吞吐實(shí)時(shí)系統中的當時(shí) sofa 的壓縮算法，進(jìn)行無(wú)損壓縮，廣泛適用于 IoT 和云端服務(wù)等各個(gè)L域。它引入 delta-of-delta 對時(shí)間戳進(jìn)行處理，用 xor 對數據進(jìn)行變換然后用 Huffman 編碼及 bit-packing。示例圖如下所示。

MO：類(lèi)似 Gorilla，但去掉了 bit-packing，所有的數據操作基本都是字節對齊，降低了壓縮率但提供了處理性能。

滴滴機器學(xué)習平臺調度系統的演進(jìn)與K8s二次開(kāi)發(fā)

滴滴機器學(xué)習場(chǎng)景下的 k8s 落地實(shí)踐與二次開(kāi)發(fā)的技術(shù)實(shí)踐與經(jīng)驗，包括平臺穩定性、易用性、利用率、平臺 k8s 版本升級與二次開(kāi)發(fā)等內容

人工智能和機器學(xué)習之間的差異及其重要性

機器學(xué)習就是通過(guò)經(jīng)驗來(lái)尋找它學(xué)習的模式，而人工智能是利用經(jīng)驗來(lái)獲取知識和技能，并將這些知識應用于新的環(huán)境

面向動(dòng)態(tài)記憶和學(xué)習功能的神經(jīng)電晶體可塑性研究

神經(jīng)形態(tài)結構融合學(xué)習和記憶功能L域的研究主要集中在人工突觸的可塑性方面，同時(shí)神經(jīng)元膜的固有可塑性在神經(jīng)形態(tài)信息處理的實(shí)現中也很重要

CVPOS自助收銀的挑戰以及商品識別算法工程落地方法和經(jīng)驗

針對結算收銀場(chǎng)景中商品識別的難點(diǎn)，從商品識別落地中的模型選擇、數據挑選與標注、前端和云端部署、模型改進(jìn)等方面，進(jìn)行了深入講解

內容流量管理的關(guān)鍵技術(shù)：多任務(wù)保量?jì)?yōu)化算法實(shí)踐

通過(guò)分析其中的關(guān)鍵問(wèn)題，建立了新熱內容曝光敏感模型，并終給出一種曝光資源約束下的多目標優(yōu)化保量框架與算法

百變應用場(chǎng)景下，優(yōu)酷基于圖執行引擎的算法服務(wù)框架筑造之路

優(yōu)酷推薦業(yè)務(wù)，算法應用場(chǎng)景眾多，需求靈活多變，需要一套通用業(yè)務(wù)框架，支持運行時(shí)的算法流程的裝配，提升算法服務(wù)場(chǎng)景搭建的效率

餓了么推薦算法的演進(jìn)及在線(xiàn)學(xué)習實(shí)踐

餓了么算法專(zhuān)家劉金介紹推薦業(yè)務(wù)背景，包括推薦產(chǎn)品形態(tài)及算法優(yōu)化目標；然后是算法的演進(jìn)路線(xiàn)；后重點(diǎn)介紹在線(xiàn)學(xué)習是如何在餓了么推薦L域實(shí)踐的

拯救渣畫(huà)質(zhì)，馬賽克圖秒變G清，杜克大學(xué)提出AI新算法

杜克大學(xué)的一種 AI 算法PULSE可以將模糊、無(wú)法識別的人臉圖像轉換成計算機生成的圖像，其細節比之前任何時(shí)候都更加精細、逼真

如何搭建一個(gè)GPU加速的分布式機器學(xué)習系統，遇到的問(wèn)題和解決方法

能快速將現有算法在實(shí)際生產(chǎn)環(huán)境落地，并能利用GPU加速實(shí)現大規模計算，我們自己搭建了一個(gè)GPU加速的大規模分布式機器學(xué)習系統，取名小諸葛

ICRA2020論文分享：基于視觸融合感知的可形變物體抓取狀態(tài)評估

人類(lèi)可以通過(guò)視覺(jué)和觸覺(jué)融合感知快速確定抓取可變形物體所需力的大小，以防止其發(fā)生滑動(dòng)或過(guò)度形變，但這對于機器人來(lái)說(shuō)仍然是一個(gè)具有挑戰性的問(wèn)題

一種基于層次強化學(xué)習的機械手魯棒操作

在底層通過(guò)使用基于模型的操作單元，保證了手指與物體之間持續穩定的抓��；在中層使用強化學(xué)習進(jìn)行規劃，從而實(shí)現較長(cháng)和復雜的手內操作流程

移動(dòng)機器人Wang利用深度強化學(xué)習算法和視覺(jué)感知相結合的方法完成非結構環(huán)境下的移動(dòng)

中科院沈陽(yáng)自動(dòng)化所的Wang利用深度強化學(xué)習算法和視覺(jué)感知相結合的方法來(lái)完成移動(dòng)機器人在非結構環(huán)境下的移動(dòng)操作

資料獲取

機器人開(kāi)發(fā)

== 資訊 ==

ChatGPT：又一個(gè)“人形機器人”主題

ChatGPT快速流行，重構 AI 商業(yè)

中國機器視覺(jué)產(chǎn)業(yè)方面的政策

中國機器視覺(jué)產(chǎn)業(yè)聚焦于中國東部沿海地區(

從CHAT-GPT到生成式AI：人工智能

工信部等十七部門(mén)印發(fā)《機器人+應用行動(dòng)實(shí)

人工智能企業(yè)市值/估值 TOP20

創(chuàng )澤智能機器人集團股份有限公司第十一期上

諧波減速器和RV減速器比較

機器人減速器：諧波減速器和RV減速器

人形機器人技術(shù)難點(diǎn) G精尖技術(shù)的綜合

機器人大規模商用面臨的痛點(diǎn)有四個(gè)方面

青島市機器人產(chǎn)業(yè)概況：機器人企業(yè)多布局在

六大機器人產(chǎn)業(yè)集群的特點(diǎn)

機械臂-G度非線(xiàn)性強耦合的復雜系統

== 機器人推薦 ==

迎賓講解服務(wù)機器人

服務(wù)機器人(迎賓、講解、導診...)

智能消毒機器人

智能消毒機器人

機器人開(kāi)發(fā)平臺

機器人開(kāi)發(fā)平臺

機器人招商 Disinfection Robot 機器人公司機器人應用智能醫療物聯(lián)網(wǎng) 機器人排名機器人企業(yè) 機器人政策教育機器人迎賓機器人機器人開(kāi)發(fā) 獨角獸消毒機器人品牌消毒機器人合理用藥地圖

版權所有 創(chuàng )澤智能機器人集團股份有限公司 中國運營(yíng)中心：北京清華科技園九號樓5層中國生產(chǎn)中心：山東日照太原路71號
銷(xiāo)售1：4006-935-088 銷(xiāo)售2：4006-937-088 客服電話(huà)： 4008-128-728