創(chuàng)澤機(jī)器人
CHUANGZE ROBOT
當(dāng)前位置:首頁 > 新聞資訊 > 機(jī)器人開發(fā) > 讓大規(guī)模深度學(xué)習(xí)訓(xùn)練線性加速、性能無損,基于BMUF的Adam優(yōu)化器并行化實(shí)踐

讓大規(guī)模深度學(xué)習(xí)訓(xùn)練線性加速、性能無損,基于BMUF的Adam優(yōu)化器并行化實(shí)踐

來源:AI科技大本營(yíng)     編輯:創(chuàng)澤   時(shí)間:2020/5/29   主題:其他 [加盟]

作為一種自適應(yīng)步長(zhǎng)隨機(jī)梯度優(yōu)化器,自2014年提出以來,Adam 算法便以其卓越的性能風(fēng)靡深度學(xué)習(xí)領(lǐng)域。為了提高應(yīng)用于訓(xùn)練大規(guī)模任務(wù)時(shí)的效率,該算法通常與同步隨機(jī)梯度(Synchronous Stochastic Gradient,SSG)技術(shù)相結(jié)合,采用數(shù)據(jù)并行(data parallel)的方式在多臺(tái)機(jī)器上執(zhí)行。在本文中,我們稱這一方法為 Sync-Adam。

本質(zhì)上來講,Sync-Adam 通過將一個(gè) minibatch 內(nèi)樣本的梯度計(jì)算分布到多臺(tái)機(jī)器上達(dá)到加速目的,因此通信十分頻繁,并且隨著并行機(jī)器數(shù)目增多,minibatch 內(nèi)樣本的數(shù)量也成比例增加,這種情況下,通常會(huì)損害最終得到的模型的性能。為解決基于 SSG 的 Adam 算法可擴(kuò)展性差的難題,我們把目光投向了逐區(qū)塊模型更新濾波(Blockwise Model-Update Filtering, BMUF)框架。

BMUF 是一種通信高效的通用分布式優(yōu)化算法框架,于2016年由微軟亞洲研究院語音組的研究人員提出并發(fā)表。該算法在多個(gè)并行工作機(jī)之間周期性同步模型更新信息,并與歷史更新信息相結(jié)合提升全局模型性能。與基于 SSG 的算法相比,BMUF 具有通信頻率較低、訓(xùn)練幾乎線性加速、模型性能基本無損的特點(diǎn)。這一算法已經(jīng)在工業(yè)界廣泛用于大規(guī)模深度學(xué)習(xí)模型的訓(xùn)練。

本文中,我們采用 BMUF 框架并行化 Adam 算法,并在微軟大規(guī)模 OCR 和語音產(chǎn)品數(shù)據(jù)集上進(jìn)行了測(cè)試。實(shí)驗(yàn)結(jié)果表明,在大規(guī)模 OCR 任務(wù)中,BMUF-Adam 在多達(dá)64機(jī)的并行訓(xùn)練中幾乎實(shí)現(xiàn)了線性加速的同時(shí),基本沒有模型性能損失,在32機(jī)大詞匯量連續(xù)語音識(shí)別任務(wù)中也獲得了類似效果。

接下來我們探討如何采用 BMUF 框架賦能 Adam 算法,在大規(guī)模深度學(xué)習(xí)任務(wù)上成就不凡。


在基于 BMUF 的訓(xùn)練框架下,假設(shè)我們總共有 N 個(gè)并行工作機(jī),一個(gè)工作機(jī)可以是一塊或多塊 GPU 卡,也可以是一個(gè)計(jì)算節(jié)點(diǎn)。給定一個(gè)包含 Nτ 個(gè) minibatch 的訓(xùn)練數(shù)據(jù)子集,首先我們將這些數(shù)據(jù)均勻分布到 N 個(gè)并行工作機(jī),每臺(tái)工作機(jī)獲得 τ 個(gè) minibatch。從一個(gè)共同的初始模型 θ_(t-τ)^((init)) 開始,N 個(gè)工作機(jī)獨(dú)立更新各自的局部模型 τ 步,得到 {θ_(t,1),θ_(t,2),…,θ_(t,N)},對(duì)局部模型取平均得到 θ ̅_t。這一過程稱之為數(shù)據(jù)塊內(nèi)并行優(yōu)化(Intra-Block Parallel Optimization, IBPO)。與直接將 θ ̅_t 作為全局模型不同,BMUF 技術(shù)將歷史更新信息與當(dāng)前更新信息結(jié)合,得到全局模型:






基于深度學(xué)習(xí)和傳統(tǒng)算法的人體姿態(tài)估計(jì),技術(shù)細(xì)節(jié)都講清楚了

人體姿態(tài)估計(jì)便是計(jì)算機(jī)視覺領(lǐng)域現(xiàn)有的熱點(diǎn)問題,其主要任務(wù)是讓機(jī)器自動(dòng)地檢測(cè)場(chǎng)景中的人“在哪里”和理解人在“干什么”

傳統(tǒng)目標(biāo)檢測(cè)算法對(duì)比

SIFT、PCA-SIFT、SURF 、ORB、 VJ 等目標(biāo)檢測(cè)算法優(yōu)缺點(diǎn)對(duì)比及使用場(chǎng)合比較

基于深度學(xué)習(xí)目標(biāo)檢測(cè)模型優(yōu)缺點(diǎn)對(duì)比

深度學(xué)習(xí)模型:OverFeat、R-CNN、SPP-Net、Fast、R-CNN、Faster、R-CNN、R-FCN、Mask、R-CNN、YOLO、SSD、YOLOv2、416、DSOD300、R-SSD

如何更高效地壓縮時(shí)序數(shù)據(jù)?基于深度強(qiáng)化學(xué)習(xí)的探索

大型商用時(shí)序數(shù)據(jù)壓縮的特性,提出了一種新的算法,分享用深度強(qiáng)化學(xué)習(xí)進(jìn)行數(shù)據(jù)壓縮的研究探索

滴滴機(jī)器學(xué)習(xí)平臺(tái)調(diào)度系統(tǒng)的演進(jìn)與K8s二次開發(fā)

滴滴機(jī)器學(xué)習(xí)場(chǎng)景下的 k8s 落地實(shí)踐與二次開發(fā)的技術(shù)實(shí)踐與經(jīng)驗(yàn),包括平臺(tái)穩(wěn)定性、易用性、利用率、平臺(tái) k8s 版本升級(jí)與二次開發(fā)等內(nèi)容

人工智能和機(jī)器學(xué)習(xí)之間的差異及其重要性

機(jī)器學(xué)習(xí)就是通過經(jīng)驗(yàn)來尋找它學(xué)習(xí)的模式,而人工智能是利用經(jīng)驗(yàn)來獲取知識(shí)和技能,并將這些知識(shí)應(yīng)用于新的環(huán)境

面向動(dòng)態(tài)記憶和學(xué)習(xí)功能的神經(jīng)電晶體可塑性研究

神經(jīng)形態(tài)結(jié)構(gòu)融合學(xué)習(xí)和記憶功能領(lǐng)域的研究主要集中在人工突觸的可塑性方面,同時(shí)神經(jīng)元膜的固有可塑性在神經(jīng)形態(tài)信息處理的實(shí)現(xiàn)中也很重要

CVPOS自助收銀的挑戰(zhàn)以及商品識(shí)別算法工程落地方法和經(jīng)驗(yàn)

針對(duì)結(jié)算收銀場(chǎng)景中商品識(shí)別的難點(diǎn),從商品識(shí)別落地中的模型選擇、數(shù)據(jù)挑選與標(biāo)注、前端和云端部署、模型改進(jìn)等方面,進(jìn)行了深入講解

內(nèi)容流量管理的關(guān)鍵技術(shù):多任務(wù)保量?jī)?yōu)化算法實(shí)踐

通過分析其中的關(guān)鍵問題,建立了新熱內(nèi)容曝光敏感模型,并最終給出一種曝光資源約束下的多目標(biāo)優(yōu)化保量框架與算法

百變應(yīng)用場(chǎng)景下,優(yōu)酷基于圖執(zhí)行引擎的算法服務(wù)框架筑造之路

優(yōu)酷推薦業(yè)務(wù),算法應(yīng)用場(chǎng)景眾多,需求靈活多變,需要一套通用業(yè)務(wù)框架,支持運(yùn)行時(shí)的算法流程的裝配,提升算法服務(wù)場(chǎng)景搭建的效率

餓了么推薦算法的演進(jìn)及在線學(xué)習(xí)實(shí)踐

餓了么算法專家劉金介紹推薦業(yè)務(wù)背景,包括推薦產(chǎn)品形態(tài)及算法優(yōu)化目標(biāo);然后是算法的演進(jìn)路線;最后重點(diǎn)介紹在線學(xué)習(xí)是如何在餓了么推薦領(lǐng)域?qū)嵺`的

拯救渣畫質(zhì),馬賽克圖秒變高清,杜克大學(xué)提出AI新算法

杜克大學(xué)的一種 AI 算法PULSE可以將模糊、無法識(shí)別的人臉圖像轉(zhuǎn)換成計(jì)算機(jī)生成的圖像,其細(xì)節(jié)比之前任何時(shí)候都更加精細(xì)、逼真
資料獲取
機(jī)器人開發(fā)
== 最新資訊 ==
ChatGPT:又一個(gè)“人形機(jī)器人”主題
ChatGPT快速流行,重構(gòu) AI 商業(yè)
中國(guó)機(jī)器視覺產(chǎn)業(yè)方面的政策
中國(guó)機(jī)器視覺產(chǎn)業(yè)聚焦于中國(guó)東部沿海地區(qū)(
從CHAT-GPT到生成式AI:人工智能
工信部等十七部門印發(fā)《機(jī)器人+應(yīng)用行動(dòng)實(shí)
全球人工智能企業(yè)市值/估值 TOP20
創(chuàng)澤智能機(jī)器人集團(tuán)股份有限公司第十一期上
諧波減速器和RV減速器比較
機(jī)器人減速器:諧波減速器和RV減速器
人形機(jī)器人技術(shù)難點(diǎn) 高精尖技術(shù)的綜合
機(jī)器人大規(guī)模商用面臨的痛點(diǎn)有四個(gè)方面
青島市機(jī)器人產(chǎn)業(yè)概況:機(jī)器人企業(yè)多布局在
六大機(jī)器人產(chǎn)業(yè)集群的特點(diǎn)
機(jī)械臂-高度非線性強(qiáng)耦合的復(fù)雜系統(tǒng)
== 機(jī)器人推薦 ==
迎賓講解服務(wù)機(jī)器人

服務(wù)機(jī)器人(迎賓、講解、導(dǎo)診...)

智能消毒機(jī)器人

智能消毒機(jī)器人

機(jī)器人開發(fā)平臺(tái)

機(jī)器人開發(fā)平臺(tái)


機(jī)器人招商 Disinfection Robot 機(jī)器人公司 機(jī)器人應(yīng)用 智能醫(yī)療 物聯(lián)網(wǎng) 機(jī)器人排名 機(jī)器人企業(yè) 機(jī)器人政策 教育機(jī)器人 迎賓機(jī)器人 機(jī)器人開發(fā) 獨(dú)角獸 消毒機(jī)器人品牌 消毒機(jī)器人 合理用藥 地圖
版權(quán)所有 創(chuàng)澤智能機(jī)器人集團(tuán)股份有限公司 中國(guó)運(yùn)營(yíng)中心:北京 清華科技園九號(hào)樓5層 中國(guó)生產(chǎn)中心:山東日照太原路71號(hào)
銷售1:4006-935-088 銷售2:4006-937-088 客服電話: 4008-128-728