韩国主播福利视频一区二区三区,欧美视频二区36p,欧美日韩一区在线,亚洲字幕一区二区

 
當(dāng)前位置: 首頁 » 行業(yè)資訊 » 智能制造»從概念上看看智能機(jī)器人的新范式:深度強(qiáng)化學(xué)習(xí);
   

從概念上看看智能機(jī)器人的新范式:深度強(qiáng)化學(xué)習(xí);

 46.1K
     [點(diǎn)擊復(fù)制]
放大字體  縮小字體 發(fā)布日期:2016-08-30   瀏覽次數(shù):420
核心提示:近兩年機(jī)器智能取得重大突破,像圍棋九段高手李世石敗北Alpha Go,DeepMind團(tuán)隊(duì)研發(fā)的機(jī)器人在Atari多項(xiàng)游戲上超越人類水平。這
       近兩年機(jī)器智能取得重大突破,像圍棋九段高手李世石敗北Alpha Go,DeepMind團(tuán)隊(duì)研發(fā)的機(jī)器人在Atari多項(xiàng)游戲上超越人類水平。這些突破主要得益于從基于深度學(xué)習(xí)的視覺、語音、語義感知到動作反饋的激勵(lì)懲罰強(qiáng)化訓(xùn)練模式。本文從概念上分析深度強(qiáng)化學(xué)習(xí)的要點(diǎn),部分摘于ICML 2016 Tutorial里的Deep Reinforcement Learning[1]的報(bào)告。

  強(qiáng)化學(xué)習(xí),即機(jī)器人根據(jù)環(huán)境里動作得到的懲罰和激勵(lì)去自動調(diào)整策略。通過訓(xùn)練,機(jī)器人學(xué)到一組策略:在環(huán)境狀態(tài)S下應(yīng)采取動作A,(可)能獲得最大累積獎勵(lì)V。

  強(qiáng)化學(xué)習(xí)有豐富的交叉學(xué)科背景,包括經(jīng)濟(jì)學(xué)、工程學(xué)、神經(jīng)科學(xué)里的博弈論、優(yōu)化控制,條件反射系統(tǒng)。


       深度學(xué)習(xí),使用深度神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)機(jī)器人的記憶,視覺感知,語音語義理解和生成。

  深度強(qiáng)化學(xué)習(xí)以深度學(xué)習(xí)做感知,強(qiáng)化學(xué)習(xí)訓(xùn)練策略,并且以深度神經(jīng)網(wǎng)絡(luò)作為策略載體。相比于傳統(tǒng)的多模塊組合,深度強(qiáng)化學(xué)習(xí)實(shí)現(xiàn)了從感知到控制的端到端直接訓(xùn)練,減少了模塊間信息損失。

  最近兩年在學(xué)術(shù)理論上,GoogleDeepMind團(tuán)隊(duì)在連續(xù)性動作控制[2],異步訓(xùn)練[3],訓(xùn)練框架[4],分布式訓(xùn)練[5]等都有重要突破,為智能機(jī)器人的研發(fā)奠定理論和實(shí)踐基礎(chǔ)。

  在特定任務(wù)的應(yīng)用上,深度增強(qiáng)學(xué)習(xí)已有廣泛實(shí)踐嘗試,例如流水線機(jī)器人。

  在集成應(yīng)用上,深度強(qiáng)化學(xué)習(xí)在自動駕駛,聊天機(jī)器人[6][7]都有良好的前景。例如,使用分布式訓(xùn)練或異步訓(xùn)練,自動駕駛汽車可以多輛同時(shí)在各種環(huán)境學(xué)習(xí),并且相互交換知識,加速學(xué)習(xí)過程。聊天機(jī)器人可以通過對話過程中用戶的反饋來調(diào)整自己的語言表達(dá),逐步成長。

  深度強(qiáng)化學(xué)習(xí)為智能機(jī)器人提供了新的計(jì)算范式:提供環(huán)境、激勵(lì)和懲罰、神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)即可訓(xùn)練得到最大化獎勵(lì)的智能機(jī)器人。


 
 
 
[ 行業(yè)資訊搜索 ]  [ 加入收藏 ]  [ 告訴好友 ]  [ 打印本文 ]  [ 關(guān)閉窗口 ]
 
 
展會更多+
視頻更多+
點(diǎn)擊排行
 
網(wǎng)站首頁 | 網(wǎng)站地圖 | 排名推廣 | 廣告服務(wù) | 積分換禮 | 網(wǎng)站留言 | RSS訂閱
主站蜘蛛池模板: 台中县| 万源市| 邹城市| 宿迁市| 高青县| 墨江| 抚远县| 鄂伦春自治旗| 法库县| 阿巴嘎旗| 恩施市| 微山县| 通榆县| 繁昌县| 本溪市| 吕梁市| 中宁县| 靖边县| 洛川县| 突泉县| 南阳市| 双柏县| 林州市| 新津县| 乌拉特中旗| 红安县| 温宿县| 铅山县| 札达县| 三江| 仁怀市| 石家庄市| 班戈县| 永济市| 团风县| 长宁区| 三亚市| 鹤峰县| 沈丘县| 马公市| 资源县|