強化學習研究 : 決策人工智慧超技能

  • 2018/12/08(土) 09:30(+0800) ( iCal/Outlook, Google カレンダー )
  • 台北市中山區松江路131號2F-1 (2樓教室) / 台北市中山區松江路131號2F
  • 廣宣學堂粉絲團、廣宣科技有限公司

廣宣學堂為您推出機器學習系列之 強化學習系列

近年來人工智慧的興起,AlphaGo 打敗棋王事件是一大關鍵,能夠對複雜的決策進行推估與修正,是人工智慧一個非常重要的關鍵技術。不管是 AlphaGo、自駕車系統、金融決策、推薦系統、甚至讓 AI 自己打遊戲 ,都少不了決策的關鍵能力。

強化學習 (Reinforcement Learning) 不但具備了類似人類的決策要素,也內含了人類在學習中的摸索過程。包含最佳策略(Policy)的計算、獎勵機制(Reward)的建立、能夠根據經驗擁有檢討過去、推演未來的行為特質。這幾年來,強化學習已經深入各種層面的決策應用,成為當今人工智慧開發的關鍵技能。

廣宣學堂特別邀請人工智慧領域知名,擁有豐富研究經歷、與具跨國業界資歷的講師,用其功力以精華、高效方式,帶領您能夠一次綜覽強化學習的各個重要議題與內容,並配合實作,讓學習更有感覺。絕對精采與值得一聽。把最好的投資,投資在自己身上,讓自己在專業勝人一籌 !

 

課程內容:

名師高品質教學、詳細研究、深入實作

一. 強化學習概論

環境因素與智慧代理人 / 策略與規劃(Policy and Planning) / 價值函數(Value Function) / 運作模型介紹 / 獎勵與懲罰機制 /最佳價值函數 /馬可夫決策問題(MDP)

二、深入強化學習

有限馬可夫決策處理(FMDP) / 動態規劃 / 蒙地卡羅方法(Monte Carlo Method) / 時間差分學習 / Q學習(Q-Learning) / 策略梯度法(Policy Gradient Method)

三、 深度強化學習

深度Q學習網路(DQN) / 演員評判家方法 (Actor Critic method) / deepmind 的 Deep Deterministic Policy Gradients(DDPG) / 從 AC 到 A3C /  Distributed Proximal Policy Optimization (DPPO)

四、Case Study :

1. AlphaGo原理講解

2. 問答推薦系統強化學習等

六小時精彩扼要課程、高手經驗、句句精華。(講師依學員實際狀況動態調整進度)

 

一般票 $3980 (熱賣中)
團體票 $2980 (兩人同行、限額划算價)
 
課程提醒
 
1.主辦單位得依報名人數狀況調整時間。
2.預計時段: 9:30~12:30 / 14:00~17:00 (準時開始,時段以當場狀況為準,中午自行用餐)。
3.自備筆電,建議充足電池。
4.為尊重智慧財產權,現場不開放錄音錄影,敬請配合。
5.課程十天內除天災、主辦單位異動外,恕不接受退費。
 
 
台北市中山區松江路131號2F-1 (2樓教室) / 台北市中山區松江路131號2F

イベントチケット

チケット種別 販売期間 価格
一般票

2018/11/26 13:31(+0800) ~ 2018/12/05 23:59(+0800) 販売終了
  • TWD$3,980
團體票 (限額額滿即止)

2018/11/01 00:00(+0800) ~ 2018/12/05 23:59(+0800) 販売終了
  • TWD$2,980
次へ