機器決策技能 : 強化學習概論

  • 2019/09/21(Sat) 09:30(+0800) ( iCal/Outlook, Google Calendar )
  • 台北市中山區松江路131號(2樓教室) / 台北市中山區松江路131號
  • 廣宣學堂
Organizer 廣宣學堂

 

廣宣學堂為您推出機器學習系列之 強化學習系列

強化學習 (Reinforcement Learning) 是一個有趣而充滿潛力的領域,其演算法具備了類似人類的決策要素,也內含了人類在學習中的摸索過程,能計算最佳策略、能建立獎勵機制、能根據已存有的經驗檢討過去、推演未來。近年來日益火紅,強化學習已經在各種決策應用有很突出的表現 (如 Deepmind 最火紅的 AlphaCraft、以及過去很成功的 AlphaGo),目前是人工智慧一個受人矚目而且充滿潛力的領域。

廣宣學堂特約講師為在人工智慧領域擁有堅實理論背景、又在國外知名數據公司擁有實戰經驗的洪博士,以精華、高效方式,帶領您一次跨入強化學習的各個重要議題與內容,並且配合實作,讓學習更有收穫。投資自己的競爭力,在專業上多人一步、勝人一籌 !

 

 

課程內容:

六小時名師高品質教學、詳細研究、精華一次吸收

9/21 (六) 9:30~12:30 / 13:30~16:30  (準時開始,時段以當場狀況為準,中午自行用餐)

一. 強化學習概論

環境因素與智慧代理人 / 策略與規劃(Policy and Planning) / 價值函數(Value Function) / 運作模型介紹 / 獎勵與懲罰機制 /最佳價值函數 /馬可夫決策問題(MDP)

二、深入強化學習

有限馬可夫決策處理(FMDP) / 動態規劃 / 蒙地卡羅方法(Monte Carlo Method) / 時間差分學習 / Q學習(Q-Learning) / 策略梯度法(Policy Gradient Method)

三、 深度強化學習

深度Q學習網路(DQN) / 演員評判家方法 (Actor Critic method) / deepmind 的 Deep Deterministic Policy Gradients(DDPG) / 從 AC 到 A3C /  Distributed Proximal Policy Optimization (DPPO)

四、Case Study :

1. AlphaGo原理講解

2. 問答推薦系統強化學習等

精彩課程、高手經驗、句句精華。(講師依學員實際狀況動態調整進度)

 

一般價:3980 (熱賣中)
團報價:2980
 
 
 
課程提醒 
 
1.主辦單位得依報名人數狀況調整時間。
2.預計時段: 9:30~12:30 / 13:30~16:30  (準時開始,時段以當場狀況為準,中午自行用餐)。
3.自備筆電,建議充足電池。
4.為尊重智慧財產權,現場不開放錄音錄影,敬請配合。
5.課程開始前十天內除天災、主辦單位異動外,恕不接受退費。
 
台北市中山區松江路131號(2樓教室) / 台北市中山區松江路131號

Event Tickets

Ticket Type Sale Period Price
一般票 2019/09/09 13:31(+0800) ~ 2019/09/18 23:59(+0800) End of Sale
  • TWD$3,980
團體票 2019/08/20 00:00(+0800) ~ 2019/09/18 23:59(+0800) End of Sale
  • TWD$2,980
Next Step