NLP系列 2 : 文本分析與機器學習實戰

  • 2018/04/14(周六) 09:30(+0800) ( iCal/Outlook, Google 日曆 )
  • 台北市中山區松江路131號7F-1 (7樓教室) / 台北市中山區松江路131號7F-1 / 台北市中山區松江路131號7F-1
  • 廣宣學堂粉絲團、廣宣科技有限公司

廣宣學堂為您推出機器學習系列之 NLP實戰

人工智慧興起,其中一個重要的領域就是 NLP 自然語言處理,不論時下最風行的聊天機器人、文字爬蟲、輿情系統、資料分析理解等等應用都不可或缺,是人與機器彼此互動的關鍵介面。

能讓機器能理解與表達語言是一個很具有挑戰性的工作,而一切從文字的理解分析開始,本課程特別邀請此領域業界高手 David Chiu 授課,David是國內即時輿情分析上之重量級開發者,曾協助柯文哲團隊在第一次市長選舉時,利用文字探勘與輿情分析技術打贏大數據戰爭。本次課程使用機器學習的關鍵技能,並且進行詞彙資料處理,來從事文本分析,如: 建立詞頻矩陣、TFIDF詳解、建立TFIDF 矩陣、計算文章相似度、文章分群、文章分類等技術研究,進一步則能作輿情與內容語意分析,高手傾囊相授、內容精彩。

 
本課程您將學會:
1.自然語言處理、文字探勘的深入概念 (詞庫資料整理、分析)
2.能對爬蟲來的、聊天機器人資料、大數據資訊、各種文字資料作進一步文章分析
3.對於文章內文能運用機器學習作出分析
4.能對於文章作分群分類處理與應用
 

課程內容

1. 建立詞頻矩陣秘訣
2. 詞頻加權技術原理徹底解說
3. 建立 TFIDF 矩陣實作
4. 計算文章相似度實作
5. 文章分群機器學習實戰 (KMeans, Hierarchical Clustering)
6. 文章分類機器學習實戰 (Naïve Bayes)

(講師依學員實際狀況動態調整進度

學程延伸課程 

NLP系列: (4/14) 即本課程 文本分析與機器學習實戰

NLP系列 : (5/26) 語意分析與深度學習實戰 : 以聊天機器人為例

師資簡介
丘祐瑋(David Chiu)
大數軟體執行長,即時輿情系統建構者,從事巨量資訊分析之研發,曾協助柯文哲團隊在台北市長選舉時蒐集相關網路輿情,將分析結果應用在真實選戰中,經驗豐富。團隊也曾榮獲AngelHacks台灣區首獎、台泰跨國黑客松-無敵黑客獎、中國雲計算大資料創新專案評選優勝以及兩岸四地協同創新路演大賽優異獎等肯定。著作有Machine Learning With R Cookbook [packt], R for Data Science Cookbook[packt], 機器學習與R語言實戰[機械工業出版社],擁有豐富開發與產業經驗,並用實例實地演練,精彩可期。
 

無 kktix 帳號者,可直接傳訊廣宣學堂(http://www.broadmission.org)報名

 

課程提醒
 
1.主辦單位得依報名人數狀況調整時間。
2.預計時段: 9:30~12:30 / 14:00~17:00 (準時開始,時段以當場狀況為準,中午自行用餐)。
3.自備筆電,插座有限建議充足電池。
4.為尊重智慧財產權,現場不開放錄音錄影,敬請配合。
5.課程十天內除天災、主辦單位異動外,恕不接受退費。
 
 
台北市中山區松江路131號7F-1 (7樓教室) / 台北市中山區松江路131號7F-1 / 台北市中山區松江路131號7F-1

活動票券

票種 販售時間 售價
一般票 2018/03/26 00:00(+0800) ~ 2018/04/11 23:59(+0800) 結束販售
  • TWD$3,980
團體票 2018/02/12 00:00(+0800) ~ 2018/04/11 23:59(+0800) 結束販售
  • TWD$2,980
下一步