目前位置: 首頁 > 公開課程 > 創新研發 > 專業技術 > 視覺式資料探勘實作文本爬文分析與統計實作

視覺式資料探勘實作文本爬文分析與統計實作

主要目的就是在大數據庫中找出有價值的隱含情報資訊,透過中文文字探勘及資料....

  台灣企業或政府組織開始對於大數據採掘方面相當重視,希望藉由該相關之工具及資訊技術提升企業組織之獲利、降低投資風險。面對資料型態多元,如公司內部表格式結構資料庫資料;一般描述性工作日誌及服務紀錄等文本資料分析;訪談聲音之紀錄;圖片資料等資料分析亦可經處理後進行後續分析。資料科學的分析是藉由資料統計及探勘技術為基礎,主要目的就是在大數據庫中找出有價值的隱含情報資訊,透過中文文字探勘及資料分析技術來分析及歸納出有用的結構資訊,作為決策的依據。

加入收藏
收件人email:
寄件人姓名:
寄件人email:


 
 
上課地址:工研院產業學院 台北學習中心 (實際地點以上課通知為準!)
上課時數:12
起迄日期:2017/08/17~2017/08/18
聯絡資訊:顏嘉瑩/02-2370-1111#319
報名截止日:2017/08/11 
課程類別:人才培訓(課程)
研討會編號:2317010053

課程介紹

台灣企業或政府組織開始對於大數據採掘方面相當重視,希望藉由該相關之工具及資訊技術提升企業組織之獲利、降低投資風險。面對資料型態多元,如公司內部表格式結構資料庫資料;一般描述性工作日誌及服務紀錄等文本資料分析;訪談聲音之紀錄;圖片資料等資料分析亦可經處理後進行後續分析。資料科學的分析是藉由資料統計及探勘技術為基礎,主要目的就是在大數據庫中找出有價值的隱含情報資訊,透過中文文字探勘及資料分析技術來分析及歸納出有用的結構資訊,作為決策的依據。

課程特色/目標

 

主要透過大數據之分析,提供眾多資料採掘分析演算法,包含羅吉斯回歸、SVM、貝氏網路、決策數、類神經、群集、模式測試、自然語意分析來做大數據採掘。本課程將運用PolyAnalyst視覺化資料採礦工具,協助利用現有的資料庫及各類資料來源,透過分析在大量資料中有效地找出隱藏其內的行為模式或彼此的關聯性,建立預測未來模型,以達到快速掌握趨勢,提升整體競爭力。另外,透過分析能讓大量的資料作更有效率的運用,淬煉出有用資訊和獲得其潛在的情報及知識,如此才能提供更充足的決策情報,課程案例針對業界需求設計實作,提昇企業競爭力。

 

課程對象

1. 具備大專以上等相關背景之相關工程師 
2. 有興趣之學員

 

:此為上機課程,請學員務必自備正常sizeNoteBook

  • 備配需求:RAM至少4G4G以上最佳,硬碟至少40G,建議具有獨立顯卡。

  • 作業系統:Windows 7以上。

 

講師簡介








黃老師

                   

●經 歷:科技業-軟體系統處技術部經理

●專 長:機器人模擬、布置規劃、系統模擬建模、系統分析、決策分析、資料採礦、系統模擬專案導入、類神經網路、人因工程、認知心理學、人機介面研究應用



 

 

 

課程大綱

 

第一天:

課程大綱

課程內容

前言

n   大數據分析現況

n   大數據的分析優勢

n   何謂小數據分析?

n   大數據與小數據差異

大數據之分析工具介紹

n   大數據之分析工具簡介

 大數據資料分析所遇到的困難

n   資料前處理所面臨的問題:

u  異質資料來源合併與結合

u  資料清理問題

u  欄位擴編與新訂欄位處理

u  資料型態轉換與設定問題

u  資料分割與抽樣

機械學習演算法選定

n   分類演算法應用

n   函數逼近演算法應用

n   分群演算法應用

n   關聯演算法運用

n  時間預測演算法運用

機械學習演算法介紹與案例操作

n   Cluster分群演算法

n   羅吉斯分類演算法

n   決策樹分類規則演算法

n   類神經演算法應用

n   逐步回歸演算法

n   時間序列預測

n   購物籃演算法

n   關聯演算法

n   SVM支持向量機演算法介紹

n   貝式網路應用

n   R語言的結合


第二天

中文文本分析應用介紹

n   為何需要中文文本分析?

n   文本分析的重要性?

n   中文大數據文本分析應用於維護紀錄介紹

 文本分析之範例操作

n   RSS新聞資料載入功能

n   PDF資料載入

n   CSV、Execl、Access、Map source與GIS節點設定說明

 新聞文本數據分析案例介紹

 

n   RSS文字資料前處理與規則訂定

n   關鍵字篩選與詞雲分析

n   詞彙關聯分析

n   自動文字分類

n   客製化字典建立

 文本數據分析案例實作

 實際案例與Q&A

n   文本數據分析案例建模

n   文詞歸類規則建立

n   實際案例與Q&A

n   學員個別案例討論

 

結訓與認證

發予結業證書

價格

 

全系列 (14hr)

原價

開課 10 天前或同一公司二人()以上報名

非會員

每人10,000

每人9,500

會員

每人9,000 

勤學點數(500)折抵

每人8,500

勤學點數(500)折抵

 

常見問題

 

Ø 舉辦日期106/08/17()~08/18(五)  10:00 -17:00 (共12hrs

 

Ø 舉辦地點工研院產業學院 台北學習中心 (實際地點以上課通知為準!)

 

Ø 課程洽詢:(02)2370-1111(02)2370-1111 分機319 顏小姐

 

貼心提醒

 

 ※ 以下注意事項 ─ 敬請您的協助,謝謝!

1 發票型式如是開三聯式的,請註明服務機關之完整抬頭,以利開立收據

2 為確保您的上課權益,報名後若未收到任何回覆,敬請來電洽詢方完成報名。

3 因課前教材、講義及餐點之準備及需為您進行退款相關事宜,若您不克前來,請於開課三日前告知,以利行政作業進行並共同愛護資源。

4 為尊重講師之智慧財產權益,恕無法提供課程講義電子檔

5 為配合講師時間或臨時突發事件,主辦單位有調整日期或更換講師之權利。

6 繳費方式為信用卡、ATM轉帳,恕不受理現場報名和繳費

7  請先不要繳費,有確定開課會再通知繳費。
附件
2017081718 視覺式資料探勘實作文本爬文分析與統計實作.pdf



簡介


產業學院緣起
  依據行政院「挑戰2008:國家發展重點計畫」下之「國際創新研發基地」與「產業高值化」兩計畫,首重產業科技人才的效能。

•911216經科字第09103373120號函:經濟部將本院籌設工研院產業學院之工作,列為因應產業結構轉型,提 ... more

*請務必將下列資料填妥,資料送出後,開課單位將會主動與您聯繫。

我想知道本課程的企業包班內訓     


(重新產生)