關于舉辦“Python和R數據挖掘技術-基于Python和R語言的數據挖掘和統計分析技術”培訓的通知
各有關單位:
中國科學院計算技術研究所是國家專門的計算技術研究機構,同時也是中國信息化建設的重要支撐單位,中科院計算所培訓中心是致力于高端IT類人才培養及企業內訓的專業培訓機構。中心憑借科學院的強大師資力量,在總結多年大型軟件開發和組織經驗的基礎上,自主研發出一整套課程體系,其目的是希望能夠切實幫助中國軟件企業培養高級軟件技術人才,提升整體研發能力,迄今為止已先后為國家培養了數萬名計算機專業人員,并先后為數千家大型國內外企業進行過專門的定制培訓服務。
隨著互聯網、移動互聯網和物聯網的發展,我們已經切實地迎來了一個大數據的時代。如何對海量數據進行挖掘和分析,已經成為一個非常重要且緊迫的需求。
R是一個用于統計計算和統計制圖的優秀工具,也是GNU的一個自由、免費、源代碼開放的軟件。R包括一套完整的數據處理、計算和制圖軟件系統。其功能包括:數據存儲和處理系統,數組運算工具(其向量、矩陣運算方面功能尤其強大),完整連貫的統計分析工具,優秀的統計制圖功能。
Python是一個數據分析和圖形顯示的程序設計環境,用于統計分析、繪圖的語言和操作環境。Python有簡便而強大的編程語言:可操縱數據的輸入和輸入,可實現分支、循環,用戶可自定義功能。
本培訓將對基于Python和R語言進行數據處理、數據探索的基本方法,利用R語言實現模型選擇、Logistic回歸及決策樹算法,以及貝葉斯算法及支持向量機、神經網絡等算法原理及實現進行講解。具體事宜通知如下:
一、培訓對象
1,系統架構師、系統分析師、高級程序員、資深開發人員。
2,牽涉到數據挖掘和統計分析的數據中心運行、規劃、設計負責人。
3,政府機關,金融保險、移動和互聯網等大數據來源單位的負責人。
4,高校、科研院所牽涉到數據挖掘與統計分析處理的項目負責人。
1,對IT系統設計有一定的理論與實踐經驗。
2,對數據挖掘和數據處理方法有一定的基礎知識。
3,對Hadoop/Spark等大數據技術有一定的了解。
三、師資
由業界知名大數據專家親自授課:
楊老師
主要研究網絡信息分析以及云計算相關技術,長期從事通信網管系統、網絡信息處理、商務智能(BI)以及電信決策支持系統的研究開發工作,主持和參與了多個國家和省部級基金項目,具有豐富的工程實踐及軟件研發經驗。
四、培訓內容
第一講 數據挖掘,Python和R簡介
1.1數據挖掘
1.*****on語言
1.3 R語言
1.4 Iris數據集
1.5 Bodyfat數據集
第二講 數據的導入與導出
2.1 R數據的保存與加載
2.2 CSV文件的導入與導出
2.3 通過ODBC從數據庫中讀取數據
2.4 從Excel中導入與導出數據
2.5 Python的數據操作
第三講 數據可視化展現
3.1 查看數據
3.2 單個變量展現
3.3 多個變量展現
3.4 更多探索
3.5 將圖表保存到文件中
第四講 決策樹與隨機森林
4.1 使用party包構建決策樹
4.2 使用rpart包構建決策樹
4.3 隨機森林
4.4 Python中的決策樹實現
4.5 Python決策樹實例
第五講 回歸分析
5.1 線性回歸
5.2 邏輯回歸
5.3 廣義線性回歸
5.4 非線性回歸
5.5 Python中的回歸實現
5.6 Python回歸實例
第六講 聚類分析
6.1 k-means聚類
6.2 k-medoids聚類
6.3 層次聚類
6.4 基于密度的聚類
6.5 Python中的聚類實現
6.6 Python聚類實例
第七講 離群點檢測
7.1 單變量的離群點檢測
7.2 局部離群點因子檢測
7.3 用聚類方法進行離群點檢測
7.4 時間序列數據的離群點檢測
7.5 Python中的孤立點實例
第八講 時間序列分析
8.1 R中的時間序列數據
8.2 時間序列分解
8.3 時間序列預測
8.4 時間序列聚類
8.5 時間序列分類
8.6 Python中的時間序列實例
第九講 關聯規則
9.1 關聯規則的基本概念
9.2 Titanic數據集
9.3 關聯規則挖掘
9.4 消除冗余
9.5 解釋規則
9.6 關聯規則的可視化
9.7 Python中的關聯規則實例
第十講 社交網絡分析
10.1 詞項網絡
10.2 推文網絡
10.3 雙模式網絡
10.4 Python中的社交網絡分析實例
五、培訓目標
1, 全面了解Python和R語言數據挖掘的相關知識。
2,學習Python和R的數據挖掘核心技術方法以及應用特征。
3,深入使用Python和R在數據挖掘和分析中的使用。
六、時間、地點
時間: 2018年4月10日-4月12日 地點:北京
2018年5月16日-5月18日 地點:上海
七、證書
培訓結束,頒發中科院計算所職業培訓中心“Python和R數據挖掘技術-基于Python和R語言的數據挖掘和統計分析技術”結業證書。
八、費用
培訓費:5800元/人(含教材、證書、午餐、學習用具)。住宿協助安排,費用自理。