注冊 | 登錄讀書好,好讀書,讀好書!
讀書網-DuShu.com
當前位置: 首頁出版圖書教育/教材/教輔教材研究生/本科/??平滩?/a>Python數據挖掘方法及應用(第2版)

Python數據挖掘方法及應用(第2版)

Python數據挖掘方法及應用(第2版)

定 價:¥55.00

作 者: 王術
出版社: 電子工業(yè)出版社
叢編項: 知識圖譜
標 簽: 暫缺

購買這本書可以去


ISBN: 9787121459696 出版時間: 2023-07-01 包裝: 平塑勒
開本: 頁數: 字數:  

內容簡介

  本書重點介紹Python語言在數據處理與數據挖掘方面的應用技巧,主要包括數據分析基礎知識(數據收集與分析軟件、數據挖掘的分析基礎、簡單數據的統(tǒng)計分析),數據分析高級方法(多元數據的綜合分析、時序數據的模型分析),大數據基本處理方法(大數據分析基礎應用、文獻計量與科研評價、社會網絡分析方法、數據分析編程平臺)等內容。附錄中還提供了Python數據分析相關方法和函數等,方便讀者隨時查看。本書內容豐富,圖文并茂,可操作性強且便于查閱,主要面向數據分析的讀者,能有效幫助讀者提高數據處理與分析的水平,提升工作效率。書中的例子數據、習題數據及相關代碼都可在作者的學習博客http://blog.leanote.com/DaPy下載使用,也可登錄華信教育資源網http://www.hxedu.com.cn免費下載。

作者簡介

  王術,暨南大學伯明翰大學聯(lián)合學院助理教授。比利時列日大學(與中國農業(yè)科學院聯(lián)合培養(yǎng))博士。英國倫敦大學國王學院數據科學碩士,華南華南農業(yè)大學經濟學學士。研究領域為農業(yè)經濟、環(huán)境經濟和能源經濟及數據科學等交叉學科的研究。曾受國家留學基金委資助公派留學。發(fā)表SCI及中文期刊十余篇,其中第1作者SCI一區(qū)論文5篇(分別發(fā)表于本專業(yè)國際頂級期刊)。編寫并出版教材3部,掌握計算機編程語言與軟件開發(fā)能力,精通R語言和Python數據分析。王斌會,暨南大學管理學院教授,博士生導師。國家和省級一流課程獲得者,暨南大學“十佳教學名師”。從事數學、統(tǒng)計學及經濟管理教學和科研工作37年,發(fā)表科研論文100余篇,完成50多項國家和省部級課題,獲省部級以上科技進步獎3項,獲省部級以上教學成果獎2項,一流課程4門,教學項目10余項。在數據分析和統(tǒng)計建模領域做了大量的基礎性研究與開創(chuàng)性工作。出版相關學術專著3部,出版相關教材10余本,開發(fā)計算機軟件10余套。精通大數據分析及統(tǒng)計語言的編程及數據處理云計算平臺的開發(fā)。詳情見其網站:www.yuque.com/rstat (www.jdwbh.cn/Rstat)

圖書目錄

目錄
第1部分 數據挖掘基礎
第1章 Python數據挖掘基礎 4
1.1 數據挖掘軟件簡介 5
1.1.1 基本數據挖掘軟件 5
1.1.2 Python語言介紹 6
1.2 Anaconda計算包 9
1.2.1 Anaconda的使用 9
1.2.2 Jupyter分析平臺 11
1.2.3 Spyder編程平臺 15
1.3 Python編程基礎 17
1.3.1 Python編程入門 17
1.3.2 Python數據類型 17
1.3.3 Python編程運算 21
1.4 Python程序設計 23
1.4.1 Python數據分析包 24
1.4.2 數值分析包numpy 26
1.4.3 基本繪圖包matplotlib 27
數據及練習1 34
第2章 數據挖掘的基本方法 36
2.1 數據收集過程 37
2.1.1 常規(guī)數據收集 37
2.1.2 大數據的概念 42
2.1.3 數據管理 46
2.1.4 數據分析包pandas 48
2.2 數據的描述分析 56
2.2.1 基本統(tǒng)計量 56
2.2.2 基于數據框的繪圖 61
2.3 數據的透視分析 65
2.3.1 一維頻數分析 65
2.3.2 二維集聚分析 67
2.3.3 多維透視分析 72
數據及練習2 74
第3章 數據挖掘的統(tǒng)計基礎 76
3.1 均勻分布及其應用 77
3.1.1 均勻分布的概念 77
3.1.2 均勻分布的應用 78
3.2 正態(tài)分布及其應用 81
3.2.1 正態(tài)分布簡介 81
3.2.2 基本統(tǒng)計推斷 85
數據及練習3 87
第2部分 數值數據的挖掘
第4章 線性相關與回歸模型 90
4.1 兩變量相關與回歸分析 91
4.1.1 兩變量線性相關分析 91
4.1.2 兩變量線性回歸模型 93
4.2 多變量相關與回歸分析 95
4.2.1 多變量線性相關分析 95
4.2.2 多變量線性回歸模型 97
數據及練習4 107
第5章 時間序列數據分析 110
5.1 時間序列簡介 111
5.1.1 時間序列的概念 111
5.1.2 時間序列的模擬 111
5.1.3 股票數據的分析 113
5.2 時間序列模型的構建 114
5.2.1 ARIMA模型 114
5.2.2 ARMA模型的構建 119
5.2.3 ARMA模型的建立與檢驗 123
5.3 時間序列模型的應用 129
5.3.1 模型的預處理 130
5.3.2 模型的估計與檢驗 131
5.3.3 模型的預測分析 133
數據及練習5 133
第6章 多元數據的統(tǒng)計分析 135
6.1 綜合評價方法 136
6.1.1 綜合評價指標體系 136
6.1.2 綜合評價分析方法 138
6.2 主成分分析方法 144
6.2.1 主成分分析方法的基本思想 144
6.2.2 主成分的基本分析 146
6.3 聚類分析方法 151
6.3.1 聚類分析方法的概念 151
6.3.2 系統(tǒng)聚類方法 153
數據及練習6 158
第3部分 文本數據的挖掘
第7章 簡單文本處理方法 162
7.1 字符串處理 163
7.1.1 字符串的基本操作 163
7.1.2 字符串查詢與替換 164
7.2 簡單文本處理 165
7.2.1 文本挖掘的概念 165
7.2.2 文本數據的分詞 167
7.3 網絡數據的爬蟲 170
7.3.1 網頁的基礎知識 170
7.3.2 Python爬蟲步驟 171
7.3.3 爬蟲方法的應用 173
數據及練習7 180
第8章 社會網絡與知識圖譜 182
8.1 社會網絡的初步印象 183
8.1.1 社會網絡分析概念 183
8.1.2 社會網絡分析包 184
8.2 社會網絡圖的構建 185
8.2.1 社會網絡數據形式 185
8.2.2 社會網絡統(tǒng)計量 188
8.2.3 美化社會網絡圖 191
8.3 商業(yè)數據知識圖譜應用 194
8.3.1 關聯(lián)規(guī)則分析概念入門 194
8.3.2 關聯(lián)規(guī)則分析基礎應用 195
8.3.3 關聯(lián)規(guī)則可視化分析 197
8.3.4 大樣本關聯(lián)規(guī)則實戰(zhàn) 199
數據及練習8 203
第9章 文獻計量與知識圖譜 204
9.1 文獻計量研究的框架 205
9.2 文獻數據的收集與分析 206
9.2.1 文獻數據的獲取 206
9.2.2 文獻數據的分析 209
9.3 科研數據的管理與評價 213
9.3.1 科研單位與項目分析 213
9.3.2 科研期刊與作者分析 215
9.3.3 圖譜共現矩陣計算 217
9.3.4 共現矩陣的網絡圖 218
數據及練習9 221
附錄 資源共享平臺與云計算平臺 222
附錄A 資源共享平臺 222
A1 本書的學習網站 222
A2 本書自定義函數 223
附錄B 云計算平臺簡介 225
B1 課程學習平臺 225
B2 習題解答平臺 226
參考文獻 228

本目錄推薦

掃描二維碼
Copyright ? 讀書網 m.afriseller.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號 鄂公網安備 42010302001612號