内容简介
本书以Python作为数据分析的工具,系统地介绍数据分析所需的核心知识点,为书中的数据分析任务提供分析说明、代码示例和极为详细的代码注释,对于代码中出现的重要知识点会细心地为读者标注出相关内容在书中出现的章节位置。 全书共11章,分为3篇:初识篇、基础篇和进阶篇。初识篇(第1和2章),主要介绍数据分析和Python的相关基础概念,一些数据分析的具体应用场景及Python的集成开发环境;基础篇(第3~9章),主要介绍Python的基础语法,自动化办公的基础操作,数据可视化库Matplotlib和Seaborn,数据分析的核心库Numpy和Pandas,提供了大量实有趣的编程和数据分析示例;进阶篇(第10和11章),主要介绍了机器学入门基础理论知识和代码实现,监督学习和无监督学各种典型算法,涉及机器学习和数据挖掘的常用库scikit-learn及神经网络框架PyTorch等的使用,还介绍了编程算法中的动态规划,数据分析的实战例子。 本书面向初学者,可以作为高等院校各专业的数据分析课程教材,也可以作为广大数据分析从业者、爱好者、办公人员、科研人员的参考和学习用书。
目录
初识篇第1章Python与数据分析1.1数据分析概念1.2为什么使用Python1.2.1智能时代的通用语言1.2.2的第三方库1.2.3轻松的代码结合能力1.3数据分析领域的应用场景1.3.1健康1.3.2交通出行1.3.3商业策略1.3.4经济金融1.3.5城乡规划1.3.6气象变化1.3.7科研及自动化办公1.4本章小结第2章初识Python2.1Python语言特点2.2Python安装方式2.2.1Anaconda安装2.2.2官网安装2.3Python集成开发环境2.3.1Jupyter Notebook2.3.2Spyder2.3.3PyCharm2.4本章小结基础篇第3章Python基础3.1变量与赋值3.1.1变量3.1.2赋值3.2输入与输出3.2.1输入3.2.2输出3.3Python对象3.3.1Python对象的概念3.3.2变量与对象的关系3.4数据类型3.4.1数字3.4.2字符串3.4.3列表3.4.4元组3.4.5字典3.4.6集合3.5运算符与表达式3.5.1算术运算符3.5.2比较运算符3.5.3逻辑运算符3.5.4位运算符3.5.5赋值运算符3.5.6成员运算符3.5.7身份运算符3.6选择结构3.6.1if语句3.6.2ifelse语句3.6.3ifelifelse语句3.7循环结构3.7.1while循环3.7.2for循环3.7.3循环嵌套3.7.4循环控制语句3.8综合示例3.9本章小结第4章Python函数与模块4.1函数4.1.1函数的概念4.1.2函数的声明4.1.3函数的参数4.1.4函数的调用及参数值的传递过程4.1.5变量的作用域4.1.6lambda函数4.1.7函数编程示例4.1.8递归函数4.2第三方模块4.2.1概念与作用4.2.2第三方模块的导入与使用4.3本章小结第5章面向对象编程5.1面向对象5.1.1类和对象的概念5.1.2面向过程编程与面向对象编程比较5.2类、对象的创建和使用5.2.1类的定义及实例化5.2.2类变量和类方法的权限5.2.3综合示例5.3类的继承5.3.1继承的概念5.3.2继承的语法和使用5.4Python中的异常处理机制5.4.1异常的概念5.4.2异常处理语句5.4.3assert断言5.4.4自定义异常5.5本章小结第6章Pyt件r/>6.1文件字符的编码方式6.2Pyt件的操作步骤6.3文件的打开与关闭 6.4文件的读取与写入 6.5Excel文件操作库简介6.6Pyt件的批量自动化r/>6.7本章小结第7章数据可视化7.1Matplotlib7.1.1Matplotlib简介及安装7.1.2Matplotlib绘图基础7.1.3默认属值的修改与绘图填充7.1.4常用绘图形式7.1.5词云7.2Seaborn7.2.1折线图7.2.2散点图7.2.3关联图7.2.4直方图7.2.5其他常用绘图形式7.2.6绘图风格与数据分组7.3本章小结第8章数值计算扩展库8.1NumPy简介及安装8.2数组的创建8.3数组对象ndarray的常用属8.4数组对象的数据取值8.4.1索引取值8.4.2索引列表取值8.4.3切片取值8.4.4布尔取值8.4.5搭配取值8.4.6迭代取值8.5数组对象元素的更新8.6数组对象的合并与拆分8.7数组对象的基本运算与广播机制8.8数组对象支持的数据类型8.9数组对象的维度转换8.10NumPy的数组8.11数组对象的常用数据统计函数8.12数据处理常用r/>8.13数组对象的常用数学函数8.14NumPy与线代数计算8.15NumPy文件和批量数据r/>8.16本章小结第9章结构化数据分析库9.1Pandas简介及安装9.2Pandas支持的数据类型9.3Series对象详细讲解9.3.1Series对象的创建方法9.3.2Series对象的属9.3.3Series对象的取值9.3.4Series对象的更新9.3.5Series对象的基本运算9.3.6Series对象的统计函数9.3.7Series对象的字符串处理9.3.8Series对象的常用函数9.4Dataframe对象详细讲解9.4.1Dataframe对象的创建方法9.4.2Dataframe对象的属9.4.3Dataframe对象的取值9.4.4Dataframe对象的更新9.4.5Dataframe对象的基本运算9.4.6Dataframe对象的统计函数9.4.7Dataframe对象的字符串处理9.4.8Dataframe对象的常用函数9.5Pandas的文件r/>9.5.1读取和写入Excel文件9.5.2批量处理多个Excel文件数据9.5.3读取和写入csv文件9.5.4读取和写入txt文件9.6Pandas的数据分组与聚合9.6.1数据分组9.6.2数据聚合9.6.3综合示例9.7Pandas的透视表与交r/>9.7.1透视表9.7.2交r/>9.8Pandas的数据预处理9.8.1缺失值处理9.8.2重复值处理9.8.3归一化处理9.8.4有效审校9.8.5连续值离散化9.8.6离散值编码9.9Pandas的时间序列处理9.9.1创建时间序列9.9.2时间序列格式化9.9.3时间序列运算9.9.4时间序列属9.9.5时间序列处理综合示例9.10Pandas数据的可视化9.11本章小结进阶篇第10章数据分析常用算法10.1机器学习基础10.2监督学习算法10.2.1线回归10.2.2逻辑回归10.2.3KNN算法10.2.4基于PyTorch搭建神经网络10.2.5线判别分析10.2.6朴素贝叶斯分类器10.2.7SVM支持向量机10.2.8决策树10.3无监督学习算法10.3.1聚类10.3.2PCA数据降维10.4编程算法在数据分析中的应用10.4.1编程算法与数据分析10.4.2动态规划算法概念10.4.3动态规划算法编程示例10.4.4动态规划算法在数据分析中的应用示例10.5本章小结第11章数据分析实战11.1数据集介绍11.2实战演练11.2.1数据预处理11.2.2统计分析与绘图11.2.3机器学习建模11.3本章小结参考文献



VIP会员