数据挖掘原理(第4版计算机科学典范教材)

价格 118.00对比
发货 广东东莞市
销量 暂无
评价 已有 0 条评价
人气 已有 2 人关注
数量
+-
库存100
 
联系方式
加关注0

新书科技

VIP   VIP会员第2年
资料未认证
保证金未缴纳

内容简介

《数据挖掘原理(第4版)》解释、探索了数据挖掘的主要技术,可以从数据中自动提取隐式和潜在有用的信息。数据挖掘越来越多地用于商业、科学和其他应用领域,它侧重于分类、关联规则挖掘和聚类。 书中对每个主题都进行了清晰的解释,是算法而不是数学公式,并通过详细的有效示例加以说明。本书是为没有强数学或统计学背景的读者写的,并详细解释了使用的所有公式。 《数据挖掘原理(第4版)》适合作为本科生或研究生层次的教材,适用专括计算机科学、商业研究、市场营销、人工智能、生物信息学和法医学。 为了帮助读者自学,本书旨在帮助普通读者理解什么是“黑盒”,这样他们可以有差别地使用商业数据挖,读者或学术研究者可以对未来该领域的技术进步做出贡献。 书中每一章都有实践练习,让读者检查自己的进度。附录括所使用的技术术语的完整术语表。 数据挖掘原括对流数据分类算法的介绍括平稳数据(底层模型是固定的)和依赖时间的数据(底层模型不时变化)——这种现象称为概念漂移。 《数据挖掘原理(第4版)》提供了前馈神经网络与反向传播的详细描述,并显示它如何可以用于分类。

目录

目 录 第1章 数据挖掘简介 11.1 数据爆炸 11.2 知识发现 21.3 数据挖掘的应用 31.4 标签数据和无标签数据 41.5 监督学习:分类 41.6 监督学习:数值预测 61.7 无监督学习:关联规则 61.8 无监督学习:聚类 7第2章 用于挖掘的数据 92.1 标准制定 92.2 变量的类型 102.3 数据准备 112.4 缺失值 132.4.1 丢弃实例 142.4.2 用频繁值/平均值替换 142.5 减少属个数 142.6 数据集的UCI存储库 152.7 本章小结 162.8 自我评估练习 16第3章 分类简介:朴素贝叶斯和_x00B_邻算法 173.1 什么是分类 173.2 朴素贝叶斯分类器 183.3 邻分类 243.3.1 距离测量 263.3.2 标准化 283.3.3 处理分类属 293.4 急切式和懒惰式学习 303.5 本章小结 303.6 自我评估练习 30第4章 使用决策树进行分类 334.1 决策规则和决策树 334.1.1 决策树:高尔夫示例 334.1.2 术语 354.1.3 degrees数据集 354.2 TDIDT算法 384.3 推理的类型 404.4 本章小结 414.5 自我评估练习 41第5章 决策树归纳:使用熵_x00B_进行属选择 435.1 属选择:一个实验 435.2 替代决策树 445.2.1 足球/无板篮球示例 445.2.2 匿名数据集 465.3 选择要分裂的属:使用熵 485.3.1 lens24数据集 485.3.2 熵 495.3.3 使用熵进行属选择 505.3.4 信息增益大化 525.4 本章小结 535.5 自我评估练习 53第6章 决策树归纳:使用频率表_x00B_进行属选择 556.1 实践中的熵计算 556.1.1 等效证明 576.1.2 关于零值的说明 586.2 其他属选择标准:多样_x00B_基尼指数 586.3 χ2属选择准则 596.4 归纳偏好 626.5 使用增益比进行属选择 636.5.1 分裂信息的属 646.5.2 结 656.6 不同属选择标准生成的_x00B_规则数 656.7 缺失分支 666.8 本章小结 676.9 自我评估练习 67第7章 估计分类器的预测精度 697.1 简介 697.2 方法1:将数据划分为_x00B_训练集和测试集 707.2.1 标准误差 707.2.2 重复训练和测试 717.3 方法2:k折交叉验证 727.4 方法3:N折交叉验证 727.5 实验结果I 737.6 实验结果II含缺失值的_x00B_数据集 757.6.1 策略1:丢弃实例 757.6.2 策略2:用频繁值/_x00B_平均值替换 767.6.3 类别缺失 777.7 混淆矩阵 777.8 本章小结 797.9 自我评估练习 79第8章 连续属 818.1 简介 818.2 局部与全局离散化 838.3 向TDIDT添加局部离散化 838.3.1 计算一组伪属的信息_x00B_增益 848.3.2 计算效率 888.4 使用ChiMerge算法进行_x00B_全局离散化 908.4.1 计算期望值和χ2 928.4.2 查找阈值 968.4.3 设置minIntervals和_x00B_maxIntervals 978.4.4 ChiMerge算法结 988.4.5 对ChiMerge算法的评述 988.5 比较树归纳法的全局离_x00B_散化和局部离散化 998.6 本章小结 1008.7 自我评估练习 100第9章 避免决策树的过度拟合 1019.1 处理训练集中的冲突 1019.2 关于过度拟合数据的更多_x00B_规则 1059.3 预剪枝决策树 1069.4 后剪枝决策树 1089.5 本章小结 1139.6 自我评估练习 113第10章 关于熵的更多信息 11510.1 简介 11510.2 使用位的编码信息 11810.3 区分M个值(M不是2_x00B_的幂) 11910.4 对“非等可能”的值进行_x00B_编码 12110.5 训练集的熵 12310.6 信息增益必须为正数或0 12410.7 使用信息增益简化分类_x00B_任务的特征 12510.7.1 示例1:geics_x00B_数据集 12610.7.2 示例2:bcst96数据集 12810.8 本章小结 13010.9 自我评估练习 130第11章 归纳分类的模块化规则 13111.1 规则后剪枝 13111.2 冲突解决 13211.3 决策树的问题 13511.4 Prism算法 13711.4.1 基本Prism算法的_x00B_变化 14311.4.2 将Prism算法与TDIDT_x00B_算法进行比较 14411.5 本章小结 14511.6 自我评估练习 145第12章 度量分类器的能 14712.1 真假正例和真假负例 14812.2 能度量 14912.3 真假正例率与预测精度 15212.4 ROC图 15312.5 ROC曲线 15512.6 寻找佳分类器 15512.7 本章小结 15712.8 自我评估练习 157第13章 处理大量数据 15913.1 简介 15913.2 将数据分发到多个_x00B_处理器 16113.3 案例研究:PMCRI 16313.4 评估分布式系统PMCRI的_x00B_有效 16513.5 逐步修改分类器 16913.6 本章小结 17313.7 自我评估练习 173第14章 集成分类 17514.1 简介 17514.2 估计分类器的能 17714.3 为每个分类器选择不同的_x00B_训练集 17814.4 为每个分类器选择一组_x00B_不同的属 17914.5 组合分类:替代投票_x00B_系统 17914.6 并行集成分类器 18314.7 本章小结 18314.8 自我评估练习 183第15章 比较分类器 18515.1 简介 18515.2 配对t检验 18615.3 为比较评估选择数据集 19115.4 抽样 19315.5 “无显著差异”的结果有多_x00B_糟糕 19515.6 本章小结 19615.7 自我评估练习 196第16章 关联规则挖掘I 19916.1 简介 19916.2 规则兴趣度的衡量标准 20016.2.1 Piatetsky-Shapiro标准_x00B_和RI度量 20216.2.2 规则兴趣度度量_x00B_应用于chess数据集 20416.2.3 使用规则兴趣度度量_x00B_解决冲突 20616.3 关联规则挖掘任务 20616.4 找到佳N条规则 20716.4.1 J-Measure:度量规则的_x00B_信息内容 20716.4.2 搜索策略 20916.5 本章小结 21116.6 自我评估练习 211第17章 关联规则挖掘II 21317.1 简介 21317.2 事务和项目集 21317.3 对项目集的支持 21517.4 关联规则 21517.5 生成关联规则 21717.6 Apriori 21817.7 生成支持的项目集:一个_x00B_示例 22117.8 为支持项目集生成规则 22317.9 规则兴趣度度量:提升度_x00B_和杠杆率 22417.10 本章小结 22617.11 自我评估练习 227第18章 关联规则挖掘III:_x00B_频繁模式树 22918.1 简介:FP-growth 22918.2 构造FP-tree 23118.2.1 预处理事务数据库 23118.2.2 初始化 23318.2.3 处理事务1:f, c, a, _x00B_m, p 23418.2.4 处理事务2:f, c, a, _x00B_b, m 23518.2.5 处理事务3:f, b 23918.2.6 处理事务4:c, b, p 24018.2.7 处理事务5:f, c, a, _x00B_m, p 24018.3 从FP-tree中查找频繁_x00B_项目集 24218.3.1 以项目p结尾的_x00B_项目集 24418.3.2 以项目m结尾的_x00B_项目集 25218.4 本章小结 25818.5 自我评估练习 258第19章 聚类 25919.1 简介 25919.2 k-means聚类 26119.2.1 示例 26219.2.2 找到佳簇集 26619.3 凝聚式层次聚类 26719.3.1 记录簇间距离 26919.3.2 终止聚类过程 27219.4 本章小结 27219.5 自我评估练习 272第20章 文本挖掘 27320.1 多重分类 27320.2 表示数据挖掘的文本_x00B_文档 27420.3 停用词和词干 27520.4 使用信息增益减少特征 27620.5 表示文本文档:构建向_x00B_量空间模型 27620.6 规范权重 27720.7 测量两个向量之间的_x00B_距离 27820.8 度量文本分类器的能 27920.9 超文本分类 28020.9.1 对网页进行分类 28020.9.2 超文本分类与文本_x00B_分类 28120.10 本章小结 28420.11 自我评估练习 284第21章 分类流数据 28521.1 简介 28521.2 构建H-Tree:更新数组 28721.2.1 currentAtts数组 28721.2.2 splitAtt数组 28821.2.3 将记录排序到适当的_x00B_叶节点 28821.2.4 hitcount数组 28921.2.5 classtotals数组 28921.2.6 acvCounts阵列 28921.2.7 branch数组 29021.3 构建H-Tree:详细示例 29121.3.1 步骤1:初始化根_x00B_节点0 29121.3.2 步骤2:开始读取_x00B_记录 29121.3.3 步骤3:考虑在节点0_x00B_处分裂 29221.3.4 步骤4:在根节点上拆分_x00B_并初始化新的叶节点 29321.3.5 步骤5:处理下一组_x00B_记录 29521.3.6 步骤6:考虑在节点2_x00B_处分裂 29621.3.7 步骤7:处理下一组_x00B_记录 29621.3.8 H-Tree算法概述 29721.4 分裂属:使用信息_x00B_增益 29921.5 分裂属:使用Hoeffding_x00B_边界 30121.6 H-Tree算法:终版本 30421.7 使用不断进化的H-Tree_x00B_进行预测 30621.8 实验:H-Tree与TDIDT 30821.8.1 lens24数据集 30821.8.2 vote数据集 31021.9 本章小结 31121.10 自我评估练习 311第22章 分类流数据II:时间_x00B_相关数据 31322.1 平稳数据与时间相关_x00B_数据 31322.2 H-Tree算结 31522.2.1 currentAtts数组 31622.2.2 splitAtt数组 31622.2.3 hitcount数组 31622.2.4 classtotals数组 31622.2.5 acvCounts数组 31722.2.6 branch数组 31722.2.7 H-Tree算法的伪代码 31722.3 从H-Tree到CDH-Tree:_x00B_概述 31922.4 从H-Tree转换到CDH-Tree:_x00B_递增计数 31922.5 滑动窗口方法 32022.6 在节点处重新分裂 32422.7 识别可疑节点 32422.8 创建备用节点 32622.9 成长/遗忘备用节点_x00B_及其后代 32922.10 用备用节点替换一个_x00B_内部节点 33122.11 实验:跟踪概念漂移 33722.11.1 lens24数据:替代_x00B_模式 33922.11.2 引入概念漂移 33922.11.3 使用交替lens24_x00B_数据的实验 34022.11.4 关于实验的评论 34722.12 本章小结 34722.13 自我评估练习 347第23章 神经网络概论 34923.1 简介 34923.2 神经网络示例1 35123.3 神经网络示例2 35423.3.1 前向传播输入节点_x00B_的值 35623.3.2 前向传播:公式 36123.4 反向传播 36123.4.1 梯度下降 36223.4.2 求梯度 36323.4.3 从输出层倒推到_x00B_隐藏层 36523.4.4 从隐藏层倒推到_x00B_输入层 36723.4.5 更新权值 37023.5 处理多实例训练集 37223.6 使用神经网络进行分类:_x00B_iris数据集 37223.7 使用神经网络进行分类:_x00B_seeds数据集 37623.8 神经网络:注意事项 37923.9 本章小结 38023.10 自我评估练习 380附录A 基本数学知识 381附录B 数据集 395附录C 更多信息来源 411附录D 词汇表和符号 413附录E 自我评估练习题答案 433

举报收藏 0
网站首页  |  关于我们  |  联系方式  |  用户协议  |  隐私政策  |  版权声明  |  网站地图  |  排名推广  |  广告服务  |  积分换礼  |  网站留言  |  RSS订阅  |  违规举报  |  粤ICP备2021111040号