| 价格 | ¥79.00 |
| 发货 | 广东东莞市 |
| 数量 | -+ |
| 库存 | 100本 |
本书是机器学习和数据挖掘领域的经典教材,被众多国外名校选为教材。书中详细介绍用于数据挖掘领域的机器学习技术和工具以及实践方法,并且提供了一个公开的数据挖掘工作平台Weka。本书主要内容包括:数据输入/输出、知识表示、数据挖掘技术(决策树、关联规则、基于实例的学习、线性模型、聚类、多实例学习等)以及在实践中的运用。本版对上一版内容进行了全面更新,以反映自第2版出版以来数据挖掘领域的技术变革和新方法,包括数据转换、集成学习、大规模数据集、多实例学习等,以及新版的Weka机器学习软件。
出版者的话
译者序
前言
致谢
第一部分 数据挖掘简介
第1章 绪论
1.1 数据挖掘和机器学习
1.1.1 描述结构模式
1.1.2 机器学习
1.1.3 数据挖掘
1.2 简单的例子:天气问题和其他问题
1.2.1 天气问题
1.2.2 隐形眼镜:一个理想化的问题
1.2.3 鸢尾花:一个经典的数值型数据集
1.2.4 CPU性能:介绍数值预测
1.2.5 劳资协商:一个更真实的例子
1.2.6 大豆分类:一个经典的机器学习的成功例子
1.3 应用领域
1.3.1 Web挖掘
1.3.2 包含评判的决策
1.3.3 图像筛选
1.3.4 负载预测
1.3.5 诊断
1.3.6 市场和销售
1.3.7 其他应用
1.4 机器学习和统计学
1.5 将泛化看做搜索
1.5.1 枚举概念空间
1.5.2 偏差
1.6 数据挖掘和道德
1.6.1 再识别
1.6.2 使用个人信息
1.6.3 其他问题
1.7 补充读物
第2章 输入:概念、实例和属性
2.1 概念
2.2 样本
2.2.1 关系
2.2.2 其他实例类型
2.3 属性
2.4 输入准备
2.4.1 数据收集
2.4.2 ARFF格式
2.4.3 稀疏数据
2.4.4 属性类型
2.4.5 缺失值
2.4.6 不正确的值
2.4.7 了解数据
2.5 补充读物
第3章 输出:知识表达
3.1 表
3.2 线性模型
3.3 树
3.4 规则
3.4.1 分类规则
3.4.2 关联规则
3.4.3 包含例外的规则
3.4.4 表达能力更强的规则
3.5 基于实例的表达
3.6 聚类
3.7 补充读物
第4章 算法:基本方法
4.1 推断基本规则
4.1.1 缺失值和数值属性
4.1.2 讨论
4.2 统计建模
4.2.1 缺失值和数值属性
4.2.2 用于文档分类的朴素贝叶斯
4.2.3 讨论
4.3 分治法:建立决策树
4.3.1 计算信息量
4.3.2 高度分支属性
4.3.3 讨论
4.4 覆盖算法:建立规则
4.4.1 规则与树
4.4.2 一个简单的覆盖算法
4.4.3 规则与决策列表
4.5 挖掘关联规则
4.5.1 项集
4.5.2 关联规则
4.5.3 有效地生成规则
4.5.4 讨论
4.6 线性模型
4.6.1 数值预测:线性回归
4.6.2 线性分类:Logistic回归
4.6.3 使用感知机的线性分类
4.6.4 使用Winnow的线性分类
4.7 基于实例的学习
4.7.1 距离函数
4.7.2 有效寻找邻
4.7.3 讨论
4.8 聚类
4.8.1 基于距离的迭代聚类
4.8.2 快速距离计算
4.8.3 讨论
4.9 多实例学习
4.9.1 聚集输入
4.9.2 聚集输出
4.9.3 讨论
4.10 补充读物
4.11 Weka实现
第5章 可信度:评估学习结果
5.1 训练和测试
5.2 预测性能
5.3 交叉验证
5.4 其他评估方法
5.4.1 留一交叉验证
5.4.2 自助法
5.5 数据挖掘方法比较
5.6 预测概率
5.6.1 二次损失函数
5.6.2 信息损失函数
5.6.3 讨论
5.7 计算成本
5.7.1 成本敏感分类
5.7.2 成本敏感学习
5.7.3 提升图
5.7.4 ROC曲线
5.7.5 召回率-率曲线
5.7.6 讨论
5.7.7 成本曲线
5.8 评估数值预测
5.9 描述