《大数据(互联网大规模数据挖掘与分布式处理)》由拉贾拉曼、厄尔曼所著,是关于数据挖掘的。但是,本书主要关注极大规模数据的挖掘,也就是说这些数据大到无法在内存中存放。由于重点强调数据的规模,所以本书的例子大都来自web本身或者web上导出的数据。另外,本书从算法的角度来看待数据挖掘,即数据挖掘是将算法应用于数据,而不是使用数据来“训练”某种类型的机器学习引擎。
网站首页 软件下载 游戏下载 翻译软件 电子书下载 电影下载 电视剧下载 教程攻略
霍普软件下载网电子书栏目提供海量电子书在线免费阅读及下载。
书名 | 大数据(互联网大规模数据挖掘与分布式处理)/图灵程序设计丛书 |
分类 | |
作者 | (美)拉贾拉曼//厄尔曼 |
出版社 | 人民邮电出版社 |
下载 |
![]() |
介绍 |
编辑推荐 《大数据(互联网大规模数据挖掘与分布式处理)》由拉贾拉曼、厄尔曼所著,是关于数据挖掘的。但是,本书主要关注极大规模数据的挖掘,也就是说这些数据大到无法在内存中存放。由于重点强调数据的规模,所以本书的例子大都来自web本身或者web上导出的数据。另外,本书从算法的角度来看待数据挖掘,即数据挖掘是将算法应用于数据,而不是使用数据来“训练”某种类型的机器学习引擎。 内容推荐 《大数据(互联网大规模数据挖掘与分布式处理)》由斯坦福大学的“web 挖掘”课程的内容总结而成,由拉贾拉曼、厄尔曼所著,主要关注极大规模数据的挖掘。主要内容包括分布式文件系统、相似性搜索、搜索引擎技术、频繁项集挖掘、聚类算法、广告管理及推荐系统。其中相关章节有对应的习题,以巩固所讲解的内容。读者更可以从网上获取相关拓展材料。 《大数据(互联网大规模数据挖掘与分布式处理)》适合本科生、研究生及对数据挖掘感兴趣的读者阅读。 目录 第1章 数据挖掘基本概念 第2章 大规模文件系统及map-reduce 第3章 相似项发现 第4章 数据流挖掘 第5章 链接分析 第6章 频繁项集 第7章 聚类 第8章 web广告 第9章 推荐系统 索引 |
随便看 |