Hadoop大数据技术与应用(数据科学与大数据技术专业系列规划教材)豆瓣PDF电子书bt网盘迅雷下载电子书下载-霍普软件下载网

网站首页   软件下载   游戏下载   翻译软件   电子书下载   电影下载   电视剧下载   教程攻略   音乐专区

请输入您要查询的图书:

霍普软件下载网电子书栏目提供海量电子书在线免费阅读及下载。

电子书 Hadoop大数据技术与应用(数据科学与大数据技术专业系列规划教材)
分类 电子书下载
作者 杨治明//许桂秋
出版社 人民邮电出版社
下载 暂无下载
介绍
内容推荐
杨治明、许桂秋主编的《Hadoop大数据技术与应用(数据科学与大数据技术专业系列规划教材)》采用理论与实践相结合的方式,全面介绍了Hadoop大数据技术。主要内容包括初识Hadoop大数据技术,Hadoop环境设置,分布式文件系统HDFS,资源调度框架YARN,分布式并行编程模型MapReduce,分布式的列式数据库HBase,数据仓库Hive,数据查询与分析平台Pig,分布式的海量日志采集、聚合和传输系统Flume,在传统数据库与分布式数据库之间进行数据传递的工具Sqoop,提供分布式协调一致性服务的ZooKeeper,Hadoop快速部署工具Ambari,机器学习领域经典算法库Mahout。
本书可以作为高等院校数据科学与大数据技术、计算机、信息管理等相关专业的大数据入门教材。
目录
第1章 初识Hadoop大数据技术
1.1 大数据技术概述
1.1.1 大数据产生的背景
1.1.2 大数据的定义
1.1.3 大数据技术的发展
1.2 Google的“三驾马车”
1.2.1 GFS的思想
1.2.2 MapReduce的思想
1.2.3 BigTable的思想
1.3 Hadoop概述
1.3.1 Hadoop对Google公司三篇论文思想的实现
1.3.2 Hadoop的发展历史
1.3.3 Hadoop版本的演变
1.3.4 Hadoop的发行版本
1.3.5 Hadoop的特点
1.4 Hadoop生态圈
1.5 Hadoop的典型应用场景与应用架构
1.5.1 Hadoop的典型应用场景
1.5.2 Hadoop的典型应用架构
习题
第2章 Hadoop环境设置
2.1 安装前准备
2.1.1 安装虚拟机
2.1.2 安装Ubuntu操作系统
2.1.3 关闭防火墙
2.1.4 SSH安装
2.1.5 安装Xshell及Xftp
2.1.6 安装JDK
2.1.7 下载Hadoop并解压
2.1.8 克隆主机
2.2 Hadoop的安装
2.2.1 安装单机模式
2.2.2 安装伪分布式模式
2.2.3 安装完全分布式模式
习题
实验 搭建Hadoop伪分布式模式环境
第3章 HDFS
3.1 HDFS简介
3.2 HDFS的组成与架构
3.2.1 NameNode
3.2.2 DataNode
3.2.3 SecondaryNameNode
3.3 HDFS的工作机制
3.3.1 机架感知与副本冗余存储策略
3.3.2 文件读取
3.3.3 文件写入
3.3.4 数据容错
3.4 HDFS操作
3.4.1 通过Web界面进行HDFS操作
3.4.2 通过HDFS Shell进行HDFS操作
3.4.3 通过HDFS API进行HDFS操作
3.5 HDFS的高级功能
3.5.1 安全模式
3.5.2 回收站
3.5.3 快照
3.5.4 配额
3.5.5 高可用性
3.5.6 联邦
习题
实验1 通过Shell命令访问HDFS
实验2 熟悉基于IDEA+Maven的Java开发环境
实验3 通过API访问HDFS
第4章 YARN
第5章 MapReduce
第6章 HBase、Hive、Pig
第7章 Flume
第8章 Sqoop
第9章 ZooKeeper
第10章 Ambari
第11章 Mahout
参考文献
截图
随便看

免责声明
本网站所展示的内容均来源于互联网,本站自身不存储、不制作、不上传任何内容,仅对网络上已公开的信息进行整理与展示。
本站不对所转载内容的真实性、完整性和合法性负责,所有内容仅供学习与参考使用。
若您认为本站展示的内容可能存在侵权或违规情形,请您提供相关权属证明与联系方式,我们将在收到有效通知后第一时间予以删除或屏蔽。
本网站对因使用或依赖本站信息所造成的任何直接或间接损失概不承担责任。联系邮箱:101bt@pm.me