大数据处理与应用(微课版大数据专业教材)清华大学出版社豆瓣PDF电子书bt网盘迅雷下载-霍普软件下载网

本书以项目驱动的方式详细讲解大数据生态体系架构各方面的知识。主要涉及ETL的数据采集与清洗、离线数据仓库的构建和实时数据仓库的构建。
本书分为三个模块：模块一介绍大数据离线数据处理与分析，包含项目一和项目二，知识点覆盖HDFS、Hive、Sqoop、MapReduce、Spark Core和Flink DataSet；模块二介绍大数据实时数据处理与分析，包含项目三和项目四，知识点覆盖Kafka、Flume、Spark Streaming和Spark SQL；模块三介绍大数据处理与分析的扩展知识，包含项目五和项目六，项目五为基于大数据分析处理实现的推荐系统，项目六为大数据ETL数据采集的CDC技术。
本书可作为高等院校大数据与相关专业学生的教材，也可作为具有一定的Java编程基础的读者阅读，如平台架构师、开发人员和运维管理人员。

项目准备搭建实验环境
任务一安装Linux操作系统
任务二配置Linux环境
任务三部署Hadoop环境
任务四部署Spark环境
任务五部署Flink环境
任务六安装MySQL数据库
任务七安装Hive
任务八安装ZooKeeper和Kafk
任务九部署Storm环境
项目一企业人力资源员工数据的离线分析
任务一企业人力资源及员工数据的获取
[职业能力目标]
[任务描述与要求]
[知识储备]
一、关系型数据库MySQL
二、大数据ETL采集引擎Sqoop
三、HDFS分布式文件系统
[任务计划与决策]
一、企业人力资源原始数据观察
二、企业人力资源原始数据采集
[任务实施]
一、将企业人力资源员工的原始数据导入MySQL数据库
二、安装并使用Sqoop完成数据的采集
[任务检查与评价]
[任务小结]
[任务拓展]
任务二清洗企业人力资源员工数据
[职业能力目标]
[任务描述与要求]
[知识储备]
一、大数据离线计算引擎MapReduce
二、大数据离线计算引擎Spark Core
三、大数据离线计算引擎Flink DataSet
[任务计划与决策]
[任务实施]
[任务检查与评价]
[任务小结]
[任务拓展]
任务三企业人力资源员工数据的分析与处理
[职业能力目标]
[任务描述与要求]
[知识储备]
一、大数据分析引擎Hive
二、Hive的数据模型
[任务计划与决策]
[任务实施]
[任务检查与评价]
[任务小结]
[任务拓展]
项目二电商平台商品销售数据的离线分析
项目三网站用户访问实时Hot IP分析
项目四实时分析用户信息访问数据
项目五基于大数据平台的推荐系统
项目六基于CDC（获取数据变更）的实时数据采集
参考文献

书名	大数据处理与应用(微课版大数据专业教材)
分类
作者
出版社	清华大学出版社
下载
简介	内容推荐本书以项目驱动的方式详细讲解大数据生态体系架构各方面的知识。主要涉及ETL的数据采集与清洗、离线数据仓库的构建和实时数据仓库的构建。本书分为三个模块：模块一介绍大数据离线数据处理与分析，包含项目一和项目二，知识点覆盖HDFS、Hive、Sqoop、MapReduce、Spark Core和Flink DataSet；模块二介绍大数据实时数据处理与分析，包含项目三和项目四，知识点覆盖Kafka、Flume、Spark Streaming和Spark SQL；模块三介绍大数据处理与分析的扩展知识，包含项目五和项目六，项目五为基于大数据分析处理实现的推荐系统，项目六为大数据ETL数据采集的CDC技术。本书可作为高等院校大数据与相关专业学生的教材，也可作为具有一定的Java编程基础的读者阅读，如平台架构师、开发人员和运维管理人员。目录项目准备搭建实验环境任务一安装Linux操作系统任务二配置Linux环境任务三部署Hadoop环境任务四部署Spark环境任务五部署Flink环境任务六安装MySQL数据库任务七安装Hive 任务八安装ZooKeeper和Kafk 任务九部署Storm环境项目一企业人力资源员工数据的离线分析任务一企业人力资源及员工数据的获取 [职业能力目标] [任务描述与要求] [知识储备] 一、关系型数据库MySQL 二、大数据ETL采集引擎Sqoop 三、HDFS分布式文件系统 [任务计划与决策] 一、企业人力资源原始数据观察二、企业人力资源原始数据采集 [任务实施] 一、将企业人力资源员工的原始数据导入MySQL数据库二、安装并使用Sqoop完成数据的采集 [任务检查与评价] [任务小结] [任务拓展] 任务二清洗企业人力资源员工数据 [职业能力目标] [任务描述与要求] [知识储备] 一、大数据离线计算引擎MapReduce 二、大数据离线计算引擎Spark Core 三、大数据离线计算引擎Flink DataSet [任务计划与决策] [任务实施] [任务检查与评价] [任务小结] [任务拓展] 任务三企业人力资源员工数据的分析与处理 [职业能力目标] [任务描述与要求] [知识储备] 一、大数据分析引擎Hive 二、Hive的数据模型 [任务计划与决策] [任务实施] [任务检查与评价] [任务小结] [任务拓展] 项目二电商平台商品销售数据的离线分析项目三网站用户访问实时Hot IP分析项目四实时分析用户信息访问数据项目五基于大数据平台的推荐系统项目六基于CDC（获取数据变更）的实时数据采集参考文献
随便看	昆虫记全集(卷6古典珍藏本) 度量信息系统交付质量/海军新军事变革丛书广陵剑(上下)/梁羽生小说全集联剑风云录/梁羽生小说全集得配本草释义关键时刻命该怎么救--@急诊医生王成钢讲突发意外怎么办秀禾的桂花树/冰心奖获奖作家精品书系小发现者阅读地图/小发现者丛书最有钱途的9种女人人性的88点反思麦道夫骗局你的收入你做主机遇指导书(华夏名人把握机遇的故事彩图版)/名家推荐学生必读丛书完全图解心理学入门命运参考书(海外名人改变命运的故事彩图版)/名家推荐学生必读丛书外国100位艺术巨匠/青少年必知的外国名人家谱意大利/MOOK经典之旅菊与刀(附菊与刀英文赠送版经典插图珍藏版) 最有钱途的9种男人巧言利口的心理学唤醒身体自愈的潜能薪酬体系设计实务与范例最常用的150个财务管理模板/弗布克岗位常用模板系列中国文化遗产入魂一番赏送奶宝乐馆网速管家极速版品市古诗国学闹钟倒班日历傲桔数据恢复大师软件 PDF扫描全能王时光宝宝视频大师电脑版 S健康电脑版有票儿电脑版一剑问情电脑版 WPS邮箱电脑版电影频道电脑版爱奇艺动画屋电脑版口袋妖怪逆袭电脑版轻课表电脑版暴风体育电脑版 biologist biology biomass biome biometric bionic biophysics biopic biopsy biorhythm [BT下载][斗罗大陆之燃魂战][第11-12集][WEB-MKV/1.71G][国语配音/中文字幕][4K-2160P][H265][流媒体][ZeroTV] [BT下载][无能之鹰][第08集][WEB-MKV/0.91G][中文字幕][1080P][流媒体][ParkTV] [BT下载][无路可走：手机游戏软件下载赌][第01-04集][WEB-MKV/8.96G][简繁英字幕][1080P][Disney+][流媒体][ParkTV] [BT下载][时光音乐会.第四季][第08集][WEB-MP4/2.40G][国语配音/中文字幕][1080P][流媒体][LelveTV] [BT下载][时光音乐会.第四季][第08集][WEB-MP4/6.34G][国语配音/中文字幕][4K-2160P][H265][流媒体][LelveTV] [BT下载][有歌2024][第11-12集][WEB-MKV/1.32G][国语配音/中文字幕][1080P][H265][流媒体][ZeroTV] [BT下载][有歌2024][第11-12集][WEB-MKV/3.98G][国语配音/中文字幕][4K-2160P][H265][流媒体][ZeroTV] [BT下载][末代厨娘][第31-32集][WEB-MKV/4.78G][国语配音/中文字幕][1080P][流媒体][ParkTV] [BT下载][机智的恋爱][全10集][WEB-MP4/15.82G][国语配音/中文字幕][1080P][流媒体][ZeroTV] [BT下载][机智的恋爱][全10集][WEB-MP4/21.94G][国语配音/中文字幕][4K-2160P][H265][流媒体][ZeroTV] 《女人时刻》曝预告安娜·肯德里克和杀人魔约会《炉石传说》国服回归盗贼免费卡组一览发掘与灭绝卡组一览电影频道M指数2024年第37周（9.9-15）结果发布《炉石传说》国服回归术士免费卡组一览严酷疲劳卡组一览湾区升明月2024大湾区电影音乐晚会9.22澳门唱响《原神》荆棘与勋冠第三关攻略荆棘与勋冠第三关配队推荐《浴火之路》曝新预告肖央赵丽颖刘烨边境涉险《炉石传说》国服回归战士免费卡组一览宇宙控制卡组一览刘德华再现激燃动作戏!《危机航线》9.30登IMAX 《炉石传说》国服回归恶魔猎手免费卡组一览无畏海盗卡组一览