![]()
内容推荐 本书通过Titanic数据分析案例,深入浅出地介绍了R语言在大数据分析应用中的相关知识,包括:数据准备、数据清洗、数据探索、数据变换、特征工程、数据建模、模型评估、模型部署等。全书共13章,第1~3章介绍R语言的开发环境和基本语法;第4~8章按数据分析生命周期讨论R语言的实现;第9章高级编程相对独立,主要解决复杂问题可能用到的程序结构;第10、11章与机器学习有关,内容偏难,但通过Rattle包回避了算法底层技术的难点;第12、13章通过两个实际项目,让读者体验数据处理的全过程以及业务对分析的重要性。本书力求以简洁、精练、理论与实践相结合的方式,让读者快速掌握R语言。 本书既可作为数据分析相关课程的教材,也可作为数据分析爱好者的参考资料。 作者简介 程显毅,工学博士,南通大学教授,硅湖职业技术学院特聘教授。江苏省人工智能学会监事会监事,江苏省微电脑学会人工智能专委会副主任委员。长期从事人工智能、自然语言理解领域的教学研究工作。主持国家自然科学基金项目2项。发表论文100多篇、出版教材6部、专著5部。 目录 第1章 绪论 1.1 R语言概述 1.1.1 R语言现状 1.1.2 R语言主要优势 1.1.3 学R语言的理由 1.2 新手上路 1.3 R语言开发环境部署 1.3.1 安装R 1.3.2 安装RStudio 1.4 获取帮助 1.5 工作空间 1.6 脚本 1.7 R包 习题 第2章 基本语法 2.1 变量 2.1.1 变量及其作用 2.1.2 变量命名 2.1.3 变量赋值 2.1.4 变量值输出 2.2 常量 2.2.1 逻辑常量 2.2.2 符号常量 2.2.3 标量 2.3 向量 2.3.1 向量产生 2.3.2 向量引用 2.3.3 向量化运算 2.3.4 向量排序 2.4 运算符 2.4.1 算术运算符 2.4.2 关系运算符 2.4.3 逻辑运算符 2.4.4 其他运算符 2.5 命令 2.6 重要内置函数 习题 第3章 数据类型 3.1 基本数据类型 3.2 结构数据类型 3.2.1 矩阵 3.2.2 数组 3.2.3 数据框 3.2.4 因子 3.2.5 列表 3.3 字符串操作 3.3.1 分割 3.3.2 拼接 3.3.3 正则表达式 3.3.4 替换 3.3.5 提取 3.3.6 测定字符串长度 3.3.7 匹配 3.4 数据类型判断和转换 3.5 日期和时间数据操作 3.5.1 日期数据基本操作 3.5.2 时间数据基本操作 习题 第4章 数据导入导出 4.1 数据导入 4.1.1 键盘输入数据 …… 第5章 数据可视化 第6章 数据清洗 第7章 数据探索 第8章 数据变换 第9章 高级编程 第10章 数据建模 第11章 模型评估 第12章 影响大学平均录取分数线因素分析 第13章 收视率分析 参考文献 附录A 附录B |