网站首页  软件下载  游戏下载  翻译软件  电子书下载  电影下载  电视剧下载  教程攻略

请输入您要查询的图书:

 

书名 大规模语言模型(从理论到实践)/通用智能与大模型丛书
分类 计算机-操作系统
作者 张奇//桂韬//郑锐//黄萱菁
出版社 电子工业出版社
下载
简介
内容推荐
本书详细介绍了构建大语言模型的四个主要阶段:预训练、有监督微调、奖励建模和强化学习。每个阶段都有算法、代码、数据、难点及实践经验的详细讨论。
本书以大语言模型的基础理论开篇,探讨了大语言模型预训练数据的构建方法,以及大语言模型如何理解并服从人类指令,介绍了大语言模型的扩展应用和评估方法,为读者提供了更全面的视野。
本书旨在为对大语言模型感兴趣的读者提供入门指南,也可作为高年级本科生和研究生自然语言处理相关课程的补充教材。
作者简介
黄萱菁,复旦大学计算机科学技术学院教授、博士生导师。主要从事自然语言处理、信息检索和社会媒体分析研究。兼任中国中文信息学会常务理事、社会媒体专委会副主任,中国计算机学会自然语言处理专委会副主任、学术工作委员会委员、AACL执委。在高水平国际学术期刊和会议上发表了百余篇论文,负责的多个科研项目受到国家自然科学基金、科技部、教育部、上海市科委的支持。入选2020年度人工智能全球女性、2020年度AI 2000人工智能全球最具影响力提名学者及福布斯中国2020科技女性榜。
目录
第1章 绪论
1.1 大语言模型的基本概念
1.2 大语言模型的发展历程
1.3 大语言模型的构建流程
1.4 本书的内容安排
第2章 大语言模型基础
2.1 Transformer结构
2.1.1 嵌入表示层
2.1.2 注意力层
2.1.3 前馈层
2.1.4 残差连接与层归一化
2.1.5 编码器和解码器结构
2.2 生成式预训练语言模型GPT
2.2.1 无监督预训练
2.2.2 有监督下游任务微调
2.2.3 基于HuggingFace的预训练语言模型实践
2.3 大语言模型的结构
2.3.1 LLaMA的模型结构
2.3.2 注意力机制优化
2.4 实践思考
第3章 大语言模型预训练数据
3.1 数据来源
3.1.1 通用数据
3.1.2 专业数据
3.2 数据处理
3.2.1 质量过滤
3.2.2 冗余去除
3.2.3 隐私消除
3.2.4 词元切分
3.3 数据影响分析
3.3.1 数据规模
3.3.2 数据质量
3.3.3 数据多样性
3.4 开源数据集
3.4.1 Pile
3.4.2 ROOTS
3.4.3 RefinedWeb
3.4.4 SlimPajama
3.5 实践思考
第4章 分布式训练
4.1 分布式训练概述
4.2 分布式训练的并行策略
4.2.1 数据并行
4.2.2 模型并行
4.2.3 混合并行
4.2.4 计算设备内存优化
4.3 分布式训练的集群架构
4.3.1 高性能计算集群的典型硬件组成
4.3.2 参数服务器架构
4.3.3 去中心化架构
4.4 DeepSpeed实践
4.4.1 基础概念
4.4.2 LLaMA分布式训练实践
4.5 实践思考
第5章 有监督微调
5.1 提示学习和语境学习
5.1.1 提示学习
5.1.2 语境学习
5.2 高效模型微调
5.2.1 LoRA
5.2.2 LoRA的变体
5.3 模型上下文窗口扩展
5.3.1 具有外推能力的位置编码
5.3.2 插值法
5.4 指令数据的构建
5.4.1 手动构建指令
5.4.2 自动构建指令
5.4.3 开源指令数据集
5.5 DeepSpeed-Chat SFT实践
5.5.1 代码结构
5.5.2 数据预处理
5.5.3 自定义模型
5.5.4 模型训练
5.5.5 模型推理
5.6 实践思考
第6章 强化学习
6.1 基于人类反馈的强化学习
6.1.1 强化学习概述
6.1.2 强化学习与有监督学习的区别
6.1.3 基于人类反馈的强化学习流程
6.2 奖励模型
6.2.1 数据收集
6.2.2 模型训练
6.2.3 开源数据
6.3 近端策略优化
6.3.1 策略梯度
6.3.2 广义优势估计
6.3.3 近端策略优化算法
6.4 MOSS-RLHF实践
6.4.1 奖励模型训练
6.4.2 PPO微调
6.5 实践思考
第7章 大语言模型应用
7.1 推理规划
7.1.1 思维链提示
7.1.2 由少至多提示
7.2 综合应用框架
7.2.1 LangChain框架核心模块
7.2.2 知识库问答系统实践
7.3 智能代理
7.3.1 智能代理的组成
7.3.2 智能代理的应用实例
7.4 多模态大语言模型
7.4.1 模型架构
7.4.2 数据收集与训练策略
7.4.3 多模态能力示例
7.5 大语言模型推理优化
7.5.1 FastServe框架
7.5.2 vLLM推理框架实践
7.6 实践思考
第8章 大语言模型评估
8.1 模型评估概述
8.2 大语言模型评估体系
8.2.1 知识与能力
8.2.2 伦理与安全
8.2.3 垂直领域评估
8.3 大语言模型评估方法
8.3.1 评估指标
8.3.2 评估方法
8.4 大语言模型评估实践
8.4.1 基础模型评估
8.4.2 SFT模型和RL模型评估
8.5 实践思考
参考文献
索引
随便看

 

霍普软件下载网电子书栏目提供海量电子书在线免费阅读及下载。

 

Copyright © 2002-2024 101bt.net All Rights Reserved
更新时间:2025/5/5 18:49:52