GPT图解 pdf epub mobi txt 电子书下载 2026

简体网页||繁体网页

☆☆☆☆☆

出版者:

作者:黄佳

出品人:异步图书

页数:254

译者:

出版时间:2023-12

价格:79.80元

装帧:平装

isbn号码:9787115623683

丛书系列:

图书标签:

GPT
人工智能
机器学习
深度学习
自然语言处理
图解
科普
技术入门
AI
模型

下载链接在页面底部

facebook linkedin mastodon messenger pinterest reddit telegram twitter viber vkontakte whatsapp 复制链接

想要找书就要到小美书屋

book.quotespace.org

立刻按 ctrl+D收藏本页

你会得到大惊喜!!

具体描述

人工智能（AI），尤其是生成式语言模型和生成式人工智能（AIGC）模型，正以惊人的速度改变着我们的世界。驾驭这股潮流的关键，莫过于探究自然语言处理（NLP）技术的深奥秘境。本书将带领读者踏上一段扣人心弦的探索之旅，让其亲身感受，并动手搭建语言模型。本书主要内容包括N-Gram，词袋模型（BoW），Word2Vec（W2V），神经概率语言模型（NPLM），循环神经网络（RNN），Seq2Seq（S2S），注意力机制，Transformer，从初代GPT到ChatGPT再到GPT-4等一系列突破性技术的诞生与演进。

本书将以生动活泼的笔触，将枯燥的技术细节化作轻松幽默的故事和缤纷多彩的图画，引领读者穿梭于不同技术的时空，见证自然语言处理技术的传承、演进与蜕变。在这场不断攀登技术新峰的奇妙之旅中，读者不仅能深入理解自然语言处理技术的核心原理，还能自己动手，从零开始搭建起一个又一个语言模型。

无论你是在校学生还是人工智能从业者，这本书都将成为一盏明灯，照亮你探索人工智能无限奥秘的道路。

作者简介

黄佳，笔名咖哥，新加坡科技研究局人工智能研究员。主攻方向为 NLP 大模型的研发与应用、持续学习、AI in FinTech。黄佳深耕人工智能领域多年，积累了丰富的科研项目和政府、银行、能源、医疗等领域 AI 项目落地实战经验，目前正与 PlatoX.AI 展开富有前景的技术合作。曾著有《零基础学机器学习》《数据分析咖哥十话》等多部畅销书。同时，在极客时间开设专栏《零基础实战机器学习》《LangChain 实战课》，在深蓝学院开设视频课程“生成式预训练语言模型：理论与实战”。

目录信息

序章　看似寻常最奇崛，成如容易却艰辛　001
GPT-4：点亮人工通用智能的火花　002
人工智能演进之路：神经网络两落三起　004
现代自然语言处理：从规则到统计　007
何为语言？信息又如何传播？　008
NLP是人类和计算机沟通的桥梁　009
NLP技术的演进史　010
大规模预训练语言模型：BERT与GPT争锋　012
语言模型的诞生和进化　012
统计语言模型的发展历程　014
基于Transformer架构的预训练模型　016
“预训练+微调大模型”的模式　018
以提示/指令模式直接使用大模型　019
从初代GPT到ChatGPT，再到GPT-4　021
GPT作为生成式模型的天然优势　022
ChatGPT背后的推手——OpenAI　023
从初代GPT到ChatGPT，再到GPT-4的进化史　024
第1课　高楼万丈平地起：语言模型的雏形N-Gram和简单文本表示Bag-of-Words　026
1.1　N-Gram模型　026
1.2　“词”是什么，如何“分词”　030
1.3　创建一个Bigram字符预测模型　032
1.4　词袋模型　036
1.5　用词袋模型计算文本相似度　037
小结　042
思考　043
第2课　问君文本何所似：词的向量表示Word2Vec和Embedding　044
2.1　词向量 ≈ 词嵌入　045
2.2　Word2Vec：CBOW模型和Skip-Gram模型　047
2.3　Skip-Gram模型的代码实现　050
2.4　CBOW模型的代码实现　061
2.5　通过nn.Embedding来实现词嵌入　063
小结　067
思考　068
第3课　山重水复疑无路：神经概率语言模型和循环神经网络　069
3.1　NPLM的起源　070
3.2　NPLM的实现　072
3.3　循环神经网络的结构　079
3.4　循环神经网络实战　082
小结　086
思考　087
第4课　柳暗花明又一村：Seq2Seq编码器-解码器架构　088
4.1　Seq2Seq架构　089
4.2　构建简单Seq2Seq架构　092
小结　103
思考　103
第5课　见微知著开慧眼：引入注意力机制　104
5.1　点积注意力　105
5.2　缩放点积注意力　114
5.3　编码器-解码器注意力　116
5.4　注意力机制中的Q、K、V　122
5.5　自注意力　125
5.6　多头自注意力　126
5.7　注意力掩码　129
5.8　其他类型的注意力　131
小结　132
思考　132
第6课　　层峦叠翠上青天：搭建GPT核心组件Transformer　133
6.1　Transformer架构剖析　133
6.1.1　编码器-解码器架构　135
6.1.2　各种注意力的应用　135
6.1.3　编码器的输入和位置编码　140
6.1.4　编码器的内部结构　141
6.1.5　编码器的输出和编码器-解码器的连接　142
6.1.6　解码器的输入和位置编码　143
6.1.7　解码器的内部结构　145
6.1.8　解码器的输出和Transformer的输出头　146
6.2　Transformer代码实现　148
6.3　完成翻译任务　176
6.3.1　数据准备　177
6.3.2　训练Transformer模型　179
6.3.3　测试Transformer模型　179
小结　181
思考　182
第7课　芳林新叶催陈叶：训练出你的简版生成式GPT　183
7.1　BERT与GPT争锋　184
7.2　GPT：生成式自回归模型　188
7.3　构建GPT模型并完成文本生成任务　191
7.3.1　搭建GPT模型（解码器）　　　　192
7.3.2　构建文本生成任务的数据集　　　　195
7.3.3　训练过程中的自回归　　　　198
7.3.4　文本生成中的自回归（贪婪搜索）　　　　200
7.4　使用WikiText2数据集训练Wiki-GPT模型　201
7.4.1　用WikiText2构建Dataset和DataLoader　　　　202
7.4.2　用DataLoader提供的数据进行训练　　　　206
7.4.3　用Evaluation Dataset评估训练过程　　　　207
7.4.4　文本生成中的自回归（集束搜索）　　　　209
小结　212
思考　213
第8课　流水后波推前波：ChatGPT基于人类反馈的强化学习　214
8.1　从GPT到ChatGPT　215
8.2　在Wiki-GPT基础上训练自己的简版ChatGPT　218
8.3　用Hugging Face预训练GPT微调ChatGPT　225
8.4　ChatGPT的RLHF实战　233
8.4.1　强化学习基础知识　　　　235
8.4.2　简单RLHF实战　　　　237
小结　243
思考　244
第9课　生生不息的循环：使用强大的GPT-4 API　245
9.1　强大的OpenAI API　245
9.2　使用GPT-4 API　249
小结　251
思考　252
后　记　莫等闲，白了少年头　253
· · · · · · (收起)

读后感

评分☆☆☆☆☆

1. 代码 https://github.com/huangjia2019/llm_gpt/tree/main 2. 勘误 https://github.com/huangjia2019/llm_gpt/blob/main/%E5%8B%98%E8%AF%AF%E8%A1%A8.md 3. 购书 https://u.jd.com/EzPlXWB

评分☆☆☆☆☆

自从2022年11月30日，OpenAI推出chapGPT以后，大规模语言模型(简称大模型)有多火不用我再重复了。中国的各大互联网公司以及金融机构都相继推出了自己的大模型，大模型开始进入“百模齐放”的时代。有不少小伙伴很想了解GPT大模型究竟是怎么构建的，可很多小伙伴都没有AI的专业...

评分☆☆☆☆☆

AIGC技术如今已经如火如荼，许多文案写作，绘画制作都依赖于AIGC技术自动生成基础的图片与文案。除了日常聊天，文案写作，基于GPT模型诞生的许多工具陆陆续续步入我们的工作生活。然而，你真的懂什么是GPT么？人工智能、自然语言处理又是如何发展至今的呢？黄佳（咖哥）是新加...

评分☆☆☆☆☆

我是由《数据分析咖哥十话：从思维到实践促进运营增长》这本书开始关注佳哥的，当时在做数据分析相关的学习，这本书给我提供了很大的帮助，后面又学习了佳哥的《零基础学机器学习》。这两本书对于我理清机器学习相关方法和后续的学习都提供了帮助。佳哥的书我觉得很适合做技术...

评分☆☆☆☆☆

作者对GPT有着深厚大模型算法数学功底，将GPT用漫画图画方式完完全全详细讲清楚了，有一点电脑，网络，云空间操作经验，就可以自己实验。当前GPT非常流行，要掌握了GPT需要大学，科研机构有长时间的数学研究，计算机架构，云空间，GPU，并行运算，方方面面辛苦把挖。作者做到...

用户评价

评分☆☆☆☆☆

通俗易懂是黄老师写书的特点，这本书让我从一个小白就能看清GPT发展的脉络，从bag of Word 到Seq2Seq,再发展到Transformer,BERT,最后到ChatGPT,这么一步一步的发展过来，一本不厚的书让如醍醐灌顶，对GPT的发展有一个清晰的认识。现在模型太多了，有了这本书让大家知道，你学到哪里，以及后面的road map是什么。感谢作者能用巧妙的文字勾画出这一切，让我读起来饶有兴趣。

评分☆☆☆☆☆

本书以“古诗词+章节内容”的形式为每个讲解不同语言模型的篇章命名，多为古诗词的改编，加上暗喻，用字数简短但是意蕴深厚的古诗词提炼大模型的特征、语言模型的发展脉络，让知识点直观、易懂、易记。

评分☆☆☆☆☆

我是本书作者： 1. 这本书实际上是从早期NLP模型到BERT、GPT这种大语言模型的技术发展简史 2. 亮点是用一系列200行以内的代码复现了一系列经典论文和经典模型，层层递进，理解大语言模型的构建。 3. 源代码可以去异步图书下载。也可以去https://github.com/huangjia2019/DeepBlue-LLM看代码。这个书和生成式语言模型的课程算是配套的。 4. 我的github上面https://github.com/huangjia2019/llm_gpt有勘误表

评分☆☆☆☆☆

这本书很不错。

评分☆☆☆☆☆

大模型现在太火了。这本书教我们如何搭建大模型demo，值得读读