七个章节,从概念到实战,每节课都有生动的类比和真实案例,让你真正「懂」AI,而不只是「听说过」。
用你最熟悉的比喻,理解大语言模型的本质。它不是「真正的智能」,但它极其强大。
Token、训练、预测下一个词……不需要数学,用故事讲清楚 LLM 的运转方式。
学会「和 AI 说话」是一项超有用的技能。好的提示词让 AI 发挥 10 倍威力。
ChatGPT、Claude、Gemini、Midjourney……认识这些工具,知道该用哪个。
AI 不只能聊天,还能自主行动!Agents 是让 AI 变成「你的数字员工」的关键。
不会写代码?没关系。用 Claude Code、Cursor 等工具,让 AI 帮你把想法变成真正的软件。
AI 改变世界的速度很快,但不要慌。聊聊如何保持学习、找到自己的位置。
从「人工智能」这四个字说起,一步步理解为什么 ChatGPT 突然「火了」。
「人工智能」(Artificial Intelligence,简称 AI)这个词已经存在了几十年。从最早的国际象棋程序,到现在的 ChatGPT,AI 一直在悄悄进化。
广义上说,AI 是让计算机模仿人类思维的技术的统称。你手机里的「人脸解锁」、导航里的「预计到达时间」、购物 App 里的「猜你喜欢」——这些都是 AI。
AI 就像一个勤奋但有局限的助手。它学习了海量的人类知识,能做很多事——但它不是真正「懂」的,更像是一个超级熟练的「模仿者」。
LLM(大语言模型)是 AI 领域近几年最革命性的突破。「大」指的是模型的规模——它用了数千亿甚至数万亿个「参数」(你可以理解为神经网络里的小旋钮),用海量的文字数据训练而成。
LLM 能理解你说的话,并生成流畅、合理的回答。它之所以「大火」,是因为达到了一个临界点——规模够大之后,AI 突然开始展现出惊人的「涌现」能力:翻译、写作、编程、分析、创作……都变得可能。
想象一个人读遍了互联网上所有的书、文章、论坛帖子……几乎所有人类写下的文字。读完之后,它变得极其博学,可以流畅地谈论任何话题。但它不是「思考」,而是根据读过的内容,「预测」出最合适的回应。这就是 LLM。
| 名称 | 来自哪里 | 特点 |
|---|---|---|
| GPT-4o | OpenAI(美国) | 最广为人知,能力均衡,有 ChatGPT 网页和 App |
| Claude | Anthropic(美国) | 更注重安全和诚实,长文本处理能力强 |
| Gemini | Google(美国) | 与 Google 生态深度整合,擅长多模态 |
| DeepSeek | 深度求索(中国) | 国产强模型,代码和推理能力出众 |
| Qwen(通义) | 阿里巴巴(中国) | 中文理解好,阿里云生态接入方便 |
这些模型各有优缺点,没有绝对「最好」的。就像选择工具一样,用对场景才是关键。后面的章节我们会详细介绍。
LLM 有数千亿个「参数」——但参数到底是什么?点击下面的神经网络,看看信号是怎么一层层传递的。
每条连线上都有一个数字,叫做权重(参数)。训练 LLM 就是不断调整这数千亿个数字,让网络的输出越来越准确。
不需要数学公式,用故事讲清楚 Token、训练和涌现。
LLM 不像我们一样一个字一个字地读,而是将文字切成一段段的「Token」。你可以把 Token 理解为「词块」:
理解 Token 很重要,因为 LLM 有「上下文窗口」限制——就像人的短期记忆有限,一次对话能处理的 Token 有上限(GPT-4 约 128K,Claude 约 200K)。
LLM 最核心的工作原理出奇地简单:给定前面的文字,预测下一个 Token 最可能是什么。
就像语文课上的完形填空,「今天天气_____,我决定出去散步」——你会自然地填「很好」或「不错」。LLM 也在做类似的事,只是规模大了几亿倍,而且它做了无数次这样的训练。
研究者发现了一个有趣的现象:当模型规模小时,它的能力很一般;但当规模超过某个临界点,它突然涌现出很多没有明确训练过的能力——比如做数学推理、写诗、解释笑话……
水在 0 摄氏度以上是液态,降到 0 摄氏度就突然凝固——这就是「相变」。LLM 的涌现类似:参数量不断增加,看似没变化,但某一刻突然「跃迁」出了新能力。
这也是为什么 2022 年 ChatGPT 发布后,全世界都被震惊了——大家突然意识到 AI 到达了一个新的临界点。
LLM 不是从左到右死板地读句子——它同时看所有词,并判断「这个词应该关注哪些其他词」。点击下方任意一个词,看看它的注意力分布。
当你点击「它」,你会发现它对「书」的注意力权重最高——这就是模型知道「它」指的是「书」而不是其他词的原因。注意力机制让 AI 能理解长距离的语言关联。
和 AI 说话是门学问。学会写好提示词,AI 的能力能提升 10 倍。
Prompt(提示词)就是你对 AI 说的话。但「怎么说」的差别,可以带来截然不同的结果。
和 AI 交流就像给一位极其聪明但从不主动猜测的助手下指令。你说得越清楚,它完成得越好。不要假设 AI「懂你的意思」——要把你的意思清楚地说出来。
第一次回答不满意?直接说「再改改,这次要……」。AI 支持多轮对话,可以不断打磨,像雕塑一样慢慢完善。
Temperature(温度)控制 AI 回复的「创意程度」。拖动下方的滑块,看看同一个问题在不同温度下会得到什么样的回答。
写代码、提取数据时用低温度(稳定准确);写故事、头脑风暴时用高温度(充满创意)。大多数日常对话在 0.7–1.0 之间效果最好。
认识这些工具,知道什么场景用哪个,少走弯路。
| 用途 | 推荐工具 | 适合场景 |
|---|---|---|
| 对话 / 写作 / 分析 | ChatGPT、Claude、Kimi、豆包 | 写文章、总结资料、头脑风暴、学习辅导 |
| AI 画图 | Midjourney、Stable Diffusion、即梦 | 创意图、海报设计、插画生成 |
| AI 音乐 | Suno、Udio | 生成任何风格的歌曲,可有歌词 |
| AI 视频 | Runway、可灵、Sora | 文字/图片转视频,短片制作 |
| AI 编程 | Cursor、Claude Code、GitHub Copilot | 代码补全、用自然语言写软件 |
| AI 搜索 | Perplexity、Kimi 搜索 | 像 Google 但会总结、有引用来源 |
| AI 办公 | WPS AI、Notion AI、微软 Copilot | PPT、表格、邮件自动化 |
先把 ChatGPT 或 Claude 用熟,因为它们是「万能型」工具。其他垂直工具等有具体需求再学,不用全部学遍。
Claude(由 Anthropic 公司开发)是本教程重点推荐的模型之一。它有几个独特之处:
当你在 ChatGPT 里打字,幕后发生了什么?点击「发送请求」,看一次完整的 API 调用全过程。
API 就是这么工作的——你发一段 JSON,服务器处理后把回复流式返回。所有 AI 应用(包括 ChatGPT 的网页)背后都在做同样的事。
LLM 只是「大脑」,Agents 让 AI 有了「手」——能自主行动、使用工具、完成复杂任务。
普通的 ChatGPT 对话:AI 只能输出文字,不能真正发邮件、搜最新新闻、操作你的电脑。
而 AI Agent 则不同——
LLM 是一个极其聪明的顾问,但它只能坐在椅子上给你建议。Agent 是同一个顾问,但现在它有了手机、电脑、信用卡——它可以直接去做事情,不只是说说而已。
| 框架 | 特点 | 适合谁用 |
|---|---|---|
| Claude Code | Anthropic 出品,专注代码开发,在终端直接操控代码库 | 想用 AI 写代码的所有人 |
| Cursor | AI 代码编辑器,有图形界面,像 VS Code 加了 AI | 程序员或想学编程的人 |
| LangChain | Python 框架,可以组合 LLM + 工具 + 记忆,构建复杂 Agent | 开发者,需要一定编程基础 |
| AutoGPT | 自动分解目标并执行,探索性项目 | 想玩自动化实验的人 |
| n8n / Zapier + AI | 可视化自动化工作流,无需写代码 | 不会编程,想自动化工作的人 |
Agent 不是一次性生成答案,而是反复循环「思考 → 行动 → 观察」。点击播放,看一个真实的 Agent 任务是怎么执行的。
这种「边想边做」的方式让 Agent 能应对复杂任务——每次行动后都会根据新信息重新思考,而不是盲目执行。
不会写代码?没问题。现在的 AI 工具已经可以让你把想法直接变成软件。
Claude Code 是 Anthropic 开发的 AI 编程助手,可以直接在命令行里工作,理解整个代码库、写代码、修 Bug、运行测试。不懂命令行?没问题,一步步来:
# 全局安装 Claude Code npm install -g @anthropic-ai/claude-code # 进入你的项目文件夹 cd my-project # 启动 Claude Code claude
你不需要懂代码来使用 Claude Code。你需要的只是:清晰地描述你想要什么结果。Claude Code 会处理所有技术细节。
Git 是代码的「时光机」——每次 Commit 就是保存一个快照,出了问题可以随时回退。下面模拟一个真实的 Git 工作流,亲手操作试试。
和 AI 协作开发时,每完成一个小功能就 Commit 一次,是最安全的工作方式。AI 改坏了代码?一键回到上一个版本。
AI 不是你的替代品,而是你的超级放大器。
很多人以为 AI 时代是「工程师的时代」,但事实恰恰相反。AI 把编程的门槛降低了,把创意的价值放大了。在 AI 时代,最有价值的能力是:
Google 发表《Attention is All You Need》,奠定了所有现代 LLM 的基础架构。当时很少人意识到这篇论文的意义。
OpenAI 发布拥有 1750 亿参数的 GPT-3,AI 界震惊。它第一次展示了「规模带来涌现」的威力。
ChatGPT 上线仅 5 天用户突破 100 万,2 个月突破 1 亿。这是人类历史上增长最快的消费级应用。
Claude、Gemini、Llama、Mistral……各家大模型涌现。AI 编程工具爆发,Cursor 崛起。
AI 从「聊天助手」进化为「自主 Agent」。Claude Code、Devin 等工具让 AI 可以独立完成复杂软件开发任务。
这是学习 AI 最好的时机。工具已经足够成熟,学习曲线已经足够平缓,而先行者的红利还没消失。
不要追求「完全学会再用」。AI 工具每周都在更新,最好的学习方式是边用边学。一个月后,你会发现自己已经在用 AI 的视角看世界了。
「AI 对齐」描述的是 AI 的行为和人类价值观之间的吻合程度。拖动滑块,看看不同对齐程度的 AI 会怎么表现。
Anthropic 开发 Claude 的核心使命就是确保 AI 尽可能停留在「完全对齐」的一侧。这不只是技术问题,也是伦理问题——这也是为什么 AI 安全研究越来越重要。
每一章都有对应的练习,动手才能真正掌握。
学习 AI 最常见的疑问,都在这里。