零基础也能学会的 AI 入门教程

从零开始,
轻松驾驭 AI 技术

不需要理科背景,不需要编程经验。跟着这份教程,你将从「AI 是什么」一路学到用 AI Agents 开发自己的软件。

7
系统章节
0
专业门槛
可能性

你将学到什么?

七个章节,从概念到实战,每节课都有生动的类比和真实案例,让你真正「懂」AI,而不只是「听说过」。

什么是 AI 和 LLM?

从「人工智能」这四个字说起,一步步理解为什么 ChatGPT 突然「火了」。

AI
AI 是什么?
从电影里的机器人,到你手机里的功能

「人工智能」(Artificial Intelligence,简称 AI)这个词已经存在了几十年。从最早的国际象棋程序,到现在的 ChatGPT,AI 一直在悄悄进化。

广义上说,AI 是让计算机模仿人类思维的技术的统称。你手机里的「人脸解锁」、导航里的「预计到达时间」、购物 App 里的「猜你喜欢」——这些都是 AI。

生活类比

AI 就像一个勤奋但有局限的助手。它学习了海量的人类知识,能做很多事——但它不是真正「懂」的,更像是一个超级熟练的「模仿者」。

AI 的几种类型

视觉
计算机视觉
识别图片和视频中的内容,比如人脸识别、自动驾驶看路。
语音
语音识别
把人说话转成文字,Siri、科大讯飞都用到这个。
语言
自然语言处理
理解和生成人类语言,这就是 LLM 所在的领域。
强化
强化学习
AI 通过反复试错学会下棋、打游戏,甚至控制机器人。
LLM
LLM 是什么?
大语言模型 = Large Language Model

LLM(大语言模型)是 AI 领域近几年最革命性的突破。「大」指的是模型的规模——它用了数千亿甚至数万亿个「参数」(你可以理解为神经网络里的小旋钮),用海量的文字数据训练而成。

LLM 能理解你说的话,并生成流畅、合理的回答。它之所以「大火」,是因为达到了一个临界点——规模够大之后,AI 突然开始展现出惊人的「涌现」能力:翻译、写作、编程、分析、创作……都变得可能。

最好理解的类比

想象一个人读遍了互联网上所有的书、文章、论坛帖子……几乎所有人类写下的文字。读完之后,它变得极其博学,可以流畅地谈论任何话题。但它不是「思考」,而是根据读过的内容,「预测」出最合适的回应。这就是 LLM。

主流的 LLM

名称来自哪里特点
GPT-4oOpenAI(美国)最广为人知,能力均衡,有 ChatGPT 网页和 App
ClaudeAnthropic(美国)更注重安全和诚实,长文本处理能力强
GeminiGoogle(美国)与 Google 生态深度整合,擅长多模态
DeepSeek深度求索(中国)国产强模型,代码和推理能力出众
Qwen(通义)阿里巴巴(中国)中文理解好,阿里云生态接入方便
提示

这些模型各有优缺点,没有绝对「最好」的。就像选择工具一样,用对场景才是关键。后面的章节我们会详细介绍。

延伸阅读
神经网络与参数:LLM 的「砖块」是什么?
想更深入了解模型内部的运作机制,点这里展开

LLM 有数千亿个「参数」——但参数到底是什么?点击下面的神经网络,看看信号是怎么一层层传递的。

神经网络信号传播
点击「激活」,看信号如何从输入层流向输出层

每条连线上都有一个数字,叫做权重(参数)。训练 LLM 就是不断调整这数千亿个数字,让网络的输出越来越准确。

LLM 是怎么工作的?

不需要数学公式,用故事讲清楚 Token、训练和涌现。

Token
Token:AI 看到的「字」
AI 不是逐字读,而是按 Token 处理

LLM 不像我们一样一个字一个字地读,而是将文字切成一段段的「Token」。你可以把 Token 理解为「词块」:

中文
中文示例
「人工智能」可能被分为 [「人工」,「智能」] 两个 Token。
英文
英文示例
「ChatGPT」可能是 [「Chat」,「G」,「PT」] 三个 Token。
计费
计费单位
API 按 Token 数量收费,大约 1000 Token 约等于 750 个英文单词。

理解 Token 很重要,因为 LLM 有「上下文窗口」限制——就像人的短期记忆有限,一次对话能处理的 Token 有上限(GPT-4 约 128K,Claude 约 200K)。

核心
预测下一个词:LLM 的核心
本质上,LLM 在做一件事——「猜下一个词」

LLM 最核心的工作原理出奇地简单:给定前面的文字,预测下一个 Token 最可能是什么

类比:完形填空

就像语文课上的完形填空,「今天天气_____,我决定出去散步」——你会自然地填「很好」或「不错」。LLM 也在做类似的事,只是规模大了几亿倍,而且它做了无数次这样的训练。

三个训练阶段

1
预训练(Pre-training)用海量互联网文字训练模型学会「语言规律」。这一步耗费巨大算力,通常需要数月和数百万美元。
2
指令微调(Fine-tuning)让人类标注员写出「好的对话」示例,教模型「怎么好好答话」——从「只会续写文字」的模型,变成「会对话的助手」。
3
人类反馈强化学习(RLHF)让模型生成多个答案,人类评选哪个更好,用这个偏好数据进一步训练。这让 AI 的回答更安全、更有帮助、更符合人类预期。
涌现
涌现:规模带来的惊喜
为什么 LLM 突然变得「这么厉害」?

研究者发现了一个有趣的现象:当模型规模小时,它的能力很一般;但当规模超过某个临界点,它突然涌现出很多没有明确训练过的能力——比如做数学推理、写诗、解释笑话……

类比:水变成冰

水在 0 摄氏度以上是液态,降到 0 摄氏度就突然凝固——这就是「相变」。LLM 的涌现类似:参数量不断增加,看似没变化,但某一刻突然「跃迁」出了新能力。

这也是为什么 2022 年 ChatGPT 发布后,全世界都被震惊了——大家突然意识到 AI 到达了一个新的临界点。

延伸阅读
Transformer:让 LLM 成为可能的核心架构
想了解「注意力机制」和 Transformer 的原理,点这里展开

LLM 不是从左到右死板地读句子——它同时看所有词,并判断「这个词应该关注哪些其他词」。点击下方任意一个词,看看它的注意力分布。

注意力机制可视化
点击一个词,查看它最「关注」哪些其他词

当你点击「它」,你会发现它对「书」的注意力权重最高——这就是模型知道「它」指的是「书」而不是其他词的原因。注意力机制让 AI 能理解长距离的语言关联。

如何与 AI 对话?提示词工程

和 AI 说话是门学问。学会写好提示词,AI 的能力能提升 10 倍。

提示
什么是提示词(Prompt)?
你发给 AI 的每一句话,都是 Prompt

Prompt(提示词)就是你对 AI 说的话。但「怎么说」的差别,可以带来截然不同的结果。

差的 Prompt vs 好的 Prompt

模糊的提问(效果差)
帮我写个简历
AI 会给你一个通用模板,没什么参考价值……
清晰的提问(效果好)
我是一名有 3 年经验的产品经理,熟悉用户调研、需求分析和敏捷开发流程,曾主导过 2 款月活超过 10 万的 App 上线。请帮我写一份简洁有力的简历自我介绍,控制在 150 字以内,目标岗位是互联网大厂的高级产品经理。
AI 会给你一段有针对性、有说服力的自我介绍,可以直接用或稍作修改。
类比

和 AI 交流就像给一位极其聪明但从不主动猜测的助手下指令。你说得越清楚,它完成得越好。不要假设 AI「懂你的意思」——要把你的意思清楚地说出来。

要素
提示词的 6 个黄金要素
写好 Prompt 的通用公式
角色
角色设定
告诉 AI 扮演什么角色。「你是一位经验丰富的文案写手……」
任务
任务描述
明确说你要什么。「帮我写一篇小红书种草文案……」
背景
背景信息
提供相关上下文。「产品是一款防晒霜,主打学生党……」
格式
格式要求
指定输出格式。「分三段,每段不超过 50 字……」
受众
目标受众
说明面向谁。「目标用户是 18-25 岁的大学生……」
示例
示例(Examples)
给 AI 看参考例子效果最好。「类似这种风格:[例子]……」

完整 Prompt 示例

完整的好 Prompt
你是一位小红书资深博主,擅长写生活方式类种草笔记,文风活泼可爱。

任务:帮我写一篇关于「早起晨跑」的种草文案。

背景:我最近开始晨跑,坚持了两周,想分享早起的美好感受和改变。

格式要求:标题吸引人;正文 200 字左右;结尾加 3 个话题标签。

风格参考:活力、温暖、真实,像在和朋友分享,不要太官方。
技巧

第一次回答不满意?直接说「再改改,这次要……」。AI 支持多轮对话,可以不断打磨,像雕塑一样慢慢完善。

进阶
进阶技巧
让 AI 发挥更大潜力
1
思维链(Chain of Thought)加上「请一步步思考」,能让 AI 给出更严密的推理,尤其对数学和逻辑题有效。
2
给 AI「出口」遇到不确定的问题,加上「如果你不知道,直接说不知道」——AI 会减少乱编答案(幻觉)的概率。
3
分段处理长任务不要一次性把所有要求堆在一起。先让 AI 列大纲,确认后再逐段扩写,效果更好。
4
系统提示词(System Prompt)在 API 中可以设置「系统角色」,定义 AI 的整体行为规则,比如「永远用中文回答」。后面的 Agents 章节会用到。
延伸阅读
Prompt 注入攻击与安全边界
了解 AI 对话的「安全盲区」以及如何在开发中防范,点这里展开

Temperature(温度)控制 AI 回复的「创意程度」。拖动下方的滑块,看看同一个问题在不同温度下会得到什么样的回答。

Temperature 滑块实验
冷静精确自然对话天马行空
1.0

写代码、提取数据时用低温度(稳定准确);写故事、头脑风暴时用高温度(充满创意)。大多数日常对话在 0.7–1.0 之间效果最好。

主流 AI 工具全景

认识这些工具,知道什么场景用哪个,少走弯路。

地图
AI 工具地图
按用途分类,找到最适合你的
用途推荐工具适合场景
对话 / 写作 / 分析ChatGPT、Claude、Kimi、豆包写文章、总结资料、头脑风暴、学习辅导
AI 画图Midjourney、Stable Diffusion、即梦创意图、海报设计、插画生成
AI 音乐Suno、Udio生成任何风格的歌曲,可有歌词
AI 视频Runway、可灵、Sora文字/图片转视频,短片制作
AI 编程Cursor、Claude Code、GitHub Copilot代码补全、用自然语言写软件
AI 搜索Perplexity、Kimi 搜索像 Google 但会总结、有引用来源
AI 办公WPS AI、Notion AI、微软 CopilotPPT、表格、邮件自动化
建议

先把 ChatGPT 或 Claude 用熟,因为它们是「万能型」工具。其他垂直工具等有具体需求再学,不用全部学遍。

Claude 值得重点介绍

Claude(由 Anthropic 公司开发)是本教程重点推荐的模型之一。它有几个独特之处:

长文
超长上下文
支持 200K Token,相当于一本书。可以把整份合同、整个代码库扔给它分析。
安全
更安全诚实
Anthropic 在安全性上投入很多,Claude 更倾向于承认自己不知道,而不是乱编。
代码
代码能力强
写代码、调 Bug 表现出色,是程序员和非程序员学编程的好伙伴。
写作
写作风格好
文章、邮件、创意写作质量高,语言自然,不像机器写的。
延伸阅读
如何通过 API 直接调用 AI 模型?
想绕过网页界面、用代码直接控制 AI,点这里展开

当你在 ChatGPT 里打字,幕后发生了什么?点击「发送请求」,看一次完整的 API 调用全过程。

API 请求全程动画
App
你的应用
网页/App
JSON
打包请求
JSON格式
Cloud
Claude服务器
处理中
OK
收到回复
流式返回
点击按钮,开始模拟一次 API 调用

API 就是这么工作的——你发一段 JSON,服务器处理后把回复流式返回。所有 AI 应用(包括 ChatGPT 的网页)背后都在做同样的事。

什么是 AI Agents?

LLM 只是「大脑」,Agents 让 AI 有了「手」——能自主行动、使用工具、完成复杂任务。

Agent
从聊天机器人到 Agent
AI 的能力边界在哪里?

普通的 ChatGPT 对话:AI 只能输出文字,不能真正发邮件、搜最新新闻、操作你的电脑。

AI Agent 则不同——

1
接受目标你说:「帮我研究今天的 A 股市场,总结三个值得关注的机会,并发邮件给我」
2
规划步骤Agent 自动分解任务:搜索今日行情 → 分析数据 → 生成报告 → 发送邮件
3
调用工具Agent 调用搜索工具、计算工具、邮件 API,一步步执行。
4
完成任务你收到了一封整理好的市场分析邮件。全程无需你干预。
最好理解的类比

LLM 是一个极其聪明的顾问,但它只能坐在椅子上给你建议。Agent 是同一个顾问,但现在它有了手机、电脑、信用卡——它可以直接去做事情,不只是说说而已。

组成
Agent 的核心组成
一个 Agent = 大脑 + 记忆 + 工具 + 行动
大脑
LLM(大脑)
负责理解任务、推理决策、生成文字。Claude、GPT-4 这些都可以作为 Agent 的大脑。
记忆
记忆(Memory)
短期记忆:当前对话上下文;长期记忆:通过数据库存储跨会话信息。
工具
工具(Tools)
搜索引擎、代码执行器、文件读写、API 调用……Agent 通过工具触达现实世界。
循环
行动循环
Agent 不停循环「思考 → 行动 → 观察结果 → 再思考」,直到完成目标。

常见 Agent 框架

框架特点适合谁用
Claude CodeAnthropic 出品,专注代码开发,在终端直接操控代码库想用 AI 写代码的所有人
CursorAI 代码编辑器,有图形界面,像 VS Code 加了 AI程序员或想学编程的人
LangChainPython 框架,可以组合 LLM + 工具 + 记忆,构建复杂 Agent开发者,需要一定编程基础
AutoGPT自动分解目标并执行,探索性项目想玩自动化实验的人
n8n / Zapier + AI可视化自动化工作流,无需写代码不会编程,想自动化工作的人
延伸阅读
ReAct 框架:Agent 是如何「思考再行动」的?
深入了解 Agent 内部的推理循环机制,点这里展开

Agent 不是一次性生成答案,而是反复循环「思考 → 行动 → 观察」。点击播放,看一个真实的 Agent 任务是怎么执行的。

ReAct 思考循环(任务:查天气并决定是否带伞)

这种「边想边做」的方式让 Agent 能应对复杂任务——每次行动后都会根据新信息重新思考,而不是盲目执行。

用 AI Agents 开发软件

不会写代码?没问题。现在的 AI 工具已经可以让你把想法直接变成软件。

流程
从想法到软件:全流程
以「做一个记账小 App」为例
1
明确想法(Product Brief)用自然语言写清楚你要做什么,不需要技术词汇。例:「我想做一个网页版记账工具,支持分类记录收支、看月度图表,要界面简洁好看。」
2
让 AI 规划把你的想法发给 Claude 或 ChatGPT,让它帮你拆解功能、建议技术方案。你不需要懂技术,但要学会「审核」AI 的建议是否符合你的期望。
3
选择开发工具初学者推荐 Cursor(有图形界面)或 Claude.ai(直接在网页对话生成代码)。进阶用户可以尝试 Claude Code(在终端,AI 直接控制整个代码库)。
4
迭代对话让 AI 生成代码 → 运行 → 看效果 → 告诉 AI 哪里不对 → 修改。这个循环就是现代 AI 开发的核心流程。
5
部署上线用 Vercel、Netlify 等平台一键部署网站,完全免费。AI 可以帮你写部署步骤,你只需要跟着做。
实战
Claude Code 实战入门
最强的 AI 编程 Agent 之一

Claude Code 是 Anthropic 开发的 AI 编程助手,可以直接在命令行里工作,理解整个代码库、写代码、修 Bug、运行测试。不懂命令行?没问题,一步步来:

1
安装(只需一行命令)先安装 Node.js,然后在终端输入:
终端命令
# 全局安装 Claude Code
npm install -g @anthropic-ai/claude-code

# 进入你的项目文件夹
cd my-project

# 启动 Claude Code
claude
2
用自然语言描述任务启动后,直接和 Claude 对话:
你对 Claude Code 说
帮我创建一个简单的待办事项 App,用 HTML+CSS+JavaScript 实现,要有添加、删除、标记完成的功能,界面要粉色主题,好看一点。
Claude Code 会自动创建文件、写代码、告诉你如何打开预览……全程不需要你懂任何代码知识。
遇到 Bug 时
点击删除按钮没有反应,帮我看看哪里出了问题,修复它。
Claude Code 会自动读取你的代码,找到 Bug,修复,并解释是什么原因导致的。
提示

你不需要懂代码来使用 Claude Code。你需要的只是:清晰地描述你想要什么结果。Claude Code 会处理所有技术细节。

案例
真实案例
用 AI 做了什么——一些真实的用户故事
设计
设计师小林
用 Claude Code 把 Figma 设计稿变成了真实网站,全程没有写一行代码,客户直接拿去用。
产品
产品经理小周
用 Cursor 快速做了一个内部数据看板原型,2 小时完成,之前需要和工程师沟通 2 周。
学生
大学生小王
完全没有编程基础,用 Claude 对话开发了一个英语单词记忆 App,放到了 App Store 上。
自由
自由职业者 Mia
用 n8n 加 AI 搭建了一个自动整理邮件、生成摘要、同步到 Notion 的工作流,省下每天 1 小时。
延伸阅读
版本控制与 Git:和 AI 协作开发的必备基础
了解如何用 Git 管理 AI 帮你写的代码,避免「改坏了找不回来」,点这里展开

Git 是代码的「时光机」——每次 Commit 就是保存一个快照,出了问题可以随时回退。下面模拟一个真实的 Git 工作流,亲手操作试试。

Git 提交时间线
点击时间线上任意提交点可以「回滚」到那个版本

和 AI 协作开发时,每完成一个小功能就 Commit 一次,是最安全的工作方式。AI 改坏了代码?一键回到上一个版本。

属于你的 AI 未来

AI 不是你的替代品,而是你的超级放大器。

优势
AI 时代,人人都有机会
技术门槛降低了,真正稀缺的是你的判断力和创造力

很多人以为 AI 时代是「工程师的时代」,但事实恰恰相反。AI 把编程的门槛降低了,把创意的价值放大了。在 AI 时代,最有价值的能力是:

创意
创意和审美
知道什么是「好的」,能引导 AI 往正确方向走。AI 只能生成,你来判断和筛选。
沟通
沟通和共情
理解真实用户的需求,AI 无法感受情感。人际关系、用户洞察是护城河。
提问
提问的能力
知道问什么、怎么问,比知道答案更重要。Prompt 工程就是提问的艺术。
跨界
跨领域连接
把 AI 能力应用到你熟悉的领域(美妆、教育、法律……),这是最稀缺的组合。
时间轴
AI 发展时间线
我们站在历史的哪个节点
2017 年 — Transformer 论文发表

Google 发表《Attention is All You Need》,奠定了所有现代 LLM 的基础架构。当时很少人意识到这篇论文的意义。

2020 年 — GPT-3 发布

OpenAI 发布拥有 1750 亿参数的 GPT-3,AI 界震惊。它第一次展示了「规模带来涌现」的威力。

2022 年 11 月 — ChatGPT 发布

ChatGPT 上线仅 5 天用户突破 100 万,2 个月突破 1 亿。这是人类历史上增长最快的消费级应用。

2023 年 — 百花齐放

Claude、Gemini、Llama、Mistral……各家大模型涌现。AI 编程工具爆发,Cursor 崛起。

2024—2025 年 — Agents 时代

AI 从「聊天助手」进化为「自主 Agent」。Claude Code、Devin 等工具让 AI 可以独立完成复杂软件开发任务。

现在 — 你在这里

这是学习 AI 最好的时机。工具已经足够成熟,学习曲线已经足够平缓,而先行者的红利还没消失。

计划
你的 30 天 AI 入门计划
从零开始,30 天后你会有质的变化
1
第 1—7 天:建立使用习惯注册 Claude 或 ChatGPT,每天用 AI 处理至少一件真实的事:写邮件、总结文章、头脑风暴。感受它的能力边界。
2
第 8—14 天:学写好的 Prompt回头复习第 3 章,在日常使用中刻意练习「完整描述任务」。尝试让 AI 扮演不同角色,比较效果差异。
3
第 15—21 天:尝试 AI 创作用 Midjourney 或即梦生成图片,用 Suno 生成一首歌,用 AI 写一篇小故事。体验 AI 的创意能力。
4
第 22—30 天:做一个小项目用 Claude Code 或 Cursor,做一个属于你的小工具——可以很简单,比如一个个人主页、一个计算器。完成比完美更重要。
重要

不要追求「完全学会再用」。AI 工具每周都在更新,最好的学习方式是边用边学。一个月后,你会发现自己已经在用 AI 的视角看世界了。

延伸阅读
AI 对齐与安全:为什么这是最重要的研究方向?
了解 AI 安全问题的本质,以及 Anthropic 为什么把安全放在第一位,点这里展开

「AI 对齐」描述的是 AI 的行为和人类价值观之间的吻合程度。拖动滑块,看看不同对齐程度的 AI 会怎么表现。

AI 对齐程度光谱
完全对齐基本对齐中立偏差失控

Anthropic 开发 Claude 的核心使命就是确保 AI 尽可能停留在「完全对齐」的一侧。这不只是技术问题,也是伦理问题——这也是为什么 AI 安全研究越来越重要。

学完就练!

每一章都有对应的练习,动手才能真正掌握。

01
挑战 1:解释 LLM
用你自己的话,向一位完全不懂技术的朋友解释「什么是大语言模型」。能讲清楚,说明你真的懂了。
02
挑战 2:Prompt 升级
找一个你最近用 AI 却没得到好答案的问题,用第 3 章的六要素重写 Prompt,感受差别。
03
挑战 3:AI 创作
用 Midjourney 或即梦,生成一张你想象中的「理想家居」图片。体验文字变图像的魔法。
04
挑战 4:第一个网页
打开 Claude.ai,说「帮我做一个自我介绍的网页,要好看,有我的名字和爱好」。把生成的代码保存成 .html 文件,在浏览器打开。
05
挑战 5:设计一个 Agent
想象一个可以帮你节省时间的自动化 Agent:它应该做什么?需要哪些工具?把你的设想写下来。
06
终极挑战:做一个小产品
用 Claude Code 或 Cursor,做一个解决你生活中某个小问题的工具。分享给朋友,听听反馈。

常见问题

学习 AI 最常见的疑问,都在这里。

我没有理科背景,学这些会不会太难?
完全不难!本教程专门避开了数学和代码(第 6 章的例子也是用自然语言驱动的)。AI 工具已经把技术难度降低到几乎为零,你需要的是清晰的思维和表达能力——这些才是真正的核心竞争力。
AI 会取代我的工作吗?
AI 会取代「重复性的任务」,但会放大「创造性的思维」。建议把问题换成:我如何用 AI 让自己的工作产出翻倍?率先学会用 AI 工作的人,会比不用的人更有竞争力。AI 不是你的竞争对手,不会用 AI 的人才是。
用 AI 写的东西,算是我的作品吗?
这是个很有价值的问题。AI 是你的工具,就像用 Photoshop 做设计、用 Excel 做分析一样。关键在于:是你提供了想法、方向、判断和审美——这些才是创作的核心。AI 帮你执行,你负责方向。
ChatGPT 和 Claude 哪个更好?
两个各有优势。ChatGPT(GPT-4o)知名度更高、生态更丰富;Claude 在长文本处理、代码和安全性上表现更好。建议都免费试用一下,根据自己的使用场景选择。很多人会同时用两个。
免费版 AI 够用吗?需要付费吗?
免费版完全够入门学习用。如果你开始认真使用(比如每天大量写作、做开发项目),付费版(约 20 美元/月)的额度和能力明显更强。建议先免费用一个月,有需求了再付费升级。
AI 说的话都是真的吗?
不!这一点非常重要。LLM 有「幻觉」问题——它有时会非常自信地给出错误答案,尤其是涉及具体数字、日期、引用文献时。对重要信息,要独立核实,不要完全信任 AI 的输出。把 AI 当聪明助手,不要当权威来源。
如何保护自己的隐私?
不要把真实姓名、身份证号、银行账户等敏感信息发给 AI。工作中涉密的信息也要谨慎。大多数 AI 公司会用对话数据训练模型(可以在设置里关闭)。对于特别敏感的内容,可以用本地部署的开源模型,或者模糊化处理后再输入。