人工智能相关术语总结 | 水木易Blog

type

status

date

summary

slug

category

tags

icon

password

人工智能这几年忽然“无处不在”，但真正阻碍大多数人上手的，往往不是技术本身，而是满天飞的术语。

现在我将把常见的 AI 相关概念拆成几类：从普通用户最常遇到的聊天产品用语，到背后的技术原理，再到产品与工程视角下的指标，用一句话解释配合生活类比，并标注“是否值得深入”。

你可以把它当成一份“AI 术语速查表”，在需要时随手翻一眼，就知道这个词大概是什么、要不要花力气往下挖。

表格持续更新中。。。

聊天产品相关（ChatGPT、豆包等）

术语	一句话解释	生活类比	是否建议深入
人工智能（AI）	让机器做“看起来像在思考”的任务的总称	请一个不会累、擅长重复任务的助理	否
大模型 / 大语言模型（LLM）	用海量数据训练出来的“文字大脑”，能理解和生成文本	读完超大图书馆的“文字大脑”	否
Token（令牌）	文本被拆成的小片段，收费和限制按它计数	把一句话拆成小拼图，按片数收费	是
上下文（Context）	当前一次对话里模型能看到的全部文字内容	你面前桌上的所有资料	是
提示词 / 提示工程	设计给模型的指令，让它按你想要的方式输出	写好“任务说明书”	是
幻觉（Hallucination）	模型一本正经地说错话、编事实	特别会瞎编的“自信型选手”	是
RAG（检索增强生成）	先查资料再回答的问题方式	回答前先在你的档案柜里翻资料	是
工具调用（Tool Use）	模型根据需要调用外部工具来查信息或执行操作	人类助理会“去帮你查日程、发邮件”	是
Agent（智能体）	能拆任务、规划步骤、用工具完成目标的系统	一个数字实习生，能自己干活	否
内容审核 / 安全策略	自动检查和过滤不合规内容的机制	入口处的安检 / 内容审查员	否

技术原理相关

术语	一句话解释	生活类比	是否建议深入
机器学习（ML）	让机器从数据中自己摸索规律的技术	不教公式，只给大量例题让学生自己悟	是
深度学习	用多层神经网络自动提取特征的机器学习方法	很多层“滤镜”逐层处理信息	是
参数（Parameters）	模型内部可学习的数字，决定它的行为	每本书的“下划线重点”和“批注”	否
训练（Training）	用数据不断调整参数，让模型学会任务	学生做题＋老师讲解，成绩不断提升	是
预训练（Pre-training）	用广泛数据学一般语言与世界知识	先把“所有书大致浏览一遍”	否
微调（Fine-tuning）	在预训练基础上，用专门数据细调	把通才训练成律师或医生	视需求而定
数据集（Dataset）	用于训练或评估的一组整理好的数据	考试题库或习题集	是
监督学习	输入＋正确答案成对的学习方式	题目附带标准答案	是
无监督学习	没有答案，让模型自己发现规律	一堆未分类的文稿，自己归类主题	否
强化学习（RL）	通过试错和奖励，学会策略	玩游戏不断试，赢了加分、输了扣分	否
RLHF	用人类对答案好坏的评价来做强化学习	老师打分“这个回答好/不好”，学生改进	否
神经网络	模仿大脑结构的多层数学模型	水管网络，多层阀门控制水流	否
层（Layer）	神经网络中的一次变换单元	一道工序，每道工序加工一次	否
Transformer	主流大模型结构，用注意力机制处理序列	一群读者，能判断“谁和谁更相关”	是
嵌入 / 向量（Embedding）	把内容变成一串数字坐标，用来算相似度	把每本书放在“主题地图”上的一个点	是

产品与工程相关

术语	一句话解释	生活类比	是否建议深入
推理 / 调用（Inference）	训练完成后，用模型来生成或预测的过程	考试现场答题（训练阶段是平时学习）	否
API	用代码，而不是网页 UI 来调用模型的接口	提供一个“电源插座”，别的设备可以来插	开发产品必须要懂
延迟（Latency）	请求从发出到收到结果的时间	网页打开的响应速度	否
吞吐量（Throughput）	系统单位时间内能处理的请求数量	收银台每分钟结账的顾客数	否
对齐（Alignment）	让模型行为符合人类价值观和规则	训练一个“懂规矩”的助理	否
偏见（Bias）	模型学到的不公平倾向或刻板印象	看多了带偏见的媒体，观点被带偏	否