type
status
date
slug
summary
tags
category
icon
password
人工智能这几年忽然“无处不在”,但真正阻碍大多数人上手的,往往不是技术本身,而是满天飞的术语。
现在我将把常见的 AI 相关概念拆成几类:从普通用户最常遇到的聊天产品用语,到背后的技术原理,再到产品与工程视角下的指标,用一句话解释配合生活类比,并标注“是否值得深入”。
你可以把它当成一份“AI 术语速查表”,在需要时随手翻一眼,就知道这个词大概是什么、要不要花力气往下挖。
表格持续更新中。。。

聊天产品相关(ChatGPT、豆包等)

术语
一句话解释
生活类比
是否建议深入
人工智能(AI)
让机器做“看起来像在思考”的任务的总称
请一个不会累、擅长重复任务的助理
大模型 / 大语言模型(LLM)
用海量数据训练出来的“文字大脑”,能理解和生成文本
读完超大图书馆的“文字大脑”
Token(令牌)
文本被拆成的小片段,收费和限制按它计数
把一句话拆成小拼图,按片数收费
上下文(Context)
当前一次对话里模型能看到的全部文字内容
你面前桌上的所有资料
提示词 / 提示工程
设计给模型的指令,让它按你想要的方式输出
写好“任务说明书”
幻觉(Hallucination)
模型一本正经地说错话、编事实
特别会瞎编的“自信型选手”
RAG(检索增强生成)
先查资料再回答的问题方式
回答前先在你的档案柜里翻资料
工具调用(Tool Use)
模型根据需要调用外部工具来查信息或执行操作
人类助理会“去帮你查日程、发邮件”
Agent(智能体)
能拆任务、规划步骤、用工具完成目标的系统
一个数字实习生,能自己干活
内容审核 / 安全策略
自动检查和过滤不合规内容的机制
入口处的安检 / 内容审查员

技术原理相关

术语
一句话解释
生活类比
是否建议深入
机器学习(ML)
让机器从数据中自己摸索规律的技术
不教公式,只给大量例题让学生自己悟
深度学习
用多层神经网络自动提取特征的机器学习方法
很多层“滤镜”逐层处理信息
参数(Parameters)
模型内部可学习的数字,决定它的行为
每本书的“下划线重点”和“批注”
训练(Training)
用数据不断调整参数,让模型学会任务
学生做题+老师讲解,成绩不断提升
预训练(Pre-training)
用广泛数据学一般语言与世界知识
先把“所有书大致浏览一遍”
微调(Fine-tuning)
在预训练基础上,用专门数据细调
把通才训练成律师或医生
视需求而定
数据集(Dataset)
用于训练或评估的一组整理好的数据
考试题库或习题集
监督学习
输入+正确答案成对的学习方式
题目附带标准答案
无监督学习
没有答案,让模型自己发现规律
一堆未分类的文稿,自己归类主题
强化学习(RL)
通过试错和奖励,学会策略
玩游戏不断试,赢了加分、输了扣分
RLHF
用人类对答案好坏的评价来做强化学习
老师打分“这个回答好/不好”,学生改进
神经网络
模仿大脑结构的多层数学模型
水管网络,多层阀门控制水流
层(Layer)
神经网络中的一次变换单元
一道工序,每道工序加工一次
Transformer
主流大模型结构,用注意力机制处理序列
一群读者,能判断“谁和谁更相关”
嵌入 / 向量(Embedding)
把内容变成一串数字坐标,用来算相似度
把每本书放在“主题地图”上的一个点

产品与工程相关

术语
一句话解释
生活类比
是否建议深入
推理 / 调用(Inference)
训练完成后,用模型来生成或预测的过程
考试现场答题(训练阶段是平时学习)
API
用代码,而不是网页 UI 来调用模型的接口
提供一个“电源插座”,别的设备可以来插
开发产品必须要懂
延迟(Latency)
请求从发出到收到结果的时间
网页打开的响应速度
吞吐量(Throughput)
系统单位时间内能处理的请求数量
收银台每分钟结账的顾客数
对齐(Alignment)
让模型行为符合人类价值观和规则
训练一个“懂规矩”的助理
偏见(Bias)
模型学到的不公平倾向或刻板印象
看多了带偏见的媒体,观点被带偏