今年,最火的就是Ai了,仅李先生身边就有不少朋友都想快速了解、学习,并希望能从这一波行情中赚上一笔!最起码也提升下自己的认知与视野。然而,面对一个个新名字,瞬间就晕了~其实只要我们对这些AI相关的名字做一轮详细的了解,那么对这个行业也算是有了一个初步的认识。
今天,就来给大家整理一下,希望你入行之后如鱼得水,早成锦鲤~

Ai名词解释大全 如果真想学Ai起码要对这些有了解
AI
人工智能
名词解释:Artificial Intelligence,即人工智能,1956年于Dartmouth学会上提出,一种旨在以类似人类反应的方式对刺激做出反应并从中学习的技术,其理解和判断水平通常智能在人类的专业技能中找到。AI因具备自主学习和认知能力,可进行自我调整和改进,从而应对更加复杂的任务。
AGI
通用人工智能
名词解释:Artificial General Intelligence(GI),通用人工智能,是具备与人类同等智能、或超越人类的人工智能,能表现正常人类所具有的所有智能行为。又名强人工智能。
ASI
人工超级智能
名词解释:Artificial Super Intelligence(ASI),尽管存在争议,但ASI通常被定义为超越人类思维能力的人工智能。
ANI
狭义人工智能
名词解释:Artificial Narrow Intelligence(ANI),狭义的人工智能,即专注一件事的 AI,如下围棋的AlphaGo。又名弱人工智能。
AIGC
人工智能生成内容
名词解释:全称"AI generated content”,意为人工智能生成内容,是种内容生产形式。例如AI文字续写,文字转像的AI图、AI主持人等,都属于AIGC的应用。
Accelerator
加速器
名词解释:一类旨在加速人工智能应用的微处理器!
Agents: 代理
名词解释:Agent(智能体)= 一个设定了一些目标和任务,可以选择行动的模型。这个大型语言模型(LLM)在像ChatGPT这样的工具中的“智能体”的使用方式不同。在ChatGPT中,你提问一个问题并获得一个答案作为回应。而Agent拥有更多的工作流程,模型本质上可以自我决策,而无需人类逐步的交互。
Alignment: 对齐
名词解释:人工智能对齐(英语:AI alignment)是指引导人工智能系统的行为,使其符合设计者的利益和预期目标。一个已对齐的人工智能的行为会符合预期的发展;而未对齐的人工智能的行为虽然也具备存活能力,但其目标并非设计者所期望的。
Attention: 注意力
名词解释:在神经网络的上下文中,注意力机制帮助模型在处理输入时专注于相关部分。
Backpropagation: 反向传播
名词解释:"误差反向传播"的简称,是一种用于优化(如梯度下降)结合使用的,用来训练人工神经网络的算法。该方法计算每个神经元连接权重的贡献,用于更新权重以最小化训练误差。
Bias: 偏差
名词解释:AI模型对数据所做的假设。“偏差方差权衡”是模型对训练数据的偏向与测试数据的泛化之间必须实现的平衡。偏差衡量了模型学习到的预测与真实值的偏离。
CLIP: 对比语言图像预训练
名词解释:CLIP(Contrastive Language-Image Pretraining),由OpenAI开发的AI模型,用于连接图像和文本,促使智能理解和生成图像描述。
CNN: 卷积神经网络
名词解释:Convolutional Neural Network (CNN),一种深度学习模型,通过应用一系列过滤器来处理结构化数据(例如图像)的数据。这类模型通常用于图像识别任务。
CV: 计算机视觉
名词解释:计算机视觉(Computer vision)是一门研究如何使计算机“看”的科学,更进一步的说,就是指用摄像机和计算机代替人眼对目标进行识别、跟踪和测量、处理图像,并进一步做图像的识别、用计算机处理成为更适合人类视觉系统接收的图像或图像。
ChatGPT: ChatGPT
名词解释:ChatGPT是OpenAI开发的人工智能聊天机器人系统,于2022年11月推出。该程序使用基于GPT-3.5、GPT-4架构的大型语言模型处理人类的文字对话。
Chatbot: 聊天机器人
名词解释:一种计算机程序,旨在通过文本或语音回答用户的查询。聊天机器人通常利用自然语言处理技术理解用户输入并提供相应的应答。
CoT: 思维链提示
名词解释:思维链提示(CoT, Chain-of-thought)通过提示 LLM 生成一系列小步骤来增强 LLM 的推理能力,这些中间步骤将复杂多步骤问题的答案链起来。该技术自谷歌研究人员于 2022 年春季发布以来获得广泛应用。
Compute: 计算
名词解释:用于训练或运行 AI 模型的计算资源(如 CPU 或 GPU 时间)。
Connectionism: 连接主义
名词解释:连接主义(Connectionism)也被称为神经网络学习的AI,主要观点是,知识在大量分散的处理单元(即神经元)中存储,连接这些单元的权重决定了知识的性质。连接主义强调知识表示的并行和分布式特性,而非集中式知识表示的符号系统。连接主义AI以大规模并行处理和模糊逻辑为基础,通过模拟人脑神经网络的结构和功能来进行学习和记忆。
Cross-modal generalization: 跨模态泛化
名词解释:"跨模态泛化"(cross-modal generalization)是一种跨学习范式,指的是模型能够在不同模态(如视觉、听觉、触觉)之间进行知识的迁移和应用。跨模态学习对人类感知的基本原理进行了建模,因为它涉及了多个模态之间的信息共享与融合。
Data Augmentation: 数据增强
名词解释:通过添加和变换数据的微修改或伪变动用来训练模型的多样性的过程。
Deep Learning: 深度学习
名词解释:深度学习是机器学习的分支,是一种以人工神经网络为架构,对深层特征进行逐层学习的过程。深度学习中的许多层次"深层特征"是指网络中间层。
DeepMind: DeepMind公司
名词解释:DeepMind是一家英国的人工智能公司,公司创建于2010年,最初名称为DeepMind科技,在2014年被谷歌收购。DeepMind于2014年开发了第一个人工智能围棋软件AlphaGo,2016年3月战胜李世石(李世乭)9段,震惊世界。
Diffusion Models: 扩散模型
名词解释:机器学习中,扩散模型通过逐步添加噪声的方式进行训练的神经网络,但其对抗扩散的部分需耗费大量计算资源。
Double Descent: 双降
名词解释:机器学习中的一种现象,某种模型性能的显著性提升和极大下降,然后再次提升。
Embedding: 嵌入
名词解释:让我们换一种方式来思考,假设你在玩一个叫“猜词”的游戏。你的目标是描述一个词,而你的朋友们猜词。你不会直截了当地说出这个词,而是用这个词的某些特点来描述。这样做的目的是让你的朋友们更容易理解这个词。对于机器学习来说,这种描述就叫“嵌入”。
Emergence: 涌现
名词解释:涌现(英语:emergence)或称涌现、突现、显现、涌显,是一种现象,指为许多小组件/作用/后产生的大整体,而这个大整体展现了另外的性质或特征。
End-to-End Learning: 端到端学习
名词解释:一种不需要手动设计功能的端到端学习模型。该模型只是提供输入数据,并期望从这些输入中学习。
Expert Systems: 专家系统
名词解释:人工智能技术的一种,为特定领域的复杂问题提供解决方案。
Few-Shot: 小样本学习(En)
名词解释:小样本学习/小量样本学习(low-shot learning),其目标是从少量样本中学习模型识别的能力。小样本学习包括小样本学习(few-shot learning)和零样本学习(zero-shot learning)等。零样本学习是指模型在没有训练数据的情况下,利用类比的知识推断出新的数据。
Fine-Tuning: 微调(En)
名词解释:微调是迁移学习中的一种常用技术。目标模型受到预训练的基础模型的参数影响,并基于目标数据集和特定任务进行少量训练以适应任务。
Fitting: 拟合
名词解释:在机器学习和统计学中,拟合(fitting)是指使用模型学习数据的过程。目标是使模型能够尽量贴近数据中的趋势,同时也避免一些问题,无法预测的趋势。
Forward Propagation: 前向传播
名词解释:在神经网络中,前向传播输入数据从输入层通过神经元传递到下一层(从输入层到隐藏层,最后到输出层)以产生输出结果。网络结构的响应会随层次传递,并使用前向传播进行推理输出。
Foundation Model: 基础模型
名词解释:在广泛规模上训练的大型模型,它旨在完成多任务。
GAN: 通用对抗网络
名词解释:Generative Adversarial Network (GAN),一种机器学习模型,用于生成类似于真实数据的新数据。它使用两个神经网络相互对抗:“一个生成器”,创造新数据,另一个鉴别器“被训练区分真假数据”。
GPT-4: GPT-4
名词解释:Generative Pre-trained Transformer 4,缩略GPT-4,是由OpenAI公司开发于2023年3月14日发布的自回归语言模型。GPT-4的表现被认为超过了OpenAI之前发布的GPT-3和GPT-3.5模型。
GPU: 图形处理单元
名词解释:GPU(Graphics Processing Unit),一种特殊类型的处理器,主要用于快速渲染图像并输出显示器。GPU 在执行训练和运行深度神经网络的计算任务方面也非常高效。
Generalization ability: 泛化能力
名词解释:泛化能力(generalization ability)的含义。在机器学习中,一个模型的泛化能力是指其在未见过的数据上的表现能力。
Generalize: 广义化
名词解释:广义化(英语:Generalize),又称一般化、通解化、普遍化、概念化,与之相对应的意义特殊化,指的是广义化将特定概念从特定范畴中引申出来以用于更加广泛的范畴。通过广义化的过程,某些概念可以从特定领域上升为一个更广泛的概念。一个标志性广义化的例子是广义化。
Generative AI / Gen AI: 生成式AI
名词解释:AI 的一个子集,专注于创建新内容,这些内容可以根据现有数据的模式生成,比如图像、音乐或文本。
Gradient Descent: 梯度下降
名词解释:在机器学习中,梯度下降是一种优化方法,根据模型对数据的最大改进方向逐渐调整模型的参数。例如,在递迭回归中,梯度下降通过反复调整模型参数和比较误差从而帮助找到最佳的参数。
Hallucinate: 幻觉
名词解释:在人工智能的背景下,幻觉是指模型生成的内容不是真实或不符合现实时的现象。
Hidden Layer: 隐藏层
名词解释:神经网络中不直接连接到输入或输出的人工神经元层。
Hyperparameter Tuning: 超参数调优
名词解释:为机器学习模型选择超参数(不是从数据中学习的参数)选择最佳值的过程。
Inference: 推理
名词解释:使用经过训练的机器学习模型进行预测的过程。
Instruction Tuning: 指令调优
名词解释:机器学习中的一种技术,其中模型根据指令集中给出的特定指令进行微调。
Knowledge Distillation: 知识蒸馏
名词解释:数据蒸馏旨在将模型的一个庞大的数据集浓缩生成一个小型数据集,使得学生模型的训练效率增加,和在原数据集上训练的模型表现相似。特别是基础模型至微型模型的过程。它可以帮助将较大模型转化为较紧凑的轻量模型的过程,帮助缩小模型的计算开销,提升推理效率。
LLM: 大语言模型(En)
名词解释:large language model (LLM)大语言模型是具有许多参数(通常为数十亿或数百亿)的语言模型,使用自监督学习学习大量的未标记文本进行训练。
LSTM: 长短期记忆
名词解释:长短期记忆(英语:Long Short-Term Memory,LSTM)是一种回归神经网络(RNN),论文首次发表于1997年。由于其独特的设计结构,LSTM适合于处理连续时间序列中的问题和记忆非周期长的关键事件。
Latent Space: 潜在空间
名词解释:在机器学习中,该术语是指模型(如神经网络)创建的数据的压缩表示。类似的表示在空间中更接近。
Loss Function: 损失函数
名词解释:Loss Function (or Cost Function) 也叫成本函数,机器学习模型在训练期间试图使最小化的函数。它量化了模型的预测与真实值的偏离。
Machine Learning: 机器学习
名词解释:机器学习是人工智能的一个分支。人工智能的研究内容有许多被归为“难题” 为目标,用到“学习”为其自然、自适应、渐渐的移植、显现。机器学习是实现人工智能的一个途径之一,即以机器学习为手段,将融入人工智能的部分问题。
Mixture of Experts: 专家混合
名词解释:一种机器学习技术,其中训练多个“专家”,并从这些专家输出的方式组合它们的预测。
Multimodal: 多模态
名词解释:在人工智能中,这是指可以理解和生成多种类型(如文本和图像)信息的模型。
NLP: 自然语言处理
名词解释:NLP是人工智能和语言学领域的分支学科,此领域探讨如何处理及运用自然语言;自然语言处理包括语音识别,基本有认知,理解,生成等部分。
NeRF: 神经辐射场
名词解释:NeRF(Neural Radiance Fields),一种使用神经网络从2D图像创建3D场景的方式。它可用于渲染真实的渲染、视频和合成。
Neural Network: 神经网络
名词解释:一种受人脑启发的人工智能模型。它由连接着节点(称为神经元)的多层组成。神经元传递信号,对它们进行一系列计算,并产生输出。
Objective Function: 目标函数
名词解释:机器学习模型在训练期间试图寻找大化或最小化的函数。
OpenAI: OpenAI公司
名词解释:OpenAI是美国一个人工智能研究实验室,由非营利组织OpenAI Inc. 和营利组织OpenAI LP所组成。OpenAI进行AI 研究的目的在于发展友好的人工智能,使人类整体受益。该公司由Sam Altman.
Overfitting: 过拟合
名词解释:过拟合(overfitting)是机器学习中的一个常见问题,发生在模型学习了太多,误差下降在训练期间显著降低,但在处理新数据时表现不佳。
Paradigm: 范式
名词解释:在科学哲学中,该术语是由托马斯·库恩(Thomas S. Kuhn)在其著作《科学革命的结构》中提出并广泛讨论的,指一种描述科学研究的基本理论和方法的典型例子。范式定义了科学研究的基本框架,并影响研究者如何看待世界和进行研究。
Parameters: 参数
名词解释:在机器学习中,参数是模型用于进行预测的内部变量。它们是在训练数据中从训练数据中学习的。例如,在神经网络中,权重值就是参数。
Pre-training: 预训练
名词解释:训练机器学习模型的初始阶段,其中模型从数据中学习一般特征,而不是特定于目标任务的特征。这种预训练提供了一个很好的初始点,使得模型可以更有效地学习目标任务的特定特征。这些特征用于模型的微调,以执行特定任务。
Prompt Engineering: 提示工程
名词解释:它是人工智能的一个概念,特别是涉及到自然语言处理(NLP)。在提示工程中,任务的描述通过输入给模型。提示工程的主要工作方式是设计一个或多个任务的描述,提示词可以是完整的查询或单个关键词。
RAG: 检索增强生成
名词解释:RAG(Retrieval-augmented generation)检索增强生成。
RLHF: 基于人类反馈的强化学习
名词解释:在机器学习中,人类反馈强化学习(RLHF)或人类反馈强化学习是一种直接根据人类反馈奖励模型学习来调整模型行为的技术。通过人类反馈,模型能够更有效地学习复杂的任务。
RNN: 循环神经网络
名词解释:循环神经网络(Recurrent neural network: RNN)是神经网络的一种,其中的RNN因无法处理跨层级数据。权重连接数影响参数学习的问题,难以捕捉长期时间关联;而结合不同的模型LSTM则很好解决这个问题。
Regularization: 正则化
名词解释:在机器学习中,正则化是一种通过增加约束或惩罚项来防止模型过度拟合的技术。这种技术帮助模型在训练数据中表现更好,并提高其在处理未见数据时的泛化能力。
Reinforcement Learning: 强化学习
名词解释:强化学习(Reinforcement learning,简称RL)是机器学习中的一个领域,强调如何在环境中采取行动,以获得最大化的累积奖励。强化学习模型通过与环境的交互学习,从经验中学习并改进其行为。
Singularity: 奇点
名词解释:在人工智能的背景下,奇点(也称为技术奇点)是一种假设未来时间点,当技术进步达到不可控制和不可逆转时,导致人类文明发生不可预见的变化。
Supervised Learning: 监督学习
名词解释:监督学习是机器学习的一种方法,可以训练模型中学习到创建一个模式(函数/learning model),并在提供模型的示例,并根据提供的学习目标(标签/target)给出输出结果。
Symbolic AI: 符号主义
名词解释:符号主义也被称为基于规则的AI或逻辑主义,它使用符号和规则来表示知识。符号主义的基本假设是,所有的知识和推理都可以用符号和规则来表示。这种方法在自然语言处理、知识表示和推理等领域中得到广泛应用。符号主义的优点是能够清晰地表示知识和逻辑关系,缺点是难以处理不确定性和复杂性。
System1 /System2: 系统1/系统2
名词解释:思考与决策由诺贝尔奖得主提出的系统1和系统2的理论系统。系统1是一种快速的无意识的决策系统。而系统2是慢速的有意识的决策系统。两者是人在决策时常常使用的思考方式。
TPU: 张量处理单元
名词解释:谷歌开发的专用处理单元,专门用于加速机器学习工作负载。
TensorFlow: TensorFlow
名词解释:由Google开发的开源机器学习平台,用于构建和训练机器学习模型。
Token: 标记/词元
名词解释:token 的计算工具:
atGPT的对话中,"token"是指一个字符文本输入的单位,它可以是一个单词,一个标点符号。
Training Data: 训练数据
名词解释:用于训练机器学习模型的数据集。
Transfer Learning: 迁移学习
名词解释:机器学习中的一种方法,其中对新问题使用先前训练的模型。
Transformer: Transformer模型
名词解释:Transformer模型(直译为“变换器”)是一种深度学习模型的深度学习模型,这一模型可以透过神经网络捕捉句子的更多细节和不同句子之间的联系。该模型主要用于自然语言处理(NLP)与计算机视觉(CV)等领域。
Turing test: 图灵测试
名词解释:图灵测试是英国著名科学家艾伦·图灵在1950年提出的测试,目的是测试机器能否表现出与人一样的智能力或能力。测试的过程包括让人类判断机器生成的语言是否由人类生成。
Underfitting: 欠拟合
名词解释:欠拟合是指模型过于简单,不能够捕捉到数据中的基本结构和模式。欠拟合的模型在训练数据和新的、未见过的数据上的表现通常都不好。例如,如果我们拟合一条直线(线性模型)来拟合一组呈现非线性模式的数据,那么我们可能会得到一个欠拟合的模型。
Unsupervised Learning: 无监督学习
名词解释:无监督学习是机器学习的一种方法,指没有给定样本标记的情况下,通过对数据进行分类学习。无监督学习的目标是发现数据中的结构。常见的无监督学习方法包括聚类分析(cluster analysis)、关联规则(association rule)、维度缩减(dimensionality reduce)。它是机器学习和统计学的分支之一。
Validation Data: 验证数据
名词解释:机器学习中使用的数据集的一部分,独立于训练数据集和测试数据集。它用于调整模型的超参数(例如权重),而不是模型。
Vector: 向量
名词解释:向量,物理,工程等也称作矢量,是欧几里得向量(Euclidean vector),是数学、物理学和工程科学等学科的基本概念。指一个同时具有大小和方向的量。向量是平行于某方向的一段有向线段。理论上向量可以有无穷多的维数。一般地,向量是由具有大小和方向两个性质的向量组成。向量在空间中的表示通常为箭头。向量可以表示许多物理量,如速度、力和加速度等。
Vector Database: 向量数据库(En,非线量百科)
名词解释:向量数据库(Om-iBASE)是基于高维查找需要存储向量的特征值,转变为大小+定义。特征值、空间向量的多维数值值打包在向量存储的集成值,使内容不仅被存储,同时对数据能聚合与分析。
Weight: 模型权重
名词解释:模型权重,在深度学习中,模型权重(weights)是指神经网络中的参数,这些参数用于调整和学习模型的行为,以使得模型在给定任务上表现良好。模型权重是通过训练数据中调节而获得的。深度学习模型的权重由许多参数和连接参数组成,而权重主要是通过神经元之间传递信号的参数。
XAI: 可解释的人工智能
名词解释:Explainable AI (XAI),人工智能的一个子领域专注于创造透明的解释,为其决策提供明确的解释。
Zero-Shot: 零样本学习(En)
名词解释:零样本学习(ZSL)是一种机器学习范例,模型在没有训练样本的情况下能够进行分类。其思路是将训练集的样本投影到向量空间中,并将其与测试集的样本向量进行比较。简言之,零样本学习的目标是利用训练集的特征和分类知识,解决未见过的新类别的分类问题。