Page 1 of 1

理解大型语言模型与生成式人工智能

Posted: Wed Dec 04, 2024 8:11 am
by mstlucky4550
您很可能听说过大型语言模型 (LLM)和生成式人工智能 (Gen AI),尤其是在 ChatGPT 热潮之后。但它们到底是什么?为什么人们倾向于交替使用这些术语?

嗯,它们是两个不同的东西,但有点复杂。我们以这个类比为例:

想象一下 GenAI 是一位多才多艺的厨师,能够从头开始制作各种菜肴。这位厨师学习了各种烹饪技巧,了解口味组合的基本原理,这让他们能够根据职业生涯中学习到的烹饪知识,制作出全新的食谱。基本上,GenAI 就是戈登·拉姆齐。

另一方面,法学硕士就像一个巨大的图书馆,里面装满了来自世界各地的食谱。这些食谱包含了从几代烹饪传统中收集来的无数菜谱、说明和技巧。当你要求提供菜谱时,LMM 会根据您的要求在其广泛的收藏中搜索最合适的菜谱,并以书面形式向您呈现所有必要的细节。

GenAI 解决方案通常使用 LLM 及其庞大的数据集进行训练,以生成新颖独特的内容。就像戈登·拉姆齐 (Gordan Ramsey) 接受过来自世界各地的数百种食谱和技术的训练一样,这也激励他创造出新颖独特的菜肴。看到其中的联系了吗?

本质上,GenAI 根据其对数据的理解创建全新的内容,而 LLM 则根据您的输入从其数据集中检索现有内容。这两种方法的目的都是根据用户输入提供内容,但它们的运作方式却截然不同。

让我们更深入地研究这两种技术,以便更好地理解它们。

什么是大型语言模型?
LLM 是一种生成式 AI。它们使用自然语言处理(NLP) 来理解和生成类似人类的语言输出。LLM 经过来自各种来源的大量语言数据的训练。

LLM 有一种称为变换器模型的东西,通常被比作大脑的神经网络。这种变换器可以对数据进行编码和解码,这样 LLM 就可以通过关注单词和短语在序列中如何相互关联来分析和理解文本。

法学硕士示例
LLM 仅用于语言和文本相关任务。以下是一些现实生活中的 LLM 示例:

OpenAI 的 GPT
生成式预训练 Transformer(更广为人知的名字是GPT )由OpenAI于去年推出,可能是目前世界上最广为人知的 LLM 之一。GPT 用于文本内容生成、聊天机器人、翻译、摘要等。

Google 的 LaMDA
LaMDA是 Google 的法学硕士课程,专门针对文本数据进行训练,这意味着它只能理解和生成文本输出(与大多数法学硕士课程一样)。LaMDA 与 Google 的其他法学硕士课程结合使用,为他们的 Gemini AI 解决方案提供支持。

Meta 的 Llama
Llama是 LLM 的另一个例子。它是一种语言模型,还能够生成代码和有关代码的语言,这使其成为开发人员加快编程速度的绝佳工具。

多模式法学硕士
最近,法学硕士 (LLM) 已发展到理解除文本以外的内容。这些被 华侨英国人电话号码数据 称为多模态法学硕士 (LLM)。这些法学硕士可以解读不同模态的内容,如图像、视频和音频,使与用户的对话更加动态。

让我们重新回顾一下 LLM 食谱库的类比。多模 LLM 能够处理一道菜的图像,比如牧羊人派,识别它并提供可用于复制它的食谱。


什么是生成式人工智能?
GenAI 专注于创建新内容。传统的 AI 系统通常是为特定任务或解决问题而设计的,但 GenAI 能够生成新内容——从图像、文本、音乐、视频等任何内容。与基于语言数据的 LLM 不同。

生成式人工智能的工作原理是在大型数据集上训练算法,使它们能够学习数据中固有的模式和结构。经过训练后,这些算法可以生成模仿训练数据的风格、特征和分布的新内容。

Image


5 种生成式人工智能
与法学硕士不同,生成式人工智能可以根据其所训练的机器学习算法理解、分析和生成不同类型的内容。以下是一些较受欢迎的 GenAI 类型的简短列表:

1. 生成对抗网络(GAN)
这种生成模型可以学习并发现输入数据中的模式和不规则性,从而可以创建新的、独特的输出,这些输出可能是原始输入的一部分。例如,如果该模型是在人脸上训练的,它会理解面部结构中的结构和模式,从而生成一个不存在的人的图像。该模型主要用于文本到图像的生成 AI,与其他模型一起使用,为我们提供 DALL-E 或 Midjourney。

2. 扩散模型
这是一种先进的机器学习算法,它会向输入数据添加噪声,以便它可以学习反转和消除噪声并将数据恢复到其原始形式。这种类型的生成式人工智能在根据文本描述生成新图像、完成图像和处理图像方面取得了极大的成功。