我的世界开源官网源码(我的世界服务器官网源码)
AI 领域是一个充满技术和数学术语的兔子洞,即使是最基本的概念也缺乏简单的解释。因此,像 ChatGPT 和Stable Diffusion这样的工具感觉就像神秘的黑匣子,很容易忘记它们与相关公司之间的区别。
为了帮助理解这一切,这里有一个通俗易懂的英文词汇表,包含著名的 AI 术语、产品和公司,以及您可以了解更多信息的链接。
基本人工智能术语
AI:人工智能的缩写,广义上指的是计算机可以(像人类)一样学习和做出决策的想法。
神经网络:一种机器学习模型,模仿人脑中的神经元,使用节点网络通过算法处理数据。这允许计算机在许多不同的数据点之间建立联系,并在响应查询时了解哪些是最重要的。
深度学习:描述了一个神经网络,其数据在到达响应之前经过多层处理——其中一些对程序员是隐藏的。ChatGPT 和 Stable Diffusion 等 AI 工具是使用深度学习技术的应用示例。
GPT 和对话式 AI
GPT:“Generative Pre-Trained Transformer”的缩写,这是一种使用深度学习生成类人文本的 AI 模型,由 OpenAI 创建。其中 :
“生成”是指其生成文本的能力。
“预训练”是指使用一个机器学习任务的模型来训练另一个,类似于人类在学习新事物时如何利用现有知识。在这种情况下,GPT 涉及对大量文本进行预训练。
“Transformer”是一种神经网络,可以全面了解数据序列所有部分(如句子中的单词)之间的关系。它被视为人工智能的一项突破,因为它比以前的方法更能理解上下文和细微差别。
语言建模:一种确定句子中单词顺序的技术,基于这些单词有意义的概率。
展开全文
ChatGPT:OpenAI 创建的对话式聊天机器人,使用强调来回对话的语言模型。 截至目前,可以免费试用。
GPT-3:OpenAI创建的第三代语言模型。 它构成了过去两年推出的大量使用OpenAI 的 API的 AI 编写工具的基础。(ChatGPT 使用改进版本,称为 GPT-3.5,而 GPT-4 正在开发中。)
OpenAI:GPT-3、ChatGPT 和 DALL-E 背后的人工智能研究公司。 它最初是一个非营利组织,但现在经营着一家雇佣大部分员工的“利润上限”公司。值得注意的是,Elon Musk 是联合创始人,但于 2018 年辞去了 OpenAI 董事会的职务。
DALL-E、Stable Diffusion和AI艺术
扩散模型:一种根据文本提示创建图像的方法。它的工作原理是向一组训练图像添加随机噪声,然后学习如何去除噪声以构建所需图像。
几家公司现在正在使用扩散模型来提供文本到图像的工具,最著名的是:
DALL-E: OpenAI 的文本转图像工具,它使用 GPT-3 来解释用户的请求。 最新版本 DALL-E2 于 7 月推出,提供比原始版本更清晰、更准确的图像。 它 在公开测试版中可用 ,用户最多可以免费创建 50 张图像。
Stable Diffusion: 由 Stability AI 创建 的开源文本到图像应用程序 。 正式版 安装过程繁琐 ,并通过命令行运行,但第三方开发人员使用开源代码为 台式机 和 网络 创建了更易访问的版本。
Imagen: 另一种使用扩散模型的文本到图像工具,由谷歌创建。 该公司选择 暂时不发布其代码或公开展示它 ,理由是它有可能创建不适当的内容。
Midjourney: 一个创建自己的文本到图像系统的独立实验室,目前 仅提供受邀测试版 。
Dreambooth:一种由谷歌开发的深度学习模型,可以微调通过扩散创建的图像。它最著名的用例是能够根据现有照片生成特定人物的新照片——无论好坏。尽管 Google 本身并未发布 Dreambooth 供公众使用,但其实现已作为开源项目发布。
Lensa:Prisma Labs 于 2018 年首次推出的适用于 iOS和Android的图像编辑应用程序。由于新的“魔法头像”功能,它在最近几周走红,其效果类似于 Stable Diffusion 和 Dreambooth。它因创造过度性感的图像(尤其是女性图像)以及意外的裸体而受到批评。
END