跳到主要内容

OpenAI 介绍

OpenAI API 几乎可以应用于任何需要理解或生成自然语言和代码的任务。OpenAI API 还可用于生成和编辑图像或将语音转换为文本。我们提供一系列具有不同功能和价位的模型,并且能够微调定制模型。

数据隐私

在 OpenAI,保护用户数据是我们使命的基础。我们不会通过 API 来训练我们的模型的输入和输出。请访问我们的 API 数据隐私页面了解更多信息。

关键概念

GPT

OpenAI 的 GPT(生成式预训练变压器)模型经过训练可以理解自然语言和代码。GPT 提供文本输出来响应其输入。GPT 的输入也称为"提示"。设计提示本质上是如何"编程"GPT 模型,通常是通过提供说明或一些如何成功完成任务的示例。

GPT 可用于多种任务,包括:

  • 内容或代码生成
  • 摘要
  • 对话
  • 创意写作

嵌入

嵌入是一段数据(例如某些文本)的矢量表示,旨在保留其内容和/或其含义的各个方面。在某些方面相似的数据块往往比不相关的数据具有更紧密的嵌入。

OpenAI 提供文本嵌入模型,该模型将文本字符串作为输入并生成嵌入向量作为输出。嵌入对于以下任务非常有用:

  • 搜索
  • 聚类
  • 推荐
  • 异常检测
  • 分类

代币(Tokens)

GPT 和嵌入模型以称为标记的块的形式处理文本。标记代表常见的字符序列。例如:

  • "tokenization" 被分解为 "token" 和 "ization"
  • "the" 这样的短而常见的单词被表示为单个标记
提示

根据经验,1 个标记大约相当于:

  • 4 个字符
  • 0.75 个英文单词
  • 1.6 个中文汉字
注意

对于 GPT 模型,提示和生成的输出之和不得超过模型的最大上下文长度。 上述规则对于其它 Ai 模型同样生效

这篇文档对您有帮助吗?