OpenAI 介 绍
OpenAI API 几乎可以应用于任何需要理解或生成自然语言和代码的任务。OpenAI API 还可用于生成和编辑图像或将语音转换为文本。我们提供一系列具有不同功能和价位的模型,并且能够微调定制模型。
数据隐私
在 OpenAI,保护用户数据是我们使命的基础。我们不会通过 API 来训练我们的模型的输入和输出。请访问我们的 API 数据隐私页面了解更多信息。
关键概念
GPT
OpenAI 的 GPT(生成式预训练变压器)模型经过训练可以理解自然语言和代码。GPT 提供文本输出来响应其输入。GPT 的输入也称为"提示"。设计提示本质上是如何"编程"GPT 模型,通常是通过提供说明或一些如何成功完成任务的示例。
GPT 可用于多种任务,包括:
- 内容或代码生成
- 摘要
- 对话
- 创意写作
嵌入
嵌入是一段数据(例如某些文本)的矢量表示,旨在保留其内容和/或其含义的各个方面。在某些方面相似的数据块往往比不相关的数据具有更紧密的嵌入。
OpenAI 提供文本嵌入模型,该模型将文本字符串作为输入并生成嵌入向量作为输出。嵌入对于以下任务非常有用:
- 搜索
- 聚类
- 推荐
- 异常检测
- 分类
代币(Tokens)
GPT 和嵌入模型以称为标记的块的形式处理文本。标记代表常见的字符序列。例如:
- "tokenization" 被分解为 "token" 和 "ization"
- "the" 这样的短而常见的单词被表示为单个标记
提示
根据经验,1 个标记大约相当于:
- 4 个字符
- 0.75 个英文单词
- 1.6 个中文汉字
注意
对于 GPT 模型,提示和生成的输出之和不得超过模型的最大上下文长度。 上述规则对于其它 Ai 模型同样生效