批次请求
POST
/v1/embeddings请求频率限制
当前单账号限制 10 记录/秒。如果您收到速率限制的报错,则表示您在短时间内发出了太多请求,API 会拒绝新请求,直到经过指定的时间。
请求参数
Header 参数
Content-Type
string
必需
请求的数据格式,目前仅支持 JSON 格式,固定填写"application/json"。
示例值:
application/json
Authorization
string
必需
请求鉴权的 APIKey,由百川提供,Bearer 开头。请先在百川 API 开放平台完成实名认证、充值、创建 APIkey 等流程,流程详见如下链接中的流程图:https://platform.baichuan-ai.com/docs/api
示例值:
Bearer $BAICHUNA_API_KEY
Body 参数application/json
model
string
必需
模型名称,目前仅支持“Baichuan-Text-Embedding”,输入最长是 512 个 token,输出 1024 维。
input
array[string]
必需
输入文本以获取 embeddings。说明: (1)文本数量不超过 16。 (2)每个文本长度不超过 512 个 token,超出自动截断,token 统计信息,token 数 = 汉字数+单词数*1.3 (仅为估算逻辑,以实际返回为准)。(3) 批量最多 16 个,超过 16 后默认截断。
示例
{
"model": "Baichuan-Text-Embedding",
"input": [
"新年快乐",
"百川大模型"
]
}
示例代码
返回响应
成功(200)
HTTP 状态码: 200
内容格式: JSONapplication/json
数据结构
data
array [object {3}]
必需
详见data 说明。
index
integer
必需
序号,对应请求 input 中的下标,从 0 开始。
embedding
array[number]
必需
embedding 的处理结果,返回向量化表征的数组。
object
string
必需
固定值"embedding"。
model
string
使用的模型名称。
object
string
必需
回包类型,固定值“list”。
usage
object
必需
本次模型调用的 tokens 数量统计,详见usage 说明。
prompt_tokens
integer
必需
问题 tokens 数。
total_tokens
integer
必需
总 tokens 数量。
示例
{
"data":[
{
"index":0,
"embedding":[
-0.019259492,
0.060714953,
-0.03308828,
0.02188026,
-0.0083048185,
-0.040358588,
...
],
"object":"embedding"
},
{
"index":1,
"embedding":[
0.009904957,
0.0043520057,
-0.0013257528,
0.03802269,
-0.011389915,
0.010124389,
...
],
"object":"embedding"
}
],
"model":"Baichuan-Text-Embedding",
"object":"list",
"usage":{
"prompt_tokens":14,
"total_tokens":14
}
}
最后修改时间: 1 年前