百川智能

批次请求

POST/v1/embeddings

请求频率限制
当前单账号限制 10 记录/秒。如果您收到速率限制的报错，则表示您在短时间内发出了太多请求，API 会拒绝新请求，直到经过指定的时间。

请求参数

Header 参数

Content-Type

string

必需

请求的数据格式，目前仅支持 JSON 格式，固定填写"application/json"。

示例值:

application/json

Authorization

string

必需

请求鉴权的 APIKey，由百川提供，Bearer 开头。请先在百川 API 开放平台完成实名认证、充值、创建 APIkey 等流程，流程详见如下链接中的流程图：https://platform.baichuan-ai.com/docs/api

示例值:

Bearer $BAICHUNA_API_KEY

model

string

必需

模型名称，目前仅支持“Baichuan-Text-Embedding”，输入最长是 512 个 token，输出 1024 维。

input

array[string]

必需

输入文本以获取 embeddings。说明：（1）文本数量不超过 16。（2）每个文本长度不超过 512 个 token，超出自动截断，token 统计信息，token 数 = 汉字数+单词数*1.3 （仅为估算逻辑，以实际返回为准)。(3) 批量最多 16 个，超过 16 后默认截断。

{
  "model": "Baichuan-Text-Embedding",
  "input": [
    "新年快乐",
    "百川大模型"
  ]
}

示例代码

返回响应

成功(200)

HTTP 状态码: 200

内容格式: JSONapplication/json

data

array [object {3}]

必需

详见data 说明。

index

integer

必需

序号，对应请求 input 中的下标，从 0 开始。

embedding

array[number]

必需

embedding 的处理结果，返回向量化表征的数组。

object

string

必需

固定值"embedding"。

model

string

使用的模型名称。

必需

object

string

必需

回包类型，固定值“list”。

usage

object

必需

本次模型调用的 tokens 数量统计，详见usage 说明。

prompt_tokens

integer

必需

问题 tokens 数。

total_tokens

integer

必需

总 tokens 数量。

                {
    "data":[
        {
            "index":0,
            "embedding":[
                -0.019259492,
                0.060714953,
                -0.03308828,
                0.02188026,
                -0.0083048185,
                -0.040358588,
                ...
            ],
            "object":"embedding"
        },
        {
            "index":1,
            "embedding":[
                0.009904957,
                0.0043520057,
                -0.0013257528,
                0.03802269,
                -0.011389915,
                0.010124389,
                ...
            ],
            "object":"embedding"
        }
    ],
    "model":"Baichuan-Text-Embedding",
    "object":"list",
    "usage":{
        "prompt_tokens":14,
        "total_tokens":14
    }
}

最后修改时间： 1 年前