接上兼容 OpenAI 格式的请求,用于监控🚀


准备工作 🛠️

  • 一个有效的 API 密钥 (API Key)

API 请求的三个核心要素

一个完整的 API 请求主要包含三部分:请求目标请求头请求体。下面我们来逐一分解。

1. 请求目标📍

  • 方法 (Method): POST
  • URL: https://api/v1/embeddings或者/chat/completions 等等

2. 请求头 🔐

请求头用来传递一些元数据,比如身份认证信息。你需要设置两个关键的头:

Key (键) Value (值) 说明
Content-Type application/json 发送的数据是 JSON 格式。
Authorization Bearer sk-yio...epmuy (你的密钥) 身份认证
请求头
{
 "Content-Type": "application/json",
 "Authorization": "Bearer [key]"
}

3. 请求体 (Body) 📦

请求体是我们这次请求的核心内容,告诉服务器我们具体想做什么。

  • model (string): 指定你要使用的模型。这里我们用 Qwen/Qwen3-Embedding-8B
  • input (string | array): 你想要转换成 Embedding 向量的文本。可以是一个字符串,也可以是字符串数组。

一个典型的请求体长这样:

{
    "model": "modelname",
    "input": "hello"
}

整合示例

curl --location 'https://api/v1/chat/completions' \
--header 'Content-Type: application/json' \
--header 'Authorization: Bearer [API Key]' \
--data '{
    "model": "modelname",
    "input": "hello"
}'



### 成功的响应 ✅

如果一切顺利,服务器会返回一个 JSON 对象,里面就包含了你需要的 Embedding 向量。

```json
{
    "object": "list",
    "data": [
        {
            "object": "embedding",
            "index": 0,
            "embedding": [
                -0.019822081,
                0.013498003,
                -0.006450682,
                // ... 大量数字组成的向量
            ]
        }
    ],
    "model": "Qwen/Qwen3-Embedding-8B",
    "usage": {
        "prompt_tokens": 24,
        "total_tokens": 24
    }
}

总结一下 📝

接口尾缀 主要用途 模型类型 当前状态
/v1/chat/completions 聊天、问答、多轮对话 对话模型 ✅ 主流标准
/v1/embeddings 将文本转换为向量 (用于搜索、推荐等) Embedding 模型 ✅ 标准