接上兼容 OpenAI 格式的请求，用于监控🚀

准备工作 🛠️

一个有效的 API 密钥 (API Key)。

API 请求的三个核心要素

一个完整的 API 请求主要包含三部分：请求目标、请求头 和 请求体。下面我们来逐一分解。

1. 请求目标📍

方法 (Method): POST
URL: https://api/v1/embeddings或者/chat/completions 等等

2. 请求头 🔐

请求头用来传递一些元数据，比如身份认证信息。你需要设置两个关键的头：

Key (键)	Value (值)	说明
`Content-Type`	`application/json`	发送的数据是 JSON 格式。
`Authorization`	`Bearer sk-yio...epmuy` (你的密钥)	身份认证

请求头
{
 "Content-Type": "application/json",
 "Authorization": "Bearer [key]"
}

3. 请求体 (Body) 📦

请求体是我们这次请求的核心内容，告诉服务器我们具体想做什么。

model (string): 指定你要使用的模型。这里我们用 Qwen/Qwen3-Embedding-8B。
input (string | array): 你想要转换成 Embedding 向量的文本。可以是一个字符串，也可以是字符串数组。

一个典型的请求体长这样：

{
    "model": "modelname",
    "input": "hello"
}

整合示例

curl --location 'https://api/v1/chat/completions' \
--header 'Content-Type: application/json' \
--header 'Authorization: Bearer [API Key]' \
--data '{
    "model": "modelname",
    "input": "hello"
}'



### 成功的响应 ✅

如果一切顺利，服务器会返回一个 JSON 对象，里面就包含了你需要的 Embedding 向量。

```json
{
    "object": "list",
    "data": [
        {
            "object": "embedding",
            "index": 0,
            "embedding": [
                -0.019822081,
                0.013498003,
                -0.006450682,
                // ... 大量数字组成的向量
            ]
        }
    ],
    "model": "Qwen/Qwen3-Embedding-8B",
    "usage": {
        "prompt_tokens": 24,
        "total_tokens": 24
    }
}

总结一下 📝

接口尾缀	主要用途	模型类型	当前状态
/v1/chat/completions	聊天、问答、多轮对话	对话模型	✅ 主流标准
/v1/embeddings	将文本转换为向量 (用于搜索、推荐等)	Embedding 模型	✅ 标准