接上兼容 OpenAI 格式的请求,用于监控🚀
准备工作 🛠️
- 一个有效的 API 密钥 (API Key)。
API 请求的三个核心要素
一个完整的 API 请求主要包含三部分:请求目标、请求头 和 请求体。下面我们来逐一分解。
1. 请求目标📍
- 方法 (Method):
POST - URL:
https://api/v1/embeddings或者/chat/completions 等等
2. 请求头 🔐
请求头用来传递一些元数据,比如身份认证信息。你需要设置两个关键的头:
| Key (键) | Value (值) | 说明 |
|---|---|---|
Content-Type |
application/json |
发送的数据是 JSON 格式。 |
Authorization |
Bearer sk-yio...epmuy (你的密钥) |
身份认证 |
请求头
{
"Content-Type": "application/json",
"Authorization": "Bearer [key]"
}
3. 请求体 (Body) 📦
请求体是我们这次请求的核心内容,告诉服务器我们具体想做什么。
model(string): 指定你要使用的模型。这里我们用Qwen/Qwen3-Embedding-8B。input(string | array): 你想要转换成 Embedding 向量的文本。可以是一个字符串,也可以是字符串数组。
一个典型的请求体长这样:
{
"model": "modelname",
"input": "hello"
}
整合示例
curl --location 'https://api/v1/chat/completions' \
--header 'Content-Type: application/json' \
--header 'Authorization: Bearer [API Key]' \
--data '{
"model": "modelname",
"input": "hello"
}'
### 成功的响应 ✅
如果一切顺利,服务器会返回一个 JSON 对象,里面就包含了你需要的 Embedding 向量。
```json
{
"object": "list",
"data": [
{
"object": "embedding",
"index": 0,
"embedding": [
-0.019822081,
0.013498003,
-0.006450682,
// ... 大量数字组成的向量
]
}
],
"model": "Qwen/Qwen3-Embedding-8B",
"usage": {
"prompt_tokens": 24,
"total_tokens": 24
}
}
总结一下 📝
| 接口尾缀 | 主要用途 | 模型类型 | 当前状态 |
|---|---|---|---|
| /v1/chat/completions | 聊天、问答、多轮对话 | 对话模型 | ✅ 主流标准 |
| /v1/embeddings | 将文本转换为向量 (用于搜索、推荐等) | Embedding 模型 | ✅ 标准 |