OpenAI 兼容接口
使用本接口调用蚂蚁百灵模型,支持多轮对话、长程任务等对话场景。接口格式与 OpenAI chat/completions 完全兼容,可直接使用 OpenAI SDK 接入。
请求地址
| 方法 | 地址 |
|---|---|
POST | https://api.ant-ling.com/v1/chat/completions |
授权
Authorization
- 类型:
HTTP Bearer Auth,值类型string - 必填
- 说明:用于验证账户信息。前往 API 控制台 ,点击创建令牌获取。
Authorization: Bearer <YOUR_API_KEY>请求头
Content-Type
- 类型:
enum<string> - 必填,固定值
application/json - 说明:请求体的媒体类型,必须为
application/json。
请求体
概览
| 参数 | 类型 | 必填 | 默认值 | 说明 |
|---|---|---|---|---|
model | string | 是 | — | 模型 ID |
messages | object[] | 是 | — | 消息列表 |
stream | boolean | 否 | false | 是否启用流式输出 |
tools | list | 否 | — | 工具列表(Function Calling) |
temperature | double | 否 | 1 | 随机性,范围 [0.0, 1.0] |
top_p | double | 否 | 1 | 多样性,范围 (0.0, 1.0] |
enable_search | boolean | 否 | false | 是否开启联网搜索 |
search_options | object | 否 | — | 联网搜索策略 |
model
- 类型:
string - 必填
- 说明:要调用的模型 ID。
- 可选值:
Ling-2.6-1T、Ling-2.6-flash、Ling-2.5-1T、Ling-1T、Ring-2.5-1T、Ring-1T
messages
- 类型:
object[] - 必填
- 说明:提供给模型的消息列表,按对话顺序排列。
[{ "role": "user", "content": "你好" }]messages.role
- 类型:
string - 必填
- 说明:消息发送者的角色。
- 可选值:
system(系统提示)、user(用户)、assistant(助手)
messages.content
- 类型:
string - 必填
- 说明:发送给模型的消息内容。
- 示例:
你好,蚂蚁百灵
stream
- 类型:
boolean - 非必填,默认
false - 说明:设为
true时启用流式输出,服务端以 SSE 格式逐块返回内容。
非流式调用的超时时间为 90 秒。对于较长的生成任务,建议开启 stream: true 以避免超时。
tools
- 类型:
list - 非必填
- 说明:工具列表(Function Calling)。模型可在回复中调用这些工具。
[
{
"type": "function",
"function": {
"name": "get_current_weather",
"description": "Get the current weather in a given location",
"parameters": {
"type": "object",
"properties": {
"location": {
"type": "string",
"description": "The city and state, e.g. San Francisco, CA"
},
"unit": {
"type": "string",
"enum": ["celsius", "fahrenheit"]
}
},
"required": ["location"]
}
}
}
]temperature
- 类型:
double - 非必填,默认
1 - 说明:控制输出的随机性。取值范围
[0.0, 1.0],值越小输出越确定,值越大输出越多样。
top_p
- 类型:
double - 非必填,默认
1 - 说明:核采样概率阈值。取值范围
(0.0, 1.0],值越小模型越倾向于高概率词汇。
enable_search
- 类型:
boolean - 非必填,默认
false - 说明:是否允许模型调用联网搜索能力。
启用联网搜索会增加 Token 消耗,请根据实际需求开启。
search_options
- 类型:
object - 非必填
- 说明:联网搜索策略配置。仅在
enable_search: true时生效。
search_options.forced_search
- 类型:
boolean - 非必填,默认
false - 说明:是否强制每次请求都执行联网搜索。设为
true时,模型不再自行判断是否需要搜索,而是每次都发起搜索。
请求与响应
请求示例
流式调用
cURL
curl --request POST \
--url https://api.ant-ling.com/v1/chat/completions \
--header 'Authorization: Bearer <YOUR_API_KEY>' \
--header 'Content-Type: application/json' \
--data '{
"model": "Ling-2.6-flash",
"stream": true,
"messages": [
{
"role": "user",
"content": "2025 年中国大模型行业将面临哪些机遇与挑战?"
}
]
}'响应示例
流式响应
流式响应以 SSE 格式返回,每行以 data: 开头,结束时发送 data: [DONE]。
data: {"choices":[{"delta":{"content":"","role":"assistant"},"index":0}],"created":1761122942,"id":"0a4244f3...","model":"Ling-2.6-flash","object":"chat.completion.chunk"}
data: {"choices":[{"delta":{"content":"你好","role":"assistant"},"index":0}],"created":1761122942,"id":"0a4244f3...","model":"Ling-2.6-flash","object":"chat.completion.chunk"}
data: {"choices":[{"delta":{"content":"!有什么我可以帮你的吗?","role":"assistant"},"index":0}],"created":1761122943,"id":"0a4244f3...","model":"Ling-2.6-flash","object":"chat.completion.chunk"}
data: {"choices":[{"delta":{"content":"","role":"assistant"},"finish_reason":"stop","index":0}],"created":1761122943,"id":"0a4244f3...","model":"Ling-2.6-flash","object":"chat.completion.chunk","usage":{"completion_tokens":20,"prompt_tokens":19,"total_tokens":39}}
data: [DONE]Was this page helpful?
Last updated on