Skip to Content

OpenAI 兼容接口

使用本接口调用蚂蚁百灵模型,支持多轮对话、长程任务等对话场景。接口格式与 OpenAI chat/completions 完全兼容,可直接使用 OpenAI SDK 接入。

请求地址

方法地址
POSThttps://api.ant-ling.com/v1/chat/completions

授权

Authorization

  • 类型HTTP Bearer Auth,值类型 string
  • 必填
  • 说明:用于验证账户信息。前往 API 控制台 ,点击创建令牌获取。
Authorization: Bearer <YOUR_API_KEY>

请求头

Content-Type

  • 类型enum<string>
  • 必填,固定值 application/json
  • 说明:请求体的媒体类型,必须为 application/json

请求体

概览

参数类型必填默认值说明
modelstring模型 ID
messagesobject[]消息列表
streambooleanfalse是否启用流式输出
toolslist工具列表(Function Calling)
temperaturedouble1随机性,范围 [0.0, 1.0]
top_pdouble1多样性,范围 (0.0, 1.0]
enable_searchbooleanfalse是否开启联网搜索
search_optionsobject联网搜索策略

model

  • 类型string
  • 必填
  • 说明:要调用的模型 ID。
  • 可选值Ling-2.6-1TLing-2.6-flashLing-2.5-1TLing-1TRing-2.5-1TRing-1T

messages

  • 类型object[]
  • 必填
  • 说明:提供给模型的消息列表,按对话顺序排列。
[{ "role": "user", "content": "你好" }]

messages.role

  • 类型string
  • 必填
  • 说明:消息发送者的角色。
  • 可选值system(系统提示)、user(用户)、assistant(助手)

messages.content

  • 类型string
  • 必填
  • 说明:发送给模型的消息内容。
  • 示例你好,蚂蚁百灵

stream

  • 类型boolean
  • 非必填,默认 false
  • 说明:设为 true 时启用流式输出,服务端以 SSE 格式逐块返回内容。

非流式调用的超时时间为 90 秒。对于较长的生成任务,建议开启 stream: true 以避免超时。


tools

  • 类型list
  • 非必填
  • 说明:工具列表(Function Calling)。模型可在回复中调用这些工具。
[ { "type": "function", "function": { "name": "get_current_weather", "description": "Get the current weather in a given location", "parameters": { "type": "object", "properties": { "location": { "type": "string", "description": "The city and state, e.g. San Francisco, CA" }, "unit": { "type": "string", "enum": ["celsius", "fahrenheit"] } }, "required": ["location"] } } } ]

temperature

  • 类型double
  • 非必填,默认 1
  • 说明:控制输出的随机性。取值范围 [0.0, 1.0],值越小输出越确定,值越大输出越多样。

top_p

  • 类型double
  • 非必填,默认 1
  • 说明:核采样概率阈值。取值范围 (0.0, 1.0],值越小模型越倾向于高概率词汇。

  • 类型boolean
  • 非必填,默认 false
  • 说明:是否允许模型调用联网搜索能力。
启用联网搜索会增加 Token 消耗,请根据实际需求开启。

search_options

  • 类型object
  • 非必填
  • 说明:联网搜索策略配置。仅在 enable_search: true 时生效。

  • 类型boolean
  • 非必填,默认 false
  • 说明:是否强制每次请求都执行联网搜索。设为 true 时,模型不再自行判断是否需要搜索,而是每次都发起搜索。

请求与响应


请求示例

curl --request POST \ --url https://api.ant-ling.com/v1/chat/completions \ --header 'Authorization: Bearer <YOUR_API_KEY>' \ --header 'Content-Type: application/json' \ --data '{ "model": "Ling-2.6-flash", "stream": true, "messages": [ { "role": "user", "content": "2025 年中国大模型行业将面临哪些机遇与挑战?" } ] }'

响应示例

流式响应以 SSE  格式返回,每行以 data: 开头,结束时发送 data: [DONE]

data: {"choices":[{"delta":{"content":"","role":"assistant"},"index":0}],"created":1761122942,"id":"0a4244f3...","model":"Ling-2.6-flash","object":"chat.completion.chunk"} data: {"choices":[{"delta":{"content":"你好","role":"assistant"},"index":0}],"created":1761122942,"id":"0a4244f3...","model":"Ling-2.6-flash","object":"chat.completion.chunk"} data: {"choices":[{"delta":{"content":"!有什么我可以帮你的吗?","role":"assistant"},"index":0}],"created":1761122943,"id":"0a4244f3...","model":"Ling-2.6-flash","object":"chat.completion.chunk"} data: {"choices":[{"delta":{"content":"","role":"assistant"},"finish_reason":"stop","index":0}],"created":1761122943,"id":"0a4244f3...","model":"Ling-2.6-flash","object":"chat.completion.chunk","usage":{"completion_tokens":20,"prompt_tokens":19,"total_tokens":39}} data: [DONE]
Was this page helpful?
Last updated on