Skip to content

Chat Completions API

Chat Completions 是最常用的 API,用于与 AI 模型进行对话交互。

端点

POST https://api.lurus.cn/v1/chat/completions

请求参数

必填参数

参数类型描述
modelstring模型名称,如 deepseek-chatgpt-4o
messagesarray对话消息数组

可选参数

参数类型默认值描述
temperaturenumber1.0采样温度 (0-2),越高越随机
top_pnumber1.0核采样参数
max_tokensinteger-最大生成 Token 数
streambooleanfalse是否启用流式响应
stopstring/array-停止生成的标记
presence_penaltynumber0存在惩罚 (-2 到 2)
frequency_penaltynumber0频率惩罚 (-2 到 2)
ninteger1生成几个回复
userstring-用户标识符

Messages 格式

json
{
  "messages": [
    {"role": "system", "content": "你是一个有帮助的助手"},
    {"role": "user", "content": "你好"},
    {"role": "assistant", "content": "你好!有什么可以帮你的?"},
    {"role": "user", "content": "介绍一下自己"}
  ]
}

角色说明:

  • system: 系统指令,设定 AI 的行为和人设
  • user: 用户消息
  • assistant: AI 回复(用于多轮对话历史)

完整请求示例

bash
curl https://api.lurus.cn/v1/chat/completions \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer sk-your-api-key" \
  -d '{
    "model": "deepseek-chat",
    "messages": [
      {
        "role": "system",
        "content": "你是一位专业的技术顾问,擅长用简洁的语言解释复杂概念。"
      },
      {
        "role": "user",
        "content": "什么是 RESTful API?"
      }
    ],
    "temperature": 0.7,
    "max_tokens": 500
  }'

响应格式

标准响应

json
{
  "id": "chatcmpl-abc123xyz",
  "object": "chat.completion",
  "created": 1700000000,
  "model": "deepseek-chat",
  "choices": [
    {
      "index": 0,
      "message": {
        "role": "assistant",
        "content": "RESTful API 是一种基于 REST(表述性状态转移)架构风格设计的 Web API..."
      },
      "finish_reason": "stop"
    }
  ],
  "usage": {
    "prompt_tokens": 45,
    "completion_tokens": 120,
    "total_tokens": 165
  }
}

字段说明

字段描述
id请求唯一标识
object固定为 chat.completion
createdUnix 时间戳
model实际使用的模型
choices生成的回复数组
choices[].messageAI 回复消息
choices[].finish_reason结束原因:stoplengthcontent_filter
usageToken 使用统计

流式响应

启用 stream: true 后,响应通过 Server-Sent Events 逐块返回:

bash
curl https://api.lurus.cn/v1/chat/completions \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer sk-your-api-key" \
  -d '{
    "model": "deepseek-chat",
    "messages": [{"role": "user", "content": "写一首诗"}],
    "stream": true
  }'

流式响应格式

data: {"id":"chatcmpl-abc","object":"chat.completion.chunk","choices":[{"delta":{"content":"春"},"index":0}]}

data: {"id":"chatcmpl-abc","object":"chat.completion.chunk","choices":[{"delta":{"content":"风"},"index":0}]}

data: {"id":"chatcmpl-abc","object":"chat.completion.chunk","choices":[{"delta":{"content":"送"},"index":0}]}

data: [DONE]

Python 流式处理

python
from openai import OpenAI

client = OpenAI(
    base_url="https://api.lurus.cn/v1",
    api_key="sk-your-api-key"
)

stream = client.chat.completions.create(
    model="deepseek-chat",
    messages=[{"role": "user", "content": "写一首诗"}],
    stream=True
)

for chunk in stream:
    if chunk.choices[0].delta.content:
        print(chunk.choices[0].delta.content, end="", flush=True)

多模态输入 (Vision)

部分模型支持图像输入:

json
{
  "model": "gemini-3-pro-image-preview",
  "messages": [
    {
      "role": "user",
      "content": [
        {"type": "text", "text": "描述这张图片"},
        {
          "type": "image_url",
          "image_url": {
            "url": "https://example.com/image.jpg"
          }
        }
      ]
    }
  ]
}

也支持 Base64 编码:

json
{
  "type": "image_url",
  "image_url": {
    "url": "..."
  }
}

最佳实践

1. 设置合理的 System Prompt

json
{
  "messages": [
    {
      "role": "system",
      "content": "你是一位专业的客服代表。请用友好、专业的语气回复客户问题。回复要简洁明了,控制在100字以内。"
    }
  ]
}

2. 控制输出长度

json
{
  "max_tokens": 500,
  "stop": ["\n\n", "---"]
}

3. 调整创造性

json
// 精确回答(代码、数学)
{"temperature": 0.1}

// 创意写作
{"temperature": 0.9}

4. 保持对话上下文

python
conversation = []

def chat(user_message):
    conversation.append({"role": "user", "content": user_message})
    
    response = client.chat.completions.create(
        model="deepseek-chat",
        messages=conversation
    )
    
    assistant_message = response.choices[0].message.content
    conversation.append({"role": "assistant", "content": assistant_message})
    
    return assistant_message

错误处理

常见错误:

错误码原因解决方案
400请求参数错误检查 JSON 格式和必填参数
401API Key 无效检查 Key 是否正确
403无权限访问模型联系管理员开通权限
429速率限制降低请求频率
500服务器错误重试或联系支持

详见 错误处理

Powered by Lurus Technologies