最近,大型語言模型圈有個大新聞,就是中國的 DeepSeek 模型推出了,但目前還有不少爭議,比如資料來源、資安問題和高頻率當機等。不過這些問題可能要等更多消息出來後才好討論,現在先看看後續發展吧。
比較有趣的是,DeepSeek 官方 API 文件 提供了一段範例程式碼,使用的是 OpenAI 的庫,而且它的 HTTP 請求格式跟 GPT、Llama 系列一樣,也有一個不錯的功能:函數呼叫 (function calling),使用方式跟其他模型一樣。目前先分享OpenAI相關使用方式,想必未來DeepSeek也有類似的使用方式。
使用API可以有更全面的功能,下一篇會先介紹不需要寫程式也能輕鬆上手的方法。
▼ 從DeepSeek複製下來的範例程式碼,與OpenAI格式相同,也使用相同的library,API 的使用方式以及參數效果會在後面幾篇談到
from openai import OpenAI
client = OpenAI(api_key="<DeepSeek API Key>", base_url="https://api.deepseek.com")
response = client.chat.completions.create(
model="deepseek-chat",
messages=[
{"role": "system", "content": "You are a helpful assistant"},
{"role": "user", "content": "Hello"},
],
stream=False
)
print(response.choices[0].message.content)
curl https://api.deepseek.com/chat/completions \
-H "Content-Type: application/json" \
-H "Authorization: Bearer <DeepSeek API Key>" \
-d '{
"model": "deepseek-chat",
"messages": [
{"role": "system", "content": "You are a helpful assistant."},
{"role": "user", "content": "Hello!"}
],
"stream": false
}'