メインコンテンツへスキップ
Zhipu AI はテキスト対話、画像理解、音声認識(ASR)、ベクトル(Embedding)をサポートしており、1 つの zhipu_ai_api_key ですべての機能を有効化できます。
Web コンソールの「モデル管理」ページから、以下のすべての機能をワンストップで設定でき、設定ファイルを手動で編集する必要はありません。

テキスト対話

{
  "model": "glm-5.1",
  "zhipu_ai_api_key": "YOUR_API_KEY"
}
パラメータ説明
modelglm-5.1glm-5-turboglm-5glm-4.7glm-4-plusglm-4-flashglm-4-air などを指定可能。詳細は モデルコード を参照
zhipu_ai_api_keyZhipu AI コンソール で作成
zhipu_ai_api_base任意。デフォルトは https://open.bigmodel.cn/api/paas/v4

画像理解

Zhipu の chat 系モデル(glm-5.1glm-5-turbo など)はビジョンに対応していないため、ビジョン呼び出しは glm-5v-turbo に統一的にルーティングされます。zhipu_ai_api_key を設定すると、Agent の Vision ツールは自動的にこのモデルを使用するため、設定ファイルで明示的に指定する必要はありません。

音声認識

{
  "voice_to_text": "zhipu",
  "voice_to_text_model": "glm-asr-2512"
}
パラメータ説明
voice_to_textzhipu に設定すると Zhipu ASR が有効になります
voice_to_text_model任意。デフォルトは glm-asr-2512
認証情報は zhipu_ai_api_key を自動的に再利用します。音声ファイルは 25MB 未満を推奨します。サイズが大きすぎるファイルはサーバ側で拒否される可能性があります。

ベクトル

{
  "embedding_provider": "zhipu",
  "embedding_model": "embedding-3"
}
選択可能なモデル:embedding-3embedding-2。embedding を変更した後は /memory rebuild-index コマンドを実行してインデックスを再構築する必要があります。