メインコンテンツへスキップ
Google Gemini はテキスト対話、画像理解、画像生成(Nano Banana シリーズ)をサポートしており、1 つの gemini_api_key ですべての機能を有効化できます。
Web コンソールの「モデル管理」ページから、以下のすべての機能をワンストップで設定でき、設定ファイルを手動で編集する必要はありません。

テキスト対話

{
  "model": "gemini-3.5-flash",
  "gemini_api_key": "YOUR_API_KEY"
}
パラメータ説明
model推奨は gemini-3.5-flashgemini-3.1-pro-previewgemini-3.1-flash-lite-previewgemini-3-flash-previewgemini-3-pro-preview などもサポート。詳細は 公式ドキュメント を参照
gemini_api_keyGoogle AI Studio で作成
gemini_api_base任意。デフォルトは https://generativelanguage.googleapis.com。サードパーティのプロキシに変更可能

画像理解

Gemini の全シリーズモデルはネイティブにビジョンをサポートしています。gemini_api_key を設定すると、Agent の Vision ツールは自動的にメインモデルを使用して画像を認識します。追加設定は不要です。 Vision モデルを手動で指定したい場合:
{
  "tools": {
    "vision": {
      "model": "gemini-3.1-flash-lite-preview"
    }
  }
}

画像生成

{
  "skills": {
    "image-generation": {
      "model": "gemini-3.1-flash-image-preview"
    }
  }
}
モデル IDエイリアス
gemini-3.1-flash-image-previewNano Banana 2
gemini-3-pro-image-previewNano Banana Pro
gemini-2.5-flash-imageNano Banana