Gemini - CowAgent

Google Gemini はテキスト対話、画像理解、画像生成（Nano Banana シリーズ）をサポートしており、1 つの gemini_api_key ですべての機能を有効化できます。

Web コンソールの「モデル管理」ページから、以下のすべての機能をワンストップで設定でき、設定ファイルを手動で編集する必要はありません。

テキスト対話

{
  "model": "gemini-3.5-flash",
  "gemini_api_key": "YOUR_API_KEY"
}

パラメータ	説明
`model`	推奨は `gemini-3.5-flash`。`gemini-3.1-pro-preview`、`gemini-3.1-flash-lite-preview`、`gemini-3-flash-preview`、`gemini-3-pro-preview` などもサポート。詳細は公式ドキュメントを参照
`gemini_api_key`	Google AI Studio で作成
`gemini_api_base`	任意。デフォルトは `https://generativelanguage.googleapis.com`。サードパーティのプロキシに変更可能

Gemini の全シリーズモデルはネイティブにビジョンをサポートしています。gemini_api_key を設定すると、Agent の Vision ツールは自動的にメインモデルを使用して画像を認識します。追加設定は不要です。 Vision モデルを手動で指定したい場合：

{
  "tools": {
    "vision": {
      "model": "gemini-3.1-flash-lite-preview"
    }
  }
}

{
  "skills": {
    "image-generation": {
      "model": "gemini-3.1-flash-image-preview"
    }
  }
}