跳转到主要内容
使用 Vision API 分析本地图片或图片 URL,支持内容描述、文字提取(OCR)、物体识别等。

依赖

需要配置至少一个 API Key(通过 env_config 工具或工作空间 .env 文件配置):
后端环境变量优先级
OpenAIOPENAI_API_KEY优先使用
LinkAILINKAI_API_KEY备选

参数

参数类型必填说明
imagestring本地文件路径或 HTTP(S) 图片 URL
questionstring对图片提出的问题
modelstring模型名称(默认 gpt-4.1-mini)
支持的图片格式:jpg、jpeg、png、gif、webp

使用场景

  • 描述图片中的内容
  • 提取图片中的文字(OCR)
  • 识别物体、颜色、场景
  • 分析截图、文档扫描件
超过 1MB 的图片会自动压缩后上传。如果未配置任何 Vision API Key,该工具不会被加载。