Skip to content

相机捕获(代理)

OpenClaw 支持代理工作流的相机捕获功能:

  • iOS 节点(通过 Gateway 配对):通过 node.invoke 捕获照片(jpg)或短视频片段(mp4,可选音频)。
  • Android 节点(通过 Gateway 配对):通过 node.invoke 捕获照片(jpg)或短视频片段(mp4,可选音频)。
  • macOS 应用(通过 Gateway 的节点):通过 node.invoke 捕获照片(jpg)或短视频片段(mp4,可选音频)。

所有相机访问都受用户控制的设置保护。

iOS 节点

用户设置(默认开启)

  • iOS 设置标签 → CameraAllow Camera(camera.enabled)
    • 默认:开启(缺少键值视为启用)。
    • 关闭时:camera.* 命令返回 CAMERA_DISABLED

命令(通过 Gateway node.invoke)

  • camera.list

    • 响应载荷:
      • devices:{ id, name, position, deviceType } 数组
  • camera.snap

    • 参数:
      • facing:front|back(默认:front)
      • maxWidth:数字(可选;iOS 节点默认 1600)
      • quality:0..1(可选;默认 0.9)
      • format:当前为 jpg
      • delayMs:数字(可选;默认 0)
      • deviceId:字符串(可选;来自 camera.list)
    • 响应载荷:
      • format: "jpg"
      • base64: "<...>"
      • widthheight
    • 载荷保护:照片会被重新压缩以保持 base64 载荷小于 5 MB。
  • camera.clip

    • 参数:
      • facing:front|back(默认:front)
      • durationMs:数字(默认 3000,最大限制为 60000)
      • includeAudio:布尔值(默认 true)
      • format:当前为 mp4
      • deviceId:字符串(可选;来自 camera.list)
    • 响应载荷:
      • format: "mp4"
      • base64: "<...>"
      • durationMs
      • hasAudio

前台要求

canvas.* 类似,iOS 节点仅在前台允许 camera.* 命令。后台调用返回 NODE_BACKGROUND_UNAVAILABLE

CLI 辅助工具(临时文件 + MEDIA)

获取附件最简单的方式是通过 CLI 辅助工具,它会将解码的媒体写入临时文件并打印 MEDIA:<path>

示例:

bash
openclaw nodes camera snap --node <id>               # default: both front + back (2 MEDIA lines)
openclaw nodes camera snap --node <id> --facing front
openclaw nodes camera clip --node <id> --duration 3000
openclaw nodes camera clip --node <id> --no-audio

注意:

  • nodes camera snap 默认为双面拍摄,为代理提供两个视角。
  • 输出文件是临时的(在操作系统临时目录中),除非你构建自己的封装器。

Android 节点

用户设置(默认开启)

  • Android 设置面板 → CameraAllow Camera(camera.enabled)
    • 默认:开启(缺少键值视为启用)。
    • 关闭时:camera.* 命令返回 CAMERA_DISABLED

权限

  • Android 需要运行时权限:
    • camera.snapcamera.clip 都需要 CAMERA
    • includeAudio=true 时,camera.clip 需要 RECORD_AUDIO

如果缺少权限,应用会在可能的情况下提示;如果被拒绝,camera.* 请求会失败并返回 *_PERMISSION_REQUIRED 错误。

前台要求

canvas.* 类似,Android 节点仅在前台允许 camera.* 命令。后台调用返回 NODE_BACKGROUND_UNAVAILABLE

载荷保护

照片会被重新压缩以保持 base64 载荷小于 5 MB。

macOS 应用

用户设置(默认关闭)

macOS 配套应用提供了一个复选框:

  • Settings → General → Allow Camera(openclaw.cameraEnabled)
    • 默认:关闭
    • 关闭时:相机请求返回"Camera disabled by user"。

CLI 辅助工具(节点调用)

使用主 openclaw CLI 在 macOS 节点上调用相机命令。

示例:

bash
openclaw nodes camera list --node <id>            # list camera ids
openclaw nodes camera snap --node <id>            # prints MEDIA:<path>
openclaw nodes camera snap --node <id> --max-width 1280
openclaw nodes camera snap --node <id> --delay-ms 2000
openclaw nodes camera snap --node <id> --device-id <id>
openclaw nodes camera clip --node <id> --duration 10s          # prints MEDIA:<path>
openclaw nodes camera clip --node <id> --duration-ms 3000      # prints MEDIA:<path> (legacy flag)
openclaw nodes camera clip --node <id> --device-id <id>
openclaw nodes camera clip --node <id> --no-audio

注意:

  • openclaw nodes camera snap 默认为 maxWidth=1600,除非被覆盖。
  • 在 macOS 上,camera.snap 会在预热/曝光稳定后等待 delayMs(默认 2000ms)再捕获。
  • 照片载荷会被重新压缩以保持 base64 小于 5 MB。

安全 + 实际限制

  • 相机和麦克风访问会触发常规的操作系统权限提示(并需要在 Info.plist 中添加使用说明字符串)。
  • 视频片段有上限(当前为 <= 60s),以避免节点载荷过大(base64 开销 + 消息限制)。

macOS 屏幕录制(操作系统级别)

对于_屏幕_录制(非相机),使用 macOS 配套应用:

bash
openclaw nodes screen record --node <id> --duration 10s --fps 15   # prints MEDIA:<path>

注意:

  • 需要 macOS Screen Recording 权限(TCC)。