概述

openclaw-logo-text-dark.avif

OpenClaw 是一个跨平台工具,通过统一的网关将各种通讯应用连接到AI智能体,实现通过常用聊天应用与AI对话的功能。

OpenClaw官网:https://docs.openclaw.ai/zh-CN

主要特性

  • 多平台支持:原生支持 WhatsApp、Telegram、Discord、iMessage

  • 插件扩展:可通过插件添加 Mattermost、钉钉、飞书、企业微信 等更多渠道

  • 跨平台运行:适用于任意操作系统

  • 统一管理:通过单一网关管理所有连接

工作原理

WhatsApp / Telegram / Discord / iMessage (+ plugins)
        │
        ▼
  ┌───────────────────────────┐
  │          Gateway          │  ws://127.0.0.1:18789 (loopback-only)
  │     (single source)       │
  │                           │  http://<gateway-host>:18793
  │                           │    /__openclaw__/canvas/ (Canvas host)
  └───────────┬───────────────┘
              │
              ├─ Pi agent (RPC)
              ├─ CLI (openclaw …)
              ├─ Chat UI (SwiftUI)
              ├─ macOS app (OpenClaw.app)
              ├─ iOS node via Gateway WS + pairing
              └─ Android node via Gateway WS + pairing

核心组件

  1. Gateway(网关):长期运行的单进程,管理渠道连接

  2. 通讯渠道适配器

    • WhatsApp: 通过 WhatsApp Web / Baileys

    • Telegram: 通过 Bot API / grammY

    • Discord: 通过 Bot API / discord.js

    • iMessage: 通过 imsg CLI

通信方式

  • WebSocket: ws://127.0.0.1:18789(仅本地回环)

  • HTTP: http://<gateway-host>:18793/__openclaw__/canvas/

快速开始

系统要求

Node ≥ 22

全局安装 OpenClaw

npm install -g openclaw@latest
# 或
pnpm add -g openclaw@latest

配置向导步骤

初始化配置

openclaw onboard --install-daemon

1. 安全条款

接受安全条款:选择"Yes"

2. 选择模型

使用快速安装选项

3. 配置大模型

我这里选择智谱,填入API key

4. 选择对接的应用

首次暂时跳过:Skip for now

5. 配置技能

提示是否配置技能,选是

根据自己的需求配置技能,上下键切换Skill,空格来选择或者取消选择:

6. 技能安装

选择安装方式

7. 技能说明

🔐 密码与安全

  1. password - 通过 CLI 访问 1Password,读取或查询密码库中的条目,用于脚本或自动化场景。

  2. oracle - 本地或远程的"信息查询/推理"类 skill,具体能力取决于实现(不是 Oracle 数据库本身)。

🍎 Apple / macOS 原生生态

  1. apple-notes - 通过 memo CLI 管理 Apple Notes,可创建、查看、编辑、删除、搜索、移动笔记。

  2. apple-reminders - 通过 CLI 读取和管理 Apple 提醒事项。

  3. imsg - 通过命令行发送或读取 iMessage(通常依赖 macOS 权限)。

  4. things-mac - 操作 Things 任务管理器(创建任务、项目、查询状态)。

  5. obsidian - 读写 Obsidian vault 中的 Markdown 笔记。

  6. bear-notes - 管理 Bear Notes 中的笔记内容。

📧 通信与消息

  1. himalaya - 命令行邮件客户端(支持 IMAP/SMTP),用于收发和管理邮件。

  2. wacli - 通过 CLI 访问 WhatsApp(通常基于非官方接口)。

  3. sag - 一般用于"对话 / 语音 / 消息聚合"类能力,具体取决于实现。

  4. bird - 常见用法是 Twitter/X 的 CLI 客户端或相关 API 封装。

📚 内容、笔记与知识管理

  1. blogwatcher - 监控博客或 RSS 更新,并在有新内容时提示。

  2. summarize - 对文本、文章或网页做摘要。

  3. nano-pdf - 对 PDF 做轻量级处理或摘要、拆分、提取文本。

  4. nano-banana-pro - 名称偏内部或实验性,通常是文本/内容处理相关 skill。

  5. model-usage - 统计或查看模型/API 使用情况(token、调用次数等)。

💻 开发者与平台服务

  1. github - 通过 CLI 操作 GitHub(issue、PR、repo、release 等)。

  2. gemini - 接入 Google Gemini 模型或其相关 API 能力。

  3. openai-image-gen - 使用 OpenAI 的图像生成接口。

  4. openai-whisper - 调用 Whisper 做语音转文字。

  5. clawdhub - 通常是某个私有或特定平台的 API/Hub 封装(偏项目相关)。

  6. eightctl - 类似 kubectl 的控制工具,面向某个特定系统或平台。

🎵 多媒体与设备

  1. camsnap - 通过 CLI 控制摄像头拍照或抓取图像。

  2. video-frames - 从视频中抽取帧图像。

  3. songsee - 音乐识别或音乐信息查询。

  4. sonoscli - 控制 Sonos 音箱(播放、暂停、切歌等)。

  5. openhue - 控制 Philips Hue 灯光系统。

🛠️ 工具与实用类

  1. gifgrep - 在 GIF 或视频帧中搜索/匹配内容。

  2. peekaboo - 快速预览文件或内容。

  3. goplaces - 地点/POI 查询(通常基于地图 API)。

  4. gog - 访问 GOG 游戏平台(库、下载、信息查询)。

  5. ordercli - 订单或电商相关操作(具体依赖后端服务)。

  6. mcporter - 文件/内容搬运或格式转换类工具。

  7. blucLi (blucli) - 名称显示与蓝牙或某专用服务相关。

  8. nano-banana-pro - 同上,偏内部或实验性功能。

8. 配置Google和Openai 的apikey

这里根据需要进行配置,我不配置,选择NO

9. Hooks配置

选择“Skip for now”

10. 启动方式

选择“TUI”(终端聊天界面)

出现聊天界面后输入“Hello”测试,确认安装成功

11. 运行效果

最佳实践

集成飞书

参考文档:https://www.ctyun.cn/document/11057595/11091017

集成钉钉

参考文档:https://www.ctyun.cn/document/11057595/11091022

集成企业微信

参考文档:https://www.ctyun.cn/document/11057595/11091018