🦞

OpenClaw

把 AI 从聊天框里解放出来

OpenClaw & AI Agent 交流分享会 · 李林翼 Rocky · 2026.03.13

02

Outline

今天聊什么

01
OpenClaw 是什么
概念 · 架构 · 工作机制
核心特性 · 自托管 / 多渠道 / 记忆 / 工具 / 协作
系统架构 · Gateway / LLM / 能力层
云端大模型 ≠ Agent · 本质区别
推理循环 · Agent 的心跳
持久记忆 · 跨 session 记住你是谁
02
能做什么
五类能力 · 多 Agent 协作
五类核心能力 · 一句话搞定一件事
多 Agent 协作 · 角色分工自动通信
我的 Agent 团队 · 六个角色各司其职
03
怎么用
真实案例 · 上手 · 现场 Demo
三个真实故事 · 昨天今天发生的事
安装配置 · 一条 npm 命令
现场 Demo · 讨论 & Q&A
01

OpenClaw 是什么

概念 · 架构 · 工作机制

03

Key Features

OpenClaw 的核心特性

一个运行在你本地的 AI Agent 平台——让 AI 不只是回答问题,而是真正帮你做事情
🏠

自托管

跑在你自己的设备上——Mac、树莓派、服务器都行。数据不出本地,你说了算。

💬

多渠道

一个 Gateway 同时连接 Discord、Telegram、WhatsApp、iMessage……在你常用的 app 里直接对话。

🧠

持久记忆

重要信息写入文件系统。Session 清了,记忆还在——下次启动自动读取。

🔧

工具执行

不只「说」,还能「做」——读写文件、执行代码、控制浏览器、发消息。

🔄

自主循环

收到指令 → 思考 → 调工具 → 看结果 → 再思考 → 直到任务完成。

🤝

多 Agent 协作

多个 Agent 角色分工,互相通信、委托任务、汇报结果。

04

Architecture

系统架构

入口层 · User Entry
💬
Discord
服务器 / DM
✈️
Telegram
Bot 对话
📱
Signal
端到端加密
🔗
更多渠道
WhatsApp / iMessage / Slack
用户消息 ↓ · ↑ 回复推送
Gateway 调度中枢
消息路由 · 会话管理 · 工具编排
定时任务 · 状态持久化
推理请求 →
← 结构化响应
🧠
大脑 LLM
Claude · Gemini · GPT
思考 · 决策 · 生成
按需调用 ↓↑
能力层 · Capabilities
🧩
Skills & Tools
GitHub · Notion · MCP
🗄️
持久记忆
MEMORY.md · 偏好
💻
设备访问
终端 · 文件系统
🌐
互联网
浏览器 · 搜索
05

LLM vs Agent

云端大模型 AI Agent

☁️ ChatGPT / Claude / Gemini

  • 很聪明,但活在浏览器标签页里
  • 看不到你的文件、设备、应用
  • 你不开口,它永远不会主动找你
  • 数据在别人的服务器上
  • 关掉标签页,一切停止
VS

🦞 AI Agent (OpenClaw)

  • 跑在你自己的设备上,数据不出本地
  • 能操作你的浏览器、文件、终端
  • 凌晨4点发现问题,主动推送提醒
  • 通过 Discord / Telegram 随时联系你
  • 7×24 在线,多个 Agent 分工协作
07

Agent Loop

推理循环:Agent 的心跳

📩
收到消息
你发了一条指令
🤔
思考
该用什么工具?
调用工具
执行具体操作
👀
看结果
成功了?还需要什么?
回复你
任务完成,汇报结果
↻ 一个复杂任务可能循环十几次,全自动
例子:Discord 收到语音消息 → 下载音频附件 → 检测格式并转码 → 本地调用 Whisper 模型转录 → 生成文字 → 回复到 Discord 对话 ✅
08

How Memory Works

记忆是怎么形成的

OpenClaw 的记忆是纯文本 Markdown 文件,存在你自己的硬盘上。
完全透明、可版本控制、可备份迁移——你的数据,你做主。
  • 1
    对话中提取
    Agent 自动把重要信息写进 memory/ 目录
  • 2
    语义检索
    下次启动时,先搜索记忆,找相关上下文
  • 3
    完全透明
    纯文本文件,你随时可以查看、编辑、删除
📄 memory/2026-03-12.md
## 创作选题库
1. OpenClaw × Gemini 音乐创作
2. 如何成为一个游戏高手
3. 价值主张是什么

## 已发布
- 食历Freshkeeper · 公众号 · 2026-03-12
📄 memory/2026-03-11.md
## 用户偏好
- 文件输出统一放 ~/Documents/contentbot/
- 默认 model: claude-sonnet-4-6
- 内部沟通频道: #agent-comms
📄 SOUL.md
你是艺术家,Rocky 的内容创意引擎。
创意优先,但要高效产出……
09

Memory in Action

记忆在工作的样子

Rocky · 3月11日
以后你输出的文件统一放在 Documents/contentbot
🎨 艺术家
收到,已记录。✅
—— Session 重置 / 第二天 ——
Rocky · 3月12日
帮我做一个 OpenClaw 介绍的幻灯片
🎨 艺术家
好,文件已保存到 ~/Documents/contentbot/openclaw-intro.html ✅
↑ 没有重新问「存哪里」——因为记忆里有
同理:你的背景、项目状态、写作风格、常用工具……都进了记忆。Agent 越用越懂你。
02

能做什么

五类能力 · 多 Agent 协作

11

What It Can Do

五类核心能力

你说一句,它在后台搞定一切

🔍

主动监控 & 提醒

  • 定时扫 Gmail,重要邮件即时推送
  • 凌晨发现阿里云到期,主动提醒
  • 每日思考题、早报,Cron 自动触发
🌐

浏览器自动化

  • 登录微信公众平台审稿
  • 批量关注 KOL、抓取推文
  • 操作真实浏览器,不是模拟器

本地工具执行

  • 调用 ffmpeg、Whisper 等任何 CLI 工具
  • 读写文件、跑脚本、装依赖
  • 所有操作在本地完成,数据不上云
🤝

多 Agent 协作

  • 艺术家开发 → 工程师部署
  • Agent 间自动通信、委托、汇报
  • 角色分工,各司其职
🧠

持久记忆

  • 偏好说一次,跨 session 记住
  • 你的背景、风格、习惯都在记忆里
  • 纯文本文件,随时查看编辑
09

Why Multi-Agent

为什么需要多个 Agent?

单一 Agent 什么都做:上下文太长、角色混乱、容易出错。
  • 1
    独立 Workspace
    每个 Agent 有自己的工作目录、记忆和 session
  • 2
    按角色分工
    擅长什么做什么,不串台
  • 3
    Agent 间通信
    互相发消息、委托任务、汇报结果
Rocky
帮我把个人主页的 X 链接去掉,换成 email
🎨 艺术家
完成 ✅ 不过部署到 GitHub Pages 是 IT 的事,我转给工程师了。
🔨 工程师
收到艺术家的转发。文件没问题,但 gh 未登录。请先运行 gh auth login,完成后我接着部署。

↑ 今天的真实对话

10

My Setup

我的 Agent 团队

Agent 角色 负责范围
🎮 玩家 总指挥 调度协调、日程管理、邮件处理、任务分发
🎨 艺术家 创意引擎 内容创作、视频脚本文案、App idea、产品概念、创意发散
🏠 小管家 生活管理 财务账单、UK 签证/政府手续、保险银行税务、订阅管理
🎯 猎人 职业 & 创业 求职策略、AI 创业探索、行业情报、职业规划
🔧 工程师 技术执行 IT 诊断、OpenClaw debug、应用开发、技术选型
🧠 哲学家 深度思考 人生重大决策、价值观梳理、内耗时的思想碰撞、每日思考题
03

怎么用

真实案例 · 上手 · 现场 Demo

13

Real Cases

真实案例

🎬
多媒体处理
视频 → GIF → Discord
「把这段视频剪成 GIF 发到 Discord」。Agent 用 ffmpeg 裁剪压缩,生成 GIF 后通过 Discord API 发到指定频道。
ffmpeg 分析视频 定位目标片段
裁剪 + 压缩成 GIF 检查文件大小
调用 Discord API 发送到指定频道 ✅
🌐
浏览器自动化
31个 KOL,一篇素材
「帮我看看 AI 圈最近在聊什么」。Agent 打开浏览器,批量关注 31 个 AI KOL,读取近一周推文,整理成公众号文章素材。
打开浏览器 登录 X/Twitter
逐个关注 31 个 KOL 读取近一周推文
筛选 + 分类整理 输出素材文档 ✅
📝
跨平台操作
公众号草稿审稿
「帮我看看公众号草稿」。Agent 打开浏览器,进入微信公众平台,读取草稿内容,分析后给出修改建议。
打开浏览器 登录微信公众平台
进入草稿箱 读取文章内容
分析结构 + 文案 输出修改建议 ✅
📅
日历自动化
玩虾大会,一键入日历
把玩虾大会的活动页链接发给 Agent,自动抓取所有场次、换算时区,批量写入日历。
解析活动页链接 抓取所有场次信息
识别时间 + 换算 UK 时区 生成日历事件
批量写入日历 自动设置提醒 ✅
🌐
多 Agent 协作
个人主页开发 + 上线
艺术家负责设计开发,工程师部署到 GitHub Pages,再到 Dynadot 购买 player1.bot 域名并完成绑定。
艺术家设计 + 开发页面 交付给工程师
工程师部署 GitHub Pages Dynadot 购买域名
配置 DNS 绑定 player1.bot 上线 ✅
🧠
主动陪伴
每日思考题
哲学家每天主动发来一道思考题。不是你问 AI,而是 AI 来问你——换个方向,换个角度看自己。
Cron 定时触发 哲学家生成今日题目
结合你最近的状态和话题 个性化出题
推送到 Discord 等你回答 💬
16

Getting Started

怎么上手?

  • 1
    安装 OpenClaw
    一条 npm 命令搞定
  • 2
    配置 AI 模型
    Claude / Gemini / GPT 任选其一
  • 3
    连接消息渠道
    Discord Bot 或 Telegram Bot
  • 4
    开始对话
    Agent 上线,说话就能干活
# 安装
npm install -g openclaw

# 初始化
openclaw onboard --install-daemon

# 启动网关
openclaw gateway start
📖 文档
docs.openclaw.ai
💬 社区
discord.com/invite/clawd
🦞

Demo Time

现在来看看实际效果