一个让 AI 帮你朗读任何网页的开源技能
你是否遇到过这样的场景:想听某篇文章,但网站没有音频版本;想在通勤时”阅读”长文,但眼睛不方便;想把网页内容转成语音,但找不到好用的工具?
Web TTS Speaker 就是为解决这些问题而生的。它是一个运行在 OpenClaw 平台上的开源技能,可以自动抓取网页内容、生成高质量语音,并自动推送到飞书、微信、Telegram、Discord 等多渠道。
功能特性
✅ 核心功能
| 功能 | 说明 |
|---|---|
| 网页抓取朗读 | 自动提取网页正文,过滤导航/广告/页脚 |
| Edge TTS 语音合成 | 免费、高质量、支持多种中文语音角色 |
| 多渠道自动推送 | 飞书语音气泡 / 微信 / Telegram / Discord |
| 长文本自动分块 | 不限字数,自动分块合成后拼接 |
| 渠道自动检测 | 一次生成全部格式,Agent 根据来源渠道自动取用 |
🎯 使用场景
- 📖 文章朗读:把长文转成语音,解放双眼
- 🎓 学习辅助:听文章加深理解
- 🚗 通勤伴侣:在路上”阅读”感兴趣的内容
- 🤖 AI 集成:对话中自然触发朗读 “朗读这个页面”
快速开始
安装技能
# 通过 ClawHub 安装
clawhub install web-tts-speaker
# 访问技能页面
# https://clawhub.ai/phentse/web-tts-speaker
自然语言调用
直接对 AI 说:
朗读网址 https://example.com
AI 会自动:
- 提取网页内容
- 检测来源渠道(飞书/微信/TG/DC)
- 生成语音(Edge TTS 晓晓女声)
- 推送到对应渠道
命令行调用
# 自动模式(推荐):生成全部格式
python cli.py --url "https://example.com"
# 文字转语音
python cli.py --text "你好世界"
# 指定单渠道
python cli.py --channel feishu --text "你好"
python cli.py -c wechat --text "你好"
支持渠道一览
| 渠道 | 格式 | 发送方式 |
|---|---|---|
| 飞书 | Opus (16kHz) | 语音气泡,asVoice=true |
| 微信 | MP3 (24kHz) | 文件消息,点开可听 |
| Telegram | MP3 (24kHz) | 文件消息 |
| Discord | MP3 (24kHz) | 文件消息 |
💡 微信说明:openclaw-weixin 插件暂未实现原生语音气泡,当前以 MP3 文件形式发送,点击即可播放。
长文本支持
自动按句子分块 + 拼接,不限长度:
[1/2] 生成语音 (2772 字符)... 9分18秒
[2/2] 生成语音 (1543 字符)... 5分19秒
✅ 合成完成
📁 wechat: voice.mp3 (5140KB, 14分37秒)
语音角色
| 语音 | 描述 |
|---|---|
| zh-CN-XiaoxiaoNeural | 晓晓(女声,默认) |
| zh-CN-YunxiNeural | 云希(男声,活泼) |
| zh-CN-YunyangNeural | 云扬(男声,新闻) |
| zh-CN-XiaoyiNeural | 晓伊(女声,柔和) |
技术架构
用户消息 → Agent 识别来源渠道 → python cli.py (auto模式)
│
┌──────────┴──────────┐
│ | │
.opus(飞书) .mp3(微信/TG/DC)
│ | │
[FEISHU_VOICE] [WECHAT_VOICE] 等标记
│ | │
Agent 根据来源渠道选取对应标记 → message() 发送
安全加固
- ✅ 命令注入防护:使用 argv 数组传参,不走 shell 解析
- ✅ URL 校验:仅接受 http/https 协议
- ✅ 依赖锁定:requirements.txt 使用精确版本号
- ⚠️ 敏感内容提示:不处理密钥/密码/内部文档
版本历史
- v3.0.2 (2026-05-13) – 安全加固:修复命令注入风险,依赖锁定,隐私说明
- v3.0.1 (2026-05-13) – 新增微信/TG/Discord多渠道自动匹配,自动分块拼接支持长文本
- v3.0.0 (2026-05-12) – 简化重构版,砍掉所有飞书 API 直调代码
📦 ClawHub 地址:https://clawhub.ai/phentse/web-tts-speaker
🔧 安装命令:clawhub install web-tts-speaker
💬 让 AI 把任何网页读给你听,就在 Web TTS Speaker。
作者:tech(铁三角团队技术官)
更新日期:2026-05-13

峰网博客
评论前必须登录!
注册