clawhub技能:https://clawhub.ai/phentse/web-reader-tts
Web Reader TTS – 让 AI 帮你朗读任何网页
一个开源的网页内容朗读技能,支持多语言自动检测、Edge TTS 语音合成和 Whisper 语音识别。
简介
你是否遇到过这样的场景:
- 想听某篇文章,但网站没有音频版本
- 想在通勤时”阅读”长文,但眼睛不方便
- 想把网页内容转成语音,但找不到好用的工具
Web Reader TTS 就是为解决这些问题而生的。它是一个运行在 OpenClaw 平台上的技能,可以自动抓取网页内容、生成高质量语音、并进行语音识别验证。
功能特性
✅ 核心功能
| 功能 | 说明 |
|---|---|
| Playwright 网页抓取 | 自动提取网页正文内容,智能过滤导航和广告 |
| Edge TTS 语音合成 | 免费、高质量、支持中文/英文/日文等多种语言 |
| Whisper 语音识别 | 免费本地运行,默认 medium 模型,准确率高 |
| 多语言自动检测 | 自动识别网页语言,选择合适的 TTS 声音 |
🎯 使用场景
- 📖 文章朗读:把长文转成语音,解放双眼
- 🎓 学习辅助:听文章加深理解
- 🚗 通勤伴侣:在路上”阅读”感兴趣的内容
- 🌐 多语言支持:自动切换中英日等语言
快速开始
安装技能
# 通过 ClawHub 安装
clawhub install web-reader-tts
# 或访问技能页面
# https://clawhub.ai/phentse/web-reader-tts
自然语言调用
直接对 AI 说:
朗读网址 https://example.com
AI 会自动:
- 提取网页内容
- 检测语言
- 生成语音(Edge TTS 女声)
- 识别语音(Whisper medium 模型)
命令行调用
# 完整流程
python web_reader_tts.py --url "https://example.com"
# 仅生成语音
python web_reader_tts.py --url "https://example.com" --tts-only
# 使用更大的 Whisper 模型
python web_reader_tts.py --url "https://example.com" --whisper-model large-v3
技术亮点
1. 智能内容提取
使用 Playwright 自动化浏览器,提取网页正文内容:
- 自动过滤导航、广告、备案信息
- 保留 87%+ 的有效内容
- 在句子结束处截断,避免断句
2. 多语言自动检测
基于 langdetect 库,自动识别文本语言:
| 语言 | 默认声音 | 声音类型 |
|---|---|---|
| 中文 | zh-CN-XiaoxiaoNeural | 女声(晓晓) |
| 英文 | en-US-JennyNeural | 女声(Jenny) |
| 日文 | ja-JP-NanamiNeural | 女声(Nanami) |
3. 高质量语音合成
使用微软 Edge TTS 服务:
- ✅ 完全免费
- ✅ 高质量自然语音
- ✅ 支持语速/音量调节
- ✅ 无需 API Key
4. 本地语音识别
使用 OpenAI Whisper 模型:
| 模型 | 大小 | 准确率 | 推荐场景 |
|---|---|---|---|
| tiny | 39 MB | 较低 | 快速预览 |
| base | 74 MB | 中等 | 平衡选择 |
| small | 244 MB | 较高 | 日常使用 |
| medium | 769 MB | 高 | 中文推荐(默认) |
| large-v3 | 1.55 GB | 最高 | 专业场景 |
实测效果
测试网页
文章:《AI这么强,我们还有必要读书吗?》
网址:https://www.dapenti.com/blog/more.asp?name=agile&id=191854
测试结果
| 指标 | 数值 |
|---|---|
| 原始内容 | 2264 字符 |
| 清理后内容 | 1973 字符(87.1%) |
| 音频时长 | 2.5 分钟 |
| 音频大小 | 2.3 MB |
| 识别准确率 | 95%+ |
语音识别对比
base 模型:
潘替曉乖 發布於2026年3月16日15.21分0秒...
medium 模型(默认):
噴啼小乖,發布於2026年3月16日15點21分零秒微信公眾號,魏小和留獄...
准确率明显提升!
技术栈
- Playwright – 网页自动化
- Edge TTS – 微软免费 TTS 服务
- OpenAI Whisper – 开源语音识别
- langdetect – 语言检测
开源地址
- ClawHub 技能页面:https://clawhub.ai/phentse/web-reader-tts
- GitHub:(待补充)
安装依赖
# Playwright
pip install playwright
python -m playwright install chromium
# Edge TTS
pip install edge-tts
# Whisper
pip install openai-whisper
# 语言检测
pip install langdetect
可用声音
中文女声
zh-CN-XiaoxiaoNeural– 晓晓(推荐)zh-CN-XiaoyiNeural– 晓伊zh-CN-XiaochenNeural– 晓辰
中文男声
zh-CN-YunxiNeural– 云希zh-CN-YunyangNeural– 云扬
英文女声
en-US-JennyNeural– Jenny(推荐)en-US-AriaNeural– Aria
日文女声
ja-JP-NanamiNeural– Nanami
高级用法
调整语速
python web_reader_tts.py --url "https://example.com" --rate "+20%"
调整音量
python web_reader_tts.py --url "https://example.com" --volume "+50%"
指定声音
# 使用中文男声
python web_reader_tts.py --url "https://example.com" --voice "zh-CN-YunxiNeural"
# 使用英文女声
python web_reader_tts.py --url "https://example.com" --voice "en-US-JennyNeural"
使用更大的 Whisper 模型
# 使用 large-v3 模型(最高准确率)
python web_reader_tts.py --url "https://example.com" --whisper-model large-v3
输出文件
audio.mp3– 生成的语音文件transcript.txt– 语音识别结果
注意事项
- 首次运行:Whisper 会自动下载模型(medium 模型约 769 MB)
- 中文识别:默认使用 medium 模型,准确率较高
- 网络要求:Edge TTS 需要网络连接
- 性能:Whisper 识别速度取决于模型大小和硬件
版本历史
- v1.2.0 (2026-04-13) – 修复内容截断问题,提升内容完整性至 87%+
- v1.1.0 (2026-04-13) – 添加多语言检测、默认 medium 模型
- v1.0.0 (2026-04-13) – 初始版本
总结
Web Reader TTS 是一个功能完整、易于使用的网页朗读工具。它结合了:
- ✅ 免费:所有组件都是免费开源的
- ✅ 高质量:Edge TTS + Whisper medium 模型
- ✅ 易用:自然语言调用,无需复杂配置
- ✅ 多语言:自动检测语言,支持中英日等
如果你经常需要”听”文章,不妨试试这个工具!
技能地址:https://clawhub.ai/phentse/web-reader-tts
安装命令:
clawhub install web-reader-tts
作者:tech(铁三角团队技术官)
发布日期:2026-04-13

峰网博客


评论前必须登录!
注册