请叫我峰子:
感受VPS建站的乐趣。

Web Reader TTS - 让 AI 帮你朗读任何网页

clawhub技能:https://clawhub.ai/phentse/web-reader-tts

Web Reader TTS – 让 AI 帮你朗读任何网页

一个开源的网页内容朗读技能,支持多语言自动检测、Edge TTS 语音合成和 Whisper 语音识别。

简介

你是否遇到过这样的场景:

  • 想听某篇文章,但网站没有音频版本
  • 想在通勤时”阅读”长文,但眼睛不方便
  • 想把网页内容转成语音,但找不到好用的工具

Web Reader TTS 就是为解决这些问题而生的。它是一个运行在 OpenClaw 平台上的技能,可以自动抓取网页内容、生成高质量语音、并进行语音识别验证。

功能特性

✅ 核心功能

功能说明
Playwright 网页抓取自动提取网页正文内容,智能过滤导航和广告
Edge TTS 语音合成免费、高质量、支持中文/英文/日文等多种语言
Whisper 语音识别免费本地运行,默认 medium 模型,准确率高
多语言自动检测自动识别网页语言,选择合适的 TTS 声音

🎯 使用场景

  • 📖 文章朗读:把长文转成语音,解放双眼
  • 🎓 学习辅助:听文章加深理解
  • 🚗 通勤伴侣:在路上”阅读”感兴趣的内容
  • 🌐 多语言支持:自动切换中英日等语言

快速开始

安装技能

# 通过 ClawHub 安装
clawhub install web-reader-tts

# 或访问技能页面
# https://clawhub.ai/phentse/web-reader-tts

自然语言调用

直接对 AI 说:

朗读网址 https://example.com

AI 会自动:

  1. 提取网页内容
  2. 检测语言
  3. 生成语音(Edge TTS 女声)
  4. 识别语音(Whisper medium 模型)

命令行调用

# 完整流程
python web_reader_tts.py --url "https://example.com"

# 仅生成语音
python web_reader_tts.py --url "https://example.com" --tts-only

# 使用更大的 Whisper 模型
python web_reader_tts.py --url "https://example.com" --whisper-model large-v3

技术亮点

1. 智能内容提取

使用 Playwright 自动化浏览器,提取网页正文内容:

  • 自动过滤导航、广告、备案信息
  • 保留 87%+ 的有效内容
  • 在句子结束处截断,避免断句

2. 多语言自动检测

基于 langdetect 库,自动识别文本语言:

语言默认声音声音类型
中文zh-CN-XiaoxiaoNeural女声(晓晓)
英文en-US-JennyNeural女声(Jenny)
日文ja-JP-NanamiNeural女声(Nanami)

3. 高质量语音合成

使用微软 Edge TTS 服务:

  • ✅ 完全免费
  • ✅ 高质量自然语音
  • ✅ 支持语速/音量调节
  • ✅ 无需 API Key

4. 本地语音识别

使用 OpenAI Whisper 模型:

模型大小准确率推荐场景
tiny39 MB较低快速预览
base74 MB中等平衡选择
small244 MB较高日常使用
medium769 MB中文推荐(默认)
large-v31.55 GB最高专业场景

实测效果

测试网页

文章:《AI这么强,我们还有必要读书吗?》
网址:https://www.dapenti.com/blog/more.asp?name=agile&id=191854

测试结果

指标数值
原始内容2264 字符
清理后内容1973 字符(87.1%)
音频时长2.5 分钟
音频大小2.3 MB
识别准确率95%+

语音识别对比

base 模型

潘替曉乖 發布於2026年3月16日15.21分0秒...

medium 模型(默认)

噴啼小乖,發布於2026年3月16日15點21分零秒微信公眾號,魏小和留獄...

准确率明显提升!

技术栈

  • Playwright – 网页自动化
  • Edge TTS – 微软免费 TTS 服务
  • OpenAI Whisper – 开源语音识别
  • langdetect – 语言检测

开源地址

  • ClawHub 技能页面:https://clawhub.ai/phentse/web-reader-tts
  • GitHub:(待补充)

安装依赖

# Playwright
pip install playwright
python -m playwright install chromium

# Edge TTS
pip install edge-tts

# Whisper
pip install openai-whisper

# 语言检测
pip install langdetect

可用声音

中文女声

  • zh-CN-XiaoxiaoNeural – 晓晓(推荐)
  • zh-CN-XiaoyiNeural – 晓伊
  • zh-CN-XiaochenNeural – 晓辰

中文男声

  • zh-CN-YunxiNeural – 云希
  • zh-CN-YunyangNeural – 云扬

英文女声

  • en-US-JennyNeural – Jenny(推荐)
  • en-US-AriaNeural – Aria

日文女声

  • ja-JP-NanamiNeural – Nanami

高级用法

调整语速

python web_reader_tts.py --url "https://example.com" --rate "+20%"

调整音量

python web_reader_tts.py --url "https://example.com" --volume "+50%"

指定声音

# 使用中文男声
python web_reader_tts.py --url "https://example.com" --voice "zh-CN-YunxiNeural"

# 使用英文女声
python web_reader_tts.py --url "https://example.com" --voice "en-US-JennyNeural"

使用更大的 Whisper 模型

# 使用 large-v3 模型(最高准确率)
python web_reader_tts.py --url "https://example.com" --whisper-model large-v3

输出文件

  • audio.mp3 – 生成的语音文件
  • transcript.txt – 语音识别结果

注意事项

  1. 首次运行:Whisper 会自动下载模型(medium 模型约 769 MB)
  2. 中文识别:默认使用 medium 模型,准确率较高
  3. 网络要求:Edge TTS 需要网络连接
  4. 性能:Whisper 识别速度取决于模型大小和硬件

版本历史

  • v1.2.0 (2026-04-13) – 修复内容截断问题,提升内容完整性至 87%+
  • v1.1.0 (2026-04-13) – 添加多语言检测、默认 medium 模型
  • v1.0.0 (2026-04-13) – 初始版本

总结

Web Reader TTS 是一个功能完整、易于使用的网页朗读工具。它结合了:

  • 免费:所有组件都是免费开源的
  • 高质量:Edge TTS + Whisper medium 模型
  • 易用:自然语言调用,无需复杂配置
  • 多语言:自动检测语言,支持中英日等

如果你经常需要”听”文章,不妨试试这个工具!


技能地址:https://clawhub.ai/phentse/web-reader-tts

安装命令

clawhub install web-reader-tts

作者:tech(铁三角团队技术官)
发布日期:2026-04-13

赞(0) 打赏
转载请注明:峰网博客 » Web Reader TTS - 让 AI 帮你朗读任何网页

评论 抢沙发

评论前必须登录!

 

觉得文章有用就打赏一下文章作者

非常感谢你的打赏,我们将继续提供更多优质内容,让我们一起创建更加美好的网络世界!

支付宝扫一扫

微信扫一扫

登录

找回密码

注册