EdgeTTS 使用指南

📖 快速开始

1 获取 API Key

联系管理员获取你的专属 API Key（免费提供）

2 打开播放器

访问 https://edgetts-player.aws.xin 或 https://edgetts.aws.xin

3 输入 API Key

首次使用时输入 API Key，会自动保存到浏览器本地

4 开始使用

输入文本，选择语音和输出格式，点击"生成语音"

✨ 核心特性

🌊

PCM 真流式播放 NEW

选择 PCM 格式 + 流式模式，实现边接收边播放，无需等待完整数据

🎵

多种输出格式

支持 MP3、PCM、Opus、AAC、WAV 五种格式，满足不同场景需求

🌍

322+ 神经网络音色

支持中文、英语、日语、韩语、德语、法语等 70+ 种语言

⚡

低延迟生成

首字节延迟约 1 秒，PCM 流式模式可实现边生成边播放

🎚️

语速/音调调节

语速 0.25x - 2.0x，音调 0.5 - 1.5，灵活调整

📝

智能文本处理

自动清理 Markdown、Emoji、URL，支持停顿标签 <break time="1s"/>

🔒

隐私保护

API Key 仅保存在浏览器本地，不上传服务器

🎵 输出格式说明

格式	特点	适用场景
MP3	兼容性最好，文件较小	下载保存、通用播放
PCM 推荐流式	无压缩，支持真流式播放	实时播放、低延迟场景
Opus	高压缩率，音质好	网络传输、节省带宽
AAC	苹果设备兼容性好	iOS/macOS 应用
WAV	无损格式，文件大	音频编辑、后期处理

💡 真流式播放推荐配置

选择 PCM 格式 + 流式模式，可实现：

边接收边播放，无需等待完整数据
首字节到达后约 500ms 开始播放
长文本也能快速开始播放

🎤 热门音色推荐

🇨🇳 中文音色

zh-CN-XiaoxiaoNeural (晓晓) - 温柔女声 ⭐推荐
zh-CN-YunxiNeural (云希) - 阳光男声 ⭐推荐
zh-CN-YunyangNeural (云扬) - 专业男声
zh-CN-XiaoyiNeural (晓伊) - 活泼女声
zh-CN-YunjianNeural (云健) - 激情男声

🇬🇧 英语音色

en-US-JennyNeural (Jenny) - 美式女声 ⭐推荐
en-US-GuyNeural (Guy) - 美式男声
en-GB-SoniaNeural (Sonia) - 英式女声
en-GB-RyanNeural (Ryan) - 英式男声

🌐 多语言音色

en-US-AvaMultilingualNeural - 多语言女声（支持跨语言朗读）
en-US-AndrewMultilingualNeural - 多语言男声

完整音色列表：访问 https://edgetts.aws.xin/v1/models 获取全部 322+ 音色

🔧 API 调用指南

标准模式（完整下载后播放）

curl -X POST 'https://edgetts.aws.xin/v1/audio/speech' \
  -H 'Authorization: Bearer YOUR_API_KEY' \
  -H 'Content-Type: application/json' \
  -d '{
    "input": "你好，这是一个测试",
    "voice": "zh-CN-XiaoxiaoNeural",
    "speed": 1.0,
    "response_format": "mp3"
  }' \
  --output audio.mp3

流式模式（边接收边播放）

curl -X POST 'https://edgetts.aws.xin/v1/audio/speech' \
  -H 'Authorization: Bearer YOUR_API_KEY' \
  -H 'Content-Type: application/json' \
  -d '{
    "input": "这是一段很长的文本...",
    "voice": "zh-CN-XiaoxiaoNeural",
    "speed": 1.0,
    "response_format": "pcm",
    "stream": true
  }' \
  --output audio.pcm

完整参数说明

参数	类型	默认值	说明
`input`	string	必需	要转换的文本
`voice`	string	zh-CN-XiaoxiaoNeural	音色名称
`speed`	number	1.0	语速 (0.25 - 2.0)
`pitch`	number	1.0	音调 (0.5 - 1.5)
`response_format`	string	mp3	输出格式: mp3/pcm/opus/aac/wav
`stream`	boolean	false	是否流式输出

Python 示例

import requests

url = "https://edgetts.aws.xin/v1/audio/speech"
headers = {
    "Authorization": "Bearer YOUR_API_KEY",
    "Content-Type": "application/json"
}
data = {
    "input": "你好，这是一个测试",
    "voice": "zh-CN-XiaoxiaoNeural",
    "speed": 1.0,
    "response_format": "mp3"
}

response = requests.post(url, headers=headers, json=data)
with open("output.mp3", "wb") as f:
    f.write(response.content)

Python 流式示例

import requests

url = "https://edgetts.aws.xin/v1/audio/speech"
headers = {
    "Authorization": "Bearer YOUR_API_KEY",
    "Content-Type": "application/json"
}
data = {
    "input": "这是一段很长的文本...",
    "voice": "zh-CN-XiaoxiaoNeural",
    "response_format": "pcm",
    "stream": True
}

# 流式接收
with requests.post(url, headers=headers, json=data, stream=True) as r:
    with open("output.pcm", "wb") as f:
        for chunk in r.iter_content(chunk_size=8192):
            f.write(chunk)
            # 这里可以边接收边处理/播放

💡 使用技巧

停顿控制

在文本中插入 <break time="1.0s"/> 可以添加停顿：

"第一句话。<break time=\"1.5s\"/>停顿1.5秒后继续。"

长文本处理

系统自动按标点断句，每块约 300 字
单次请求建议不超过 15,000 字
超长文本建议使用流式模式

语速建议

0.7x - 适合语言学习，听清每个词
1.0x - 正常语速，日常使用
1.5x - 快速浏览，节省时间

💰 费用说明

✅ 完全免费

个人使用和中小型项目完全免费！

每天 10 万次请求以内：100% 免费
无流量费用
无时间限制
EdgeTTS 服务本身免费（微软提供）

超出免费额度后

如果每天超过 10 万次请求（极少见）：

每百万请求：$0.50
例如每天 20 万次：约 $0.50/月

结论：对于个人使用，完全不用担心费用！

❓ 常见问题

Q: 流式模式和标准模式有什么区别？

A: 标准模式等待全部数据生成后返回；流式模式边生成边返回，配合 PCM 格式可实现边接收边播放。

Q: 为什么推荐 PCM 格式做流式播放？

A: PCM 是无压缩的原始音频数据，没有文件头，数据一到就能播放。MP3 等格式需要解析文件头和帧结构，必须积累一定数据才能开始播放。

Q: API Key 安全吗？

A: 完全安全。API Key 仅保存在你的浏览器本地（localStorage），不会上传到任何服务器。

Q: 支持哪些语言？

A: 支持 70+ 种语言，322+ 种音色。所有音色都支持跨语言朗读。

Q: 有使用限制吗？

A: 每天 10 万次请求以内完全免费。单次请求建议不超过 15,000 字。

Q: 可以商用吗？

A: 可以，但建议联系管理员获取专用 API Key。

🎙️ EdgeTTS 使用指南