- edge-tts可以用js/websocket调用,返回的是音频流。
别人解析了API,有两个开源项目,csdn / github。我复制了csdn上面的,因为GitHub上的不是纯js环境,用了node。
edge-tts可以用js调用,也就是说chrome也能用edge的声音朗读网页。
2. 冷知识,edge-tts 可以被离线调用,嵌入其他本地应用。
edge-tts官方支持离线使用,但仅限部分。
Multi-tts 最新的apk已经集成引擎,再安装1gb微软语音包,就能无限听 xiaoxiao、aria等多种语言,打开转发服务,还能批量导出音频文件。
官方SDK(应该是这个): [Embedded Speech - Speech service - Azure AI services](Embedded Speech - Speech service - Azure AI services)
调用只需一个url://手机ip地址:8774/forward?volume=50&speed=2&voice=microsoft_zh-CN-XiaoxiaoNeural&text=哈哈哈
就能返回一个wav音频文件。可以用ffmpeg concat拼接多个网络流,压缩成 flac 或 MP3。