silly:
生成各种格式和类型的测试数据
语音数据处理:
PraatIO提供了读写praat格式文件的工具,它是一种跨平台的应用,主要为学术社区提供了可视化,抄录,编辑以及提取语音信息的功能。
这个库的主要功能在于读写转录,可用于提取语音数据的信息。这个库即可以与praat结合使用也可以脱离其使用。
https://github.com/timmahrt/praatIO
ProMo——Prosody Morph的简称——是一个可以对持续性或高音文件进行复杂处理的库。人们可以扩展不同的单词,比如说改变一个语句的单调。
https://github.com/timmahrt/ProMo
Pysle是python中针对Isle字典的一个接口——该字典是包含了英文中重音信息的发音字典。通过使用pysle,人们可以自动地标记出转录演讲中的重音。有一个函数可以使用PraatIO根据重音信息标记出textgrid。
https://github.com/timmahrt/pysle
PyAcousitics是我目前工作相关的内容。PraatIO和ProMo都是从pyAcoustics中分离出来的。它虽然有些杂乱,但是包含了许多有用的工具。当你需要从语音数据中提取或者修改信息时你会发现它很有用。
https://github.com/timmahrt/pyAcoustics
验证码识别:
pytesser
网友评论