Replies: 1 comment 2 replies
-
感觉比起改代码,用户直接手动把原始数据集混合起来比较方便,比如 aishell3 + baker, 你可以把 baker 相关的数据当成 aishell3 里面的一个音色,文本和音频按同样的格式放 |
Beta Was this translation helpful? Give feedback.
2 replies
Sign up for free
to join this conversation on GitHub.
Already have an account?
Sign in to comment
-
除了已支持的数据集以外,如果需要加入新的数据集,或者需要混合多个数据集一起训练,是否可以改进一下preprocess的流程,以避免重复预处理呢?目前preprocess的问题是需要全部重新计算一遍,是否可以添加一些控制的参数如--input_data,然后输入某些数据集的名字,然后自动跳过已生成的pitch,energy,speech等信息,或者自动删除--input_data中不存在的数据集的信息(比如说上次预处理aishell3,这次不想要aishell3的数据就自动删除),这样可以快速的提高预处理的速度,对自定义数据集的处理更加方便。
Beta Was this translation helpful? Give feedback.
All reactions