非官方 VALL-E(Neural Codec Language Models are Zero-Shot Text to Speech Synthesizers)开源 PyTorch 实现。 未同步更新,移步英文版🇺🇸