Skip to content

中文混淆语料生成,可用于训练或测试中文纠错模型。1.支持字符级别的形近字及音近字。2.支持双字词语的音近字生成。3.结合字符和词语级别,随机生成句子级别中文混淆语料。

License

Notifications You must be signed in to change notification settings

currenttime/chinese_confusion

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

1 Commit
 
 
 
 
 
 

Repository files navigation

chinese_confusion

中文混淆语料生成:1.支持字符级别的形近字及音近字。2.支持双字词语的音近字生成。3.结合字符和词语级别,随机生成句子级别中文混淆语料。

About

中文混淆语料生成,可用于训练或测试中文纠错模型。1.支持字符级别的形近字及音近字。2.支持双字词语的音近字生成。3.结合字符和词语级别,随机生成句子级别中文混淆语料。

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published