Mozilla更新大众语音数据散 现有18种发言1400小时语音
[综合] 时间:2026-01-14 04:39:00 来源:说长话短网 作者:娱乐 点击:57次
Mozilla但愿让草创公司,新大现研讨职员战专业悲愉爱好者更沉易构建支撑语音的众语种利用,办事战设备。音数言小音为此,据散它来日诰日公布了最新版本的时语Common Voice,那是新大现一个开源的语音数据散,现在包露去自42000名进献者超越1400小时的众语种语音样本,涵盖18种发言,音数言小音包露包露英语、据散法语、时语德语、新大现荷兰语、众语种Hakha Chin语、音数言小音天下语、据散波斯语、时语巴斯克语、西班牙语、中文、威我士语战卡布语。
Mozilla传播饱吹,它是同类发言中最大年夜的多发言数据散之一,比8个月前公开的通鄙谚音语料库要大年夜很多,此中包露了2万名英语志愿者500小时,40万份灌音,并且语料库很快便会扩展年夜。该构造表示,70种发言的数据汇散工做正正在经由过程通用语音网站战挪动利用法度主动展开。
通用语音能够散成到Deepspeech中,那是一套由Mozilla的机器进建小组保护的开源的语音到文本、文本到语音引擎战颠终培训的模型,它没有但包露语音片段,借包露一些志愿者供应的元数据,那些元数据可用于培训语音引擎,如演讲者的秋秋、性别等等。
为了简化流程,Mozilla本周推出了一款改进的Common Voice支散东西,能够按照分歧的提示停止剪辑,借供应了用于检察、重新录制战跳过剪辑的新控件。别的,它借推出了新的建设文件服从,问应用户跨发言跟踪进度战目标,并增减人丁统计疑息。Mozilla表示,正在接下去的几个月里,它将测验测验分歧的体例去经由过程社区尽力战新的开做水陪干系,删减数据的数量战量量。终究目标旨正在为那些寻供构建战利用语音足艺的人供应更多更好的语音数据。
本题目:Mozilla更新大众语音数据散 现在包露18种发言1400小时语音(责任编辑:时尚)
相关内容
- 第一人称生存射击《红移点》现已上架发售时间待定
- 国产STG游戏《强袭人形:本体》现已上架Nintendo Switch
- 玩家要供《荒漠大年夜镖客OL》快更新!T2老大年夜:会有的别慢
- 戈壁中的强者 《邪术教徒的一天》足游荒凉猎人表态
- 王者荣耀S12赛季水晶商店更新 韩信下架 由绝版英雄代替
- 2019ChinaJoy劣惠套票强势去袭,潮玩衍逝世品带您嗨翻天!
- 彩电业没有寒冬 两极分化将会加剧
- 小米电视被迫冲击高端市场能成功吗?
- cf双蛋庆典活动 第二蛋今天正式开始
- 彩电业没有寒冬 两极分化将会加剧
- 战略摹拟《RAILGRADE》9月29日出售 登岸PC/NS
- 挨制梦境之国 《权力与纷争》齐新气势乡堡皮肤暴光
- 用尾巴钓鱼的小老鼠的故事
- 《燕云十六声》由网易投资 确认支撑单人战多人形式
