meta发布voiceboxai模型：可生成音频回复信息，用于npc对话-九游会体育

voicebox ai 模型的特色，图源 meta

据悉，voicebox ai 模型只需要一段 2 秒钟的音频样本，即可准确辨别出音频细节、音色，并基于文字结果转换为语音输出，支持英语、法语、德语、西班牙语。此外，voicebox 还具备“基于语音片段前后内容来补齐中间缺失内容”的能力。

voicebox ai 模型的特色，图源 meta

meta 表示，voicebox 可以为基于 ai 的虚拟助手或元宇宙中的 npc 提供自然而真实的语音效果。而对于无障碍方面而言，voicebox 也可以对声带受损的人群提供一定的协助作用。

it之家经过查询得知，voicebox ai 模型目前仍处于研发阶段。meta 表示，他们意识到这种人工智能技术在虚假伪造方面，可能会带来潜在危害，因此 meta 目前正在努力找到一种有效的方式来区分真实语音和由 voicebox 生成的音频，在找到九游会登录j9入口的解决方案前，暂时不会向公众公开提供。目前可以在这里找到 voicebox 模型的更多信息。

声明：本网转发此文章，旨在为读者提供更多信息资讯，所涉内容不构成投资、消费建议。文章事实如有疑问，请与有关方核实，文章观点非本网观点，仅供读者参考。