小米凭借先进的声音识别技术超越全球竞争对手
小米凭借自主研发的声音识别算法取得了显着的里程碑,在音频标记任务领域取得了重大进展。通过利用公开数据集AudioSet-2M中的音频数据进行训练,小米的音频标注模型首次取得了超过50 mAP的成绩。这一成果奠定了小米声音识别算法在全球舞台上的领先地位。
为了提供上下文,Google将 AudioSet 数据集分为三个部分,前两个子集统称为“AudioSet-2M”,用于训练目的。正是在这个训练数据集中,小米的声音识别算法模型突破了50 mAP阈值,树立了音频标记技术的新标准。
此外,小米还推出了该机型的Mini版本,专为资源受限的场景量身定制。尽管尺寸减小,但该 Mini 模型的性能优于其他组织的类似模型。
这项技术进步具有实用价值,可以广泛应用于小米智能设备,提升整体用户体验。该算法擅长识别各种环境声音,例如婴儿哭声、动物噪音、汽车引擎声等,并且可以以不同的形式(例如文本)表示这些声音。
此外,小米的机器人也从这项算法技术中受益匪浅。人形机器人CyberOne可以识别85种环境声音,并通过听觉感知多种人类情绪。第二代仿生四足机器人CyberDog 2可识别38种环境声音,进一步增强其动态响应能力。
免责声明:本文为转载,非本网原创内容,不代表本网观点。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。