小米凭借先进的声音识别技术超越全球竞争对手

发布时间：2023-09-14 15:17:43来源：

小米凭借自主研发的声音识别算法取得了显着的里程碑，在音频标记任务领域取得了重大进展。通过利用公开数据集AudioSet-2M中的音频数据进行训练，小米的音频标注模型首次取得了超过50 mAP的成绩。这一成果奠定了小米声音识别算法在全球舞台上的领先地位。

为了提供上下文，Google将 AudioSet 数据集分为三个部分，前两个子集统称为“AudioSet-2M”，用于训练目的。正是在这个训练数据集中，小米的声音识别算法模型突破了50 mAP阈值，树立了音频标记技术的新标准。

此外，小米还推出了该机型的Mini版本，专为资源受限的场景量身定制。尽管尺寸减小，但该 Mini 模型的性能优于其他组织的类似模型。

这项技术进步具有实用价值，可以广泛应用于小米智能设备，提升整体用户体验。该算法擅长识别各种环境声音，例如婴儿哭声、动物噪音、汽车引擎声等，并且可以以不同的形式(例如文本)表示这些声音。

此外，小米的机器人也从这项算法技术中受益匪浅。人形机器人CyberOne可以识别85种环境声音，并通过听觉感知多种人类情绪。第二代仿生四足机器人CyberDog 2可识别38种环境声音，进一步增强其动态响应能力。

标签：

免责声明：本文为转载，非本网原创内容，不代表本网观点。其原创性以及文中陈述文字和内容未经本站证实，对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺，请读者仅作参考，并请自行核实相关内容。