Meta AI Llama 3人工智能语言模型的未来

发布时间：2024-05-23 10:21:48来源：

Meta AI开发并发布了 Llama 3，这是一种大型语言模型，其之前的版本在人工智能领域掀起了波澜。 Llama 家族的最新成员拥有令人印象深刻的功能，包括生成连贯流畅的文本、回答问题和参与对话。

《Llama 3》与前作有何不同?根据人类评估结果，该模型对 Mistral Medium 的胜率达到 59.3%，对 GPT-3.5 的胜率达到 63.7%。这些令人印象深刻的数字表明 Llama 3 可以生成质量与人类生成的文本相当的文本。

Llama 3 的训练数据集由从公开来源收集的超过 15T 个令牌组成，比 Llama 2 使用的训练数据集大七倍。这种广泛的训练数据使模型能够生成多样化且准确的文本。

这个 15 万亿代币数据集比其前身大得多，包含的数据是 Llama 2 的七倍，并包含广泛的代码，是之前使用量的四倍。值得注意的是，超过 5% 的数据是跨越 30 多种语言的高质量非英语内容，尽管人们承认这些语言的性能可能达不到英语的水平。

为了确保数据的质量，Meta 开发了复杂的过滤管道。其中包括启发式过滤器、NSFW 内容过滤器、语义重复数据删除和旨在评估文本质量的分类器。有趣的是，Llama 2 被用来完善这些质量分类器的训练数据，事实证明在为下一代提供动力方面发挥了重要作用。

标签：

免责声明：本文为转载，非本网原创内容，不代表本网观点。其原创性以及文中陈述文字和内容未经本站证实，对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺，请读者仅作参考，并请自行核实相关内容。