小红书开源首个大模型预训练未使用合成数据

2025年6月10日 09:29 • 财经观察

小红书开源了首个大模型dots.llm1，小红书方面告诉《科创板日报》，dots.llm1是一个1420亿参数的混合专家模型（MoE），在推理过程中仅激活140亿参数，能保持高性能的同时大幅度降低训练和推理成本。此外，dots.llm1.ins在预训练阶段使用了11.2万亿的非合成数据，最终性能与阿里Qwen3-32b相比，在中英文、数学、对齐任务上表现接近。

文章来源：科创板日报

免责声明：本站转载的文章，版权归原作者所有；旨在传递信息，不代表本站的观点和立场。

中欧班列累计开行突破11万列发送货值超4500亿美元

上一篇 2025年6月10日 09:19

财经观察：“老房焕新”让适老消费更有温度

下一篇 2025年6月10日 09:29

小红书开源首个大模型 预训练未使用合成数据

相关推荐

小红书开源首个大模型预训练未使用合成数据