SmallThinker 发布:超小推理模型,性能不容小觑!

作者: 译见AI

作者简介: AI共学会倾力打造的一档译制节目,为您呈现全球前沿的AI应用教程!

描述: 大家好,欢迎回到我的频道!O1 发布后,DeepSeek R1 和 Qwen QWQ 等模型也相继问世,让 O1 面临着激烈的竞争。今天,我要介绍另一款非常出色的推理模型,它就是 SmallThinker。这款模型只有三十亿参数,是在千问 2.5 3b 的基础上微调而来,性能却非常惊人,甚至在某些方面超越了 GPT-4O,特别是在 STEM 领域。不仅如此,SmallThinker 还可以作为 QWQ 的草稿模型,提升推理速度。接下来,我会详细介绍 SmallThinker 的基准测试结果,并演示如何将它作为草稿模型配合 QWQ 使用。让我们一起看看这个小巧却强大的推理模型!

SmallThinker 发布:超小推理模型,性能不容小觑!

推荐视频

一分钟!看懂Qwen3家族

一分钟!看懂Qwen3家族

上传者: 通义千问大模型