AI新工具
banner

QwQ-32B


介绍:

QwQ-32B是Qwen系列推理模型,具有325亿参数,擅长解决难题,推荐使用特定参数以标准化输出格式。









QwQ-32B

QwQ-32B是Qwen系列的一个推理模型,参数量为325亿。相较于传统的指令微调模型,QwQ-32B具备更强的推理能力,尤其在解决难题时表现更佳,可以与DeepSeek-R1, o1-mini等先进推理模型相媲美。它基于Qwen2.5,使用了RoPE, SwiGLU, RMSNorm, 和 Attention QKV bias等技术。模型上下文长度为131,072 tokens。为了获得最佳性能,建议在生成时加入"\n"引导模型思考,并使用适当的采样参数(Temperature=0.6, TopP=0.95, TopK=20-40)。 对于长输入,可以使用YaRN技术优化。 该模型支持vLLM部署。

<<<<<<< HEAD ======= 可扫如下微信二维码加好友 >>>>>>> HEAD@{1}

广告:私人定制视频文本提取,字幕翻译制作等,欢迎联系QQ:86911638