QwQ-32B
QwQ-32B是Qwen系列的一个推理模型,参数量为325亿。相较于传统的指令微调模型,QwQ-32B具备更强的推理能力,尤其在解决难题时表现更佳,可以与DeepSeek-R1, o1-mini等先进推理模型相媲美。它基于Qwen2.5,使用了RoPE, SwiGLU, RMSNorm, 和 Attention QKV bias等技术。模型上下文长度为131,072 tokens。为了获得最佳性能,建议在生成时加入"
广告:私人定制视频文本提取,字幕翻译制作等,欢迎联系QQ:86911638