AI文摘

blog-thum
大模型面试百问百答

作者  Codering https:zhuanlanzhihucomp686761933今天分享大模型面试相关知识点,持续更新。1RAG技术体系的总体思路数据预处理->分块(这一

read more
blog-thum
LLM百倍推理加速之稀疏篇

【点击】加入大模型技术交流群原文:https:zhuanlanzhihucomp677948929众所周知的是,在GPU上对LLM有着三个核心的影响因素:(1)GPU计算总量 (2)G

read more