AI文摘

blog-thum
大模型微调数据选择和构造技巧

大模型场景微调里面,最关键地的一个是问题是:选择什么样的数据微调?大的方向上大家都能把握,大概无非是要注意数据的多样性,要注意数据的质量,那在实践中有哪些技巧呢?比如我们会经常遇到下面几种情况:1数

read more
blog-thum
微软新文query2doc:用大模型做query检索拓展

目前比较主流的检索方案主要是字面检索(sparse,稀疏)和向量检索(dense,稠密),然而检索哪怕是到了现在也一直有一个很大的困境,就是query对文档文段的召回,一直是存在困难的,因为两者无论是

read more