AI文摘

blog-thum
GPT成熟之路官方笔记OpenAI开发者日

鱼羊克雷西发自凹非寺量子位公众号QbitAIChatGPT产品打造的细节,现在OpenAI自己交了个底。并且这波干货分享真是信息量满满,包括但不限于:ChatGPT背后的产品和研发团队如

read more
blog-thum
一些RLHF的平替汇总

众所周知,RLHF十分玄学且令人望而却步。我听过有的小道消息说提升很大,也有小道消息说效果不明显,究其根本还是系统链路太长自由度太高,不像SFT一样可以通过数据配比、prompt、有限的超参数来可控地

read more