AI新工具

blog-thum
HumanOmni

HumanOmni是业界首个以人为中心的多模态大语言模型,能综合理解人类相关场景中的视频与语音信息。

read more
blog-thum
Klee

Klee是一款开源桌面平台,可安全本地运行AI,基于Ollama和LlamaIndex,方便易用。

read more
blog-thum
ViDoRAG

ViDoRAG是基于动态迭代推理Agent的视觉文档检索增强生成框架,旨在提升视觉文档理解和问答效果。

read more
blog-thum
Shandu

Shandu是一款AI研究系统,利用先进语言模型、智能网络爬取,自动生成全面且结构化的研究报告。

read more
blog-thum
Agentic Memory

Agentic Memory是一种新型LLM智能体记忆系统,采用智能化的动态组织方式,提升记忆管理和利用效率。

read more
blog-thum
Leffa

Leffa是可控人物图像生成的统一框架,通过注意力机制精确控制人物的外观和姿态。

read more