AI新工具

blog-thum
OmniParser

OmniParser是一款基于视觉的用户界面解析工具,能够将界面截图转换为结构化元素。

read more
blog-thum
AyaMCooking

AyaMCooking是一款支持多语言的语音助手,帮助用户生成食谱、提供烹饪建议及营养信息。

read more
blog-thum
NotebookLlama

NotebookLlama是一个开源项目,旨在将PDF文档转换为播客,涵盖多个处理步骤。

read more
blog-thum
Video-XL

Video-XL是一种先进的视听语言模型,专注于对长时长视频的理解和分析。

read more