20250225 Anthropic推出混合推理模型Claude 3.7 Sonnet

🦉 AI新闻
🚀 Anthropic推出混合推理模型Claude 3.7 Sonnet
摘要:人工智能公司Anthropic发布首款“混合推理模型”Claude 3.7 Sonnet,该模型在数学和编程等复杂任务上的表现优于前代产品。Claude 3.7结合了推理和传统生成答案的能力,成为市面上唯一此类模型。此外,公司推出了编程工具Claude Code,支持代码搜索和编辑。尽管模型尚不具备实时网络搜索功能,但知识更新至2024年10月,开发者可通过“草稿纸”功能指导模型的思考方式,提升用户体验。
🚀 DeepSeek推出开源FlashMLA代码库
摘要:DeepSeek于2月24日启动了“开源周”,首个发布的开源项目为FlashMLA,这是一个针对Hopper GPU优化的高效MLA解码内核,旨在处理可变长度序列。FlashMLA受到了FlashAttention 2&3和cutlass项目的启发,支持CUDA 12.3及以上版本与PyTorch 2.0及以上版本。在H800 SXM5配置下,内存受限时带宽可达3000 GB/s,计算受限时算力可达580 TFLOPS。代码和详细信息可通过GitHub获取。
🚀 阿里巴巴未来三年投资3800亿元建设云与AI基础设施
摘要:阿里巴巴集团CEO吴泳铭宣布,未来三年将投入超过3800亿元,用于云和AI硬件基础设施建设,创下中国民营企业该领域最大投资纪录。吴泳铭表示,AI的爆发超出预期,阿里巴巴将加速基础设施建设,助力行业生态发展。公司将继续关注电商、科技业务及互联网平台等三大业务领域,围绕AI战略核心加大在基础设施和应用转型等方面的投入。
🚀 苹果宣布未来四年投资5000亿美元
摘要:苹果公司日前宣布将投资5000亿美元于美国本土业务,包括在休斯顿建设AI服务器制造工厂和设立密歇根供应商学院。作为交换,美国总统同意免除苹果从中国进口产品的关税。此次投资将创造2万个就业岗位,主要集中在研发和AI领域,同时苹果将扩大数据中心容量,并增设制造学院,为中小企业提供支持。库克表示看好美国创新未来,支持290万个就业岗位。
🚀 OpenAI新研究指出AI仍无法取代人类程序员
摘要:尽管OpenAI首席执行官萨姆・奥尔特曼认为AI模型将在年底超越低级别软件工程师,但最新研究显示,当前最先进的AI仍无法有效完成编程任务。研究基于1400个软件工程任务评估三款大型语言模型,发现它们只能解决些表面问题,缺乏对漏洞深入理解,表现仅逊于人类程序员。这一发现强调了AI在软件工程领域的局限性,尽管其正在快速发展。
🚀 马斯克Grok 3强势发布,xAI建新数据中心
摘要:马斯克推出的Grok 3模型表现卓越,仅用8分钟解决2025年普特南竞赛难题,并被誉为强大的AI编码助手,吸引大量用户转向。与此同时,xAI在亚特兰大开建新数据中心,计划部署约12,000个NVIDIA GPU,提升AI计算能力。马斯克还计划将当前的20万GPU集群扩展至100万,以应对日益增长的需求。市场专家认为,xAI或许有望超越特朗普的“星际之门计划”。
🚀 央企接入DeepSeek推动AI发展
摘要:近期,超过20家国资央企接入DeepSeek,涵盖能源、通信、汽车、金融和建筑等多个领域。国务院国资委强调在“十五五”规划中将人工智能发展作为重点,推动科技领军企业和初创企业的成长。能源领域的多家央企已完成DeepSeek大模型的私有化部署,通信运营商也积极布局。业内人士认为,央企需通过定制化开发将技术方案与业务需求深度结合,推动数字化转型。
🚀 DeepSeek算力紧张情况有所缓解
摘要:2月24日消息,用户反馈DeepSeek算力紧张情况有所改善,使用高峰期较少出现“服务器繁忙,请稍后再试”的提示。此前有行业人士猜测DeepSeek可能对使用次数进行了限制,但接近DeepSeek的人士表示并没有特别限制,而是因为之前资源不足。近期,DeepSeek团队正在进行技术架构优化,使其在较少资源的情况下能支持更多用户。
🚀 拼多多组建大模型团队 推动AI应用
摘要:拼多多已组建电商推荐大模型团队,负责人曾为百度凤巢核心成员,其年薪是之前的数倍。拼多多大模型产品涵盖比价、推荐、广告、搜索及客服等多个领域,并已持续投入。公司内部小组间进行比赛,以成果评估收益。2024年第三季度,拼多多营收993.544亿元,同比增长44%;净利润249.807亿元,同比增长61%。
🚀 苹果将在iOS 18引入ChatGPT与Gemini模型
摘要:在WWDC 2024期间,苹果宣布与OpenAI合作,将ChatGPT引入iOS 18。除了与OpenAI的合作,苹果还计划为海外版iPhone接入谷歌的Gemini模型。数据挖掘者Aaron Perris发现iOS 18.4测试版中涉及Google与OpenAI的相关代码,预示未来可能允许用户选择不同的第三方AI模型。谷歌近期推出了更强大的Gemini 2.0 Pro和高性价比的Gemini 2.0 Flash-Lite模型。
更多AI工具 Github-AI123
广告:私人定制视频文本提取,字幕翻译制作等,欢迎联系QQ:86911638