汇集全球顶尖行业资讯,AI驱动 助您紧跟实时热点,不错过任何重要信息。
Google Antigravity现已全面支持Skills规范,用户可创建和使用Skills。随着OpenAI和谷歌等巨头支持,Skills作为扩展AI代理能力的开放标准,预计将迎来爆发式增长。
本文详细介绍了如何安装和使用一款能生成带动效PPT的技能,并阐述了其构建逻辑和细节。
bm.md Markdown编辑器发布,AI辅助排版,支持多媒体,旨在简化微信公众号内容创作。该项目完全由AI编码,并已适配阿里云ESAA Pages。
归藏(guizang.ai)发布了完整的项目使用教程和构建思路,用户可通过提供的链接获取详细信息。
马斯克的MACROHARD数据中心利用特斯拉Megapack电池系统作为备用电源,并配备200兆瓦风冷及扩建至400兆瓦水冷能力,结合天然气轮机实现电力自给自足,展现其快速基建能力。
Boris Cherny 在社交媒体平台 X 上回复用户 @altryne,内容为 'All of it'。该推文获得1个赞和720次浏览。
Anthropic发布Claude Code新功能Cowork,其代码竟由Claude Code自身完成。该功能面向非技术人员,能处理文件、提取信息、整理报告,并可与Chrome版Claude协同,预示AI自我创造时代来临。
Claude Code 似乎正计划推出带 UI 的桌面客户端,类似于 OpenCode。目前正在招聘设计师,要求具备技术能力并经常使用 Claude Code。
Anthropic推出面向非技术用户的Claude Code Cowork,可读写文件,协助整理下载、提取费用记录、生成报告初稿,并与Chrome版Claude协同工作。
苹果宣布与谷歌达成合作,将Gemini AI整合到iOS设备中,包括Siri。此举预计将推动谷歌股价上涨。
文章展示Veo 3.1结合矢量插画,能生成惊艳的动画PPT。作者成功开发出独有的AI PPT生成Agent,支持演示动效、无限循环、速度控制及视频导出,极大提升了演示体验,被赞效果“太猛了”。
DeepSeek推出了V3.2模型,包括推理型Speciale,该模型凭借稀疏注意力机制和深度强化学习,在数学/信息学奥赛中达到金牌水平。这证明算法创新能挑战美国科技巨头在纯推理AI领域的优势,缩小差距。同时,小型实验室在专业图像/视频生成方面也取得显著进展,加剧了AI生态竞争。
Towards AI学院推出年度最后一期“从编程新手到高级LLM开发者”课程包,享40%折扣(359美元)。此延长版黑五优惠旨在帮助AI爱好者在2026年前成为熟练的AI工程师,专注于生产级LLM开发和构建可扩展的AI产品。
Towards AI Academy 在黑五网一期间推出所有AI课程40%折扣,其中“全栈AI工程”课程现价209美元。使用代码“blackfriday”至周一有效,为有志于2026年成为AI工程师者提供最经济的途径。
DeepMind发布了Gemini 3.0 Pro和Nano Banana Pro,在AI基准测试中取得显著领先,涵盖推理和多模态生成。竞争对手Anthropic和OpenAI迅速回应,分别推出Claude Opus 4.5(侧重编码)和GPT-5.1 Codex-Max(长上下文),加剧了AI领域的竞争。
文章驳斥了“AI泡沫”的担忧,指出由萨姆·奥特曼1.5万亿美元愿景推动的大规模AI基础设施建设是一项理性投资。微软、甲骨文和亚马逊等科技巨头正因AI的已证实价值和雄厚财力而大力投入。同时,Grok 4.1和GPT-5.1更新侧重提升写作质量和情商,而非传统性能基准。
月之暗面发布了Kimi K2 Thinking,这是一款在多步工具使用(200-300次调用)和基准测试中表现卓越的智能体模型。该模型基于万亿参数MoE架构,在开源模型中排名第一,并以具有竞争力的API定价挑战领先的美国AI实验室。
人工智能行业商业化步伐加快,OpenAI完成公司转型并达成巨额GPU租赁协议。同时,Anthropic研究显示,Claude模型能通过“概念注入”有限地感知自身内部状态。尽管该能力尚处于初期且不可靠,但这提供了自我监控的因果性证据,预示着提升AI安全性、调试能力和透明度的潜力。
Towards AI的十一月全栈AI工程课程招生即将截止(仅剩1天),线上启动会定于11月2日。该课程定价349美元,旨在培养市场急需的AI工程师,专注于生产级生成式AI技能,并提供免费预览。
DeepSeek发布了DeepSeek-OCR,这是一个创新模型,它使用“上下文光学压缩”技术,将文本图像而非文本token输入给LLM。该模型实现了10倍压缩比和97%的OCR精度,为高容量文档处理提供了强大解决方案,并为高效长上下文LLM架构开辟了新范式。
Anthropic推出“Agent Skills”,为Claude提供专业可重用知识。通过动态加载指令和代码文件夹,利用渐进式披露高效管理上下文。这种结合自然语言与可执行代码的混合方法,为LLM构建提供新范式,促进企业AI应用及商业化。
谷歌发布了用于用户界面交互的Gemini 2.5 Computer Use,基准测试表现出色但面临网络复杂性。同时推出企业级AI平台Gemini Enterprise,加剧与OpenAI的竞争。其他AI新闻包括Sora下载量破百万及xAI发布Imagine v0.9视频模型。
《Import AI 436》介绍了OSGym,一个能让AI高效、经济地学习使用电脑的新平台。文章强调Luma AI计划在沙特阿拉伯建造一个2GW的数据中心,凸显了AI对巨大资源的需求。本期还批评了过度监管如何扼杀创新,并引用兰德公司的一份报告,指出目前对抗流氓超级智能的方法大多无效且具破坏性,强调预防至关重要。
《Import AI 435》探讨了三个关键AI议题:一篇论文警告称,先进AI将吸收而非赋予人类权力;“每瓦智能”指标显示开源AI模型在本地设备上的效率显著提升;以及Facebook的NCCLX软件,支持在超过10万个GPU上进行大规模AI训练,展现了私营部门的巨大规模。一篇虚构的“科技故事”还探讨了反AI数据中心袭击的负面影响。
《Import AI 433》聚焦四项重要AI进展:Ctrl-World,加速机器人研发的世界模型;LabOS,用于自动化实验室实验的AI-XR系统;检测恶意模型微调的AI审计代理;以及苹果的Pico-Banana-400k数据集,用于文本引导的图像编辑。这些创新旨在提升机器人、科学及创意AI应用的效率与安全性。
近期AI领域进展:Dreadnode原型化了利用设备LLM的自主本地AI恶意软件;Exo Labs构建混合集群提升LLM推理速度。同时,Poolside宣布在德州建设2吉瓦AI数据中心,研究员发布了人形机器人训练数据集。一篇虚构故事警示了玩家对高度逼真生成式AI角色产生情感依恋的风险。
《Import AI 430》聚焦三大AI进展:兰德报告警告,若领导者认为AGI具军事优势,恐引发预防性打击。研究发现宇树G1人形机器人存在未记录的监控后门,向中国传输数据。此外,谷歌Veo 3视频模型展现出类似语言模型的零样本学习与推理的涌现能力。另有书评探讨了超级智能的生存风险。
AI产品榜由李榜主发起,联合权威媒体发布,被硅谷投资人及中国新闻周刊等引用。它通过分析万余款AI应用,提供覆盖访问量、营收等数据的榜单,为投资人、AI从业者和用户提供市场趋势和产品洞察。