AutoResearchClaw:基于人类-AI协作的自我强化自主研究系统
AutoResearchClaw是一个多智能体自主研究系统,通过结构化辩论、自愈执行、可验证报告、人机协作和跨轮进化五大机制,将科学研究从线性流程转变为迭代循环。在ARC-Bench基准测试中,它比AI Scientist v2性能提升54.7%。
找到 36 篇包含 "AR" 的文章
AutoResearchClaw是一个多智能体自主研究系统,通过结构化辩论、自愈执行、可验证报告、人机协作和跨轮进化五大机制,将科学研究从线性流程转变为迭代循环。在ARC-Bench基准测试中,它比AI Scientist v2性能提升54.7%。
Google I/O 2025 发布 Gemini Spark 个人 AI 代理,基于 Gemini 3.5 Flash 和反重力技术运行,提供企业级安全隔离,并宣布开源部分组件。
Artifact-Bench是一个评估多模态大语言模型检测AI生成视频伪影能力的基准,包含三级伪影分类体系和三个互补任务。
谷歌在IO 2026大会上推出Gemini Spark,一款集成Gmail等Workspace产品的24/7智能助手,能自动执行长期任务。
网络安全初创公司Ocean获得2800万美元融资,其创始人Shay Shwartz曾参与以色列铁穹项目。该公司开发基于AI的邮件安全平台,利用小型语言模型检测AI驱动的钓鱼攻击,每月处理数十亿封邮件。
在2026年Google I/O大会上,Google宣布Gemini应用迎来重大更新,包括“每日简报”功能、重新设计的界面、新AI视频模型Gemini Omni以及个人AI代理Gemini Spark,旨在将Gemini从独立聊天机器人转变为全能AI中心。
谷歌在I/O大会上推出Universal Cart,一个跨搜索、Gemini、YouTube、Gmail等平台集中管理购物的AI代理中心,并发布Agent Payments Protocol (AP2)允许AI代理自动付款。
谷歌在2026年Google I/O大会上宣布与Warby Parker、Gentle Monster及三星合作,推出新一代AI智能眼镜,主打音频交互,用户可通过语音命令调用Gemini等服务,兼容Android和iOS,计划年内上市。
Google 在 I/O 大会上宣布 Wear OS 7,新增实时更新功能,可追踪快递和体育比分,并支持监控 AI 自动化任务。
9arm-skills 是一个为 Claude Code 设计的智能体技能集合,按类别组织并提供 SKILL.md 文件和脚本,通过符号链接安装。
初创企业战场200(Startup Battlefield 200)的申请将于5月27日截止,入选者可在TechCrunch Disrupt大会上展示并有机会获得10万美元奖金。
Artifact-Bench是一个评估多模态大语言模型检测AI生成视频伪影能力的基准,包含三级分类体系和三个任务。对19个模型的实验揭示了当前模型的局限性。
谷歌在IO 2026上推出Gemini Spark,一款集成Gmail等Workspace产品的24/7智能助手,基于Gemini模型和Antigravity代理框架,可自动执行长期任务。
Shay Shwartz 从少年黑客转型为网络安全专家,曾参与以色列铁穹项目。他创立的 Ocean 公司开发了基于AI的邮件安全平台,专门防御AI驱动的钓鱼攻击,已获得2800万美元融资。
谷歌在IO 2026上宣布Gemini应用重大更新,包括每日简报、新界面、AI视频模型Gemini Omni及个人代理Gemini Spark,旨在转型为全能AI中心,与ChatGPT和Claude竞争。
谷歌在I/O大会上推出Universal Cart,一个跨搜索、Gemini、YouTube、Gmail的AI购物代理中心,可追踪价格、库存和优惠,并发布Agent Payments Protocol (AP2)允许AI代理自动付款。
谷歌在2026年Google I/O大会上宣布与Warby Parker、Gentle Monster及三星合作,推出新一代AI智能眼镜,主打音频交互,用户可通过语音命令调用Gemini等谷歌服务,兼容Android和iOS,计划年内上市。
Google 在 I/O 大会上宣布 Wear OS 7,新增实时更新功能,可追踪快递、体育比分及 AI 自动化任务。
Remove-AI-Watermarks 是一个开源命令行工具和库,用于从图像中移除AI生成的水印,支持批量处理。
SDAR 提出了一种自蒸馏智能体强化学习方法,通过在线策略自蒸馏作为门控辅助目标,增强多轮智能体训练。该方法在 Qwen2.5 和 Qwen3 系列上取得了显著效果。
Anthropic 收购了纽约初创公司 Stainless,该公司专注于自动化创建和维护 SDK,客户包括 OpenAI、Google 和 Cloudflare。
韩国初创公司LetinAR开发了一款拇指甲大小的透镜,有望成为AI眼镜时代的光学支柱。该技术通过创新的光学设计,解决了传统AR眼镜体积大、视场角窄、功耗高等痛点。
本文介绍了Cloudflare的Project Glasswing项目,重点分析了Mythos系统在提升数据处理效率和优化资源分配方面的表现,并探讨了其在复杂系统集成中的关键价值。
Files.md 是一款开源的笔记应用,旨在替代 Obsidian,支持 Markdown 编辑、双向链接和图谱视图,强调本地优先和隐私保护。
本文探讨了Bitwarden密码管理器近期进行的一系列低调但重要的改进,包括性能优化、用户体验提升以及安全增强。
YC首席执行官Garry Tan公开指责作者进行不道德报道,但文章未提供具体细节,仅包含标题和评论。
本文介绍了一种在Amiga计算机上通过硬件DMA和音频芯片配置实现零CPU占用播放Atari ST音乐文件的方法,详细说明了数据格式转换、DMA设置和中断处理等技术细节。
研究存储库ArXiv宣布,若作者让AI完成全部工作,将被禁止提交论文一年,以打击滥用大型语言模型的行为。
RJ Scaringe 凭借其卓越的叙事与沟通能力,在三家初创公司中累计融资超过120亿美元,投资者对其理念持续追捧。
earendil-works/pi 是一个面向 AI 智能体的综合工具包,包含编码智能体命令行界面、统一 LLM API、终端 UI 与 Web UI 库、Slack 机器人以及 vLLM 推理集群支持,旨在简化 AI 应用的开发与部署。
AI驱动的营销平台Nectar Social宣布完成3000万美元A轮融资,由Menlo Ventures及其与Anthropic联合创立的Anthology Fund领投。
Mado 是一个用 Rust 开发的高性能 Markdown 语法检查工具,能够快速检测格式问题,适合集成到 CI/CD 流程中。
General Catalyst 在社交媒体上发布了一则针对风投行业的“愤怒诱饵”帖子,成功引发了大量争议,尤其是吸引了 a16z 联合创始人 Marc Andreessen 的多次回应。该事件揭示了风投圈内的竞争与情绪化互动。
项目Warelay更名为OpenClaw,文章通过Git历史记录了名称演变过程。
《Oddity》是导演Damian McCarthy的恐怖电影,与《Hokum》类似,涉及诅咒物品和神秘学元素,文章推荐观众在不知情的情况下观看。
SDAR提出一种自蒸馏智能体强化学习方法,通过在线策略自蒸馏作为门控辅助目标,增强多轮智能体训练,在Qwen2等模型上取得显著效果。