AI·模型 Hugging Face Daily Papers 2026-05-19

使用灯塔注意力进行长上下文预训练

本文提出灯塔注意力(Lighthouse Attention),一种训练专用的对称分层选择注意力算法,通过降低计算复杂度实现因果Transformer在超长序列上的高效训练。该方法包含自适应压缩/解压缩、对称池化保持因果性、两阶段训练等创新,在小型LLM预训练实验中达到更快的总训练速度。

AI·模型 Hugging Face Daily Papers 2026-05-19

赫尔德策略优化

赫尔德策略优化(HölderPO)提出一种通用框架,通过Hölder均值统一token级概率聚合,解决了GRPO中固定聚合机制导致的训练崩溃与性能权衡问题,在多个数学基准上平均准确率达54.9%。

AI·模型 Hugging Face Daily Papers 2026-05-19

大规模多智能体路径规划中的局部通信学习

本文提出LC-MAPF预训练模型,通过可学习的局部通信模块实现相邻智能体多轮特征共享,提升多智能体路径规划协调能力。实验在多种未见场景中优于现有强化学习和模仿学习方法,且保持可扩展性。

AI·模型 Hugging Face Daily Papers 2026-05-19

学会预见:揭示在线策略蒸馏的效率解锁机制

本文揭示了在线策略蒸馏(OPD)在大语言模型后训练中的效率机制,发现其通过早期建立稳定更新轨迹、集中更新关键推理模块以及低秩集中性实现高效。基于此提出EffOPD方法,进一步优化蒸馏效率。

AI·模型 Hugging Face Daily Papers 2026-05-19

自蒸馏智能体强化学习

SDAR 提出了一种自蒸馏智能体强化学习方法,通过在线策略自蒸馏作为门控辅助目标,增强多轮智能体训练。该方法在 Qwen2.5 和 Qwen3 系列上取得了显著效果。

AI·模型 Hugging Face Daily Papers 2026-05-19

Solvita:通过智能体进化增强大型语言模型的竞赛编程能力

Solvita 是一个智能体进化框架,通过强化学习更新图结构知识网络,实现代码生成的持续学习,无需更新底层 LLM 权重。它由 Planner、Solver、Oracle 和 Hacker 四个专用智能体组成,形成策略选择、程序合成、认证监督和定向攻击的闭环系统。

AI·模型 Hacker News 2026-05-19

Agora-1:多智能体世界模型

本文介绍了Agora-1,一种多智能体世界模型,通过多个智能体协同构建和更新对环境的共同理解,强调分布式感知、推理与行动,适用于复杂动态场景。

AI·模型 Hacker News 2026-05-19

Stratum:面向高效MoE的系统-硬件协同设计与3D堆叠DRAM

Stratum是一种系统-硬件协同设计方案,利用3D堆叠DRAM优化混合专家模型(MoE)的效率,通过将MoE的稀疏激活特性与3D DRAM的高带宽、低延迟相结合,显著减少数据移动开销,提升推理和训练性能。实验表明,相比传统方案,Stratum在能效和吞吐量上分别提升2.3倍和1.8倍。

AI·模型 Hugging Face Daily Papers 2026-05-19

CiteVQA:为可信文档智能建立证据归因基准

CiteVQA 是一个针对文档视觉语言模型的基准测试,要求模型在回答问题时正确引用支持证据,以评估其归因能力。研究发现当前模型普遍存在“归因幻觉”,即答案正确但引用的证据区域错误。

AI·模型 Hugging Face Daily Papers 2026-05-19

通过协作式逐步多教师解码蒸馏长链推理

CoRD是一种协作式多教师解码框架,通过预测困惑度评分和束搜索合成推理轨迹,高效蒸馏大型推理模型,生成高质量输出并具备泛化性能。该方法解决了教师协作缺失和动态探索不足的问题,在减少冗余采样的同时保留互补推理路径。

AI·模型 Hugging Face Daily Papers 2026-05-19

超越舒适区的助推:高效策略引导的强化学习探索

NudgeRL框架通过结构化探索和策略轻推,增强基于可验证奖励的强化学习(RLVR),提升大语言模型的推理能力。该方法引入策略轻推,利用轻量级策略级上下文引导多样化推理轨迹,无需昂贵的神谕监督。

AI·模型 Hugging Face Daily Papers 2026-05-19

DexJoCo:面向MuJoCo的任务导向灵巧操作基准与工具包

DexJoCo提出了一个面向MuJoCo的灵巧操作基准与工具包,包含11个功能性任务,评估工具使用、双手协调等能力,并提供了低成本数据采集系统及1.1K条轨迹。通过视觉和动力学随机化等设置,揭示了当前策略的常见局限。

AI·模型 Hugging Face Daily Papers 2026-05-19

PhysBrain 1.0 技术报告

PhysBrain 1.0 技术报告提出利用人类自我中心视频生成物理常识监督信号,用于训练视觉-语言-动作模型,通过数据引擎提取场景元素、空间动态等关系,转化为问答监督训练 VLM,并迁移到 VLA 策略。

AI·模型 Hugging Face Daily Papers 2026-05-19

ReactiveGWM:在反应式游戏世界模型中引导NPC

ReactiveGWM是一种反应式游戏世界模型,通过扩散模型和交叉注意力模块解耦玩家控制与NPC行为,实现游戏无关的策略表示和零样本迁移。在《街头霸王》中验证,该模型在保持玩家控制的同时实现稳健的NPC策略遵循。

创业·商业 TechCrunch 2026-05-19

韩国LetinAR正在为AI眼镜打造光学核心

韩国初创公司LetinAR开发了一款拇指甲大小的透镜,有望成为AI眼镜时代的光学支柱。该技术通过创新的光学设计,解决了传统AR眼镜体积大、视场角窄、功耗高等痛点。

开发·工具 Hacker News 2026-05-19

Fil-C优化调用约定

Fil-C 项目提出了一种优化调用约定,通过寄存器分配和栈帧优化提升函数调用效率与安全性,并兼容现有 ABI。

AI·模型 Hacker News 2026-05-19

语音AI系统易受隐藏音频攻击

本文指出语音AI系统存在安全漏洞,攻击者可通过嵌入人耳无法察觉的隐藏音频指令来操控系统,导致隐私泄露或误操作。文章分析了攻击原理、潜在风险及防御建议。

开发·工具 Hacker News 2026-05-19

从零开始设计FPGA计算器

本文详细介绍了从零开始设计基于FPGA的计算器的过程,涵盖硬件架构、模块划分、状态机设计、ALU实现及输入输出处理等关键步骤。

科技 Hacker News 2026-05-19

玻璃翼项目:Mythos给我们的启示

本文介绍了Cloudflare的Project Glasswing项目,重点分析了Mythos系统在提升数据处理效率和优化资源分配方面的表现,并探讨了其在复杂系统集成中的关键价值。

开发·工具 GitHub Trending 2026-05-19

EVV1E/waylandcraft

Waylandcraft 是一个在《我的世界》中实现的 Wayland 合成器项目,允许玩家在游戏内运行图形界面应用。

开发·工具 Hacker News 2026-05-19

loopmaster – 实时编码音乐IDE

loopmaster 是一款专为现场编程音乐设计的集成开发环境(IDE),支持实时循环、音频合成与算法作曲,帮助音乐人通过代码即兴创作。

开发·工具 Hacker News 2026-05-19

Files.md:Obsidian的开源替代品

Files.md 是一款开源的笔记应用,旨在替代 Obsidian,支持 Markdown 编辑、双向链接和图谱视图,强调本地优先和隐私保护。

行业·观察 Simon Willison's Weblog 2026-05-19

GDS就NHS退出开源的决定发表意见

英国政府数字服务(GDS)就NHS因安全漏洞关闭开源仓库的决定发表评论,强调默认开放原则,认为全面封闭会增加成本并减少复用与审查。

科技 Hacker News 2026-05-19

两台电脑,一台显示器,零折腾(2025)

本文介绍了一种在2025年实现两台电脑共享一个显示器且无需手动切换的解决方案,通过使用KVM功能的显示器或切换器,结合USB-C或HDMI接口,实现鼠标、键盘和显示器的无缝共享。

开发·工具 GitHub Trending 2026-05-19

精选CUDA编程书籍列表

GitHub上出现一个精选CUDA编程书籍列表,由alternbits维护,旨在帮助开发者系统学习CUDA编程。

科技 Hacker News 2026-05-19

Bitwarden的悄然翻新

本文探讨了Bitwarden密码管理器近期进行的一系列低调但重要的改进,包括性能优化、用户体验提升以及安全增强。

开发·工具 Hacker News 2026-05-19

理解Go语言中的Singleflight

Singleflight 是 Go 语言中用于防止重复函数调用的同步原语,它确保同一时间只有一个 goroutine 执行某个操作,其他并发请求会等待并共享结果。本文介绍其工作原理、使用场景及注意事项。

开发·工具 Hacker News 2026-05-19

学习工程学

本文介绍了线束工程的基本概念、设计原则和制造流程,涵盖从需求分析到生产验证的关键步骤,强调标准化和可靠性。

AI·模型 Sebastian Raschka 2026-05-17

LLM架构最新进展:KV共享、mHC与压缩注意力

本文综述了从Gemma 4到DeepSeek V4等新型开源大语言模型在降低长上下文成本方面的关键技术:KV共享、多头压缩注意力(mHC)以及压缩注意力机制。这些方法通过减少内存占用和计算量,使LLM能高效处理超长序列。

AI·模型 GitHub Trending 2026-05-17

VGGT Omega

本文介绍了CVPR 2026 Oral论文《VGGT Omega》,提出了一种新型视觉几何变换网络,在三维重建和姿态估计任务上达到SOTA性能。

AI·模型 Hacker News 2026-05-17

DeepSeek-V4-Flash:LLM操控再次变得有趣

本文探讨了DeepSeek-V4-Flash模型如何通过改进架构和训练方法,在可控性和灵活性上取得突破,重新激发对LLM操控的兴趣,使开发者能更精细地引导模型行为。

AI·模型 Hacker News 2026-05-17

Δ-Mem:大型语言模型的高效在线记忆

Δ-Mem是一种为大型语言模型设计的高效在线记忆机制,通过增量更新和压缩存储,显著降低记忆维护的计算和存储开销,同时保持模型对长序列或动态输入的有效记忆能力。

AI·模型 Hacker News 2026-05-17

前沿AI已打破开放CTF格式

本文指出,随着前沿AI(如大型语言模型)能力的提升,传统的开放式CTF竞赛格式已不再有效,AI能自动解决许多挑战,影响竞赛公平性和趣味性。

开发·工具 Hacker News 2026-05-17

在Amiga上零CPU播放Atari ST音乐

本文介绍了一种在Amiga计算机上通过硬件DMA和音频芯片配置实现零CPU占用播放Atari ST音乐文件的方法,详细说明了数据格式转换、DMA设置和中断处理等技术细节。

科技 Hacker News 2026-05-17

加速(2005)

《加速》(2005)是一部探讨技术奇点、人工智能及后人类主义的科幻小说,描绘了人类在技术爆炸中的转型与伦理困境。

开发·工具 GitHub Trending 2026-05-17

antirez/ds4

antirez/ds4 是一个专为 DeepSeek 4 Flash 模型设计的本地推理引擎,支持 Metal 和 CUDA 加速,旨在提供高效低延迟的模型推理能力。

开发·工具 GitHub Trending 2026-05-17

代理最佳实践

GitHub上的开源项目,提供与提供商无关的智能体最佳实践,涵盖通用技能和架构设计原则,帮助开发者构建高效可扩展的代理系统。

开发·工具 GitHub Trending 2026-05-17

earendil-works/pi

earendil-works/pi 是一个面向 AI 智能体的综合工具包,包含编码智能体命令行界面、统一 LLM API、终端 UI 与 Web UI 库、Slack 机器人以及 vLLM 推理集群支持,旨在简化 AI 应用的开发与部署。

开发·工具 GitHub Trending 2026-05-17

Vercel Labs / Zero

Vercel Labs 开源了 Zero,一种专为智能体(agents)设计的编程语言,旨在简化智能体系统的开发与部署,支持高效通信与协作。

开发·工具 Hacker News 2026-05-17

我最喜欢的Bug:无效的代理对

本文探讨了Unicode代理对在编程中引发的常见Bug,分析了无效代理对导致程序崩溃、数据损坏或安全漏洞的根源,并提供了检测与修复方法。

行业·观察 The Verge 2026-05-17

得来速聊天机器人只是开始

本文回顾了麦当劳自2021年起在得来速窗口部署AI聊天机器人的历程,该技术源自其收购的初创公司Apprente,并指出这只是AI融入日常生活的开始。

科技 Hacker News 2026-05-17

苹果芯片成本高于OpenRouter

文章对比了使用 Apple Silicon 本地运行 AI 与通过 OpenRouter 等 API 服务的总成本,指出本地部署在硬件、电力和维护上的隐性成本更高,性价比不如按需付费的云端方案。

开发·工具 Hacker News 2026-05-17

在8位微控制器上托管网站

本文探讨了在资源受限的8位微控制器上托管简单网站的技术可行性,通过优化HTTP服务器和压缩数据,在仅有几KB RAM的MCU上实现基本Web服务。

AI·模型 Hacker News 2026-05-17

科学中的理解错觉

本文探讨科学中的“理解错觉”现象,分析认知偏差和知识碎片化如何导致人们高估对科学概念的理解,并提出减少错觉的策略。

开发·工具 GitHub Trending 2026-05-17

raindrop-ai/workshop

raindrop-ai/workshop 项目旨在让编码代理能够编写和运行代理评估,提升开发效率。

开发·工具 GitHub Trending 2026-05-17

代码复杂度优化器

一个基于Codex的工具,用于分析代码库复杂度并生成性能优化报告,帮助开发者识别和重构复杂代码。

开发·工具 OpenAI Blog 2026-05-17

销售团队如何使用Codex

OpenAI博客文章介绍销售团队如何使用Codex从工作输入生成管道简报、会议准备包等,提升效率和决策质量。

开发·工具 GitHub Trending 2026-05-17

PLFJY/ContextMenuMgr

PLFJY/ContextMenuMgr 是一款 Windows 上下文菜单管理工具,具备新菜单监控功能,帮助用户高效管理右键菜单项。

科技 Hacker News 2026-05-17

掌控校园内每一台投影仪和摄像头

本文探讨了通过技术手段集中控制与管理校园内投影仪和摄像头的方法,包括网络发现、设备认证、远程配置和监控等步骤,旨在提升管理效率与安全性。

开发·工具 Simon Willison's Weblog 2026-05-17

iNaturalist-clumper 0.1 发布

iNaturalist-clumper 0.1 发布,这是一个用于将 iNaturalist 观察记录发布到个人博客的基础设施组件,经过数周生产环境运行后正式发布。

开发·工具 Hacker News 2026-05-17

你不知道的HTML列表

本文深入探讨HTML列表元素的隐藏特性与最佳实践,包括嵌套规则、自定义标记、可访问性优化及CSS高级用法。

开发·工具 Simon Willison's Weblog 2026-05-17

datasette-llm-limits 0.1a0

datasette-llm-limits 0.1a0 是一个 Datasette 插件,用于设置 LLM 使用的消费限制,支持按用户或全局配置。

开发·工具 GitHub Trending 2026-05-17

openclaw/clawpatch

openclaw/clawpatch 是一个专注于代码审查、补丁修复和拉取请求合并的技术项目,旨在提升代码质量和项目稳定性。

开发·工具 GitHub Trending 2026-05-17

小提琴

shang-zhu/violin 是一个开源视频翻译技能项目,结合语音识别、文本翻译和字幕生成技术,支持多语言视频处理。

科技 The Verge 2026-05-17

混音带:青少年生活的音乐肖像

《Mixtape》是一款以高中生活为背景的视频游戏,玩家扮演音乐爱好者Stacey Rockford,在毕业前的夏日里探索友情、怀旧与青春焦虑。游戏以经典歌曲配乐,融合了青少年电影中的典型元素。

开发·工具 GitHub Trending 2026-05-17

Crypto-Web3-Copilot应用

一个基于Next.js构建的AI驱动的Web3 Copilot应用,提供智能化的加密货币和Web3交互体验。

科技 The Verge 2026-05-17

Xbox 更名为 XBOX

微软将 Xbox 品牌更名为全大写的 XBOX,源于 CEO 在 X 平台发起的投票结果,目前部分社交账号已更新。

科技 Hacker News 2026-05-17

高熵合金

高熵合金是一种由多种主要元素等原子比组成的合金,具有独特性能,但该内容与AI领域无关。

科技 Simon Willison's Weblog 2026-05-17

西部海鸥,岩鸽

本文记录了在洛杉矶地区PyCon会议前的一次晨间观鸟活动,观察到一只西美鸥在享用星巴克食物,同时提及了岩鸽的存在。内容简短,主要描述观鸟体验。

AI·模型 Hugging Face Daily Papers 2026-05-16

自蒸馏智能体强化学习

SDAR提出一种自蒸馏智能体强化学习方法,通过在线策略自蒸馏作为门控辅助目标,增强多轮智能体训练,在Qwen2等模型上取得显著效果。

AI·模型 Hacker News 2026-05-16

Sigmoid函数救不了你

本文指出Sigmoid激活函数在深度学习中存在梯度消失、非零中心输出等根本性缺陷,导致深层网络训练困难,并建议使用ReLU等替代方案。

开发·工具 Simon Willison's Weblog 2026-05-16

二维码生成器

Simon Willison 介绍了一个由 Claude 协助构建的二维码生成工具,支持文本/URL 和 WiFi 网络连接二维码生成。

科技 Hacker News 2026-05-16

古腾堡计划——越来越好

古腾堡计划是一个持续改进的数字图书馆项目,提供大量免费电子书。本文简要介绍了其发展历程和当前状态,强调其不断优化用户体验和内容质量。