本文指出Sigmoid激活函数在深度学习中存在梯度消失、非零中心输出等根本性缺陷,导致深层网络训练困难。作者强调仅靠Sigmoid无法解决现代神经网络的核心问题,并建议使用ReLU、Leaky ReLU等替代方案。
更多 AI·模型 文章
AI·模型
Hugging Face Daily Papers 2026-05-19 ★ ★ ★ ★ ☆
Flash-GRPO:通过单步策略优化实现视频扩散的高效对齐
Flash-GRPO 是一种单步训练框架,通过等时分组和时间梯度修正,在低计算预算下实现视频扩散模型的高效对齐,显著提升训练效率。
AI·模型
Hugging Face Daily Papers 2026-05-19 ★ ★ ★ ★ ☆
赫尔德策略优化
赫尔德策略优化(HölderPO)提出一种通用框架,通过Hölder均值统一token级概率聚合,解决了GRPO中固定聚合机制导致的训练崩溃与性能权衡问题,在多个数学基准上平均准确率达54.9%。
AI·模型
Hugging Face Daily Papers 2026-05-19 ★ ★ ★ ★ ☆
InsightTok:在自回归图像生成的离散分词中提升文本与面部保真度
InsightTok 是一种改进的离散视觉标记化框架,通过引入内容感知的感知损失,显著提升了文本和面部的重建质量,并有效迁移至自回归图像生成任务。
AI·模型
Hugging Face Daily Papers 2026-05-19 ★ ★ ★ ★ ☆
大规模多智能体路径规划中的局部通信学习
本文提出LC-MAPF预训练模型,通过可学习的局部通信模块实现相邻智能体多轮特征共享,提升多智能体路径规划协调能力。实验在多种未见场景中优于现有强化学习和模仿学习方法,且保持可扩展性。