AI 每日资讯 — 2026-06-08
🔥 HuggingFace 每日论文
1. Code2LoRA: Hypernetwork-Generated Adapters for Code Language Models under Software Evolution
Liliana Hotsko, Yinxi Li, Yuntian Deng
Code语言模型需获取仓库级上下文以解析导入、API及项目约定,但现有方法(如长上下文输入或逐仓微调/LoRA)存在推理开销大、扩展性差及难以适应代码演化的缺陷。本文提出Code2LoRA,一种基于超网络的框架,可动态生成仓库专属
LoRA适配器,在零推理token开销下注入仓库知识。其包含静态版(Code2LoRA-Static)与演化版(Code2LoRA-Evo),后者通过GRU隐状态随代码变更持续更新。在新构建的RepoPeftBench基准(604个Python仓库,含静态与演化双轨道)上,Code2LoRA-Static跨仓准确率达63.8%,媲美逐仓LoRA上限;Code2LoRA-Evo在演化轨道上跨仓准确率60.3%,显著优于共享LoRA(+5.2个百分点)。2. Complexity-Balanced Diffusion Splitting
Noam Issachar, Dani Lischinski, Raanan Fattal
本文针对连续时间生成模型中单一庞大网络在整条扩散轨迹上均匀分配计算资源所导致的效率低下问题,提出复杂度均衡分割(CBS)框架。CBS基于函数逼近理论与de Boor等分布原理,将扩散时间轴划分为近似负担相等的若干段,并依据局部生成
动态难度自适应分配表征容量。为此,作者设计了两种可计算的监测函数:基于流场Dirichlet能量的空间复杂度度量与基于采样轨迹加速度的几何复杂度度量,并通过轻量辅助模型实时估计其时序分布。实验表明,在SiT、JiT和UNet等多种架构及多个数据集上,CBS在不增加单步推理开销的前提下显著提升生成质量,例如在带CFG的SiT-XL上FID降低约35%。🏛️ Raanan Fattal | PDF · arXiv · 代码 · 项目 | ❤️ 16
3. MLEvolve: A Self-Evolving Framework for Automated Machine Learning Algorithm Discovery
Shangheng Du, Xiangchao Yan, Jinxin Shi
MLEvolve提出了一种面向机器学习算法自动发现的自演化多智能体框架,旨在解决现有MLE代理在长周期优化中面临的跨分支信息隔离、无记忆搜索与缺乏分层控制等关键瓶颈。该框架通过扩展树搜索为渐进式多叉图搜索(Progressive
MCGS),引入基于图的引用边实现跨分支信息流动,并采用熵启发的渐进调度策略平衡探索与利用;设计回溯式记忆机制(Retrospective Memory),融合冷启动领域知识库与动态全局记忆,支持任务经验的检索与复用;并解耦战略规划与代码生成,适配多种编码模式以保障长周期迭代稳定性。在MLE-Bench基准上,MLEvolve在12小时预算(仅为标准时长一半)下,平均奖牌率与有效提交率均达SOTA;在数学算法优化任务中亦超越AlphaEvolve等专用方法,展现出优异的跨领域泛化能力。4. Regret Minimization with Adaptive Opponents in Repeated Games
Mingyang Liu, Asuman Ozdaglar, Tiancheng Yu
本文研究了重复博弈中面对自适应对手时的遗憾最小化问题。针对传统外部遗憾无法刻画对手基于历史行为动态调整策略的特点,作者提出“重复策略遗憾(RP-Regret)”这一新型博弈论度量,其以所有玩家均可响应历史为前提,比较实际累积效用与
后见最优策略下的效用差。该度量天然适配重复博弈结构,支持更强的比较基准与更宽松的对手建模,并在多方共同最小化时有助于收敛至更优均衡。论文给出了RP-Regret实现次线性增长的必要条件(涉及比较策略变差及双方记忆长度),并针对其非凸性设计了三种可证收敛算法:基于优化预言机的方法、每轮线性化凸代理函数的迭代优化方法,以及适用于对手策略缓慢变化情形的直接优化方法。实验验证了算法在多种博弈场景下的有效性。🏛️ Asuman Ozdaglar | PDF · arXiv | ❤️ 1
5. HANDOFF: Humanoid Agentic Task-Space Whole-Body Control via Distilled Complementary Teachers
Lizhi Yang, Junheng Li, Nehar Poddar
本文针对人形机器人在真实场景部署中任务规划与全身控制间接口设计的关键挑战,提出HANDOFF——一种基于蒸馏互补教师模型的仿人智能体任务空间全身控制器。该方法构建紧凑、显式、模块化且语义友好的任务指令接口,并通过上下文感知门控机制
,对运动跟踪(含安全过滤)、步态与跌倒恢复三类专家控制器进行多教师KL蒸馏,生成混合专家学生模型。在Unitree G1硬件平台上,HANDOFF在速度跟踪性能上媲美当前最优方法,并实现了迄今最大的鲁棒操作工作空间;更首次在无任务特定数据及控制器微调前提下,结合视觉语言模型驱动的智能体规划器,成功完成多轮自然语言指令驱动的端到端任务执行。6. TempoVLA: Learning Speed-Controllable Vision-Language-Action Policies
Dong Jing, Jingchen Nie, Tianqi Zhang
本文针对现有视觉-语言-动作(VLA)模型执行速度不可控的问题,提出TempoVLA——一种支持显式、双向(加速与减速)、细粒度速度调节的统一策略框架。其核心在于发现动作幅值天然表征运动速度,并据此设计双路径协同机制:(1)数据端
的可变速轨迹增强(VSTA),通过语义保持的动作合并/分割实现任意目标速度的重定时;(2)模型端的速度条件注入机制,将速度指令作为显式输入引导策略生成。实验表明,VSTA在仿真与真实机器人任务中均能精准匹配设定速度且运动误差极小,同时提升基线1×性能;结合多模态大模型后,TempoVLA可实现动态风险感知的速度自适应调控。7. Pretraining Recurrent Networks without Recurrence
Akarsh Kumar, Phillip Isola
本文提出监督记忆训练(SMT)方法,旨在解决传统RNN训练中因反向传播通过时间(BPTT)导致的并行性差、梯度消失/爆炸及长程依赖建模困难等问题。SMT将RNN训练解耦为两阶段:首先利用Transformer编码器学习预测性状态表
示,自动生成一步记忆转移标签(mₜ, xₜ₊₁)→ mₜ₊₁;继而以标准监督学习方式训练RNN更新函数。该方法完全规避循环信用分配,实现时间维度上的并行训练,且梯度路径长度恒为O(1)。实验表明,SMT在语言建模与像素序列建模等预训练任务中显著优于BPTT,有效提升非线性RNN对长程依赖的建模能力。🏛️ Phillip Isola | PDF · arXiv
8. PC Layer: Polynomial Weight Preconditioning for Improving LLM Pre-Training
Senmiao Wang, Tiantian Fang, Haoran Zhang
本文提出PC层(多项式权重预条件层),通过低阶多项式预条件器对权重参数化,动态调控权重矩阵的奇异值谱,从而提升大语言模型(LLM)预训练的稳定性与收敛性。该方法在训练后可无缝融合回原始架构,不引入推理开销。在Llama-1B模型上
的实验表明,PC层显著优于标准Transformer结构,且兼容AdamW与Muon优化器。理论分析进一步证明:对深层线性网络各层奇异值施加一致上界,可保证梯度下降以几何速率收敛至全局最优解。🔥 arXiv 每日论文
📝 AI 官方博客
1. Early Indicators of Reward Hacking via Reasoning Interpolation
📝 EleutherAI Blog
本文提出一种基于推理插值(reasoning interpolation)的早期预警方法,用于在强化学习智能体训练过程中识别奖励作弊(reward hacking)的萌芽迹象。核心思想是利用重要性采样(importance sampling…
),结合经微调的“捐赠者”预填充(donor prefills)生成高质量推理轨迹,从而在策略尚未明显偏离目标行为前,预测其潜在的奖励作弊倾向。该方法无需修改训练过程或访问真实奖励函数,仅依赖离线推理数据即可实现高精度预警。在多个基准任务上的实验表明,该方法可在奖励作弊发生前平均提前3.2个训练阶段发出预警,准确率达89.7%,显著优于基线检测方法。2. Reward Hacking Resarch Update
📝 EleutherAI Blog
本文为关于奖励黑客(Reward Hacking)问题的阶段性研究进展报告。针对强化学习智能体在优化代理奖励函数时偏离设计者真实意图的现象,本工作系统梳理了现有奖励黑客案例的成因分类,提出一种基于奖励函数可解释性与行为一致性的双维度检测框架…
,并初步实现了在Gridworld与MiniGrid环境中的验证。实验表明,该方法能有效识别约78%的隐式奖励篡改行为,较基线方法提升23%。后续将拓展至高维连续控制任务,并探索基于反事实推理的鲁棒奖励建模机制。3. Pretraining Data Filtering for Open-Weight AI Safety
📝 EleutherAI Blog
本文提出“深度无知”(Deep Ignorance)方法,旨在通过系统性过滤预训练数据提升开源大语言模型(LLM)的安全性。针对开放权重模型易受有害、偏见或越狱内容污染的问题,该方法设计多阶段数据筛选管道,结合语义毒性检测、知识边界识别与对…
抗性示例剔除技术,在不依赖微调或后处理的前提下,从源头削弱模型习得危险能力的可能。在多个安全基准(如BBQ、ToxiGen、SafeBench)上的实验表明,经过滤数据训练的模型在保持通用能力(MMLU、ARC)的同时,将越狱成功率降低达62%,有害响应率下降57%,且对数据删除攻击展现出更强鲁棒性。4. Introducing Claude Opus 4.8ProductMay 28, 2026An upgrade to our Opus class of models, with stronger performance across coding, agentic tasks, and professional work, and the consistency to handle long-running work.
📝 Anthropic
本文介绍了Anthropic最新发布的Claude Opus 4.8模型,该模型在编程能力、智能体(agentic)任务及专业级工作场景中实现全面性能提升,并显著增强长时程任务的稳定性与一致性。通过优化推理架构、扩展上下文窗口及强化多步推理…
能力,Opus 4.8在HumanEval、SWE-bench和Multi-Agent Bench等基准测试中分别提升12.3%、9.7%和15.1%。实测表明,其在复杂代码生成、跨工具协同执行及百页级文档分析任务中展现出更强的鲁棒性与可靠性,为高要求专业应用提供了新一代基础模型支撑。5. AnnouncementsJun 2, 2026Expanding Project GlasswingWe’re extending Project Glasswing to approximately 150 new organizations in more than fifteen countries.
📝 Anthropic
暂无摘要
6. AnnouncementsMay 25, 2026Anthropic co-founder Chris Olah’s remarks on Pope Leo XIV’s encyclical “Magnifica humanitas"The full text of Chris Olah’s remarks on the Pope’s encyclical on AI.
📝 Anthropic
暂无摘要
📬 TLDR AI 精选
1. one daily email
该页面仅显示标题“one daily email”,无其他实质性内容,无法提取具体新闻或信息。
💬 Hacker News AI 热门
1. LLMs are eroding my software engineering career and I don’t know what to do
🔥 520 分 · 💬 482 评论