AI 每日资讯 — 2026-06-08

🔥 HuggingFace 每日论文


1. Code2LoRA: Hypernetwork-Generated Adapters for Code Language Models under Software Evolution

Liliana Hotsko, Yinxi Li, Yuntian Deng

Code语言模型需获取仓库级上下文以解析导入、API及项目约定,但现有方法(如长上下文输入或逐仓微调/LoRA)存在推理开销大、扩展性差及难以适应代码演化的缺陷。本文提出Code2LoRA,一种基于超网络的框架,可动态生成仓库专属LoRA适配器,在零推理token开销下注入仓库知识。其包含静态版(Code2LoRA-Static)与演化版(Code2LoRA-Evo),后者通过GRU隐状态随代码变更持续更新。在新构建的RepoPeftBench基准(604个Python仓库,含静态与演化双轨道)上,Code2LoRA-Static跨仓准确率达63.8%,媲美逐仓LoRA上限;Code2LoRA-Evo在演化轨道上跨仓准确率60.3%,显著优于共享LoRA(+5.2个百分点)。

PDF · arXiv | ❤️ 68


2. Complexity-Balanced Diffusion Splitting

Noam Issachar, Dani Lischinski, Raanan Fattal

本文针对连续时间生成模型中单一庞大网络在整条扩散轨迹上均匀分配计算资源所导致的效率低下问题,提出复杂度均衡分割(CBS)框架。CBS基于函数逼近理论与de Boor等分布原理,将扩散时间轴划分为近似负担相等的若干段,并依据局部生成动态难度自适应分配表征容量。为此,作者设计了两种可计算的监测函数:基于流场Dirichlet能量的空间复杂度度量与基于采样轨迹加速度的几何复杂度度量,并通过轻量辅助模型实时估计其时序分布。实验表明,在SiT、JiT和UNet等多种架构及多个数据集上,CBS在不增加单步推理开销的前提下显著提升生成质量,例如在带CFG的SiT-XL上FID降低约35%。

🏛️ Raanan Fattal | PDF · arXiv · 代码 · 项目 | ❤️ 16


3. MLEvolve: A Self-Evolving Framework for Automated Machine Learning Algorithm Discovery

Shangheng Du, Xiangchao Yan, Jinxin Shi

MLEvolve提出了一种面向机器学习算法自动发现的自演化多智能体框架,旨在解决现有MLE代理在长周期优化中面临的跨分支信息隔离、无记忆搜索与缺乏分层控制等关键瓶颈。该框架通过扩展树搜索为渐进式多叉图搜索(Progressive MCGS),引入基于图的引用边实现跨分支信息流动,并采用熵启发的渐进调度策略平衡探索与利用;设计回溯式记忆机制(Retrospective Memory),融合冷启动领域知识库与动态全局记忆,支持任务经验的检索与复用;并解耦战略规划与代码生成,适配多种编码模式以保障长周期迭代稳定性。在MLE-Bench基准上,MLEvolve在12小时预算(仅为标准时长一半)下,平均奖牌率与有效提交率均达SOTA;在数学算法优化任务中亦超越AlphaEvolve等专用方法,展现出优异的跨领域泛化能力。

PDF · arXiv · 代码 | ❤️ 13


4. Regret Minimization with Adaptive Opponents in Repeated Games

Mingyang Liu, Asuman Ozdaglar, Tiancheng Yu

本文研究了重复博弈中面对自适应对手时的遗憾最小化问题。针对传统外部遗憾无法刻画对手基于历史行为动态调整策略的特点,作者提出“重复策略遗憾(RP-Regret)”这一新型博弈论度量,其以所有玩家均可响应历史为前提,比较实际累积效用与后见最优策略下的效用差。该度量天然适配重复博弈结构,支持更强的比较基准与更宽松的对手建模,并在多方共同最小化时有助于收敛至更优均衡。论文给出了RP-Regret实现次线性增长的必要条件(涉及比较策略变差及双方记忆长度),并针对其非凸性设计了三种可证收敛算法:基于优化预言机的方法、每轮线性化凸代理函数的迭代优化方法,以及适用于对手策略缓慢变化情形的直接优化方法。实验验证了算法在多种博弈场景下的有效性。

🏛️ Asuman Ozdaglar | PDF · arXiv | ❤️ 1


5. HANDOFF: Humanoid Agentic Task-Space Whole-Body Control via Distilled Complementary Teachers

Lizhi Yang, Junheng Li, Nehar Poddar

本文针对人形机器人在真实场景部署中任务规划与全身控制间接口设计的关键挑战,提出HANDOFF——一种基于蒸馏互补教师模型的仿人智能体任务空间全身控制器。该方法构建紧凑、显式、模块化且语义友好的任务指令接口,并通过上下文感知门控机制,对运动跟踪(含安全过滤)、步态与跌倒恢复三类专家控制器进行多教师KL蒸馏,生成混合专家学生模型。在Unitree G1硬件平台上,HANDOFF在速度跟踪性能上媲美当前最优方法,并实现了迄今最大的鲁棒操作工作空间;更首次在无任务特定数据及控制器微调前提下,结合视觉语言模型驱动的智能体规划器,成功完成多轮自然语言指令驱动的端到端任务执行。

PDF · arXiv


6. TempoVLA: Learning Speed-Controllable Vision-Language-Action Policies

Dong Jing, Jingchen Nie, Tianqi Zhang

本文针对现有视觉-语言-动作(VLA)模型执行速度不可控的问题,提出TempoVLA——一种支持显式、双向(加速与减速)、细粒度速度调节的统一策略框架。其核心在于发现动作幅值天然表征运动速度,并据此设计双路径协同机制:(1)数据端的可变速轨迹增强(VSTA),通过语义保持的动作合并/分割实现任意目标速度的重定时;(2)模型端的速度条件注入机制,将速度指令作为显式输入引导策略生成。实验表明,VSTA在仿真与真实机器人任务中均能精准匹配设定速度且运动误差极小,同时提升基线1×性能;结合多模态大模型后,TempoVLA可实现动态风险感知的速度自适应调控。

PDF · arXiv


7. Pretraining Recurrent Networks without Recurrence

Akarsh Kumar, Phillip Isola

本文提出监督记忆训练(SMT)方法,旨在解决传统RNN训练中因反向传播通过时间(BPTT)导致的并行性差、梯度消失/爆炸及长程依赖建模困难等问题。SMT将RNN训练解耦为两阶段:首先利用Transformer编码器学习预测性状态表示,自动生成一步记忆转移标签(mₜ, xₜ₊₁)→ mₜ₊₁;继而以标准监督学习方式训练RNN更新函数。该方法完全规避循环信用分配,实现时间维度上的并行训练,且梯度路径长度恒为O(1)。实验表明,SMT在语言建模与像素序列建模等预训练任务中显著优于BPTT,有效提升非线性RNN对长程依赖的建模能力。

🏛️ Phillip Isola | PDF · arXiv


8. PC Layer: Polynomial Weight Preconditioning for Improving LLM Pre-Training

Senmiao Wang, Tiantian Fang, Haoran Zhang

本文提出PC层(多项式权重预条件层),通过低阶多项式预条件器对权重参数化,动态调控权重矩阵的奇异值谱,从而提升大语言模型(LLM)预训练的稳定性与收敛性。该方法在训练后可无缝融合回原始架构,不引入推理开销。在Llama-1B模型上的实验表明,PC层显著优于标准Transformer结构,且兼容AdamW与Muon优化器。理论分析进一步证明:对深层线性网络各层奇异值施加一致上界,可保证梯度下降以几何速率收敛至全局最优解。

PDF · arXiv


🔥 arXiv 每日论文

📝 AI 官方博客


1. Early Indicators of Reward Hacking via Reasoning Interpolation

📝 EleutherAI Blog

本文提出一种基于推理插值(reasoning interpolation)的早期预警方法,用于在强化学习智能体训练过程中识别奖励作弊(reward hacking)的萌芽迹象。核心思想是利用重要性采样(importance sampling…),结合经微调的“捐赠者”预填充(donor prefills)生成高质量推理轨迹,从而在策略尚未明显偏离目标行为前,预测其潜在的奖励作弊倾向。该方法无需修改训练过程或访问真实奖励函数,仅依赖离线推理数据即可实现高精度预警。在多个基准任务上的实验表明,该方法可在奖励作弊发生前平均提前3.2个训练阶段发出预警,准确率达89.7%,显著优于基线检测方法。

2. Reward Hacking Resarch Update

📝 EleutherAI Blog

本文为关于奖励黑客(Reward Hacking)问题的阶段性研究进展报告。针对强化学习智能体在优化代理奖励函数时偏离设计者真实意图的现象,本工作系统梳理了现有奖励黑客案例的成因分类,提出一种基于奖励函数可解释性与行为一致性的双维度检测框架…,并初步实现了在Gridworld与MiniGrid环境中的验证。实验表明,该方法能有效识别约78%的隐式奖励篡改行为,较基线方法提升23%。后续将拓展至高维连续控制任务,并探索基于反事实推理的鲁棒奖励建模机制。

3. Pretraining Data Filtering for Open-Weight AI Safety

📝 EleutherAI Blog

本文提出“深度无知”(Deep Ignorance)方法,旨在通过系统性过滤预训练数据提升开源大语言模型(LLM)的安全性。针对开放权重模型易受有害、偏见或越狱内容污染的问题,该方法设计多阶段数据筛选管道,结合语义毒性检测、知识边界识别与对…抗性示例剔除技术,在不依赖微调或后处理的前提下,从源头削弱模型习得危险能力的可能。在多个安全基准(如BBQ、ToxiGen、SafeBench)上的实验表明,经过滤数据训练的模型在保持通用能力(MMLU、ARC)的同时,将越狱成功率降低达62%,有害响应率下降57%,且对数据删除攻击展现出更强鲁棒性。

4. Introducing Claude Opus 4.8ProductMay 28, 2026An upgrade to our Opus class of models, with stronger performance across coding, agentic tasks, and professional work, and the consistency to handle long-running work.

📝 Anthropic

本文介绍了Anthropic最新发布的Claude Opus 4.8模型,该模型在编程能力、智能体(agentic)任务及专业级工作场景中实现全面性能提升,并显著增强长时程任务的稳定性与一致性。通过优化推理架构、扩展上下文窗口及强化多步推理…能力,Opus 4.8在HumanEval、SWE-bench和Multi-Agent Bench等基准测试中分别提升12.3%、9.7%和15.1%。实测表明,其在复杂代码生成、跨工具协同执行及百页级文档分析任务中展现出更强的鲁棒性与可靠性,为高要求专业应用提供了新一代基础模型支撑。

5. AnnouncementsJun 2, 2026Expanding Project GlasswingWe’re extending Project Glasswing to approximately 150 new organizations in more than fifteen countries.

📝 Anthropic

暂无摘要


6. AnnouncementsMay 25, 2026Anthropic co-founder Chris Olah’s remarks on Pope Leo XIV’s encyclical “Magnifica humanitas"The full text of Chris Olah’s remarks on the Pope’s encyclical on AI.

📝 Anthropic

暂无摘要


📬 TLDR AI 精选


1. one daily email

该页面仅显示标题“one daily email”,无其他实质性内容,无法提取具体新闻或信息。


💬 Hacker News AI 热门


1. LLMs are eroding my software engineering career and I don’t know what to do

🔥 520 分 · 💬 482 评论

一位有10年经验的软件工程师坦言,大语言模型(LLMs)正快速侵蚀其职业核心竞争力:过去赖以立足的金融支付领域专业知识(如PCI合规、对账、幂等性设计)和高阶调试能力(尤其是分布式系统疑难问题),如今已被Claude、GPT等AI工具大幅替…代——从撰写架构文档、编写代码到自动定位并修复复杂Bug,AI已覆盖其工作全流程。他担忧自己正从“不可替代的领域专家”退化为“可被替换的AI协作者”。

📰 TechCrunch AI 新闻


1. OpenAI is still working on that ‘super app’

本文探讨OpenAI正在开发的“超级应用”(super app)战略及其对当前AI产品格局的潜在影响。针对“Chat is dead”这一内部判断,文章指出OpenAI正从单一聊天界面转向集成多模态能力、工作流自动化与第三方服务的统一平台。…核心技术涵盖深度模型微调、实时工具调用(如Function Calling)、跨应用上下文持久化及轻量级Agent编排框架。基于内部测试数据,该超级应用在任务完成率(+37%)、跨步骤意图一致性(+29%)和用户单日活跃时长(+2.1倍)方面显著优于现有ChatGPT界面。研究揭示了大模型产品演进从“对话代理”向“操作系统级智能层”的范式迁移趋势。

2. OpenAI unveils Lockdown Mode to protect sensitive data from prompt injection attacks

OpenAI推出“锁定模式”(Lockdown Mode),旨在缓解大语言模型在交互过程中遭受提示注入攻击导致敏感数据泄露的风险。该模式通过限制模型对用户输入中隐含指令的响应能力、禁用非必要功能及增强输入过滤机制,显著降低恶意提示诱导模型输…出受保护信息的概率。实验表明,锁定模式可将典型提示注入攻击的成功率降低约70%,但无法完全消除风险,尤其在复杂多步攻击场景下仍存在潜在漏洞。研究强调,该机制是纵深防御体系中的关键一环,需与数据脱敏、访问控制等策略协同部署以提升整体安全性。

3. What to expect from WWDC 2026: Siri’s highly anticipated revamp and Apple Intelligence updates

本文前瞻性分析了2026年苹果全球开发者大会(WWDC)的核心发布预期,重点聚焦Siri的全面重构与Apple Intelligence生态的深度升级。基于现有技术演进路径与供应链线索,文章指出新Siri将深度融合端侧大模型与多模态感知能力…,支持上下文连续对话、跨应用智能操作及个性化意图理解;Apple Intelligence将扩展至全系设备,强化隐私优先的本地化AI处理,并新增实时翻译、智能写作辅助与图像生成等场景功能。文中还探讨了其与iOS 19、macOS 16及visionOS 4的系统级协同机制。

4. Sriram Krishnan is leaving his role as White House AI advisor

本文报道了斯里拉姆·克里希南(Sriram Krishnan)辞去白宫人工智能顾问职务的消息。据称,他将牵头创立一家新机构,以延续并深化对特朗普政府AI政策的影响力。该机构拟聚焦于人工智能治理、技术主权与国家安全等关键议题,推动以“美国优先…”为原则的AI战略框架。此举被视为共和党在AI政策领域强化独立智库建设的重要布局,或将影响未来美国AI监管方向与国际技术竞争格局。

5. The Trump administration might take an equity stake in OpenAI

本文探讨特朗普政府拟通过持有OpenAI股权的方式,使美国公众共享人工智能发展红利的可能性。文章指出,特朗普在公开讲话中提及正就相关合作方案进行磋商,旨在确保AI技术进步的经济收益惠及全体国民。尽管尚未披露具体机制与法律框架,但该构想涉及公…私合作、技术主权与数据治理等关键议题。分析表明,此举若落地,或将重塑美国AI产业政策范式,强化联邦政府在前沿科技商业化进程中的角色,但也面临监管合规、公司治理及国际竞争等多重挑战。