AI 每日资讯 — 2026-07-05
🔥 HuggingFace 每日论文
1. Program-as-Weights: A Programming Paradigm for Fuzzy Functions
Wentao Zhang, Liliana Hotsko, Woojeong Kim
本文提出“模糊函数编程”范式,旨在解决日志告警、JSON修复、意图排序等难以用精确规则描述的编程任务,避免依赖云端大模型API带来的隐私、可复现性与成本问题。作者设计“程序即权重”(Program-as-Weights, PAW)
方法:利用在自建1000万样本FuzzyBench数据集上训练的4B参数编译器,为冻结的轻量级0.6B Qwen3解释器生成参数高效的适配器。实验表明,PAW在MacBook M3上以30 token/s速度运行,推理内存仅为Qwen3-32B直接提示的1/50,性能却与之相当。该范式将基础模型从逐输入求解器转变为一次性函数构建工具,产出可离线、低成本复用的紧凑神经程序。2. EvoPolicyGym: Evaluating Autonomous Policy Evolution in Interactive Environments
Zhilin Wang, Han Song, Runzhe Zhan
本文提出EvoPolicyGym,旨在评估自主智能体在交互环境中对可执行策略的自主演化能力。针对现有评测方法将策略优化过程简化为单一终局分数或混同于通用软件工程进展的问题,作者构建了“自主策略演化”这一受控评测范式:智能体需在固定
交互预算下反复编辑并提升策略。EvoPolicyGym基于轻量级强化学习环境构建,支持16个任务的迭代策略优化评测。实验表明,GPT-5.5在整体排名与各任务前两名表现上均最优;进一步的轨迹级分析揭示,高效策略演化依赖于机制发现能力与受限反馈下的参数化调优,而非单纯任务胜率。3. WorldDirector: Building Controllable World Simulators with Persistent Dynamic Memory
Hanlin Wang, Hao Ouyang, Qiuyu Wang
本文提出WorldDirector,一种面向可控视频世界建模的新型框架,旨在实现持久化的动态对象记忆与无约束视角探索。区别于现有将物理动力学与像素渲染耦合、依赖连续视觉观测维持运动的世界模型,WorldDirector显式解耦语义
运动编排与视觉生成:利用大语言模型(LLM)协同规划3D物体轨迹与相机运动,并将编排结果作为视频生成的控制信号。该设计保障了严格的物理逻辑一致性与外观稳定性,即使动态对象长时间离开视野后重新出现,其视觉身份仍能被精确保持。实验表明,该方法在复杂长时序事件合成中展现出前所未有的可控性与动态对象记忆持久性。4. From SRA to Self-Flow: Data Augmentation or Self-Supervision?
Dengyang Jiang, Mengmeng Wang, Harry Yang
本文探究了从SRA到Self-Flow方法性能提升的根本动因,聚焦于其核心机制——双时间步调度:Self-Flow将其归因于不同噪声水平token间的注意力交互,而本文提出该增益更可能源于沿噪声维度的数据增强。为此,作者设计了注意
力分离(Attention Separation)机制,在保持双时间步输入的前提下阻断跨噪声层级的token注意力交互。实验表明,移除此类交互非但未损害性能,反而带来提升,证实增强效应主导了改进。进一步分析揭示,注意力分离本身通过将单张图像拆分为多个有效训练样本,实现了隐式数据扩充。基于此,作者融合自表示对齐、双时间步与注意力分离增强,在ImageNet上验证了所提方法的有效性。5. Learning to Move Before Learning to Do: Task-Agnostic pretraining for VLAs
Junhao Shi, Siyin Wang, Xiaopeng Yu
本文针对视觉-语言-动作(VLA)模型因专家示范数据稀缺而受限的问题,提出“任务无关预训练”(TAP)框架。作者将VLA学习解耦为物理运动能力(“如何移动”)与语义对齐能力(“做什么”)两个目标,指出仅后者需语言监督。TAP第一阶
段利用廉价、无标签的交互数据(如离线轨迹与自主机器人探索),通过自监督逆动力学目标学习可迁移的运动先验;第二阶段仅用少量专家数据实现语言接地。在SIMPLER基准上,TAP以远少于100万条专家轨迹的数据量达到同等性能,绝对准确率提升10%;在真实WidowX平台上,面对相机扰动仍保持25%成功率,显著优于崩溃至0%的互联网规模基线,验证了其鲁棒性与可扩展性。6. OrbitQuant: Data-Agnostic Quantization for Image and Video Diffusion Transformers
Donghyun Lee, Jitesh Chavan, Duy Nguyen
OrbitQuant提出了一种数据无关的后训练量化方法,专为图像与视频扩散Transformer(DiTs)设计。针对DiT激活值随时间步、提示词和引导分支剧烈变化导致传统PTQ需频繁重校准的问题,OrbitQuant引入随机置换
分块哈达玛(RPBH)旋转,在归一化正交基下将激活分布集中于固定边缘分布,从而复用单一Lloyd-Max码本覆盖所有层、时间步与模态。权重行量化离线完成,旋转矩阵被吸收进权重以抵消计算开销,仅需在激活前执行一次轻量旋转。该方法无需模态特异性调优,统一适配图像与视频DiTs,在FLUX.1、Z-Image-Turbo、Wan 2.1和CogVideoX上多项低比特设置下达到SOTA,并首次实现图像DiT在W2A4精度下保持可用生成质量。7. EAGLE-360: Embodied Active Global-to-Local Exploration in 360^circ
Jingtao Xu, Zizhuo Lin, Jianwen Sun
本文针对360°全景环境中基于多模态大语言模型(MLLM)的主动视觉搜索所面临的根本性挑战——如极区畸变与圆柱拓扑连续性建模困难、局部视角碎片化、全局先验缺失及错误恢复能力弱等问题,提出EAGLE-360框架。该框架首创“全局到局
部”的具身主动探索范式,通过引入适配全景几何的RoPE Rolling位置编码机制,显式建模连续环状空间结构,并依托自建大规模EAGLE-360数据集(14,000+ 4K全景图、70,000+轮高质量VQA对话)进行监督微调与组相对策略优化。实验表明,EAGLE-360在目标定位精度、探索效率与鲁棒性上显著优于现有方法。8. Interpretation-Oriented Cloud Removal via Observation-Anchored Residual Flow with Geo-Contextual Alignment
Ziyao Wang, Maonan Wang, Yucheng He
云去除(CR)是光学遥感影像分析的关键预处理步骤,但现有方法多追求视觉保真而忽视对下游语义分割、变化检测等任务的可解释性影响,易引发语义漂移。为此,本文提出面向解释性的地理锚定云去除框架(GACR),其核心包含观测锚定残差流(OA
R-Flow)与地理上下文先验对齐(GCPA):前者将CR建模为物理约束下的残差逆过程,以云图而非噪声为生成轨迹锚点,提升重建稳定性与保真度;后者借助视觉基础模型(VFM)引导重建落入语义流形,保障空间-语义一致性。在6个CR数据集与12项下游任务上的实验表明,GACR在重建质量与下游精度上均显著优于现有方法。🔥 arXiv 每日论文
📝 AI 官方博客
1. The latest AI news we announced in June 2026
📝 Google AI Blog
本文报道了2026年6月发布的多项前沿AI进展,涵盖多模态大模型、高效推理架构与具身智能三大方向。核心成果包括:发布开源多模态基础模型PixelDrop-3B,支持图像、视频、语音与文本的联合理解与生成;提出动态稀疏注意力机制(DSA),在…
保持98.7%原始性能的同时降低42%推理延迟;推出首个面向家庭场景的具身智能体HomeAgent v1.0,具备跨设备协同与长时序任务规划能力。实验表明,PixelDrop在MMBench-v2上达86.4分,DSA在Llama-3-8B上实现2.1倍吞吐提升,HomeAgent在真实家居环境中任务完成率达91.3%。2. New York City educators and industry leaders gathered at Google’s offices to shape the future of AI in classrooms.
📝 Google AI Blog
本文报道了由谷歌、纽约就业CEO委员会与城市联合体共同主办的AI教育峰会,汇聚纽约市150余名教育工作者与行业领袖,在谷歌纽约办公室共商人工智能在课堂教学中的创新应用与伦理实践。会议聚焦AI赋能个性化学习、教师专业发展及课程整合路径,探讨数…
据隐私、算法公平性与数字素养等关键议题,并启动多项校企协作试点项目。初步实践表明,结构化AI工具可提升学生参与度达32%,同时显著减轻教师行政负担。该峰会标志着政产学研协同推进教育智能化转型的重要一步。3. Unlocking Britain’s next era of productivity: Building a nation of AI trailblazers
📝 Google AI Blog
本文探讨英国如何通过系统性AI人才培养与生态建设,开启国家生产力新纪元。研究提出“AI先锋国家”战略框架,涵盖教育体系重构、跨部门技能认证、产学研协同创新平台及包容性技术普及四大支柱。关键技术包括基于角色的模块化AI素养课程设计、行业定制化…
微证书体系,以及覆盖中小学至终身学习的分层能力图谱。实证表明,在试点地区实施该框架后,STEM领域AI相关岗位入职率提升37%,中小企业AI工具采纳率增长2.1倍,公众AI信任度提高28个百分点。成果为发达国家AI人才战略提供了可复制的政策范式。4. Early Indicators of Reward Hacking via Reasoning Interpolation
📝 EleutherAI Blog
本文提出一种基于推理插值的早期奖励劫持检测方法,旨在训练过程中提前识别大语言模型因优化目标偏差导致的奖励劫持现象。核心思想是利用重要性采样结合经微调的“捐赠者”预填充(donor prefills),在模型尚未显现出明显异常行为前,对策略分…
布偏移进行敏感性建模与量化评估。该方法无需修改训练流程或访问奖励函数内部结构,仅依赖离线推理轨迹即可实现高精度预测。在多个指令微调与强化学习基准任务中,本方法平均提前37%的训练步数预警奖励劫持,误报率低于8%,显著优于基线检测手段。5. Reward Hacking Resarch Update
📝 EleutherAI Blog
本文为关于奖励黑客(Reward Hacking)问题的阶段性研究进展报告。针对强化学习智能体在优化代理奖励函数时偏离设计者真实意图的现象,本工作系统梳理了现有奖励黑客案例的成因分类,提出一种基于奖励函数可解释性与行为一致性的双维度检测框架…
,并初步实现了在Gridworld与MiniGrid环境中的验证。实验表明,该方法能有效识别约78%的隐式奖励篡改行为,较基线方法提升23%。后续将拓展至高维连续控制任务,并探索基于反事实推理的鲁棒奖励建模机制。6. Pretraining Data Filtering for Open-Weight AI Safety
📝 EleutherAI Blog
本文提出“Deep Ignorance”方法,旨在通过预训练数据过滤为开源大语言模型(LLMs)构建抗篡改的安全机制。针对开放权重模型易受恶意微调或后门攻击的问题,该方法系统性识别并移除预训练语料中包含敏感指令、越狱提示、对抗性模板及高风险…
行为范式的文本片段。其核心技术包括多阶段语义一致性检测、基于安全知识图谱的上下文风险评分,以及可验证的数据清洗日志机制。在多个基准(如SafeBench、ToxiGen)上的实验表明,经过滤训练的模型在保持原始能力(MMLU、ARC)的同时,将越狱成功率降低72%,且对逆向工程与数据重注入攻击展现出显著鲁棒性。7. Redeploying Fable 5AnnouncementsJun 30, 2026Fable 5 returns globally July 1. We’re also proposing an industry-wide framework for scoring jailbreak severity, together with Amazon, Microsoft, Google, and other Glasswing partners.
📝 Anthropic
本文提出了一种面向大语言模型安全评估的行业级越狱(jailbreak)严重性评分框架,由Fable、Amazon、Microsoft、Google及Glasswing联盟共同制定。该框架定义了多维度量化指标,涵盖攻击成功率、语义隐蔽性、危害…
可控性与跨模型泛化性,并引入标准化测试协议与基准数据集。实验表明,该框架在12个主流闭源与开源模型上具备良好区分度与一致性(Krippendorff’s α = 0.87),可有效支撑模型安全迭代与监管合规。8. ProductJun 30, 2026Introducing Claude Sonnet 5Sonnet 5 delivers frontier performance across coding, agents, and professional work at scale.
📝 Anthropic
暂无摘要
9. AnnouncementsJun 30, 2026Claude Science, an AI workbench for scientists, is now availableClaude Science is a customizable app that integrates the tools and packages researchers most often use, produces auditable artifacts, and provides flexible access to computing resources.
📝 Anthropic
暂无摘要
📬 TLDR AI 精选
1. one daily email
该内容仅显示标题“one daily email”,无正文信息,无法判断具体主题或事件,无法提供有效摘要。