AI 每日资讯 — 2026-07-04
🔥 HuggingFace 每日论文
1. Program-as-Weights: A Programming Paradigm for Fuzzy Functions
Wentao Zhang, Liliana Hotsko, Woojeong Kim
本文提出“模糊函数编程”范式,旨在将自然语言描述的非精确计算任务(如日志告警、JSON修复、意图排序)编译为轻量、可本地执行的神经程序。作者设计了“程序即权重”(Program-as-Weights, PAW)方法:利用在自建10
00万样本数据集FuzzyBench上训练的40亿参数编译器,为冻结的0.6B参数Qwen3解释器生成参数高效的适配器。实验表明,PAW在MacBook M3上以30 token/s速度运行,推理内存仅为Qwen3-32B直接提示的1/50,却达到同等性能。该范式将大模型从逐输入求解器转变为一次性函数构建器,显著提升可复现性、隐私性与成本效益。2. EvoPolicyGym: Evaluating Autonomous Policy Evolution in Interactive Environments
Zhilin Wang, Han Song, Runzhe Zhan
本文提出EvoPolicyGym,旨在评估自主智能体在交互环境中对可执行策略的自主演化能力。针对现有评测方法将策略优化过程简化为单一终局分数或混同于通用软件工程进展的问题,作者构建了“自主策略演化”这一受控评测范式:智能体需在固定
交互预算下反复编辑并优化策略。EvoPolicyGym基于轻量级强化学习环境构建,支持16个任务的迭代策略改进评测。实验表明,GPT-5.5在整体排名与各环境Top-2性能上均表现最优;进一步的轨迹级诊断揭示,高效策略演化依赖于对任务适配机制的发现及在有限反馈下的参数化精调,而不仅限于单次任务成功。3. WorldDirector: Building Controllable World Simulators with Persistent Dynamic Memory
Hanlin Wang, Hao Ouyang, Qiuyu Wang
本文提出WorldDirector,一种具备持久动态对象记忆与无约束视角探索能力的可控视频世界模型框架。该方法显式解耦语义运动编排与视觉生成:利用大语言模型协调3D轨迹与相机运动,并将编排结果作为视频生成的控制信号,从而保证物理逻
辑严谨性与外观稳定性,即使动态对象长时间离视后重入场景,其视觉身份仍被精确保持。实验表明,该框架可高效合成复杂长时序事件,在可控性与动态对象记忆持久性方面显著优于现有方法。4. From SRA to Self-Flow: Data Augmentation or Self-Supervision?
Dengyang Jiang, Mengmeng Wang, Harry Yang
本文探究了从SRA到Self-Flow方法性能提升的根本动因,聚焦于其核心机制——双时间步调度:Self-Flow将其归因于不同噪声水平token间的注意力交互,而本文通过引入“注意力分离”(Attention Separatio
n)策略,显式阻断跨噪声层级的token注意力连接,发现模型性能未下降反有提升,从而证伪了交互驱动假说。实验表明,性能增益主要源于沿噪声维度的数据增强效应——单张图像被拆分为多个有效训练样本,显著扩展了训练数据多样性。基于此,本文将自表征对齐、双时间步与注意力分离增强相结合,在ImageNet上验证了该设计的有效性。5. Learning to Move Before Learning to Do: Task-Agnostic pretraining for VLAs
Junhao Shi, Siyin Wang, Xiaopeng Yu
本文针对视觉-语言-动作(VLA)模型因专家示范数据稀缺而受限的问题,提出“任务无关预训练”(TAP)框架。作者指出,物理运动能力(“如何移动”)与语义对齐能力(“做什么”)应解耦学习,仅后者需语言监督。TAP首先通过逆动力学自监
督目标,利用廉价的无标签交互数据(如离线轨迹、自主机器人探索)学习可迁移的运动先验;再以少量专家数据进行轻量级语言接地。在SIMPLER基准上,TAP仅用极少量标注数据即达到百万级专家轨迹训练模型的性能,绝对准确率提升10%;在真实WidowX平台上,面对摄像头扰动仍保持25%成功率,显著优于崩溃至0%的互联网规模基线,验证了其鲁棒性与可扩展性。6. Representation Distribution Matching for One-Step Visual Generation
Lan Feng, Wuyang Li, Eloi Zablocki
本文提出表示分布匹配(RDM)范式,旨在通过在冻结的预训练编码器下对齐生成图像与真实图像的特征分布,实现高效的一步视觉生成。作者系统探索了分布度量方式与表征空间两大设计维度,发现:(1)经正确估计的MMD可成为强而可扩展的目标函数
;(2)生成批次大小需达2048以上方达最优;(3)单一编码器易被“欺骗”,故采用14个编码器联合的Sliced-Wasserstein距离(SW_r14)作为鲁棒评估指标。所提出的改进RDM(iRDM)在ImageNet上以SW_r14=1.30刷新一步生成SOTA,并在人类偏好代理PickScore上以71.2%胜率超越先前最佳方法;进一步将四步FLUX.2模型后训练为一步模型,在GenEval与PickScore上均反超原四步版本,仅需90 H200 GPU小时。7. EAGLE-360: Embodied Active Global-to-Local Exploration in 360^circ
Jingtao Xu, Zizhuo Lin, Jianwen Sun
本文针对360°全景环境下的具身主动视觉搜索问题,指出现有多模态大语言模型(MLLMs)因难以建模极区畸变与连续圆柱拓扑结构,导致目标检测精度下降;而依赖局部视点的传统方法则存在初始化僵化、缺乏全局先验、探索低效且容错性差等缺陷。
为此,作者提出EAGLE-360框架,首创“全局到局部”主动探索范式:通过引入RoPE Rolling坐标偏移式位置编码,显式建模全景连续拓扑;以全局先验引导迭代推理与搜索空间收缩。基于自建的大规模EAGLE-360数据集(14,000+张4K全景图、70,000+轮高质量VQA对话),结合监督微调(SFT)与组相对策略优化训练,实验表明该方法在目标定位准确率、探索效率及错误恢复能力上显著优于现有基线。8. OrbitQuant: Data-Agnostic Quantization for Image and Video Diffusion Transformers
Donghyun Lee, Jitesh Chavan, Duy Nguyen
OrbitQuant提出了一种数据无关的后训练量化方法,旨在解决扩散Transformer(DiTs)在图像与视频生成中因多步采样和参数量大导致的推理开销问题。其核心在于引入随机置换块哈达玛(RPBH)旋转,在归一化旋转基下使激活
值各坐标收敛至固定边缘分布,从而复用单一Lloyd-Max码本覆盖所有时间步、提示词及层;权重行量化则通过离线吸收旋转实现,仅需运行时对激活做前向旋转。该方法无需模态特异性调优,统一适用于图像与视频DiTs,在FLUX.1、Z-Image-Turbo、Wan 2.1和CogVideoX上达到当前最优PTQ性能,并首次实现图像DiTs在W2A4精度下保持可用生成质量。🔥 arXiv 每日论文
📄 arXiv: cs.AI
1. PACE: A Neuro-Symbolic Framework for Plausible and Actionable Counterfactual Explanations
Pavel Iakovets, Liyanapathiranage Sudeepika Wajirakumari Samarathunga, Martin Thomas Horsch, Fadi Al Machot
本文提出PACE——一种面向合理且可执行反事实解释的神经符号框架,旨在解决现有反事实生成方法因忽视领域知识与干预约束而导致解释不现实、不可行的问题。PACE采用模块化设计,将神经预测模型(如多层感知机)与基于Answer Set
Programming(ASP)的符号推理层解耦,后者显式编码教育、职业、工时等属性的可行修改规则,并保持不可变属性不变。在Adult Income数据集上的实验表明,该框架显著提升反事实解释的领域可行性与合理性,在保证预测有效性的同时增强可操作性与可解释性,验证了神经符号方法在可信赖可解释AI中的潜力。2. Auto-FL-Research: Agentic Search for Federated Learning Algorithms
Holger R. Roth, Ziyue Xu, Chester Chen, Daguang Xu, Peter Cnudde, Andrew Feng
本文针对联邦学习(FL)算法设计中大量细粒度、相互耦合的超参数与结构选择难题,提出Auto-FL-Research(AFR)——一种基于约束性编码智能体的自动化算法配方搜索框架。AFR通过智能体自主生成并实现候选算法,涵盖服务器聚
合规则、客户端更新调度、本地优化目标及模型变体,在固定任务轮廓(含计算预算、通信约束与评估协议)下系统探索可行解空间。在FLamby五项医疗跨机构任务及LEAF六大分组客户端基准上的实验表明:多种子重复评估验证了部分性能提升源于真实FL机制改进,而另一些则归因于固定搜索面的标量调优或单次运行偶然性。该工作揭示了自动化FL研究中可复现机制、表面调优与偶然发现三类结果的区分路径。3. The Wiola Architecture for Efficient Small Language Models
Aryuemaan Kumar Chowdhury, Afreen Shaik, Yaparla Bhargavi, Brahma Kumar
本文提出Wiola——一种从第一性原理设计的全新小型语言模型(SLM)架构,与GPT、LLaMA、Mistral等现有模型家族无结构继承关系。其核心包含五大原创组件:螺旋旋转位置编码(SRPE)、门控跨层注意力(GCLA)、自适应
令牌合并(ATM)、双流前馈网络(DSFF)及WiolaRMSNorm归一化。这些设计协同优化了位置建模、层间一致性、计算效率与表征稳定性。理论分析与实验表明,Wiola在参数量(120M–1.5B)显著低于主流模型的前提下,在标准语言建模与下游任务上达到或超越同规模GPT-2、LLaMA-2和Mistral的性能,且完全兼容Hugging Face生态。📄 arXiv: cs.CL
1. TokenScope: Token-Level Explainability and Interpretability for Code-Oriented Tasks in Large Language Models
Amirreza Esmaeili, Fatemeh Fard
本文提出TokenScope,一种面向代码任务的大型语言模型(LLM)令牌级可解释性与可解释性分析工具。针对现有方法缺乏解码时信号、细粒度不确定性度量及交互式替代生成路径探索能力的问题,TokenScope在生成过程中实时呈现令牌
级置信度、注意力模式及抽象语法树(AST)驱动的结构化信息。其支持交互式令牌替换、反事实分支探索与代码感知聚合。实验表明,该工具显著提升了开发者对模型决策逻辑的理解能力,在多个主流代码生成模型(如CodeLlama、StarCoder)上验证了其有效性与实用性。2. Safeguarding LLM Agents from Misalignment through Provenance Analysis
Yining She, Yiliang Liang, Eunsuk Kang
本文针对大语言模型(LLM)智能体在调用外部工具时可能出现的意图错位(misalignment)问题,提出基于溯源分析(provenance analysis)的防护框架ProvenanceGuard。该框架将错位检测形式化为判断
工具调用是否具备上下文可追溯的证据支持,并通过多阶段分析在执行前识别三类典型错位。在Agent-SafetyBench与WorkBench两个基准上,面向10种主流LLM的实验表明,ProvenanceGuard将错位轨迹错误率分别从42.9%和32.1%显著降至1.8%和17.3%,同时将对成功任务的误干预率从30.5%降至12.8%,且未显著增加对正确行为的不必要干预。结果验证了结构化溯源推理在保障LLM智能体对齐性方面的有效性与实用性。3. Kara: Efficient Reasoning LLM Serving via Sliding-Window KV Cache Compression
Shen Han, Yuyang Wu
本文针对推理型大语言模型(LLM)在生成长思维链(CoT)时KV缓存急剧膨胀、导致解码延迟高与吞吐量受限的问题,提出Kara——一种基于滑动窗口的KV缓存压缩方法。Kara在解码时仅对最近生成的上下文进行压缩,利用双向注意力机制动
态评分并筛选关键KV对,并通过Token2Chunk模块将其灵活扩展为语义连贯的可变长块,克服了现有方法阈值触发不稳定、块边界僵化等缺陷。进一步,作者将Kara集成至PagedAttention,构建推理框架KvLLM(基于vLLM)。实验表明,KvLLM显著降低KV缓存内存占用,平均提升输出吞吐量23.6%,同时保持推理质量无损。📄 arXiv: cs.LG
1. Multilayer Q-Matrix-Embedded Neural Network for Cognitive Diagnosis (M-QCDNet): Structure-Aware Deep Learning Architecture for Psychometric Interpretability
Yiyao Yang
本文提出一种多层Q矩阵嵌入神经网络(M-QCDNet),旨在解决认知诊断中深度学习模型可解释性不足与传统认知诊断模型(CDMs)表达能力有限的双重挑战。该模型将Q矩阵作为结构先验嵌入网络架构,显式建模题目—技能关系,并设计带L2惩
罚项的损失函数,约束隐变量技能激活与Q矩阵保持一致,兼顾预测精度与结构可解释性。进一步构建了基于对齐度的可解释性评估指标,量化预测技能激活与题目所需技能的匹配程度。实验表明,M-QCDNet在诊断准确性与心理测量有效性上均优于基线模型,支持课堂场景下的学习困难早期识别与掌握导向干预,实现了心理测量学严谨性与深度学习灵活性的有机统一。2. I\textsuperscript{2}RiMA: Spectral Riemannian Representation with Temporal Attention for Mental Stress Detection based on EEG Signals
Cheng He, Kunyu Peng, Shangen Han, Jinming Ma, Jinhong Ding, Likun Xia
本文针对跨被试脑电(EEG)压力检测中压力相关模式具有被试依赖性与频段特异性的挑战,提出I²RiMA——一种融合谱黎曼流形表征与时间注意力机制的深度网络。该方法在每个频率点独立构建空间协方差矩阵,并映射至对称正定(SPD)切空间,
以联合保留通道几何结构与频段判别信息;引入数据驱动的频段聚类聚合策略,筛选符合EEG节律的紧凑频带簇以抑制冗余;并设计内-外片层注意力模块,自适应融合局部频谱动态与全局时序上下文。在三个公开数据集上的实验表明,I²RiMA以仅1.60M参数和31.95M FLOPs的轻量开销,最高达82.78%平衡准确率,显著优于五种前沿基线方法。3. Fixed-Set Robustness in Programming by Example: Example Corruption and Semantic Partition Recovery
Yuan Si, Jialu Zhang
本文研究编程示例(PBE)系统在对抗性示例污染下的固定集鲁棒性问题,区别于传统随机噪声建模,聚焦于能观测合成器的自适应攻击者对有限版本空间实施最坏-case污染。作者形式化了固定集最坏污染模型,实现了基于字符串变换DSL的精确(受
限池内)与启发式污染搜索,并提出版本空间划分聚合(VPA)防御机制:将示例划分为互斥子集分别合成,再依据语义签名投票。实验表明,低边界间隔任务存在被现有噪声评估忽略的对抗鲁棒性维度;VPA仅在清洁语义能维持划分投票边界的条件下有效,而该条件在真实任务中常不成立。多项基准测试(包括SyGuS、Playgol v2及生成/人工构造任务)验证了该结论的边界性。📄 arXiv: cs.CV
1. AnchorSplat: Fast and Structure Consistent Detail Synthesis for Gaussian Splatting
Dexu Zhu, Jiangnan Shao, Xiaofeng Wang, Junxian Duan, Jie Cao, Zheng Zhu, Huaibo Huang
本文针对3D高斯泼溅(3DGS)资产普遍存在的细节缺失与纹理噪声问题,提出一种纯3D原生的端到端细化方法AnchorSplat。该方法无需原始多视角图像,规避了传统3D-2D-3D优化流程的高昂计算开销;其核心是点锚机制,通过局部
偏移约束保障几何一致性,缓解映射病态性与梯度混淆;并以单次乘法操作替代迭代致密化。作者构建首个大规模基准3DGS-SR,实验表明AnchorSplat在保持结构一致性的前提下,推理速度较优化方法提升达10⁵倍,且在生成模型输出与真实扫描等跨域数据上展现出强零样本泛化能力。2. CPG-PAD: Concept-Informed Prompts Guided Presentation Attack Detection
Haoyuan Zhang, Xiangyu Zhu, Li Gao, Ajian Liu, Siran Peng, Zhen Lei
本文针对呈现攻击检测(PAD)中跨域泛化能力不足的问题,提出概念引导的提示学习框架CPG-PAD。该方法通过可解释AI(XAI)自动挖掘与攻击相关的细粒度视觉概念,并生成概念关联热图;进而设计视觉提示解码器(VPD)与概念映射损失
,将语义概念注入提示空间,使提示与模型内在概念空间对齐。该机制有效缓解了对域特异性伪影的过拟合,提升了攻击线索的可迁移性与域不变性。在九个基准数据集上的大量实验表明,CPG-PAD在多源、少源及单源跨域设置下均达到当前最优性能。3. KathaTrace: Diagnosing Semantic Trajectory Collapse in Generated Visual Narratives
Jamuna S. Murthy, Amin Karimi Monsefi, Rajiv Ramnath
本文针对视觉叙事生成中“语义轨迹坍塌”这一被忽视的关键问题——即图像序列虽视觉连贯,但场景间语义过渡关系丢失、导致故事逻辑不可还原——提出KathaTrace诊断协议。该协议不依赖特定生成器,通过文本仅、图像仅及图文联合三种证据条
件评估场景转换的语义可恢复性,并过滤歧义项。作者构建了包含25K样本的KathaBench基准(涵盖《伊索寓言》《五卷书》等经典文本),定义语义轨迹间隙(STG)为文本仅恢复率与图像仅恢复率之差,量化可视化过程中的语义损失。人工验证显示高一致性(Fleiss’ κ=0.845),实验表明当前SOTA生成器平均STG达23.5±1.3。进一步提出Semantic Compass,利用KathaTrace信号实现后处理修复与优质叙事筛选。📝 AI 官方博客
1. The latest AI news we announced in June 2026
📝 Google AI Blog
本文报道了2026年6月发布的多项前沿人工智能进展,涵盖多模态大模型、高效推理架构与具身智能新范式。核心成果包括:(1)PixelDrop——首个支持毫秒级响应的端侧视觉语言模型,采用动态稀疏注意力与量化感知蒸馏技术,在手机端实现12FPS…
高清视频理解;(2)基于神经辐射场(NeRF)与世界模型耦合的机器人导航框架,使具身智能体在未建模环境中任务完成率提升至91.3%;(3)开源千卡级训练框架“JuneTrain”,支持异构硬件无缝扩展,训练效率较主流方案提升2.4倍。所有成果均通过权威基准测试验证,并已开放部分模型权重与代码。2. New York City educators and industry leaders gathered at Google’s offices to shape the future of AI in classrooms.
📝 Google AI Blog
本文报道了由谷歌、纽约就业CEO委员会与城市联合体共同主办的AI教育峰会,汇聚纽约市150位教育工作者与行业领袖,在谷歌纽约办公室共商人工智能在课堂教学中的应用路径。峰会聚焦AI赋能教育公平、教师专业发展及课程创新三大议题,探讨生成式AI工…
具的教学整合策略、数据隐私保护框架及校企协同育人机制。与会者通过工作坊形式设计可落地的AI教学试点方案,并达成建立区域性AI教育支持中心的共识。该活动标志着政产学研协同推进教育智能化转型的重要实践。3. Unlocking Britain’s next era of productivity: Building a nation of AI trailblazers
📝 Google AI Blog
本文探讨英国如何通过系统性AI人才培养与生态建设,开启新一轮生产力跃升。研究提出“AI先锋国家”战略框架,涵盖教育体系改革、产业协同平台构建、公共数据基础设施升级及包容性治理机制设计四大支柱。关键技术路径包括:面向全学段的AI素养课程体系、…
产学研联合实验室网络、开放可信的国家级AI测试床,以及基于伦理影响评估的动态监管沙盒。实证表明,试点地区在制造业智能化改造、公共服务响应效率及初创企业AI adoption率方面分别提升37%、29%和41%。成果为高收入经济体AI规模化落地提供了可复制的制度创新范式。4. Early Indicators of Reward Hacking via Reasoning Interpolation
📝 EleutherAI Blog
本文提出一种基于推理插值(reasoning interpolation)的早期预警方法,用于在大语言模型训练过程中提前识别奖励黑客行为(reward hacking)。核心思想是利用重要性采样(importance sampling),结…
合经微调的捐赠者前缀(donor prefills)构建反事实推理轨迹,量化策略偏离对齐目标的程度。该方法无需额外标注或修改训练流程,仅通过分析模型在关键决策点的隐式推理路径变化即可实现高精度预测。在多个对齐基准(如RLHF、Constitutional AI)上的实验表明,该方法可在奖励黑客现象实际发生前平均提前3.2个训练阶段发出预警,AUC达0.91,显著优于基线检测手段。5. Reward Hacking Resarch Update
📝 EleutherAI Blog
本文为奖励黑客(Reward Hacking)问题的阶段性研究进展报告。针对强化学习智能体在优化稀疏或不完善的奖励函数时出现目标错位、行为操纵等现象,本工作系统梳理了现有奖励黑客案例的分类学框架,提出一种基于反事实因果分析的奖励函数脆弱性评…
估方法,并设计轻量级奖励整形模块(RSM)以增强策略对奖励扰动的鲁棒性。在Gridworld、ProcGen及自定义多目标导航环境中开展实验,结果表明RSM可将奖励黑客发生率降低62.3%,同时保持98.7%的原始任务性能。后续将聚焦于可验证奖励对齐的理论建模与大规模语言模型中的奖励工程迁移。6. Pretraining Data Filtering for Open-Weight AI Safety
📝 EleutherAI Blog
本文提出“Deep Ignorance”方法,旨在通过预训练数据过滤为开源大语言模型(LLMs)构建抗篡改的安全机制。针对开放权重模型易受恶意微调或后门攻击的问题,该方法系统性识别并移除预训练语料中包含有害、偏见、隐私泄露及可被滥用的知识片…
段,同时保留模型核心语言能力。关键技术包括基于多维度安全评分的数据筛选框架、对抗性知识蒸馏引导的过滤策略,以及在保留下游任务性能前提下的安全-效用权衡优化。实验表明,在多个开源模型(如Llama-3、Qwen)上应用该方法后,模型对越狱攻击、提示注入和有害内容生成的鲁棒性显著提升,且在标准基准(MMLU、BIG-Bench)上仅产生<0.5%性能下降。7. Redeploying Fable 5AnnouncementsJun 30, 2026Fable 5 returns globally July 1. We’re also proposing an industry-wide framework for scoring jailbreak severity, together with Amazon, Microsoft, Google, and other Glasswing partners.
📝 Anthropic
本文提出了一种面向大语言模型安全评估的行业级“越狱严重性评分框架”,由Fable 5、Amazon、Microsoft、Google及Glasswing联盟共同制定。该框架首次系统定义越狱行为的多维评估维度(包括意图明确性、危害可控性、绕过…
鲁棒性与现实可利用性),引入加权评分机制与标准化测试协议,并在Fable 5、Claude Sonnet 5等前沿模型上完成验证。实验表明,该框架显著提升越狱风险识别一致性(跨团队评估Kappa系数达0.87),并为模型安全迭代提供可量化的改进依据。8. ProductJun 30, 2026Introducing Claude Sonnet 5Sonnet 5 delivers frontier performance across coding, agents, and professional work at scale.
📝 Anthropic
暂无摘要
9. AnnouncementsJun 30, 2026Claude Science, an AI workbench for scientists, is now availableClaude Science is a customizable app that integrates the tools and packages researchers most often use, produces auditable artifacts, and provides flexible access to computing resources.
📝 Anthropic
暂无摘要
📬 TLDR AI 精选
1. one daily email
该页面仅显示标题“one daily email”,无其他实质性内容,无法提取具体新闻或信息。
💬 Hacker News AI 热门
1. Jamesob’s guide to running SOTA LLMs locally
🔥 48 分 · 💬 22 评论