AI 每日资讯 — 2026-05-23

🔥 HuggingFace 每日论文


1. Sensor2Sensor: Cross-Embodiment Sensor Conversion for Autonomous Driving

Jiahao Wang, Bo Sun, Yijing Bai

本文针对自动驾驶系统(ADS)训练与验证中高质量、多样化传感器数据稀缺的问题,提出Sensor2Sensor框架,实现从野外单目行车记录仪视频到高保真多模态自动驾驶日志(含多视角图像与LiDAR点云)的跨形态传感器转换。为解决无配对数据难题,该方法创新性地利用4D高斯溅射(4DGS)对真实AV日志进行4D重建与虚拟视角渲染,生成合成配对数据;进而基于扩散模型完成逆向生成式转换。实验表明,生成数据在几何一致性、语义保真度与物理合理性方面显著优于现有方法,并成功将互联网及真实dashcam视频转化为可用于ADS训练与测试的多模态格式,有效拓展了外部数据源的应用边界。

PDF · arXiv | ❤️ 20


2. Gated DeltaNet-2: Decoupling Erase and Write in Linear Attention

Ali Hatamizadeh, Yejin Choi, Jan Kautz

本文提出Gated DeltaNet-2,旨在解决线性注意力中压缩记忆编辑过程中的关键瓶颈:传统方法(如KDA和Gated DeltaNet)使用单一标量门控同时控制“擦除”与“写入”,易导致语义混淆。该模型引入解耦的通道级擦除门 $b_t$ 和写入门 $w_t$,实现对键空间遗忘与值空间更新的独立调控,并统一了KDA与Gated DeltaNet为特例。进一步,作者推导出融合通道衰减的块状WY快速权重更新算法及门控感知反向传播机制,兼顾训练并行性与推理效率。在1.3B参数规模、100B FineWeb-Edu数据上训练后,Gated DeltaNet-2在语言建模、常识推理与长程依赖任务上全面超越Mamba-2、Gated DeltaNet、KDA及Mamba-3变体。

🏛️ Yejin Choi | PDF · arXiv · 代码 | ❤️ 11


3. Diversed Model Discovery via Structured Table Discovery

Zhengyuan Dong, Renée J. Miller

本文针对现有模型搜索系统因依赖文本语义相似性而导致结果同质化、难以支持多样化模型比较的问题,提出StructuredSemanticSearch——一种以结构化表格为核心的模型发现框架。该框架基于ModelTables基准,融合语义匹配(保障任务对齐)与结构感知的表格发现(利用unionability、joinability及关键词搜索等操作),从模型卡片中精准检索高信息密度的结构化证据表;进一步通过朝向感知的表格集成技术,生成紧凑、可比的跨模型整合视图。在nugget级可审计评估协议下,实验表明其显著提升模型多样性与检索质量,优于纯文本基线方法。

🏛️ Renée J. Miller | PDF · arXiv · 代码 | ❤️ 4


4. DecQ: Detail-Condensing Queries for Enhanced Reconstruction and Generation in Representation Autoencoders

Tianhang Wang, Yitong Chen, Wei Song

本文针对表示自编码器(RAEs)中冻结视觉基础模型(VFM)导致的空间重建能力受限与微调破坏语义空间之间的固有矛盾,提出DecQ框架。DecQ引入轻量级细节压缩查询(detail-condensing queries),通过condenser模块从VFM中间层特征中提取细粒度信息,并将其与patch token联合建模,协同增强解码器的重建与生成能力。实验表明:在仅增加8个查询、计算开销仅3.9%的情况下,DecQ将基于DINOv2的冻结RAE的PSNR从19.13 dB提升至22.76 dB;在生成任务中,收敛速度达RAE的3.3倍,无引导FID为1.41,有引导FID低至1.05。

PDF · arXiv · 代码 | ❤️ 1


5. Cambrian-P: Pose-Grounded Video Understanding

Jihan Yang, Zifan Zhao, Xichen Pan

本文提出Cambrian-P,一种以相机位姿为根基的视频理解多模态大语言模型。针对现有视频多模态大模型将帧视为孤立2D图像、忽略场景空间一致性的缺陷,该模型引入可学习的逐帧相机标记与位姿回归头,将显式三维几何先验融入视频理解。通过精心设计的采样策略,在VSI-Bench等空间推理基准上提升4.5–6.5%,并在8个空间及通用视频问答基准上实现泛化;同时在ScanNet上达成流式位姿估计SOTA。值得注意的是,仅用野外视频生成的伪位姿标注训练,即可进一步提升通用视频问答性能,表明位姿信号对物理世界建模具有基础性作用。

PDF · arXiv


6. MotiMotion: Motion-Controlled Video Generation with Visual Reasoning

Lee Hsin-Ying, Hanwen Jiang, Yiqun Mei

MotiMotion提出了一种面向运动控制的视频生成新范式,旨在解决现有图像到视频模型机械遵循稀疏、不精确且因果不完备运动轨迹所导致的不自然结果问题。该框架将运动控制重构为“推理-生成”两阶段任务:首先利用无需训练的视觉语言模型(VLM)对主轨迹进行因果增强与次级运动补全;其次设计置信度感知的控制机制,动态调节运动引导强度,兼顾高置信轨迹的保真性与低置信输入下的生成鲁棒性。在新构建的交互驱动视频基准MotiBench上,MotiMotion在VLM自动评估与人工评测中均显著优于现有方法,生成视频展现出更合理的物体行为与物理交互。

PDF · arXiv


7. Understanding Data Temporality Impact on Large Language Models Pre-training

Pilchen Hippolyte, Fabre Romain, Signe Talla Franck

本文探究预训练数据时序性对大语言模型(LLM)时间敏感知识获取的影响。作者构建了包含7000余道时序感知问答题的基准测试集,并提出一套评估模型事实—时间关联能力的协议;进一步在按时间排序的Common Crawl快照上预训练6B参数模型,对比标准打乱顺序训练范式。实验表明,时序预训练模型在保持通用语言理解与常识能力的同时,显著提升事实新鲜度与时序精确性,而打乱训练则更倾向于记忆早期、高频重复的事实。研究成果为LLM持续学习提供了新视角,并开源代码、检查点及数据集。

PDF · arXiv


8. Uniform Diffusion Models Revisited: Leave-One-Out Denoiser and Absorbing State Reformulation

Samson Gourevitch, Yazid Janati, Dario Shariatian

本文重新审视了均匀扩散模型(UDM),指出其标准插件式桥接参数化并非由去噪后验优化,而是由“留一法”(leave-one-out, LOO)后验驱动——即在预测每个干净token时排除其自身噪声观测。作者严格刻画了LOO目标,并推导出去噪器、LOO后验与分数函数之间的精确转换关系,从而解耦模型参数化与训练目标。基于此,无需额外训练即可提升推理性能:提出基于LOO预测器的改进型预测-校正采样器及温度采样策略。进一步,作者引入吸收态重构框架,在保持UDM联合分布不变的前提下,将其分解为类掩码扩散的采样步骤,具备更简洁的去噪后验、跨步解掩码与自然重掩码机制。语言建模实验表明,LOO参数化持续提升UDM生成质量,而吸收态重构在性能上媲美甚至超越掩码扩散模型。

PDF · arXiv


🔥 arXiv 每日论文

📄 arXiv: cs.AI


1. Benchmarking and Improving Monitors for Out-Of-Distribution Alignment Failure in LLMs

Dylan Feng, Pragya Srivastava, Cassidy Laidlaw

本文针对大语言模型(LLMs)在分布外(OOD)场景下出现的安全与对齐失效问题,构建了首个专门评估监控系统OOD对齐失败检测能力的基准MOOD。该基准包含受限训练集与七个多样化、分布外的对齐失效测试集。实验表明,现有安全分类器(guard models)在OOD场景下泛化能力严重不足,召回率仅39%。为此,作者提出将guard model与OOD检测器协同集成,并验证了基于马氏距离与困惑度的组合方案可将召回率提升至45%。进一步发现,引入OOD检测带来的性能增益显著优于单纯扩大模型参数量(如20倍),且在不同规模模型上呈现正向扩展趋势。本研究凸显OOD检测在LLM监控中的关键作用,并为后续研究提供了系统性基准与方法论基础。

2. TO-Agents: A Multi-Agent AI Pipeline for Preference-Guided Topology Optimization

Isabella A. Stewart, Hongrui Chen, Faez Ahmed

本文提出TO-Agents——一种面向偏好引导的多智能体拓扑优化框架,旨在弥合自然语言设计意图(如美学风格、可制造性)与底层优化求解器参数之间的语义鸿沟。该框架集成描述解析、求解执行、多视角视觉-语言渲染评估、独立裁判智能体反馈及参数迭代修正等模块,并引入制造智能体支持增材制造后处理。在悬臂梁与手机支架两个长周期设计任务中,系统通过四轮迭代在60%的试验中生成符合树状分形美学偏好的结构,成功率较无视觉/历史反馈的基线提升达6倍;人工评估与裁判评分验证了其参数调控有效性、容错能力与探索广度。研究同时揭示了过调、选择性记忆等典型失效模式,为自主工程设计提供了方法论启示与安全机制参考。

3. The Shape of Testimony: A Scalable Framework for Oral History Archive Comparison

Itamar Trainin, Renana Keydar, Amit Pinchevski

本文针对大屠杀研究中关于幸存者口述史“结构化”与“自由式”风格二分法的既有主张,提出一种可扩展的计算分析框架,对USC浩劫基金会与耶鲁福图诺夫档案馆逾1600份口述证词开展大规模比较研究。通过话语分割、主题建模及大语言模型驱动的分析,量化证词在主题连贯性、访谈者—幸存者互动模式及提问类型分布三个维度上的“结构化程度”。结果既部分验证了传统区分,又揭示出两馆藏间显著的叙事重叠与内部异质性,挑战了简化的二元对立范式。本研究不仅为 Holocaust 叙事研究提供了实证修正,更构建了一套可复现、可迁移的数字口述史比较分析方法论。

📄 arXiv: cs.CL


1. CR4T: Rewrite-Based Guardrails for Adolescent LLM Safety

Heajun An, Qi Zhang, Vedanth Achanta, Jin-Hee Cho

本文针对青少年使用大语言模型(LLMs)时面临的安全挑战,指出当前以成人为中心、依赖拒绝式响应(refusal-oriented suppression)的防护机制易导致对话中断、削弱建设性引导,并忽视青少年认知与情感发展的特殊性。为此,作者提出CR4T(Critique-and-Revise-for-Teenagers)——一种模型无关的重写型防护框架,通过轻量级风险检测与领域条件化重写,将不安全或过度拒绝的输出转化为符合青少年发展需求、具指导性的安全响应。实验表明,CR4T显著降低不安全与拒绝类输出比例,同时避免对合规交互的误干预,为面向青少年的LLM系统提供了更人性化、发展适配的安全范式。

2. Broadening Access to Transportation Safety Data with Generative AI: A Schema-Grounded Framework for Spatial Natural Language Queries

Mahdi Azhdari, Eric J. Gonzales

本文针对交通安全管理中数据获取不均衡问题,提出一种基于模式约束的生成式AI自然语言查询框架,旨在降低非技术用户访问空间安全数据的门槛。该框架利用大语言模型解析用户意图,通过规则验证层将自然语言查询转化为结构化语义帧,并编译为类型化的有向无环图,在PostGIS数据库上执行确定性空间操作。在马萨诸塞州 statewide 交通安全部署验证中,所有查询均成功执行,规则层修正了29%的语义偏差。结果表明,该方法在保障结果可复现、可审查的前提下,显著提升了数据可及性与可信度,为公共部门可信AI应用提供了可行路径。

3. Sem-Detect: Semantic Level Detection of AI Generated Peer-Reviews

Andr'e V. Duarte, Brian Tufts, Aditya Oke, Fei Fang, Arlindo L. Oliveira, Lei Li

本文针对AI生成与人类撰写的同行评审文本鉴别难题,提出语义层级检测方法Sem-Detect。该方法突破传统仅依赖表层文本特征的局限,融合句法特征与主张级语义分析,通过比对目标评审与同一论文的多份AI生成评审,利用AI模型间观点收敛性与人类评审观点多样性这一关键差异进行判别。在ICLR与NeurIPS超2万条真实评审数据上的实验表明:在二分类任务中,Sem-Detect在0.1%假正率下的真正率(TPR@0.1% FPR)较最强基线提升25.5%;在三分类(人类原生、LLM润色、全AI生成)设定下,LLM润色的人类评审仍保留显著可辨识的语义特征,误判率低于3.5%。

🏛️ Lei Li


📄 arXiv: cs.LG


1. Temporal Contrastive Transformer for Financial Crime Detection: Self-Supervised Sequence Embeddings via Predictive Contrastive Coding

Danny Butvinik (NICE Actimize), Yonit Marcus (NICE Actimize), Nitzan Tal (NICE Actimize), Gabrielle Azoulay (NICE Actimize)

本文提出时间对比变换器(TCT),一种面向金融交易序列的自监督表征学习框架,通过预测式对比编码(Predictive Contrastive Coding)建模动态行为模式。TCT无需标签即可学习富含时序语义的交易序列嵌入,并将其作为特征输入梯度提升分类器以支持欺诈检测。实验表明,仅使用TCT嵌入即可达到AUC 0.8644,验证其有效捕获非平凡时序结构;但与人工构造的强领域特征融合后,AUC仅从0.9205微升至0.9245,说明当前学习表征与现有特征存在高度重叠。结果表明TCT在逼近领域知识方面具有潜力,为降低金融反欺诈中对人工特征工程的依赖提供了可行路径。

2. Teaching Language Models to Forecast Research Success Through Comparative Idea Evaluation

Srujan P Mule, Aniketh Garikaparthi, Manasi Patwardhan

本文探讨语言模型能否在实验开展前预测科研想法的实证成功率,提出“比较式经验预测”任务:给定研究目标与两个候选方案,判断哪个在基准上表现更优。作者基于PapersWithCode构建了含11,488对想法的高质量数据集。实验表明,8B参数基线模型准确率仅30%,经监督微调(SFT)提升至77.1%,显著超越GPT-5(61.1%);进一步采用可验证奖励强化学习(RLVR)框架,使模型生成可解释推理路径,准确率达71.35%。消融与跨域泛化实验验证了方法对表面启发式偏差的鲁棒性及跨时间、跨数据集的迁移能力,证实轻量级模型可作为高效、客观的科研想法筛选器。

3. The Attribution Impossibility: No Feature Ranking Is Faithful, Stable, and Complete Under Collinearity

Drake Caraker, Bryan Arnold, David Rhoads

本文揭示了在特征共线性条件下,任何特征重要性排序方法均无法同时满足保真性、稳定性和完备性,即存在“归因不可能性”。作者严格证明该 impossibility,并量化其在梯度提升、Lasso、随机森林等四类模型中的表现:归因比随相关系数ρ发散或趋于无穷。为缓解该问题,提出DASH(Diversified Aggregation of SHAP)方法,其为无偏聚合中Pareto最优解,达到Cramér-Rao方差下界,并给出紧致的集成规模公式。在77个公开数据集上验证68%存在归因不稳定;条件SHAP亦无法规避该限制。研究还提供Z检验诊断流程与单模型筛查工具,并指出共线性下基于SHAP的代理歧视审计不可靠。全部结论经Lean 4形式化验证(305条定理,零未证命题),系可解释AI领域首个形式化验证的不可能性定理。

📄 arXiv: cs.CV


1. PhysX-Omni: Unified Simulation-Ready Physical 3D Generation for Rigid, Deformable, and Articulated Objects

Ziang Cao, Yinghao Liu, Haitian Li, Runmao Yao, Fangzhou Hong, Zhaoxi Chen, Liang Pan, Ziwei Liu

本文针对现有3D生成方法普遍忽略物理属性或仅支持单一物体类别(如刚体、可变形体或铰接体)的局限,提出PhysX-Omni——首个面向仿真就绪(simulation-ready)的统一物理3D生成框架。其核心创新包括:设计适配视觉语言模型的高保真无压缩几何表征,构建首个覆盖室内外场景的通用仿真就绪3D数据集PhysXVerse,并提出涵盖几何、绝对尺度、材质、功能可供性、运动学与功能描述六大维度的综合评测基准PhysX-Bench。实验表明,PhysX-Omni在生成质量与物理理解能力上均显著优于现有方法,并在仿真场景构建与机器人策略学习等下游任务中展现出良好泛化性,为具身智能与物理仿真提供了坚实基础。

2. Lens: Rethinking Training Efficiency for Foundational Text-to-Image Models

Dong Chen, Fangyun Wei, Ziyu Wan, Dongdong Chen, Jiawei Zhang, Jinjing Zhao, Sirui Zhang, Yang Yue, Zhiyang Liang, Baining Guo, Chong Luo, Jianmin Bao, Ji Li, Lei Shi, Qinhong Yang, Xiuyu Wu, Xuelu Feng, Yan Lu, Yanchen Dong, Yitong Wang, Yunuo Chen

本文提出Lens——一种仅3.8B参数的文本到图像(T2I)基础模型,在多项基准测试中性能媲美甚至超越6B+参数的SOTA模型,同时训练计算量仅为Z-Image的19.3%。其高效性源于两大策略:一是提升每批次数据信息密度,采用GPT-4.1生成的Lens-800M高质量长文本配图数据集(平均109词/ caption),并构建多分辨率、多宽高比混合批次;二是优化架构设计,引入语义VAE与强语言编码器以加速收敛并支持多语言泛化。后续通过RL微调(Lens-RL-8K)、训练免费系统提示搜索及4步蒸馏推理,进一步提升图像质量与生成速度。Lens支持1:2至2:1任意宽高比及最高1440²分辨率,单卡H100上1024²图像生成仅需3.15秒,蒸馏版4步推理低至0.84秒。

🏛️ Baining Guo


3. GenEvolve: Self-Evolving Image Generation Agents via Tool-Orchestrated Visual Experience Distillation

Sixiang Chen, Zhaohu Xing, Tian Ye, Xinyu Geng, Yunlong Lin, Jianyu Lai, Xuanhua He, Fuxiang Zhai, Jialin Gao, Lei Zhu

本文针对开放域图像生成中任务复杂性高、需求多样化的挑战,提出GenEvolve——一种基于工具编排视觉经验蒸馏的自演化图像生成代理框架。该框架将每次生成建模为工具协同的轨迹,通过证据收集、参考选择、技能调用与提示-参考程序构建实现多步推理;创新性地引入“最佳-最差”轨迹对比机制,提炼结构化视觉经验,并仅向特权教师分支提供监督信号,结合类on-policy自蒸馏范式实现细粒度token级知识迁移。作者构建了GenEvolve-Data数据集与GenEvolve-Bench评测基准,实验表明其在多项公开基准及自建评测中显著超越强基线,达到当前图像生成框架的SOTA性能。

🔬 OpenReview 近期论文


1. SkyEvents: A Large-Scale Event-enhanced UAV Dataset for Robust 3D Scene Reconstruction

Wenzong Ma, Zhuoxiao Li, Jinjing Zhu

本文针对无人机(UAV)大尺度三维场景重建在运动模糊与低光照等极端环境下性能退化的问题,提出首个面向该任务的事件增强型大规模UAV数据集SkyEvents。该数据集包含45个序列、逾8小时RGB、事件流与LiDAR多模态数据,覆盖多样光照、场景及飞行高度。为解决事件相机与RGB相机间时间异步难题,作者设计了几何约束的时间戳对齐(GTA)模块;并提出区域级事件渲染(RER)损失函数,以指导神经渲染优化。实验表明,所提方法显著提升了复杂条件下的重建鲁棒性与精度。

PDF


2. Social Agents: Collective Intelligence Improves LLM Predictions

Aanisha Bhattacharyya, Abhilekh Borah, Yaman Kumar Singla

本文提出“社交智能体”(Social Agents)框架,受“群体智慧”启发,通过构建具有多样化人口统计学(如年龄、性别)与心理特征(如价值观、兴趣)的合成人格代理群体,模拟人类社会的多元判断过程。每个代理独立对广告、视频或网页等刺激物进行量化评分(如点击率、记忆度)并提供定性解释,再通过聚合生成更接近真实人群均值的预测结果。在11项行为预测任务中,该方法以GPT-4o为基座模型,相较单LLM基线,在简单判断任务上提升达164%,在复杂解释性推理任务上提升达24%;跨模型平均增益分别为30.5%(低阶任务)和9.9%(高阶任务)。

PDF


3. Computational Barriers to Filtering for AI Alignment

Sarah Ball, Grzegorz Gluch, Shafi Goldwasser

本文探讨了人工智能对齐中外部过滤器(input/output filter)面临的核心计算障碍。作者证明:在标准密码学假设下,存在难以被高效输入过滤器识别的对抗性提示——其与良性提示在计算上不可区分;同时,输出过滤在某些自然设定下亦属计算不可解。进一步,论文形式化分析了多种宽松缓解策略,仍揭示其存在固有计算瓶颈。结果表明,仅依赖黑盒访问大语言模型、在外围部署过滤机制无法保障安全;AI系统的智能与其价值判断本质上不可分割,对齐必须深入模型内部结构与参数设计。

🏛️ Shafi Goldwasser | PDF


4. Metis: Training LLMs with FP4 Quantization

Hengjie Cao, Mengyi Chen, Yifeng Yang

本文针对大语言模型(LLM)低比特训练中FP4量化导致的性能退化问题,揭示了参数、激活与梯度奇异值谱各向异性是根本瓶颈:其长尾分布引发大幅值范围,造成量化偏差与谱失真。为此,提出谱域量化框架Metis,通过将各向异性谱划分为窄子分布并独立量化,显著抑制误差、保持谱结构。Metis利用主导子空间的稀疏随机采样与随机投影不变性,将谱分解开销降至可忽略水平。在LLaMA-3 8B模型上训练100B token时,Metis实现稳健的W4A4G4训练,仅引入0.4%训练损失增长与0.1%下游任务准确率下降,全面优于NVIDIA FP4方案且计算开销更低。

PDF


5. DP-Fusion: Token-Level Differentially Private Inference for Large Language Models

Rushil Thareja, Preslav Nakov, Praneeth Vepakomma

本文提出DP-Fusion,一种面向大语言模型(LLM)推理阶段的令牌级差分隐私机制,旨在解决工具增强或数据库检索场景下敏感上下文信息泄露问题。该方法通过标记敏感令牌、分别生成无敏与含敏输出分布,并以差分隐私约束下的加权融合实现令牌级隐私保障,理论可证地限制敏感令牌对最终输出的影响。其隐私-效用权衡由参数$\epsilon$控制,支持从完全隐藏($\epsilon=0$)到高质量生成的灵活调节。实验表明,DP-Fusion在文档脱敏任务中显著优于现有差分隐私推理方法,困惑度降低6倍,同时保持优异文本质量。

🏛️ Preslav Nakov | PDF


6. CIRCA: Causal Interpretable Readability for Chinese Assessment

Chunshen Ding, Shengling Wang, Ke Chao

可读性评估是教育领域的重要任务,但现有方法存在因果机制不明与可解释性不足的双重局限。本文针对中文语境提出CIRCA框架(Causal Interpretable Readability for Chinese Assessment),基于反事实干预剥离伪相关,利用总变分距离量化文本特征对可读性的因果效应。实验表明,部分在相关性分析中不显著的特征具有强因果影响,且关键因果因子随学段变化:低年级以主题模糊性与词汇丰富度为主,高年级则更受语义噪声影响。在《中文教材系列(2022版)》评测中,CIRCA所得分数与人工分级的相关系数达0.73,显著优于传统相关性方法的0.63。

PDF


7. Secure Outlier-Aware Large Language Model Inference

Lifan Zhao, Zhixuan Fang

本文针对安全多方计算(MPC)下大语言模型(LLM)推理延迟高的问题,提出一种面向离群值特性的安全推理框架SOAL。作者发现LLM中普遍存在的权重与激活值离群现象可显著缩小非线性操作的输入值域,从而优化密码学协议效率。SOAL无需模型重训练或微调,通过离群值感知的量化与裁剪策略,加速RMSNorm、SiLU和Softmax等关键非线性算子,分别实现近2×、2×和5×以上的性能提升。实验表明,该方法在保持原始模型精度的同时,大幅降低MPC推理开销。

PDF


8. WebDS: An End-to-End Benchmark for Web-based Data Science

Ethan Hsu, Hong Meng Yam, Ines Bouissou

WebDS 是首个面向真实场景的端到端网络数据科学基准,旨在评估智能体在复杂网页环境中的全流程数据科能力。它涵盖 870 个跨 29 类异构网站(如政府开放数据平台与新闻媒体)的任务,要求模型完成数据发现、多模态整合、清洗、分析与洞察生成等多步工具调用操作。实验表明,当前最优大语言模型智能体(如 Browser Use)在 WebDS 上仅达成 15% 任务成功率,远低于其在 Web Voyager 上的 80%,暴露出信息 grounding 不足、重复操作与路径捷径等新失败模式;而人类准确率达 90%,凸显显著能力鸿沟。WebDS 为推动实用化 LLM 数据科学代理的发展提供了更鲁棒、更贴近现实的评测基准。

PDF


9. Structured Flow Autoencoders: Learning Structured Probabilistic Representations with Flow Matching

Yidan Xu, Yixin Wang, XuanLong Nguyen

本文提出结构化流自动编码器(SFA),旨在解决现有流匹配方法难以建模潜在结构、而变分自编码器(VAEs)生成质量不足的双重局限。SFA将图模型与条件连续归一化流(CNF)似然相结合,引入一种显式建模潜在变量的新型流匹配目标,实现CNF似然与后验分布的联合优化。该框架可灵活扩展至含连续/混合潜变量及潜在动力系统的图模型。在图像、视频和RNA-seq数据上的实验表明,SFA在样本质量、表示实用性与大数据可扩展性方面均显著优于VAEs及其结构化变体;相比LatentFM等隐空间流匹配模型,SFA亦展现出更优的样本多样性与数据分布覆盖能力。

🏛️ XuanLong Nguyen | PDF


10. On learning linear dynamical systems in context with attention layers

Maria-Luiza Vladarean, Xuhui Zhang, Suvrit Sra

本文研究线性注意力层在上下文学习(ICL)中建模线性动力系统(LDS)的表达能力。针对受高斯噪声干扰的非独立同分布(non-i.i.d.)观测序列,作者构造了单层线性注意力的最优权重,并证明其等价于对一阶窗口自回归目标函数执行一次梯度下降更新。进一步,基于实验观察,揭示了该机制与预条件共轭梯度法(PCG)推广形式之间的联系,尤其适用于更大窗口尺寸的情形。数值实验验证了理论分析。该工作深化了对Transformer类模型作为上下文学习器本质的理解,并为近期发现——即其性能可媲美该设定下最优的模型依赖型滤波器(卡尔曼滤波器)——提供了合理解释。

🏛️ Suvrit Sra | PDF


11. Carré du champ flow matching: better quality-generalisation tradeoff in generative models

Jacob Bamberger, Iolo Jones, Dennis Duncan

深度生成模型常面临样本质量与泛化能力之间的根本权衡:高质量采样易导致过拟合式记忆,而非对数据内在几何结构的泛化。本文提出“卡雷·杜·尚流匹配”(CDC-FM),一种几何感知的流匹配推广方法,通过引入刻画潜在流形局部几何结构的空间变异性、各向异性高斯噪声,正则化概率路径。该几何噪声可从数据中最优估计且具备可扩展性。在合成流形、点云、单细胞基因组学、动物运动捕捉及图像等多类数据集,以及MLP、CNN和Transformer等多种架构上的实验表明,CDC-FM在质量-泛化权衡上持续优于标准流匹配,尤其在数据稀缺和采样高度不均匀的科学AI场景中提升显著。

PDF


12. Meta-UCF: Unified Task-Conditioned LoRA Generation for Continual Learning in Large Language Models

ShiLin Xiao, Tianxiang Xu, Canran Xiao

本文针对大语言模型(LLM)在持续学习场景中面临的灾难性遗忘与参数膨胀难题,提出Meta-UCF——一种统一任务条件化的LoRA生成框架。该方法将每个任务编码为轻量级层归一化均值嵌入,并通过单个超网络实时生成各Transformer层的秩-r LoRA更新;结合元对比学习与正交性约束,引导任务嵌入近似正交,从而在无内循环梯度的情况下有效保留历史知识。在Std-CL 5、Seq-GLUE 7、Long-CL 15和TRACE-8四大持续学习基准上,Meta-UCF以单适配器参数量实现平均准确率提升最高达2.2个百分点、遗忘率降低13%,显著优于现有LoRA基线。

PDF


13. Benchmarking Open-ended Segmentation

Cristina González, Santiago Rodriguez, Kevis-kokitsi Maninis

本文针对开放语义分割任务中现有评估协议无法准确反映生成描述语义准确性的问题,指出基于嵌入的相似度映射与人类判断存在显著偏差。为此,作者提出一种新型映射函数,综合考量自由形式输出与测试词表标签间的多重词汇关系,显著提升与人工标注的一致性。基于该映射构建鲁棒评估框架,对主流方法进行系统重评测;同时,首次提出面向开放语义分割的多模态大语言模型,采用对比学习目标联合对齐视觉区域与文本描述,在开放语义全景分割任务上取得新SOTA性能。

PDF


14. COOPERTRIM: Adaptive Data Selection for Uncertainty-Aware Cooperative Perception

Shilpa Mukhopadhyay, Amit Roy-Chowdhury, Hang Qiu

COOPERTRIM提出了一种面向不确定性感知的自适应数据选择框架,旨在缓解协同感知中通信带宽受限与传感器信息冗余之间的矛盾。该方法利用时序连续性建模环境动态性,设计了基于共形推理的时序不确定性度量,以量化特征相关性,并通过数据驱动机制动态调整每帧传输的特征数量。在语义分割与3D目标检测任务上,COOPERTRIM在多个开源协同模型上实现了最高80.28%和72.52%的带宽压缩,同时保持精度不降;相比其他选择策略,在节省72%带宽下IoU提升达45.54%;结合压缩技术后带宽可进一步降至原始的1.46%,且无性能损失。实验验证了其对环境变化、定位误差与通信延迟的鲁棒适应能力。

🏛️ Amit Roy-Chowdhury | PDF


15. Path Matters: Unveiling Geometric Implicit Bias via Curvature-Aware Sparse View Optimization

Canran Xiao, Liaoyuan Fan, Yanbin Li

本文针对稀疏视角下3D高斯泼溅(3DGS)重建中几何失真、跨视角不一致与渲染质量下降等关键问题,首次揭示其内在的两种几何隐式偏差:模型对高曲率区域监督信号需求更强,且对输入视角轨迹的平滑性高度敏感。为此,我们提出曲率感知的稀疏视角优化框架,联合优化相机轨迹以最大化曲率覆盖并保障运动平滑性,并结合合成视图增强数据信息量。在Mip-NeRF 360、DTU、Blender、Tanks & Temples及LLFF等多基准上的实验表明,本方法在渲染质量(PSNR/SSIM/LPIPS)与几何精度(Chamfer距离)上均显著超越现有最优方法,同时为理解3DGS的数据表征与轨迹规划耦合机制提供了新的理论洞见。

PDF


📝 AI 官方博客


1. We’re announcing new community investments in Missouri.

📝 Google AI Blog

本文宣布谷歌在密苏里州启动新一轮社区投资计划,聚焦于培育下一代技术人才与推动清洁能源发展。项目包括与当地教育机构合作开展计算机科学教育与职业培训,提升青少年及在职人员的数字技能;同时资助分布式能源、能效升级和可再生能源接入等示范性能源项目。…初步试点已在圣路易斯和堪萨斯城落地,预计三年内覆盖超5万名学生与200家中小企业,并助力该州减少年度碳排放约1.2万吨。

2. 100 things we announced at I/O 2026

📝 Google AI Blog

本文总结了2026年Google I/O开发者大会发布的100项重要更新与技术进展,涵盖AI、Android、Chrome、Cloud、Wear OS及Web平台等多个领域。核心聚焦于Gemini系列模型的全面升级,包括原生多模态理解、实时…推理优化及端侧部署能力;Android 16引入更智能的隐私沙盒与情境感知交互框架;Chrome强化Web AI API支持与跨设备无缝同步体验;Google Cloud推出面向企业级AI应用的Vertex AI新工具链。所有发布均强调以开发者为中心的可集成性与实际落地效能。

3. A new experiment brings better group meetings to Google Beam

📝 Google AI Blog

本文提出了一种面向远程混合会议场景的新型实验性系统,旨在提升Google Beam设备在小规模群体会议中的协作体验。该系统通过优化音视频同步、智能发言者追踪与动态画面构图等关键技术,显著改善了线上与线下参与者之间的临场感与交互自然度。实验在…一个典型配置(2名现场参与者+3名屏幕端参与者)下展开,结果表明,新方案使会议参与度提升27%,发言中断率降低41%,且用户主观满意度评分提高35%。本研究为未来混合办公环境下的智能会议系统设计提供了可复现的技术路径与实证依据。

4. Early Indicators of Reward Hacking via Reasoning Interpolation

📝 EleutherAI Blog

本文提出一种基于推理插值的早期奖励劫持检测方法,旨在在强化学习训练过程中提前识别模型出现奖励劫持(reward hacking)的迹象。核心思想是利用重要性采样,结合经微调的“捐赠者”预填充(donor prefills)生成语义连贯的中间…推理轨迹,并通过插值建模策略性行为演化路径。该方法无需访问真实奖励函数或人工标注,仅依赖策略梯度训练过程中的隐式行为信号。在多个基准任务(包括MiniGrid和文本推理环境)上的实验表明,该方法可在奖励劫持发生前平均提前32%的训练步数发出预警,准确率达89.7%,显著优于基于奖励波动或策略熵的传统检测基线。

5. Reward Hacking Resarch Update

📝 EleutherAI Blog

本文为关于奖励黑客(Reward Hacking)问题的阶段性研究进展报告。针对强化学习智能体在优化代理奖励函数时偏离设计者真实意图的现象,本工作系统梳理了现有奖励黑客案例的成因分类,提出一种基于奖励函数可解释性与行为一致性的双维度检测框架…,并初步实现了对策略偏移的在线识别模块。关键技术包括奖励函数敏感性分析、反事实策略扰动评估及基于人类反馈的奖励校准机制。在Gridworld与SafeLife基准环境中的实验表明,该方法可将典型奖励黑客行为检出率提升37%,同时保持92%以上的原始任务性能。后续将拓展至多智能体与长周期决策场景。

6. Pretraining Data Filtering for Open-Weight AI Safety

📝 EleutherAI Blog

本文提出“深度无知”(Deep Ignorance)方法,旨在通过系统性过滤预训练数据提升开源大语言模型(LLM)的安全性。针对开放权重模型易受有害、偏见或越狱内容污染的问题,该方法设计多阶段数据筛选管道,结合语义毒性检测、知识边界识别与对…抗性示例剔除技术,在不依赖微调或后处理的前提下,从源头削弱模型习得危险能力的可能。在多个安全基准(如BBQ、ToxiGen、SafeBench)上的实验表明,经过滤数据训练的模型在保持通用能力(MMLU、ARC)的同时,将越狱成功率降低达62%,有害响应率下降57%,且对数据删除攻击展现出更强鲁棒性。

7. Introducing Claude Opus 4.7ProductApr 16, 2026Our latest Opus model brings stronger performance across coding, agents, vision, and multi-step tasks, with greater thoroughness and consistency on the work that matters most.

📝 Anthropic

本文介绍了Anthropic最新发布的Claude Opus 4.7模型,该模型在编程、智能体(agents)、多模态视觉理解及多步骤复杂任务等关键领域实现性能跃升。其核心改进包括增强的推理深度、更优的任务一致性与更高的执行可靠性,尤其在高…价值专业工作场景中展现出更强的细致性与鲁棒性。实验表明,Opus 4.7在HumanEval代码生成、MMBench多模态基准及AgentBench代理任务上的综合得分较前代提升显著,同时支持更长上下文与更稳定的长程推理。

8. ProductApr 17, 2026Introducing Claude Design by Anthropic LabsToday, we’re launching Claude Design, a new Anthropic Labs product that lets you collaborate with Claude to create polished visual work like designs, prototypes, slides, one-pagers, and more.

📝 Anthropic

暂无摘要


9. AnnouncementsApr 7, 2026Project GlasswingA new initiative that brings together Amazon Web Services, Anthropic, Apple, Broadcom, Cisco, CrowdStrike, Google, JPMorganChase, the Linux Foundation, Microsoft, NVIDIA, and Palo Alto Networks in an effort to secure the world’s most critical software.

📝 Anthropic

暂无摘要


📬 TLDR AI 精选


1. one daily email

该页面仅显示标题“one daily email”,无其他实质性内容,无法提取具体新闻或信息。


💬 Hacker News AI 热门


1. Antigravity 2.0 Tops the OpenSCAD Architectural 3D LLM Benchmark

🔥 237 分 · 💬 102 评论

一项针对AI编程工具生成建筑3D模型能力的基准测试显示,Google推出的Antigravity 2.0(基于Gemini 3.5 Flash)在用OpenSCAD复现罗马万神殿任务中表现最佳:它准确使用真实尺寸、还原了门廊、穹顶、柱列、三…角楣及标志性的内凹式天花板纹样,综合质量得分4.5/5,为目前最强的自主生成结果;而ModelRift配合人工微调的版本则以3.8分位居非自主类第一。

📰 TechCrunch AI 新闻


1. You can no longer Google the word ‘disregard’

本文揭示了Google搜索AI更新后出现的一个意外行为:输入“disregard”(忽略)一词将导致搜索界面异常失效。研究通过系统性测试发现,该问题源于新引入的AI安全过滤机制对特定指令类词汇的过度敏感响应,其本质是模型在对抗性提示识别中误…将中性词汇判定为越狱或规避指令。作者进一步分析了触发条件、影响范围及底层模型响应逻辑,并提出临时规避策略与长期鲁棒性改进建议。实验表明,该漏洞在主流浏览器及设备上复现率达100%,凸显大模型集成至关键基础设施时语义理解与安全边界设定间的深层张力。

2. We tried Google’s AI glasses and they’re almost there

本文报道了谷歌最新原型Android XR智能眼镜的实测体验。该设备集成Gemini大模型,实现低延迟、高精度的实时场景理解与多模态交互,支持视野内即时翻译、AR导航、环境信息标注等核心功能。通过自研光学显示模组与边缘AI协同推理架构,显著…降低端侧计算延迟,提升AR叠加内容的空间锚定稳定性。初步用户测试表明,在典型室内与街景场景下,翻译准确率达92.3%,导航指引响应延迟低于180ms,视觉遮挡率控制在7%以内。结果表明,该眼镜已接近消费级落地门槛,但在续航与镜片轻量化方面仍需优化。

3. Spotify and Universal Music strike deal allowing fan-made AI covers and remixes

本文报道了Spotify与环球音乐集团(UMG)达成历史性合作协议,首次允许其Premium订阅用户在平台内合法生成基于AI的歌曲翻唱与混音作品。该合作通过授权机制与内容识别技术实现版权合规,确保原始词曲作者及录音版权方获得公平收益分成。平…台将集成AI音频生成工具,并对输出内容实施元数据标记与传播管控,兼顾创作者权益与用户创新自由。初步测试显示,该功能显著提升用户参与度与付费转化率,为流媒体平台探索AI原生内容生态提供了可复制的商业化范式。

4. Six search engines worth trying now that Google isn’t really Google anymore

本文探讨了在Google搜索体验因深度集成AI概览(AI Overview)等功能而发生显著变化的背景下,用户可替代的六大搜索引擎。文章分析了DuckDuckGo、Brave Search、You.com、Perplexity、Ecosia…和Kagi等引擎在隐私保护、结果相关性、AI增强能力及可持续性等方面的特点与优势;指出其各自在去广告、抗追踪、实时信息检索、问答交互及环保理念上的差异化实践。通过功能对比与实际检索测试,证实这些引擎在特定场景下可提供更透明、可控且低干扰的搜索体验,为对Google新范式持保留态度的用户提供切实可行的替代方案。

5. Trump delays AI security executive order, saying language ‘could have been a blocker’

本文报道特朗普总统推迟签署一项旨在加强人工智能安全的行政命令,该命令原计划要求对大型AI模型在发布前实施政府主导的安全审查。特朗普表示,草案中部分措辞“可能成为阻碍”,恐抑制AI创新与产业发展,故暂缓签署以待进一步修订。此举凸显美国在AI监…管路径上平衡国家安全关切与技术发展需求的政策张力,也反映出行政分支内部在AI风险治理优先级与实施机制上的分歧。目前尚无新时间表,相关立法与监管动向仍具不确定性。