AI 每日资讯 — 2026-05-20

🔥 HuggingFace 每日论文

1. LongLive-2.0: An NVFP4 Parallel Infrastructure for Long Video Generation

Yukang Chen, Luozhou Wang, Wei Huang

LongLive-2.0 提出了一种基于 NVFP4 的全栈并行基础设施，专为长视频生成的训练与推理优化设计。其核心创新包括：训练阶段引入序列并行自回归（AR）机制——Balanced SP，通过在各计算节点上配对“干净历史”与“

加噪目标”时间块，实现SP感知的分块VAE编码与自然teacher-forcing掩码；结合NVFP4低精度计算，显著降低显存占用并加速GEMM运算。推理阶段支持Blackwell架构下的W4A4 NVFP4量化、NVFP4 KV缓存及异步流式VAE解码，非Blackwell平台则采用SP推理与量化KV缓存协同优化通信开销。实验表明，该框架在保持高质量生成的同时，大幅提升长视频建模效率与端到端吞吐量。

PDF · arXiv · 代码 · 项目 | ❤️ 86

2. Code as Agent Harness

Xuying Ning, Katherine Tieu, Dongqi Fu

本文提出“代码即代理框架”（Code as Agent Harness）这一新范式，将代码从传统生成目标升维为代理系统的核心基础设施，支撑推理、行动、环境建模与执行验证。作者构建三层分析框架：（1）框架接口层，刻画代码如何连接代理

与外部能力；（2）框架机制层，涵盖面向长周期任务的规划、记忆、工具调用及反馈驱动的控制与优化；（3）扩展层，探讨单代理到多代理系统中共享代码构件对协同、审查与验证的支持。综述覆盖编程助手、GUI/OS自动化、具身智能、科学发现等七大应用场景，并指出评估体系、鲁棒性、可解释性等关键开放挑战。

PDF · arXiv · 代码 | ❤️ 24

3. WavFlow: Audio Generation in Waveform Space

Feiyan Zhou, Luyuan Wang, Shoufa Chen

本文提出WavFlow，一种直接在原始波形空间生成高保真音频的新型框架，摒弃了主流依赖潜在空间压缩的范式。为应对波形信号高维性与低能量带来的建模挑战，WavFlow引入波形分块（waveform patchify）构建2D令牌网格

，并通过幅度提升（amplitude lifting）统一信号尺度，结合直接x-prediction的流匹配策略实现稳定优化；同时构建包含500万高质量视频-文本-音频三元组的自动化数据集，支撑模型从零学习细粒度声学模式。实验表明，WavFlow在VGGSound（FD_PaSST: 59.98, IS_PANNs: 17.40, DeSync: 0.44）和AudioCaps（FD_PANNs: 10.63, IS_PANNs: 12.62）基准上达到或超越先进潜在空间方法，验证了无压缩波形生成的可行性与可扩展性。

PDF · arXiv | ❤️ 4

4. Actionable World Representation

Kunqi Xu, Jitao Li, Jianglong Ye

本文针对物理世界建模中缺乏统一、可操作的对象表征这一核心问题，提出WorldString——一种基于点云或RGB-D视频流直接学习真实物体状态流形的神经架构。区别于现有方法将对象动作状态隐含于视频生成或动态场景重建中，WorldS

tring显式建模对象作为具有内在属性与可变状态的可操作实体，构建兼具几何感知与物理语义的数字孪生基础模块。其全可微结构天然支持与策略学习及神经动力学模型端到端联合优化。实验表明，WorldString在跨视角对象状态重建、动作泛化与下游控制任务迁移中均展现出优越性能与强泛化能力。

PDF · arXiv | ❤️ 2

5. SafeDiffusion-R1: Online Reward Steering for Safe Diffusion Post-Training

Komal Kumar, Ankan Deria, Abhishek Basu

本文针对扩散模型在后训练阶段的安全对齐问题，提出SafeDiffusion-R1——一种无需监督标注数据的在线奖励引导框架。该方法基于Group Relative Policy Optimization（GRPO）算法，在线优化模

型对正/负文本提示的响应，避免了传统监督微调与离线强化学习引发的灾难性遗忘。创新性地设计了一种CLIP嵌入空间内的“方向引导奖励机制”，通过将文本表征向安全方向拉近、向不安全方向推远，替代专用安全/风险判别器。实验表明，该方法将不适当内容生成率从SD v1.4的48.9%显著降至18.07%，裸露检测数由646例减少至15例，同时提升GenEval上的组合生成质量（42.08%→47.83%），并在七类跨域有害提示上展现出优异泛化能力，达到当前最优性能。

PDF · arXiv · 代码 · 项目 | ❤️ 2

6. Vision-OPD: Learning to See Fine Details for Multimodal LLMs via On-Policy Self-Distillation

Qianhao Yuan, Jie Lou, Xing Yu

本文针对多模态大语言模型（MLLMs）在细粒度视觉理解任务中表现不佳的问题，提出Vision-OPD——一种基于策略内自蒸馏的区域到全局感知对齐框架。作者发现MLLMs存在“区域—全局感知鸿沟”：模型在证据裁剪图上回答细粒度问题显

著优于全图输入，表明其失败主因在于难以聚焦关键视觉证据，而非局部识别能力不足。Vision-OPD通过从同一MLLM实例化裁剪图条件教师与全图条件学生策略，在学生生成的策略轨迹上最小化教师与学生下一词分布的token级KL散度，实现无需外部教师、标注、奖励模型或推理时工具调用的端到端自蒸馏。实验表明，该方法在多个细粒度视觉理解基准上超越或媲美更大规模的开源、闭源及“图像思维”智能体模型。

PDF · arXiv | ❤️ 1

7. PIXLRelight: Controllable Relighting via Intrinsic Conditioning

Miguel Farinha, Ronald Clark

本文提出PIXLRelight，一种面向物理可控单图像重光照的前馈式方法。针对现有方法在光照控制粒度、误差累积或优化开销等方面的局限，该方法通过共享的内在表征（albedo、diffuse shading与非漫反射残差）桥接基于物

理的渲染（PBR）与数据驱动合成。训练时利用多光照配对照片进行内在分解；推理时则基于输入图像的粗略3D重建，经路径追踪生成对应PBR光照下的内在条件，并由Transformer神经渲染器结合逐像素仿射调制实现目标光照迁移。实验表明，PIXLRelight支持任意PBR风格光照控制，在重光照质量上达到SOTA水平，单图处理耗时低于0.1秒。

PDF · arXiv | ❤️ 1

8. Advancing Narrative Long Video Generation via Training-Free Identity-Aware Memory

Jinzhuo Liu, Jiangning Zhang, Wencan Jiang

本文针对自回归长视频生成中长期一致性差与记忆退化问题，提出无需训练的恒定身份感知记忆框架IAMFlow。该框架通过大语言模型（LLM）从提示中显式提取带视觉属性的实体并分配全局唯一ID，结合视觉语言模型（VLM）异步校验渲染帧中的

属性，实现精准、显式的实体追踪，有效缓解身份漂移、角色重复与属性丢失。为提升推理效率，设计了包含异步视觉验证、自适应提示切换与模型量化在内的加速流水线，在保持高质量生成的同时超越现有基线速度。此外，构建了首个面向叙事流式视频生成的基准NarraStream-Bench，涵盖324个多提示脚本及多维评估协议。

PDF · arXiv

🔥 arXiv 每日论文

📄 arXiv: cs.AI

1. AgentWall: A Runtime Safety Layer for Local AI Agents

Ashwin Aravind

本文提出AgentWall——一种面向本地AI智能体的运行时安全与可观测性防护层，旨在解决智能体在本地环境中执行真实系统操作（如Shell命令、文件修改、API调用、网页浏览）时缺乏实时行为管控的关键问题。AgentWall通过M

CP代理与OpenClaw原生插件实现，以声明式策略对每个拟执行动作进行拦截、评估与审批，并完整记录执行轨迹。其支持Claude Desktop、Cursor等主流开发环境，单命令即可部署。实验表明，AgentWall在14项基准测试中达成92.9%的策略执行准确率，平均延迟低于1毫秒。

2. ANNEAL: Adapting LLM Agents via Governed Symbolic Patch Learning

Safayat Bin Hakim, Keyan Guo, Wenkai Tan, Alvaro Velasquez, Shouhuai Xu, Houbing Herbert Song

本文提出ANNEAL——一种面向持久性故障消除的神经符号化LLM智能体，旨在解决现有LLM代理在重复执行相同任务时因底层过程知识（如操作符模式、前提条件与约束）未修复而导致的反复失败问题。ANNEAL通过Failure-Drive

n Knowledge Acquisition（FDKA）机制，在不修改基础模型权重的前提下，将反复失败转化为受控的符号化知识图谱编辑：定位失效操作符、生成带类型约束的符号补丁，并经多维评分、符号护栏与金丝雀测试验证后提交。所有编辑均具备完整溯源与确定性回滚能力。实验表明，在四个领域27组多种子运行中，ANNEAL将复发性故障率从基线方法（ReAct、Reflexion）的72–100%降至0%，且消融研究证实FDKA对结构化修复不可或缺，移除后成功率下降最高达26.7个百分点。

3. From Prompts to Protocols: An AI Agent for Laboratory Automation

Angelos Angelopoulos, James F. Cahoon, Ron Alterovitz

本文提出了一种面向实验室自动化的AI智能体架构，旨在解决传统自动化实验平台中仪器协同复杂、编程门槛高、配置繁琐等瓶颈问题。该智能体将大语言模型与实验编排系统（EOS）深度集成，支持科学家通过自然语言交互式创建、执行、监控及优化实验

协议，并内置自动验证与错误修正机制。系统还配备可视化图编辑器，实现AI生成协议与手动编辑的双向同步。在化学、生物与材料科学三类模拟实验室中评估表明，其首次协议生成成功率高达97%，界面操作量减少一个数量级，显著提升了实验自动化效率与可及性。

📄 arXiv: cs.CL

1. The Scaling Laws of Skills in LLM Agent Systems

Charles Chen, Qiming Yu, Yuhang Gu, Zhuoye Huang, Hanjing Li, Hongyu Liu, Simin Liu, Jinhao Liu, Dengyun Peng, Jiangyi Wang, Zheng Yan, Fanqing Meng, Ethan Qin, Carl Che, Mengkang Hu

本文系统探究了大语言模型（LLM）智能体系统中技能库的规模扩展规律。基于15个前沿LLM、1141项真实世界技能及超300万次路由与执行决策，发现两条耦合的标度律：路由律表明单步路由准确率随技能库规模呈对数衰减（$R^2 > 0.

97$），错误模式从局部竞争演变为跨家族漂移，并最终被泛化过强的“黑洞技能”劫持；执行律揭示联合路由在状态实现前近似乘性，而正确执行可使困难下游决策成功率提升约4倍。关键参数——路由对数衰减斜率 $b$——统一刻画路由崩溃与下游可恢复性。依律优化后，预留集路由准确率从71.3%提升至91.7%，劫持率由22.4%降至4.1%，并在ClawBench与ClawMark基准上显著提升任务通过率。

2. PQR: A Framework to Generate Diverse and Realistic User Queries that Elicit QA Agent Failures

Yunan Lu, Luigi Liu, Omar Yahia, Arpit Sharma, Zhou Yu

本文提出PQR框架，旨在自动生成兼具多样性与真实性的用户查询，以有效揭示问答代理（QA agent）在实用性、安全性等维度上的失败案例。针对现有方法多聚焦于对抗性查询、忽视真实用户意图的局限，PQR通过查询重写模块与提示优化模块的

迭代协同，动态探索语义多样的查询变体，并基于历史反馈学习违反目标约束与提升真实性的策略。在电商QA代理评估任务中，PQR相较基线方法多发现23%–78%的无帮助响应，且生成查询在多样性与真实性指标上显著更优。

3. Scaling Accessible Mathematics on arXiv: HTML Conversion and MathML 4

Deyan Ginev, Brian Caruso, Bruce Miller, Jeff Sank, Jacob Weiskoff

本文介绍了arXiv HTML Papers项目的最新进展，旨在提升数学论文在Web端的可访问性与渲染质量。项目自2023年启动以来，持续优化TeX/LaTeX到HTML的转换流程：2025–2026年初实现了社区驱动的 fide

lity 提升，处理约半数用户反馈；推进全量论文转换，错误率从25%降至10%（目标90%无错）；首次集成MathML 4 Intent标注以支持无障碍语音输出；并启动LaTeXML的Rust重写，显著降低计算开销、加速提交预览。该实验性项目正随标准演进与AI技术发展逐步走向成熟。

📄 arXiv: cs.LG

1. Systematic Optimization of Real-Time Diffusion Model Inference on Apple M3 Ultra

Yoichi Ochiai

本文系统性探索了在苹果M3 Ultra芯片（60核GPU、512 GB统一内存）上实现扩散模型实时推理的优化路径，聚焦于摄像头输入到图像生成（img2img）的端到端实时化。研究涵盖10个优化阶段，评估了CoreML转换、量化、T

oken Merging、神经引擎调度、紧凑模型设计、帧插值、kNN合成、pix2pix-turbo、光流跳帧及知识蒸馏等十余种技术。实验表明，传统CUDA平台有效的优化策略（如量化、多实例并行）在Apple Silicon统一内存架构下失效，而基于蒸馏模型SDXS-512的CoreML部署配合三线程相机流水线，最终在512×512分辨率下达成22.7 FPS实时性能。本工作首次系统揭示了苹果芯片上扩散模型推理的独特优化规律，并提供了面向实际部署的工程指南。

2. Mirror Descent-Type Algorithms for the Variational Inequality Problem with Functional Constraints

Mohammad S. Alkousa, Fedor S. Stonyakin, Belal A. Alashqar, Seydamet S. Ablaev

本文针对带函数不等式约束的变分不等式问题（VIP），提出一类新型镜像下降型算法。该算法通过动态判别约束函数值，在可行步（productive step）与非可行步间自适应切换，并支持多种步长策略与停止准则。在算子单调有界、约束函数

Lipschitz连续凸的条件下，证明了算法达到给定精度所需的最优收敛速率。进一步，作者引入约束选择机制：仅在可行步中显式处理当前违反最严重的约束，显著降低多约束场景下的计算开销。此外，算法被拓展至δ-单调算子情形，使其可适用于次梯度信息不精确的约束优化问题。数值实验验证了所提方法的有效性与鲁棒性。

3. Reducing Credit Assignment Variance via Counterfactual Reasoning Paths

Fei Ding, Yongkang Zhang, Yeling Peng, Youwei Wang, Guoxiong Zhou, Zijian Zeng

本文针对大语言模型（LLM）在多步推理强化学习中因稀疏终端奖励导致的信用分配困难问题，提出基于反事实推理路径的信用分配框架。该方法通过在同一输入下采样多条推理轨迹，将轨迹间差异视为隐式替代决策，构建过程级隐式优势估计器，将稀疏奖励

转化为步骤敏感的学习信号。在此基础上，作者提出隐式行为策略优化（IBPO）算法，在数学与代码推理基准上显著提升了训练稳定性与性能上限，有效降低了梯度方差，为释放LLM推理潜力提供了新路径。

📄 arXiv: cs.CV

1. Noise2Params: Unification and Parameter Determination from Noise via a Probabilistic Event Camera Model

Owen Root, Julinda Mujo, Min Xu

本文针对事件相机（EC）缺乏统一、准确建模的问题，提出基于光子统计的首个概率化事件检测模型，首次在单一解析框架下统一刻画静态噪声事件与阶跃响应曲线（S曲线）。该模型推导出覆盖全照度区间的三种概率分布形式（精确泊松、鞍点近似与高斯近

似），揭示了两类行为的内在关联，并指出S曲线本质是概率响应而非固定阈值决策。基于此，作者提出Noise2Params方法，仅需静态均匀场景的噪声数据，即可通过误差最小化反演标定关键参数：对数对比度阈值 $B$、照度-光子转换因子 $\alpha$ 及强度依赖的漏电项 $\theta$。实验表明，由该模型生成的合成噪声图像训练的CNN，在真实数据重建任务中性能显著优于仅用实测数据训练的模型，验证了模型的物理合理性和实用性。

2. StrLoRA: Towards Streaming Continual Visual Instruction Tuning for MLLMs

Chang Che, Ziqi Wang, Hui Ma, Cheems Wang, Zenglin Shi

本文针对多模态大语言模型（MLLMs）在真实场景中持续学习动态演化、交错混合视觉指令任务的挑战，提出流式持续视觉指令调优（StrCVIT）新范式，突破传统任务增量设定的局限。为此，作者设计StrLoRA方法：采用正则化的两阶段专家

路由机制，首先基于文本指令进行任务感知的稀疏专家选择，再通过局部视觉token与全局指令表征间的跨模态注意力实现token级专家加权；并引入路由稳定性正则化，对齐当前与历史指数滑动平均路由分布以缓解非平稳数据流下的灾难性遗忘。在新建StrCVIT基准上的实验表明，StrLoRA显著优于现有方法，有效支持模型从持续演化的多任务数据流中同步习得新能力、强化旧能力并抑制遗忘。

3. How Many Visual Tokens Do Multimodal Language Models Need? Scaling Visual Token Pruning with F^3A

YiJie Huang, Yiqun Zhang, Zhuoyue Jia, Xiaocui Yang, Junzhao Huang, Zihan Wang, Shi Feng, Daling Wang, Yifei Zhang, Yongkang Liu

本文探讨多模态大语言模型中视觉令牌（visual token）的最优数量与分配策略，旨在解决高推理开销下的视觉信息压缩难题。作者提出无需训练的视觉令牌剪枝路由器F³A，将剪枝建模为任务条件下的证据搜索过程。F³A通过轻量级问题感知

线索、冻结的稀疏感知头匹配、粗粒度定位—细粒度优化—覆盖竞争—欠覆盖恢复四阶段机制，在固定令牌预算下动态分配视觉token。实验表明，F³A在零训练、零额外LLM前向计算的前提下，显著提升多种下游任务性能，同时保持原始多模态提示与解码流程不变。

🔬 OpenReview 近期论文

1. RECAST: Expanding the Boundaries of LLMs’ Complex Instruction Following with Multi-Constraint Data

Zhengkang Guo, Wenhao Liu, Mingchen Xie

本文针对大语言模型（LLMs）在处理含大量显式约束（如超10项）的复杂指令时表现不佳的问题，提出RECAST框架——一种高效、可扩展的多约束数据合成方法。该框架从真实人机交互中提取多样化约束，构建了包含30K样本、覆盖19类约束的

高质量基准数据集RECAST-30K。实验表明，基于该数据集微调的模型在复杂指令遵循能力上显著提升，且不损害通用性能。此外，RECAST支持规则驱动与LLM驱动的双重自动验证机制，为强化学习中的奖励建模提供了可量化依据，进一步推动模型在高难度任务上的表现。

AI 每日资讯 — 2026-05-20#

🔥 HuggingFace 每日论文#

1. LongLive-2.0: An NVFP4 Parallel Infrastructure for Long Video Generation#

2. Code as Agent Harness#

3. WavFlow: Audio Generation in Waveform Space#

4. Actionable World Representation#

5. SafeDiffusion-R1: Online Reward Steering for Safe Diffusion Post-Training#

6. Vision-OPD: Learning to See Fine Details for Multimodal LLMs via On-Policy Self-Distillation#

7. PIXLRelight: Controllable Relighting via Intrinsic Conditioning#

8. Advancing Narrative Long Video Generation via Training-Free Identity-Aware Memory#

🔥 arXiv 每日论文#

📄 arXiv: cs.AI#

1. AgentWall: A Runtime Safety Layer for Local AI Agents#

2. ANNEAL: Adapting LLM Agents via Governed Symbolic Patch Learning#

3. From Prompts to Protocols: An AI Agent for Laboratory Automation#

📄 arXiv: cs.CL#

1. The Scaling Laws of Skills in LLM Agent Systems#

2. PQR: A Framework to Generate Diverse and Realistic User Queries that Elicit QA Agent Failures#

3. Scaling Accessible Mathematics on arXiv: HTML Conversion and MathML 4#

📄 arXiv: cs.LG#

1. Systematic Optimization of Real-Time Diffusion Model Inference on Apple M3 Ultra#

2. Mirror Descent-Type Algorithms for the Variational Inequality Problem with Functional Constraints#

3. Reducing Credit Assignment Variance via Counterfactual Reasoning Paths#

📄 arXiv: cs.CV#

1. Noise2Params: Unification and Parameter Determination from Noise via a Probabilistic Event Camera Model#

2. StrLoRA: Towards Streaming Continual Visual Instruction Tuning for MLLMs#

3. How Many Visual Tokens Do Multimodal Language Models Need? Scaling Visual Token Pruning with F^3A#

🔬 OpenReview 近期论文#

1. RECAST: Expanding the Boundaries of LLMs’ Complex Instruction Following with Multi-Constraint Data#

2. Transducing Language Models#

3. Explainable Token-level Noise Filtering for LLM Fine-tuning Datasets#

4. Normalized Matching Transformer#

5. Benchmarking ECG FMs: A Reality Check Across Clinical Tasks#

6. InfoMosaic-Bench: Evaluating Multi-Source Information Seeking in Tool-Augmented Agents#

7. Tractability via Low Dimensionality: The Parameterized Complexity of Training Quantized Neural Networks#

8. Benchmarking Stochastic Approximation Algorithms for Fairness-Constrained Training of Deep Neural Networks#

9. Missingness Bias Calibration in Feature Attribution Explanations#

10. GDGB: A Benchmark for Generative Dynamic Text-Attributed Graph Learning#

11. D$^2$GS: Depth-and-Density Guided Gaussian Splatting for Stable and Accurate Sparse-View Reconstruction#

12. Perturbation-Induced Linearization: Constructing Unlearnable Data with Solely Linear Classifiers#

13. Flash-Mono: Feed-Forward Accelerated Gaussian Splatting Monocular SLAM#

14. RL Squeezes, SFT Expands: A Comparative Study of Reasoning LLMs#

15. Hybrid Training for Vision-Language-Action Models#

📝 AI 官方博客#

1. The new AI-powered Google Finance is expanding to Europe.#

2. See what happens when creative legends use AI to make ads for small businesses.#

3. 5 gardening tips you can try right in Search#

4. Early Indicators of Reward Hacking via Reasoning Interpolation#

5. Reward Hacking Resarch Update#

6. Pretraining Data Filtering for Open-Weight AI Safety#

7. Introducing Claude Opus 4.7ProductApr 16, 2026Our latest Opus model brings stronger performance across coding, agents, vision, and multi-step tasks, with greater thoroughness and consistency on the work that matters most.#

8. ProductApr 17, 2026Introducing Claude Design by Anthropic LabsToday, we’re launching Claude Design, a new Anthropic Labs product that lets you collaborate with Claude to create polished visual work like designs, prototypes, slides, one-pagers, and more.#

9. AnnouncementsApr 7, 2026Project GlasswingA new initiative that brings together Amazon Web Services, Anthropic, Apple, Broadcom, Cisco, CrowdStrike, Google, JPMorganChase, the Linux Foundation, Microsoft, NVIDIA, and Palo Alto Networks in an effort to secure the world’s most critical software.#

📬 TLDR AI 精选#

1. one daily email#

💬 Hacker News AI 热门#

1. Gentoo News: Copy Fail, Dirty Frag, and Fragnesia Kernel Vulnerabilities#

📰 TechCrunch AI 新闻#

1. OpenAI co-founder Andrej Karpathy joins Anthropic’s pre-training team#

2. SandboxAQ brings its drug discovery models to Claude — no PhD in computing required#

3. Anthropic has acquired the dev tools startup used by OpenAI, Google, and Cloudflare#

4. Elon Musk has lost his lawsuit against Sam Altman and OpenAI#

5. Amazon’s new Alexa+ powered feature can generate podcast episodes#

AI 每日资讯 — 2026-05-20

🔥 HuggingFace 每日论文

1. LongLive-2.0: An NVFP4 Parallel Infrastructure for Long Video Generation

2. Code as Agent Harness

3. WavFlow: Audio Generation in Waveform Space

4. Actionable World Representation

5. SafeDiffusion-R1: Online Reward Steering for Safe Diffusion Post-Training

6. Vision-OPD: Learning to See Fine Details for Multimodal LLMs via On-Policy Self-Distillation

7. PIXLRelight: Controllable Relighting via Intrinsic Conditioning

8. Advancing Narrative Long Video Generation via Training-Free Identity-Aware Memory

🔥 arXiv 每日论文

📄 arXiv: cs.AI

1. AgentWall: A Runtime Safety Layer for Local AI Agents

2. ANNEAL: Adapting LLM Agents via Governed Symbolic Patch Learning

3. From Prompts to Protocols: An AI Agent for Laboratory Automation

📄 arXiv: cs.CL

1. The Scaling Laws of Skills in LLM Agent Systems

2. PQR: A Framework to Generate Diverse and Realistic User Queries that Elicit QA Agent Failures

3. Scaling Accessible Mathematics on arXiv: HTML Conversion and MathML 4

📄 arXiv: cs.LG

1. Systematic Optimization of Real-Time Diffusion Model Inference on Apple M3 Ultra

2. Mirror Descent-Type Algorithms for the Variational Inequality Problem with Functional Constraints

3. Reducing Credit Assignment Variance via Counterfactual Reasoning Paths

📄 arXiv: cs.CV

1. Noise2Params: Unification and Parameter Determination from Noise via a Probabilistic Event Camera Model

2. StrLoRA: Towards Streaming Continual Visual Instruction Tuning for MLLMs

3. How Many Visual Tokens Do Multimodal Language Models Need? Scaling Visual Token Pruning with F^3A

🔬 OpenReview 近期论文

1. RECAST: Expanding the Boundaries of LLMs’ Complex Instruction Following with Multi-Constraint Data

2. Transducing Language Models

3. Explainable Token-level Noise Filtering for LLM Fine-tuning Datasets

4. Normalized Matching Transformer

5. Benchmarking ECG FMs: A Reality Check Across Clinical Tasks

6. InfoMosaic-Bench: Evaluating Multi-Source Information Seeking in Tool-Augmented Agents

7. Tractability via Low Dimensionality: The Parameterized Complexity of Training Quantized Neural Networks

8. Benchmarking Stochastic Approximation Algorithms for Fairness-Constrained Training of Deep Neural Networks

9. Missingness Bias Calibration in Feature Attribution Explanations

10. GDGB: A Benchmark for Generative Dynamic Text-Attributed Graph Learning

11. D$^2$GS: Depth-and-Density Guided Gaussian Splatting for Stable and Accurate Sparse-View Reconstruction

12. Perturbation-Induced Linearization: Constructing Unlearnable Data with Solely Linear Classifiers

13. Flash-Mono: Feed-Forward Accelerated Gaussian Splatting Monocular SLAM

14. RL Squeezes, SFT Expands: A Comparative Study of Reasoning LLMs

15. Hybrid Training for Vision-Language-Action Models

📝 AI 官方博客

1. The new AI-powered Google Finance is expanding to Europe.

2. See what happens when creative legends use AI to make ads for small businesses.

3. 5 gardening tips you can try right in Search

4. Early Indicators of Reward Hacking via Reasoning Interpolation

5. Reward Hacking Resarch Update

6. Pretraining Data Filtering for Open-Weight AI Safety

7. Introducing Claude Opus 4.7ProductApr 16, 2026Our latest Opus model brings stronger performance across coding, agents, vision, and multi-step tasks, with greater thoroughness and consistency on the work that matters most.

8. ProductApr 17, 2026Introducing Claude Design by Anthropic LabsToday, we’re launching Claude Design, a new Anthropic Labs product that lets you collaborate with Claude to create polished visual work like designs, prototypes, slides, one-pagers, and more.

9. AnnouncementsApr 7, 2026Project GlasswingA new initiative that brings together Amazon Web Services, Anthropic, Apple, Broadcom, Cisco, CrowdStrike, Google, JPMorganChase, the Linux Foundation, Microsoft, NVIDIA, and Palo Alto Networks in an effort to secure the world’s most critical software.

📬 TLDR AI 精选

1. one daily email

💬 Hacker News AI 热门

1. Gentoo News: Copy Fail, Dirty Frag, and Fragnesia Kernel Vulnerabilities

📰 TechCrunch AI 新闻

1. OpenAI co-founder Andrej Karpathy joins Anthropic’s pre-training team

2. SandboxAQ brings its drug discovery models to Claude — no PhD in computing required

3. Anthropic has acquired the dev tools startup used by OpenAI, Google, and Cloudflare

4. Elon Musk has lost his lawsuit against Sam Altman and OpenAI

5. Amazon’s new Alexa+ powered feature can generate podcast episodes