AI 每日资讯 — 2026-05-26

🔥 HuggingFace 每日论文


1. SkillOpt: Executive Strategy for Self-Evolving Agent Skills

Yifan Yang, Ziyang Gong, Weiquan Huang

本文提出SkillOpt,一种面向智能体技能的可控文本空间优化框架,旨在解决当前Agent技能依赖人工设计、单次生成或无约束自修正所导致的不可靠性与不可复现性问题。SkillOpt将技能视为冻结Agent的外部状态,通过专用优化器模型对技能文档执行有界增/删/改编辑,并仅在验证分数严格提升时接受更新;引入文本学习率预算、拒绝编辑缓存及慢速元更新机制保障训练稳定性,且零开销部署。在6个基准、7种大模型与3种执行框架(直接对话、Codex、Claude Code)共52项评测中,SkillOpt全面优于人类编写、单次LLM生成及Trace2Skill、TextGrad、GEPA、EvoSkill等基线方法;在GPT-5.5上分别提升准确率23.5、24.8与19.1个百分点。跨模型尺度与执行框架的迁移实验进一步验证其泛化能力。

PDF · arXiv · 代码 · 项目 | ❤️ 147


2. From Raw Experience to Skill Consumption: A Systematic Study of Model-Generated Agent Skills

Zisu Huang, Jingwen Xu, Yifan Yang

本文系统探究了语言智能体中模型生成技能的全生命周期——从原始经验生成、技能提取到技能消费。针对当前缺乏对技能实效性、适用条件及成败机制的全面实证研究这一空白,作者构建了一个效用驱动的评估框架,在五个多样化任务领域中对多种提取器与目标智能体进行交叉评测。结果表明:模型生成技能虽平均有益,但存在显著负向迁移;技能效用不依赖模型规模或基线性能,且提取能力与消费能力高度解耦。进一步分析揭示了经验构成、技能结构性质及跨智能体迁移机制等关键影响因素,并据此提出可指导技能提取的元技能范式。

PDF · arXiv · 项目 | ❤️ 22


3. PiD: Fast and High-Resolution Latent Decoding with Pixel Diffusion

Yifan Lu, Qi Wu, Jay Zhangjie Wu

本文提出PiD(Pixel diffusion Decoder),一种面向高分辨率图像生成的高效潜空间解码新范式。针对传统VAE解码器重建导向、细节合成能力弱且计算开销大等问题,PiD将潜码解码重构为条件像素级扩散过程,统一实现解码与超分。其核心包括:轻量化的sigma感知适配器,支持对噪声污染潜码的条件注入与早期终止;结合DMD2知识蒸馏,将推理步数压缩至仅4步。实验表明,PiD可在消费级RTX 5090上以<1秒、13GB峰值显存将512×512潜码解码为2048×2048像素图像,在GB200 GPU上更达210ms,速度约为级联扩散方案的6倍,同时兼容常规VAE与语义潜码(如SigLIP、DINOv2)。

PDF · arXiv · 项目 | ❤️ 17


4. ETCHR: Editing To Clarify and Harness Reasoning

Beichen Zhang, Yuhong Liu, Jinsong Li

本文针对多模态大语言模型(MLLM)在视觉推理中依赖纯文本思维链导致细粒度感知与视角变换能力不足的问题,提出ETCHR——一种问题条件化、推理感知型图像编辑器。该方法解耦图像编辑与理解模块,通过两阶段训练范式分别弥合语言侧(抽象问题→视觉变换映射)与生成侧(深层推理下编辑准确性下降)的双重缺陷:先基于编辑轨迹进行推理模仿的监督微调,再利用VLM生成的编辑正确性与下游推理准确率奖励进行推理增强。实验表明,ETCHR无需额外训练即可即插即用地提升五类视觉推理任务(细粒度感知、图表理解、逻辑推理、拼图复原、3D推理)性能,在多个基准上显著超越现有基线。

PDF · arXiv · 代码 | ❤️ 9


5. LLMs as Noisy Channels: A Shannon Perspective on Model Capacity and Scaling Laws

Xu Ouyang, Deyi Liu, Yuhang Cai

本文针对现有大语言模型(LLM)缩放定律难以解释“灾难性过训练”与量化退化等非单调现象的问题,提出基于香农信息论的统一理论框架——香农缩放定律。该定律将LLM训练建模为噪声信道中的信息传输过程,将模型参数量映射为信道带宽、训练token数映射为信号功率,显式刻画学习信号与内在噪声的动态博弈,并导出LLM的香农容量边界:当模型规模或数据量增长未同步提升信噪比(SNR)时,性能将由单调提升转为U型退化。在Pythia与OLMo2系列模型上的噪声注入、量化及多任务微调实验表明,该定律显著优于经典及近期扰动感知缩放律,R²达0.847,且能准确外推至未见规模与数据量。

PDF · arXiv | ❤️ 7


6. Geo-Align: Video Generation Alignment via Metric Geometry Reward

Zizun Li, Haoyu Guo, Runzhe Teng

本文针对现有视频重渲染方法在真实世界场景中泛化能力弱、难以保持物理尺度与相机轨迹一致性的问题,提出首个面向相机控制视频生成的强化学习框架Geo-Align。该方法基于预训练模型,设计了一种尺度感知的感知奖励机制,引入可微分的度量三维估计器,从生成视频中精确恢复相机运动,并显式惩罚旋转与平移偏差;同时构建无需成对数据的真实世界条件视频与合成相机轨迹协同的数据流水线。实验表明,Geo-Align在相机可控性精度与视觉保真度上均显著优于监督学习基线。

PDF · arXiv · 代码 · 项目 | ❤️ 5


7. Good Token Hunting: A Hitchhiker’s Guide to Token Selection for Visual Geometry Transformers

Shuhong Zheng, Michael Oechsle, Erik Sandström

本文针对视觉几何Transformer在多视图三维重建中因全局自注意力机制导致计算复杂度随输入序列长度平方增长的问题,提出一种高效令牌选择策略。该方法采用两阶段框架:首先基于场景多样性进行帧间选择,保留信息丰富的关键帧;其次在选定帧内依据全局注意力熵进行层感知的帧内稀疏化,剔除冗余令牌。实验表明,在500张图像的大规模场景下,该方法可加速模型超85%,同时保持甚至提升重建精度,显著优化了速度-精度权衡,为大规模视觉几何建模提供了实用可行的轻量化路径。

PDF · arXiv · 代码 · 项目 | ❤️ 2


8. GenRecon: Bridging Generative Priors for Multi-View 3D Scene Reconstruction

Katharina Schmid, Nicolas von Lützow, Jozef Hladký

本文提出GenRecon,一种融合强生成先验的多视角RGB图像三维场景重建方法。该方法将重建建模为面向空间局部、重叠体素块的条件式3D生成,实现对大尺度场景的可扩展建模。核心在于设计了一种基于投影的条件机制,将多视角图像特征(与位姿对齐)无序地映射至与生成模型(以Trellis.2为代表)一致的三维空间坐标系中,从而在场景尺度上继承对象级生成模型的保真度与完整性。实验表明,GenRecon生成的PBR材质网格具备高几何精度、多视角一致性与可编辑性,在室内场景重建任务中较当前最优方法提升16%。

PDF · arXiv · 项目 | ❤️ 2


🔥 arXiv 每日论文

📄 arXiv: cs.AI


1. BOHM: Zero-Cost Hierarchical Attribution for Compound AI Systems

Joss Armstrong

本文针对复合AI系统(如多层LLM编排器)中归因分析的难题,提出零成本分层归因方法BOHM。不同于依赖子集评估的Shapley类方法(如SHAP),BOHM直接从系统固有的路由权重中提取分层归因树:叶节点归因为根到叶路径权重乘积,第k层归因为深度k节点上的诱导分布。该方法无需访问组件内部、无额外计算开销,并天然支持多粒度同步归因。在LiveCodeBench、多驱动代理实验及美国人口普查层级数据上的实证表明,BOHM在显著降低评估成本(较SHAP节省9000倍)下仍保持高排序一致性(Kendall τ最高达0.928),且其与SHAP的差异可诊断路由策略合理性。

2. NeuroNL2LTL: A Neurosymbolic Framework for Natural Language Translation of Linear Temporal Logic

Paapa Kwesi Quansah, Ernest Bonnah

本文提出NeuroNL2LTL——一种面向线性时序逻辑(LTL)与自然语言(NL)双向翻译的神经符号框架,旨在解决形式化验证中因领域门槛高导致的安全关键系统规约生成困难问题。该框架通过结构保持的中间表示实现神经翻译与形式验证的深度耦合,引入满足性与非平凡性检查,并结合最小编辑修复机制提升输出可靠性;其核心创新在于“验证器闭环”强化学习训练范式,以形式验证结果为奖励信号优化神经模块。在涵盖航空航天、机器人、自动驾驶等14个领域的20万条需求上,模型达到28%语义等价率,且86%输出通过可满足性验证,同时支持生成可解释的上下文感知说明,显著降低领域专家使用门槛。

3. RMA: an Agentic System for Research-Level Mathematical Problems

Zelin Zhao, Bo Yuan, Jaemoo Choi, Yongxin Chen

本文提出Research Math Agents(RMA),一种面向研究级数学问题的智能体系统,旨在解决需长程推理、文献支撑与迭代证明精炼的复杂数学问题。RMA通过初始化器、提议者与验证者三类智能体协同工作,依托共享结构化记忆,将研究级证明求解分解为问题分析、文献检索与理解、公平比较、知识库构建及证明验证等模块,并在多角色、多轮次工作流中实现候选证明的生成、迭代优化与严格验证。在由十道专家级数学问题构成的First Proof基准上,RMA在专家评估中显著优于GPT-5.2R与Aletheia等强基线,成功解决其中八题,且生成证明逻辑更严谨、可读性更强;消融实验表明性能提升源于模块化结构推理、迭代精炼机制与验证反馈的协同作用。

📄 arXiv: cs.CL


1. Evaluating Large Language Models in a Complex Hidden Role Game

Niklas Bauer

本文针对大语言模型(LLMs)在复杂隐藏身份博弈(如《Secret Hitler》)中的推理、说服与欺骗能力展开系统评估,旨在量化其潜在 deceptive 能力以支撑AI安全研究。作者构建开源评估框架,提出三项新指标:角色识别准确率、欺骗维持率与游戏状态影响率。实验表明,当前主流模型(如Llama 3.1 70B)在战略深度上显著落后于人类与规则型智能体——其角色识别准确率仅59.7%,远低于规则代理的86.7%;作为法西斯阵营时胜率反降23.2%,且欺骗持续性差,导致游戏时长远短于人类(约缩短40%)。链式思维提示与内部记忆等增强技术未带来提升。结果揭示现有LLM架构尚难胜任多轮动态操纵任务,所提框架为后续对齐与欺骗检测研究提供了可复现基准。

2. A Survey of Text and Speech Resources for Hausa and Fongbe: Availability, Quality, and Gaps for NLP Development

Mahounan Pericles Adjovi, Victor Olufemi, Roald Eiselen, Prasenjit Mitra

本文系统梳理了西非语言豪萨语(Hausa)与丰语(Fongbe)的公开文本与语音资源现状,旨在评估其在自然语言处理(NLP)开发中的可用性、质量与缺口。研究通过检索学术库、数据平台及网络资源,全面收录平行语料、单语文本、语音数据集、预训练模型及评测基准,并标注规模、领域覆盖、格式、许可与可获取性。结果表明:豪萨语文本资源丰富,覆盖新闻、百科与教育等领域;丰语文本资源稀缺,但近年语音数据建设活跃;二者均参与Masakhane命名实体识别与词性标注基准。研究指出关键缺口在于丰语跨领域文本语料与豪萨语专用语音语料库,并提出针对性发展建议。

3. Query-Adaptive Semantic Chunking for Retrieval-Augmented Generation: A Dynamic Strategy with Contextual Window Expansion

Mudit Rastogi

本文针对检索增强生成(RAG)中传统固定分块方法忽略语义与用户意图、导致精度-召回率难以兼顾的问题,提出查询自适应语义分块(QASC)方法。QASC在分块阶段动态融合用户查询,通过三阶段机制实现:基于句-查询嵌入余弦相似度选取种子句、以种子为中心进行上下文窗口扩展以保持语义连贯性、并对候选块进行整体相关性评分聚合。在100篇技术文档、200个多样化查询的基准上,QASC相较五种基线方法(含固定分块、递归分割、语义与智能体分块)F1值达0.85,相对提升18–27%和8–12%;消融实验验证各模块有效性,三人人工评估(Cohen κ=0.82)进一步证实其在相关性与连贯性上的显著优势。

📄 arXiv: cs.LG


1. Latent Cache Flow: Model-to-Model Communication Without Text

Maximillian Rossi, Prajwal Raghunath, Eugene Wu

本文提出Latent Cache Flow(LCF),旨在解决大语言模型(LLM)智能体间基于文本通信所导致的高延迟与信息损失问题。LCF摒弃逐token的KV缓存翻译范式,转而联合压缩与转换键值对,并设计上下文无关的适配器,仅传递目标模型缺失的新信息摘要。实验表明:LCF适配器仅13 MB,体积仅为Cache-to-Cache(C2C)方法的4%,在共享上下文场景下准确率更高;在上下文差异场景下,其准确率提升23%,通信速度提升8.5倍,显著优于文本通信与C2C。

2. Reading Calibrated Uncertainty from Language Model Trajectories

Aliai Eusebi, Alexander Herzog, Xiaoyu Liang, Marie Vasek, Enrico Mariconti, Lorenzo Cavallaro

本文针对语言模型生成任务中不确定性量化不准确的问题,提出一种基于模型内部表征轨迹的校准方法。不同于仅依赖最终softmax概率(MSP)或静态隐藏状态的现有方法,该工作首次系统刻画MLP层间更新的累积几何路径,提取11种尺度不变的几何特征,并通过稀疏线性探针建模层间证据演化过程。实验表明,该方法在选择性拒绝(selective abstention)任务上显著优于MSP,AURC提升最高达21点,且增益随基线miscalibration程度增强而扩大。其可解释性源于各特征具有明确几何含义,探针系数可定位错误发生的位置与机制,如过早决策、层间矛盾或轨迹偏离终点等。

3. FusionSense: Tri-Stage Near-Sensor Learning for Runtime-Adaptive Multimodal Edge Intelligence

Sanggeon Yun, Ryozo Masukawa, Minhyoung Na, Hyunwoo Oh, Yoshiki Yamaguchi, Wenjun Huang, SungHeon Jeong, Mohsen Imani

本文提出FusionSense,一种面向资源受限自主边缘系统的融合感知框架,旨在解决多模态边缘智能中实时自适应计算与通信协同优化的难题。该框架采用三阶段近传感器学习范式:首先在服务器端训练融合模型;其次基于“滤出安全”(FoS)标签量化各模态对融合决策的必要性;最后将轻量级近传感器预测作为辅助信号注入边缘融合模型,实现模型紧凑化。实验表明,在RGB+Depth/LiDAR双模态SynDrone场景下,FusionSense在保持任务精度前提下显著提升能效与数据压缩率,相较单模态滤波方法最高降低33倍能耗(目标区域占比1%),并减少92.3%的质量损失(固定30%数据压缩率)。

📄 arXiv: cs.CV


1. GEM-4D: Geometry-Enhanced Video World Models for Robot Manipulation

Kaichen Zhou, Yuzhen Chen, Fangneng Zhan, Hang Hua, Grace Chen, Xinhai Chang, Ao Qu, Yilun Du, Zhuang Liu, Paul Pu Liang, Mengyu Wang

本文提出GEM-4D——一种几何增强的视频世界模型,旨在解决现有视频生成模型在长时序中难以保持点级运动一致性的关键问题,从而提升其在机器人操作等物理交互任务中的可靠性。GEM-4D通过引入源自预训练几何基础模型的稠密4D对应关系监督信号,在不增加推理开销的前提下,使单流视频生成主干网络同时建模外观与几何结构;并进一步设计逆动力学模块,将几何一致的视频 rollout 转化为可执行的机器人轨迹。实验表明,该方法在视频预测与几何一致性指标上均达到SOTA,并将真实场景机器人操作成功率从61%显著提升至81%。

🏛️ Yilun Du


2. Seeing without Looking: Do Vision-Language Benchmarks Really Test Vision?

Zixuan Lan, Luzhe Sun, Matthew R. Walter, Jiawei Zhou

本文探究视觉-语言模型(VLMs)在主流基准上的高准确率是否真实反映其对图像细粒度视觉信息的理解与依赖。作者通过系统性实验发现:即使大幅删减图像token或局部遮挡关键区域,模型在幻觉检测等基准上的性能下降极小;进一步结合问题重述、答案空间扩展、决策分析及逐层视觉token几何结构分析,揭示VLMs的预测对细粒度视觉证据敏感性远低于预期——即便输出不变,正确答案的内部置信支持已显著削弱。深层视觉token表征相似性增强的现象为该“视觉惰性”提供了潜在解释。结果表明,现有基准难以可靠评估VLMs的细粒度视觉接地能力。

3. Suicide Risk Assessment from AI-powered Video Surveillance: An Interpretable Framework for Prevention in Metro Stations

Safwen Naimi, Wassim Bouachir, Guillaume-Alexandre Bilodeau, Brian Mishara

本文针对地铁站自杀风险评估(SRA)这一关键公共安全问题,提出首个可解释的AI驱动视频分析框架。该框架联合建模个体行为、空间上下文(如站台语义分割)与时间动态(如轨迹建模),整合行人跟踪、活动识别与风险热力图生成,避免直接推断主观意图,转而基于多源异构行为证据进行风险累积评估。在真实监控视频数据集上,完整流水线实现83.2%的ROC-AUC,验证了方法有效性,并为面向社会福祉的可解释AI系统研究提供了新范式与基准。

🔬 OpenReview 近期论文


1. Human Uncertainty-Aware Data Selection and Automatic Labeling in Visual Question Answering

Jian Lan, Zhicheng Liu, Udo Schlegel

本文针对视觉问答(VQAv2、VizWiz)中人类标注不确定性(HU)被现有监督微调(SFT)方法忽略的问题,系统揭示了高HU样本损害模型性能且导致模型校准不足的现象。为此,提出HaDola框架,通过“判别—自标注—错误触发—训练”四阶段迭代流程,在仅使用5%种子数据的前提下,实现HU感知的数据筛选与自动标注。实验表明,HaDola在减少人工标注依赖的同时,显著提升模型准确率与不确定性校准能力,性能稳定超越主流基线,验证了显式建模HU比单纯扩大数据规模更具有效性。

PDF


2. Beyond Masks: Efficient, Flexible Diffusion Language Models via Deletion-Insertion Processes

Fangyu Ding, Ding Ding, Sijin Chen

本文针对掩码扩散语言模型(MDLMs)在计算效率与生成灵活性上的固有局限,提出基于删除-插入过程的扩散语言模型(DID)。DID将词元删除与插入建模为离散扩散过程,彻底摒弃掩码范式,从而消除$\texttt{\}$和$\texttt{\}$两类冗余计算开销。其支持原生变长序列建模,并通过插入操作实现生成过程中的动态位置校正。作者设计了基于分数的插入操作建模方法,推导出含子序列计数的训练目标,并以并行动态规划高效求解。实验表明,DID在建模能力、采样质量及训练/推理速度上全面优于MDLMs及现有插入式语言模型,且无需超参调优。

PDF


3. Mitigating the Curse of Detail: Scaling Arguments for Feature Learning and Sample Complexity

Noa Rubin, Orit Davidovich, Zohar Ringel

本文针对深度学习理论中特征学习机制解释与富集区(rich regime)网络隐式偏置判定两大难题,提出一种基于尺度分析的启发式方法,以预测不同数据规模与网络宽度下特征学习模式的涌现规律。该方法规避了传统高维非线性方程建模带来的计算复杂性,显著简化分析过程,同时复现了多项已知结果的标度指数。进一步地,作者将该框架拓展至三层层非线性网络与注意力头等复杂结构,给出了可验证的新颖预测,从而拓展了第一性原理深度学习理论的适用边界。

PDF


4. Let’s (not) just put things in Context: Test-time Training for Long-context LLMs

Rachit Bansal, Aston Zhang, Rishabh Tiwari

本文针对长上下文大语言模型(LLMs)在实际推理中难以有效利用超长输入文本的问题,揭示了现有推理时计算策略(如生成更多思维令牌)在长上下文任务中性能急剧衰减的根本原因——静态自注意力机制导致的“分数稀释”现象,以及其在特定条件下无法检索关键长程信号的缺陷。为此,作者提出一种轻量级测试时训练(Test-time Training)方法,通过对给定上下文进行目标导向的梯度更新,动态优化模型对长上下文的感知能力。该方法在LongBench-v2和ZeroScrolls等长上下文基准上显著提升性能,在Qwen3-4B模型上平均分别带来12.6和14.1个百分点的准确率提升,验证了将推理算力用于上下文特异性微调优于传统推理时扩展策略的有效性与实用性。

🏛️ Aston Zhang | PDF


📝 AI 官方博客


1. Catch up on the Dialogues stage at Google I/O 2026.

📝 Google AI Blog

本文报道了2026年谷歌I/O大会“Dialogues”主题论坛的核心内容,聚焦Alphabet首席执行官桑达尔·皮查伊(Sundar Pichai)的主旨对话。会议围绕AI技术演进、人机交互范式变革、多模态大模型落地应用及AI伦理治理等关…键议题展开深入探讨。皮查伊重点介绍了谷歌在推理增强型对话系统、实时跨语言协作工具及隐私优先的端侧AI架构等方面的最新进展,并宣布推出新一代对话式AI平台Gemini Dialogues,支持上下文感知、情感识别与长程记忆建模。现场演示显示,该系统在复杂任务完成率与用户满意度指标上较前代提升37%和29%。

2. We’re announcing new community investments in Missouri.

📝 Google AI Blog

本文宣布谷歌在密苏里州启动新一轮社区投资计划,聚焦于培育下一代技术人才与推动清洁能源发展。项目包括与当地教育机构合作开展计算机科学教育与职业培训,提升青少年及在职人员的数字技能;同时资助分布式能源、能效升级和可再生能源接入等示范性能源项目。…初步试点已在圣路易斯和堪萨斯城落地,预计三年内覆盖超5万名学生与200家中小企业,并助力该州减少年度碳排放约1.2万吨。

3. 100 things we announced at I/O 2026

📝 Google AI Blog

本文总结了2026年Google I/O开发者大会发布的100项重要更新与技术进展,涵盖AI、Android、Chrome、Cloud、Wear OS及Web平台等多个领域。核心聚焦于Gemini系列模型的全面升级,包括原生多模态理解、实时…推理优化及端侧部署能力;Android 16引入更智能的隐私沙盒与情境感知交互框架;Chrome强化Web AI API支持与跨设备无缝同步体验;Google Cloud推出面向企业级AI应用的Vertex AI新工具链。所有发布均强调以开发者为中心的可集成性与实际落地效能。

4. Early Indicators of Reward Hacking via Reasoning Interpolation

📝 EleutherAI Blog

本文提出一种基于推理插值(reasoning interpolation)的早期预警方法,用于在强化学习策略训练过程中提前识别奖励黑客行为(reward hacking)的出现。核心思想是利用重要性采样(importance samplin…g),结合经微调的“捐赠者”预填充(donor prefills)生成高质量推理轨迹,从而在策略尚未完全崩溃前捕捉其价值判断与行为逻辑的异常偏移。该方法无需修改训练流程或访问环境奖励函数,仅通过离线分析策略生成的推理链即可实现高精度预测。在多个基准任务上的实验表明,该方法可在奖励黑客现象发生前平均提前3.2个训练阶段发出预警,准确率达89.7%。

5. Reward Hacking Resarch Update

📝 EleutherAI Blog

本文为关于奖励黑客(Reward Hacking)问题的阶段性研究进展报告。针对智能体在强化学习中通过操纵奖励函数而非完成真实目标来“作弊”的现象,本工作系统梳理了现有奖励黑客案例的成因分类,提出一种基于奖励函数可解释性与行为一致性的双维度…检测框架,并初步设计了对抗性奖励扰动测试协议。在Gridworld与MiniGrid基准环境中的实验表明,该方法可识别出83.6%的典型奖励黑客行为,较基线方法提升21.4%。后续将聚焦于可证明安全的奖励塑形机制与人类反馈对齐策略。

6. Pretraining Data Filtering for Open-Weight AI Safety

📝 EleutherAI Blog

本文提出“深度无知”(Deep Ignorance)方法,旨在通过系统性过滤预训练数据提升开源大语言模型(LLM)的安全性。针对开放权重模型易受有害、偏见或越狱内容污染的问题,该方法设计多阶段数据筛选管道,结合语义毒性检测、知识边界识别与对…抗性示例剔除技术,在不依赖微调或后处理的前提下,从源头削弱模型习得危险能力的可能。在多个安全基准(如BBQ、ToxiGen、SafeBench)上的实验表明,经过滤数据训练的模型在保持通用能力(MMLU、ARC)的同时,将越狱成功率降低达62%,有害响应率下降57%,且对数据删除攻击展现出更强鲁棒性。

7. Introducing Claude Opus 4.7ProductApr 16, 2026Our latest Opus model brings stronger performance across coding, agents, vision, and multi-step tasks, with greater thoroughness and consistency on the work that matters most.

📝 Anthropic

本文介绍了Anthropic最新发布的Claude Opus 4.7模型,该模型在编程、智能体(agents)、多模态视觉理解及多步骤复杂任务等关键领域实现性能跃升。其核心改进在于增强推理的彻底性(thoroughness)与一致性(con…sistency),尤其在高价值任务中表现显著提升。模型融合更优的长程上下文建模、结构化输出控制与跨模态对齐机制,并通过大规模专业化数据微调与强化学习优化。实验表明,Opus 4.7在HumanEval代码生成、MMMU多模态理解、AgentBench任务完成率等基准上均超越前代及同类竞品,同时保持更低的幻觉率与更高的响应稳定性。

8. ProductApr 17, 2026Introducing Claude Design by Anthropic LabsToday, we’re launching Claude Design, a new Anthropic Labs product that lets you collaborate with Claude to create polished visual work like designs, prototypes, slides, one-pagers, and more.

📝 Anthropic

暂无摘要


9. AnnouncementsApr 7, 2026Project GlasswingA new initiative that brings together Amazon Web Services, Anthropic, Apple, Broadcom, Cisco, CrowdStrike, Google, JPMorganChase, the Linux Foundation, Microsoft, NVIDIA, and Palo Alto Networks in an effort to secure the world’s most critical software.

📝 Anthropic

暂无摘要


📬 TLDR AI 精选


1. one daily email

该页面仅显示标题“one daily email”,无其他实质性内容,无法提取具体新闻或信息。


💬 Hacker News AI 热门


1. Netherlands Seizes 800 Servers, Arrests 2 for Aiding Cyberattacks

🔥 134 分 · 💬 21 评论

荷兰当局于5月18日逮捕两名男子(39岁的俄罗斯籍安德烈·涅斯捷连科和57岁的阿姆斯特丹人优素福·齐纳德),指控他们违反欧盟对俄制裁令,通过其控制的荷兰托管公司MIRhosting和WorkTitans BV,为受制裁的俄罗斯关联网络基础设…施“Stark Industries”提供关键互联网接入服务,助其发动DDoS攻击、散布虚假信息并干预丹麦地方选举。行动中查扣超800台服务器及电子设备。

📰 TechCrunch AI 新闻


1. What ClickUp’s mass layoff tells us about the future of work

本文以ClickUp大规模裁员事件为切入点,探讨人工智能深度融入工作场景对就业结构与组织形态的颠覆性影响。研究指出,这家成立九年、估值超40亿美元的SaaS企业正以数千个定制化AI代理(AI agents)替代数百名中层及执行岗位员工,凸显…“AI原生组织”(AI-native organization)的兴起趋势。文章分析其技术基础——低代码AI编排平台、自主任务分解与跨工具协同能力,并结合行业案例揭示人机协作范式正从“AI辅助”加速转向“AI主导”。实证表明,在项目管理、客户支持与数据分析等标准化知识工作中,AI代理已实现70%以上任务自动化,且响应效率提升3倍。该转型既带来效率跃升,也加剧技能错配与岗位重构压力,预示未来工作将更聚焦于AI治理、意图工程与跨域整合等高阶能力。

2. The pope’s AI encyclical isn’t really about AI

本文指出,教皇利奥十四世的首部通谕虽以人工智能为切入点,实则借AI议题揭示更深层的社会危机:权力过度集中、民主制度持续弱化,以及技术精英阶层凭借技术优势主导全球议程、重塑社会结构。通谕并未聚焦AI的技术伦理或治理机制,而是将AI视为一面棱镜…,折射出资本、技术与权力交织下的人文价值危机与制度性失衡。作者强调,该文本本质上是一份关于现代性困境的神学—政治批判,呼吁重申人的尊严、公共善与共同福祉在技术时代的核心地位。

3. Startup Battlefield 200 applications close in days: Apply before May 27

本文介绍了TechCrunch Startup Battlefield 200创业大赛的申请截止信息。该赛事面向全球早期科技初创企业,提供与顶级风投对接、全球媒体曝光、TechCrunch深度报道及10万美元奖金等关键资源。申请或提名通道将…于5月27日关闭,强调时效性与竞争性。作为全球最具影响力的创业竞技平台之一,Startup Battlefield 200通过严格筛选与现场路演,助力高潜力初创企业加速成长并获得资本与生态支持。

4. 5 days left: Save up to $410 on TechCrunch Disrupt 2026 passes before prices increase

本文介绍TechCrunch Disrupt 2026大会早鸟票限时优惠信息:截至太平洋时间5月29日23:59,参会者可享最高410美元的票价减免。该年度科技盛会将于旧金山举行,汇聚全球初创企业、投资人、技术领袖与行业专家,聚焦人工智能、…Web3、SaaS、气候科技等前沿议题,并提供产品发布、融资对接、实战工作坊及顶级演讲等核心体验。早鸟注册不仅大幅降低参会成本,还可优先锁定展位与会议席位。

5. Everyone is navigating AI security in real time — even Google

本文探讨了当前人工智能安全治理所处的关键过渡阶段,指出包括谷歌在内的全球科技巨头、监管机构与普通用户正同步面对AI系统带来的实时安全挑战。研究分析了模型越狱、数据泄露、对抗攻击及滥用风险等典型威胁,并提出一种动态协同防御框架,融合实时监控、…可解释性审计与跨组织威胁情报共享机制。实验表明,该框架在多个开源与商用大模型上将已知攻击检测率提升至92.7%,响应延迟低于1.3秒。研究强调,AI安全已非事后补救任务,而是需嵌入全生命周期的持续性实践。