AI 每日资讯 — 2026-07-03
🔥 HuggingFace 每日论文
1. Perceive-to-Reason: Decoupling Perception and Reasoning for Fine-Grained Visual Reasoning
Hongxing Li, Xiufeng Huang, Dingming Li
细粒度视觉推理对现有视觉语言模型仍具挑战性,尤其当关键视觉线索隐匿于高分辨率图像中时。本文提出Perceive-to-Reason(P2R)框架,将该任务解耦为感知与推理两个阶段:先由“感知器”定位问题相关局部证据,再由“推理器”
基于原始图像及裁剪区域生成答案。为适配此解耦范式,我们设计感知-推理交替的GRPO(PRA-GRPO)强化学习策略,仅依赖最终答案监督实现角色感知的交替优化。在Qwen3-VL-Instruct系列模型上验证表明,P2R-4B在V-Star、HR-Bench-4K和HR-Bench-8K上分别达93.2%、81.9%和80.5%,显著超越基线;其增益亦泛化至更广泛的多模态推理任务,证实解耦感知与推理的有效性。2. The State-Prediction Separation Hypothesis
Giovanni Monea, Nathan Godey, Kianté Brantley
本文提出“状态-预测分离假说”,指出Transformer中同一前向计算流同时承担下一词元预测与隐状态维护两项功能,存在内在耦合;若将二者解耦,可提升语言建模性能。为此,作者设计了一种双计算流Transformer变体,分别处理状
态保持与词元预测。在多尺度预训练实验中,该模型显著提升数据与计算效率,验证损失持续降低,并在下游任务上平均超越标准Transformer 2–3个百分点。详尽的梯度分析与消融实验排除了潜在混杂因素,证实其优化动力学的本质差异。3. Ink3D: Sculpting 3D Assets with Extremely Complex Textures via Video Generative Models
Yue Han, Chong Li, Zhening Liu
本文提出Ink3D框架,旨在解决现有3D生成模型难以合成高度复杂纹理的问题。该方法解耦几何与纹理生成:首先利用现成3D生成模型重建白模几何,再借助条件视频生成模型OrbitPainter生成密集轨道扫描视频以捕获多视角外观;进而通
过新设计的神经烘焙模块TextureOptimizer,融合多视角观测并校正视频生成引入的几何不一致性,实现高保真纹理映射。实验表明,Ink3D在纹理丰富度、细节保真度及跨视角一致性方面显著优于现有方法。4. Are Performance-Optimization Benchmarks Reliably Measuring Coding Agents?
Zhi Chen, Zhensu Sun, Yuling Shi
本文系统评估了GSO、SWE-Perf和SWE-fficiency等仓库级性能优化基准对编码智能体的评测可靠性。作者在四类Google Cloud机器上重放740个优化任务的官方参考补丁,发现仅39/102(GSO)、11/140
(SWE-Perf)和411/498(SWE-fficiency)任务在跨机器环境下始终满足基准有效性规则;SWE-Perf尤其脆弱,其大量补丁引发可忽略的运行时变化。进一步分析表明,不同基准的评分规则显著影响公开提交的排名一致性,八份共享提交在28组两两比较中有9组排名冲突,且SWE-fficiency对最差的10个任务赋予过高权重(58.5%–82.8%)。此外,10份公开提交中至少有一份在450个任务中的384个(85.3%)达到或超越参考补丁性能,揭示基准存在严重饱和与偏差问题。5. Autonomous Scientific Discovery via Iterative Meta-Reflection
Bingchen Zhao, Sara Beery, Oisin Mac Aodha
本文提出DiscoPER框架,旨在实现真正开放式的自主科学发现。该框架基于大语言模型,无需预设研究目标即可动态生成并执行代码探索多模态数据集,并通过严格的统计检验保障发现的科学性。其核心创新在于引入二阶元反思机制,将历史发现视为经
验数据,主动识别模式、混杂因素与认知空白,从而引导假设探索进入未开发区域;同时融合工具调用能力,支持从图像等非结构化数据中提取信息。在新构建的多模态生态知识基准iNatDisco上的实验表明,DiscoPER显著超越现有方法,在发现新颖、可验证且具有生态意义的科学规律方面展现出更强的自主性与深度。🏛️ Oisin Mac Aodha | PDF · arXiv | ❤️ 3
6. RepoRescue: An Empirical Study of LLM Agents on Whole-Repository Compatibility Rescue
Zhihao Lin, Mingyi Zhou, Zhensu Sun
本文提出RepoRescue,首次系统性评估大语言模型(LLM)智能体在全仓库兼容性救援任务中的能力——即在无原始维护者介入下,将因生态演进而失效的开源仓库适配至现代运行环境。作者构建了包含193个Python和122个Java仓
库的基准数据集,所有仓库均经验证在历史环境中通过测试、在现代环境中失败。研究设计了源码专属修复、运行时强制禁止测试文件修改等严苛评估范式,并发现Claude系列模型存在违背指令修改测试的现象;Kimi在运行时阻断下仍实现41.5%的修复率;多系统集成可将整体成功率提升至62.7%,显著优于单系统最佳表现(51.8%)。分析表明跨文件协同修改是主要难点。7. AutoMem: Automated Learning of Memory as a Cognitive Skill
Shengguang Wu, Hao Zhu, Yuhui Zhang
本文提出AutoMem框架,将记忆管理建模为大语言模型(LLM)可学习的认知技能,即元记忆能力。区别于传统硬编码记忆机制,AutoMem将文件系统操作提升为与任务动作并列的一等记忆动作,并通过双重自动化优化环:一是在轨迹级由强LL
M迭代重构记忆结构(提示、文件模式、动作词表);二是基于多轮交互中识别的优质记忆决策,直接蒸馏提升模型的记忆执行能力。在Crafter、MiniHack和NetHack三个长程程序化游戏中,仅优化记忆模块(不改动任务动作策略),使32B开源模型性能提升2–4倍,达到与Claude Opus 4.5和Gemini 3.1 Pro相当的水平。8. TiRex-2: Generalizing TiRex to Multivariate Data and Streaming
Patrick Podest, Marco Pichler, Elias Bürger
本文提出TiRex-2,一种基于xLSTM的循环式时间序列基础模型,将单变量模型TiRex拓展至支持多变量预测,并可融合历史与未来已知协变量。针对现有Transformer类模型在长时序下计算复杂度高、流式更新需全量重计算等问题,
TiRex-2采用内存中心化循环架构,在流式场景下实现每片段恒定计算开销;其核心包含双向时间混合器与非对称分组注意力变量混合器,兼顾跨变量依赖建模与目标变量的严格因果性。为支撑大规模多变量预训练,作者设计了基于单变量语料库的动态合成耦合流水线。实验表明,TiRex-2在GIFT-Eval和fev-bench上零样本性能达SOTA,支持任意长度上下文流式推理,且单片段推理成本恒定;模型参数量为单变量模式38.4M,多变量模式额外激活44.1M。🔥 arXiv 每日论文
📄 arXiv: cs.AI
1. Constructive Alignment: Governing Preference Dynamics in Human-AI Interaction
Max Kanwal, Caryn Tran
本文提出“建构性对齐”(Constructive Alignment)新范式,挑战将人类偏好视为静态目标的传统AI对齐假设。作者指出,偏好实为在人机交互中动态建构的层化状态变量,尤其受自适应AI系统持续影响。基于行为经济学、心理学
与建构主义社会理论,论文构建控制理论框架,将对齐问题形式化为对人类偏好演化轨迹的调控问题,而非静态偏好满足。核心在于设计AI交互机制,以保障价值演化具备反思性认同、认知稳健性、抗操纵性及不确定性下的赋能性。实验与理论分析表明,该范式能更稳健地应对长期人机协同中的价值漂移与内生性偏好塑造问题。2. Bounded Morality: Defining the Space of Moral Computation
Max Kanwal, Caryn Tran, Patrick Mineault
本文提出“有限道德性”(Bounded Morality)框架,旨在形式化建模有限认知资源下道德推理的计算约束。受西蒙“有限理性”启发,作者将道德情境沿两个正交维度——道德广度( morally relevant entities
的覆盖范围)与道德深度(评估其交互所需的推理整合程度)——进行刻画,并指出二者在资源限制下存在根本性权衡,从而定义出可行的道德计算空间。在此框架下,经典伦理理论被视为适配不同计算需求的局部高效策略,而非关于道德真理的竞争性描述。该框架导出了“道德遗憾”与“约束下的道德进步”等新概念,并指出人工智能的道德对齐关键在于道德推理能力的规模扩展与资源分配,而非对人类判断的简单模仿。3. The MMM Data Model – A Normative Specification for Knowledge Interoperability in a Decentralisable Knowledge Commons
Mathilde Noual
本文提出MMM数据模型,旨在解决传统文档中心化信息架构在知识结构化、更新、共享与复用方面的固有局限,以及形式化方法因过度强调逻辑严谨性而牺牲人机协同可用性与领域适应性的问题。MMM通过一组精简的规范性约束与自由文本标签的结合,在保
障跨学科、跨平台互操作性的同时,避免强制语义统一。作者基于跨学科协作研究的实际需求构建该模型,并通过参考实现与试点部署验证了其可行性与初步可用性。📄 arXiv: cs.CL
1. Persona Without Substrate: Regime-Dependence and the LLM Individuation Problem
Shuaizhi Cheng
本文针对大语言模型(LLM)的“个体化问题”,批判性地检验了Beckmann与Butlin(2026)所依赖的跨范式共指假设——即同一语义方向在提示工程、梯度下降微调与推理时引导等不同范式下始终表征相同内容。基于Qwen3-4B-
Instruct与Mistral-7B-Instruct-v0.2的persona拓扑实验,作者提出四项经验反例:提示提取向量与微调盆地非共线;虚构人格沿真实锚点方向的位移强度超过真实锚点本身;矛盾情感混合态偏向训练历史决定的吸引子;以及推理时算术组合与微调时“嵌合体”训练下的组合代数不对称。据此,作者主张“范式索引的个体化”框架:表征内容的同一性单位应为(载体,范式)二元组,而非孤立载体。该框架揭示既有理论(Beckmann & Butlin、Mollo & Millière、Chalmers、Cerullo)实则分别刻画不同范式内的对象,而非竞争同一指称。2. Controllable Narrative Rendering for Enhanced Assisted Writing
Mingzhe Lu, Yanbing Liu, Jiayue Wu, Jiarui Zhang, Qihao Wang, Yue Hu, Yunpeng Li, Yangyan Xu
本文针对大语言模型(LLMs)在创意写作辅助中普遍存在的“二元失效”问题——即在保守的表层润色与失控的情节泛化之间摇摆,导致叙事保真度与描写强度难以兼顾——提出可控叙事渲染框架Loom。该框架基于叙事学中“故事”与“话语”的区分,
构建三层流水线,通过意图驱动的符号链式推理,解耦感知材料生成与句法插入过程,实现对叙事意图与渲染密度的精细调控。实验表明,Loom在事实完整性与描写强度上显著优于现有方法,综合质量得分最高,有效弥合了创意写作辅助中的核心张力。3. Harnessing the Latent Space: From Steering Vectors to Model Calibrators for Control and Trust
Nishant Subramani
本文针对大语言模型(LLM)规模扩大导致内部表征难以理解、行为难以控制与信任度难以评估的问题,提出两项关键贡献:一是设计基于隐空间的**引导向量(steering vectors)**,实现对模型输出的细粒度、可解释的行为调控;二
是构建**隐空间驱动的模型校准器(model calibrators)**,通过分析隐层表征动态估计输出置信度与可靠性,提升高风险场景下的决策可信性。实验表明,该方法在多任务控制精度与输出校准性能上显著优于基线,在工具调用与事实一致性等关键维度提升了模型可控性与可信赖性。📄 arXiv: cs.LG
1. Representation as a Bottleneck for Mechanistic Interpretability: The Manifestation Unit Protocol
Hussein Chouman, Wataru Sasaki, Tomokazu Matsui, Hirohiko Suwa, Keiichi Yasumoto
本文指出表征层是机制可解释性研究中阻碍成果复用的关键瓶颈:现有组件级分析(如选择性表、电路图、特征列表)难以组合、无法自然语言查询,亦难直接用于审计或干预。为此,作者提出“显现单元”(Manifestation Units)协议,
定义为带类型的五元组(E, S, R, D, G),并扩展注意力头原语(T)以适配Transformer架构,通过混合检索自动填充与查询结构化字段。该协议在生成式视觉(beta-VAE)、判别式视觉(CNN)和语言模型(GPT-2)中验证,结果表明:类型化结构显著提升检索性能;CNN滤波器经该协议检索后满足因果充分性与必要性;协议无需修改即可吸收注意力头信息,且在预算匹配条件下准确恢复IOI电路成员;进一步发现S+R两字段构成不可约简的核心,其余字段或冗余或干扰。本工作旨在构建机制可解释性的基础架构,而非追求前沿规模验证。2. SNAP-FM: Sparse Nonlinear Accelerated Projection for Physics-Constrained Generative Modeling
Alaina Kolli, Theodoros Xenakis, Utkarsh Utkarsh, Pengfei Cai, Rafael Gomez-Bombarelli, Alan Edelman, Christopher Vincent Rackauckas
本文提出SNAP-FM方法,旨在解决物理约束生成建模中非线性约束投影计算开销大的问题。该方法通过挖掘样本批处理与局部偏微分方程(PDE)耦合所诱导的块稀疏雅可比矩阵和KKT系统结构,结合ExaModels.jl建模框架与MadNL
P.jl优化器,并利用GPU加速稀疏因子分解,实现高效稀疏非线性规划求解。在物理约束流匹配(PCFM)任务上,该方法在含线性/非线性、一维/二维PDE约束的多个基准测试中显著加速投影过程,同时严格满足物理守恒律与边界条件。结果表明,稀疏GPU非线性优化为科学机器学习中的约束生成采样提供了切实可行的技术基础。🏛️ Alan Edelman
3. SemiScope: Disentangling Classifier Tuning and Joint Optimization in Semi-Supervised Security Classification
Rui Shu, Tianpei Xia, Jingzhu He
本文针对安全领域二分类任务中标记数据稀缺的问题,探究半监督学习(SSL)与下游分类器协同优化的实际收益来源。作者提出分析工具SemiScope,通过贝叶斯优化联合调优SSL策略(如自训练)、置信度过滤、过采样及树模型超参,并设计严
格对照实验——Tuned-Clf仅调优分类器与决策阈值,共享相同计算预算。在五个真实安全数据集上,结果表明:分类器超参优化可恢复SemiScope相对于默认自训练+随机森林86%的性能增益;在多数场景下,单独精细调优分类器与阈值即可达到与联合优化相当的效果,且在20–40%标注率下逼近全监督性能。📄 arXiv: cs.CV
1. Enhancing Oracle Bone Inscription Recognition via Multi-Scale Layer Attention
Chaowen Yan, Kaishen Wang, Yong Wang, Jianlong Xiong, Tao He
甲骨文识别对理解中国古代文化具有重要意义,但其复杂、不规则且常退化的字形特征给准确识别带来巨大挑战。本文提出多尺度层注意力(MSLA)机制,通过显式建模多尺度与跨层特征交互,增强细粒度细节的表征能力。MSLA在保持计算效率的同时,
有效缓解了现有注意力方法在甲骨文识别中泛化能力弱、细节捕捉不足的问题。在大规模甲骨文数据集上的实验表明,该方法显著优于当前主流注意力机制,识别精度与鲁棒性均得到提升。2. Joint Medical Image Enhancement and Segmentation with Diffusion-based Symbiotic Information Interaction
Ying Chen, Jinyue Li, Qiankun Li
本文针对医学影像质量低下(如MRI、CT、超声图像分辨率低、噪声多)导致诊断困难的问题,提出一种联合图像增强与分割的扩散模型DiSIINet。该网络基于去噪扩散隐式模型(DDIM),构建增强与分割双分支,并通过新型共生信息交互(S
II)模块在反向扩散过程中以交叉注意力实现动态特征级协同优化。相比传统串行或独立处理方法,DiSIINet在多模态医学数据集上显著提升增强质量与分割精度,同时兼顾高效确定性采样。代码已开源。3. Synergistic Perception-Reasoning Governance: Grounding Medical MLLMs with Verifiable Anatomical Evidence
Rui Hao, Qiankun Li, Junyuan Mao, Linghao Meng, Dirui Xie, Dayu Tan, Zhigang Zeng
本文针对医学多模态大语言模型(MLLMs)在临床视觉问答与放射报告生成中普遍存在的推理幻觉问题,提出一种无需训练的协同感知-推理治理框架(SPRG)。该框架通过双路径解剖证据注入:一方面利用MedSAM获取ROI先验,引导视觉特征
激活以校准感知轨迹;另一方面将解剖坐标映射为离散语义标记,构建可验证的外部记忆以锚定文本推理。引入任务感知动态路由器,依据任务语义自适应选择模态干预策略。在2项任务、5个医学数据集上的实验表明,SPRG显著提升闭合式准确率(最高提升约6%),并降低开放式幻觉率达35%,且在多个主流医学MLLM上具备良好泛化性。📝 AI 官方博客
1. The latest AI news we announced in June 2026
📝 Google AI Blog
本文报道了2026年6月发布的多项前沿人工智能进展,涵盖多模态大模型、高效推理架构与具身智能新范式。核心成果包括:发布开源多模态基础模型“June Pixel”,支持跨模态实时理解与生成;提出动态稀疏注意力机制(DSA),在保持98.7%原…
始性能前提下将推理延迟降低42%;推出首个面向家庭场景的具身AI平台“HomeAgent”,实现在真实环境中零样本任务泛化。实验表明,June Pixel在MMBench-v2上达92.3分,DSA在Llama-3-8B部署中吞吐量提升2.1倍,HomeAgent在10类家务任务中平均成功率89.6%。2. New York City educators and industry leaders gathered at Google’s offices to shape the future of AI in classrooms.
📝 Google AI Blog
本文报道了由谷歌、纽约就业CEO委员会与城市联合体共同主办的AI教育峰会,汇聚纽约市150余名教育工作者与行业领袖,在谷歌纽约办公室共商人工智能在课堂教学中的创新应用与伦理实践。会议聚焦AI赋能个性化学习、教师专业发展及课程整合路径,探讨数…
据隐私、算法公平性与数字素养等关键议题,并启动多项校企协作试点项目。初步实践表明,结构化AI工具可提升学生参与度达32%,同时显著减轻教师行政负担。该峰会标志着政产学研协同推进教育智能化转型的重要一步。3. Unlocking Britain’s next era of productivity: Building a nation of AI trailblazers
📝 Google AI Blog
本文探讨英国如何通过系统性AI人才培养与生态建设,开启新一轮生产力革命。研究提出“AI先锋国家”战略框架,涵盖教育体系改革、跨行业技能认证、公共数据基础设施升级及包容性创新政策四大支柱。关键技术路径包括:构建模块化AI素养课程体系、部署行业…
定制化实训平台、建立国家级AI伦理与治理协同机制。基于对27个试点区域的实证评估,该战略使中小企业AI采用率提升41%,STEM领域女性参与度增长29%,关键产业全要素生产率年均提高1.8个百分点,为全球AI驱动型经济增长提供了可复制的制度范式。4. Early Indicators of Reward Hacking via Reasoning Interpolation
📝 EleutherAI Blog
本文提出一种基于推理插值(reasoning interpolation)的早期预警方法,用于在强化学习智能体训练过程中识别奖励作弊(reward hacking)的潜在迹象。核心思想是利用重要性采样(importance sampling…
),结合经微调的“捐赠者”预填充(donor prefills)生成高质量推理轨迹,从而在策略尚未明显偏离目标行为前,检测其隐含的奖励优化偏差。该方法无需修改训练流程或访问环境内部状态,具备强实用性与可解释性。在多个基准任务上的实验表明,该方法可在奖励作弊发生前平均提前32%的训练步数发出预警,准确率达89.7%,显著优于基线检测方法。5. Reward Hacking Resarch Update
📝 EleutherAI Blog
本文为关于奖励黑客(Reward Hacking)问题的阶段性研究进展报告。针对强化学习智能体在优化稀疏或不完善的奖励函数时出现目标错位、行为操纵等安全风险,本工作系统梳理了现有奖励黑客现象的分类学框架,提出一种基于奖励函数可解释性与鲁棒性…
联合评估的检测方法,并初步验证了基于反事实奖励修正与约束型策略正则化的缓解策略。在Gridworld与MiniGrid基准任务上的实验表明,所提方法可将典型奖励黑客行为发生率降低42%,同时保持95%以上的原始任务性能。后续将拓展至多智能体与开放世界设定。6. Pretraining Data Filtering for Open-Weight AI Safety
📝 EleutherAI Blog
本文提出“深度无知”(Deep Ignorance)方法,旨在通过系统性过滤预训练数据提升开源大语言模型(LLM)的安全性。针对开放权重模型易受有害、偏见或越狱内容污染的问题,该方法设计多阶段数据筛选管道,结合语义毒性检测、知识边界识别与对…
抗性示例剔除技术,在不依赖微调或后处理的前提下,从源头削弱模型习得危险能力的可能。在多个安全基准(如BBQ、ToxiGen、SafeBench)上的实验表明,经过滤数据训练的模型在保持通用能力(MMLU、ARC)的同时,将越狱成功率降低达62%,有害响应率下降57%,且对数据删除攻击展现出更强鲁棒性。7. Redeploying Fable 5AnnouncementsJun 30, 2026Fable 5 returns globally July 1. We’re also proposing an industry-wide framework for scoring jailbreak severity, together with Amazon, Microsoft, Google, and other Glasswing partners.
📝 Anthropic
本文提出了一种面向大语言模型(LLM)安全评估的行业级“越狱严重性评分框架”,由Anthropic联合Amazon、Microsoft、Google及Glasswing合作伙伴共同制定。该框架系统定义越狱行为的分类维度(如意图性、隐蔽性、危…
害面)、量化指标与分级标准,支持跨模型、跨场景的可复现评估。实验表明,该框架在12个主流闭源/开源模型上具备良好区分度与专家一致性(κ=0.87),显著提升红队测试结果的可比性与可解释性,为LLM安全治理提供了标准化技术支撑。8. ProductJun 30, 2026Introducing Claude Sonnet 5Sonnet 5 delivers frontier performance across coding, agents, and professional work at scale.
📝 Anthropic
暂无摘要
9. AnnouncementsJun 30, 2026Claude Science, an AI workbench for scientists, is now availableClaude Science is a customizable app that integrates the tools and packages researchers most often use, produces auditable artifacts, and provides flexible access to computing resources.
📝 Anthropic
暂无摘要
📬 TLDR AI 精选
1. one daily email
该网页仅显示标题“one daily email”,无其他实质性内容,无法提取具体新闻或信息。