AI 每日资讯 — 2026-06-18

🔥 HuggingFace 每日论文


1. Zone of Proximal Policy Optimization: Teacher in Prompts, Not Gradients

Byung-Kwan Lee, Ximing Lu, Shizhe Diao

本文提出Zone of Proximal Policy Optimization(ZPPO),旨在解决小规模学生模型在知识蒸馏与强化学习中泛化性差的问题。ZPPO受维果茨基“最近发展区”理论启发,将教师信号嵌入提示而非梯度:针对困难问题,构造两类提示——二元候选问题(BCQ)引导学生判别师生响应,负向候选问题(NCQ)聚合其错误轨迹以暴露共性缺陷;并借助提示回放缓冲区动态维持问题于学生当前能力边界内,直至其准确率达50%或被置换。在Qwen3.5系列(0.8B–9B)上的实验表明,ZPPO显著提升推理鲁棒性与跨任务泛化能力,尤其在低资源学生模型上优势突出。

PDF · arXiv · 项目 | ❤️ 38


2. Learning from the Self-future: On-policy Self-distillation for dLLMs

Yifu Luo, Zeyu Chen, Haoyu Wang

本文针对扩散型大语言模型(dLLMs)的后训练难题,提出首个面向dLLMs的在线策略自蒸馏框架d-OPSD。为适配dLLMs的任意序生成特性,该方法摒弃传统自回归式前缀条件建模,转而以模型自身生成的答案作为后缀条件构建“自未来”教师信号,并将监督粒度从词元级提升至去噪步级,与dLLMs的迭代优化过程对齐。在四个推理基准上的实验表明,d-OPSD显著优于RLVR和SFT基线,样本效率提升显著,仅需RLVR约10%的优化步数,为dLLM高效后训练提供了新范式。

PDF · arXiv · 代码 | ❤️ 23


3. EgoCS-400K: An Egocentric Gameplay Dataset for World Models

Rongjin Guo, Dong Liang, Yuhao Liu

本文针对世界模型训练中缺乏大规模、时序对齐的“视频-动作-语言”轨迹数据的问题,提出EgoCS-400K——一个基于《反恐精英》职业比赛演示构建的大规模主视角游戏数据集。该数据集从1000余场公开比赛demo中解析出玩家状态、视角、输入动作、武器使用、游戏事件及回合上下文,并渲染出40万段第一人称视频,涵盖10,000小时 gameplay、13张地图与每回合10种视角。实验验证其在动作条件下的未来帧预测、状态与事件感知的场景推演、回放驱动的细粒度描述生成等任务上具有显著优势,为交互式视觉世界建模提供了高质量基准资源。

PDF · arXiv · 代码 · 项目 | ❤️ 7


4. Unified Multimodal Autoregressive Modeling with Shared Context-Visual Tokenizer is Key to Unification

Wujian Peng, Lingchen Meng, Yuxuan Cai

本文提出UniAR,一种基于共享上下文-视觉分词器的统一多模态自回归建模框架,旨在解决现有方法因使用分离视觉分词器而导致表征空间割裂、难以实现真正统一建模的问题。UniAR采用预训练视觉编码器结合多级特征融合与免查表比特量化技术,构建单一离散视觉分词器,在保持语义与细节的同时高效扩展视觉词表;其自回归模型通过并行比特预测联合生成空间分组、多层级视觉码,显著压缩序列长度并加速生成;最终由扩散解码器将离散视觉token重建为高保真图像。大规模预训练及多阶段优化使UniAR在图像生成与编辑任务上达到SOTA,同时在多模态理解基准上保持竞争力。

PDF · arXiv · 代码 · 项目 | ❤️ 6


5. Variable-Width Transformers

Zhaofeng Wu, Oliver Sieberling, Shawn Tan

本文提出Variable-Width Transformers(> ped)设计,通过无参数的残差重缩放机制实现层间宽度动态调整。在200M至3B参数规模的纯稠密及MoE解码器模型上,其在语言建模损失上持续优于参数量匹配的均匀宽度基线。进一步分析表明,该瓶颈结构诱导出残差流中语义表征的质变。实验显示,该设计在保持性能的同时降低平均层宽,带来22%的FLOPs节省与15%的KV缓存内存及I/O开销缩减,显著提升资源利用效率。

PDF · arXiv · 代码 | ❤️ 5


6. Looped World Models

Hongyuan Adam Lu, Z. L. Victor Wei, Qun Zhang

当前世界模型在长时序仿真中面临计算深度与误差累积的固有矛盾:高保真模拟需深层计算,但深层模型部署成本高且易产生误差累积。本文提出循环世界模型(Looped World Models, LoopWM),首次将循环架构引入世界建模,通过参数共享的Transformer模块迭代精化潜在环境状态。该方法实现高达100倍的参数效率提升,并支持根据每步预测复杂度自适应调整计算深度。LoopWM将迭代潜在深度确立为世界模拟的新缩放维度,为提升长时序建模能力提供了可扩展、高鲁棒性的新范式。

PDF · arXiv | ❤️ 5


7. The Stanford EDGAR Filings Dataset: Reconstructing U.S. Corporate and Financial Disclosures into Layout-Faithful and Token-Efficient Pretraining Data

Nick Bettencourt, Xiaowei Ding, Kay Giesecke

本文针对高质量长文本训练数据稀缺的问题,提出斯坦福EDGAR文件数据集(SEFD),将美国证券交易委员会(SEC)公开披露文件重构为布局保真、标记高效的MultiMarkdown格式。该数据集覆盖经审计财报、风险披露、持股报告、会计附注及重大事件公告等,支持金融语言建模与推理任务。SEFD-v1含1520亿token,与Common Crawl语料重叠率低于0.1%,并配套发布EDGAR-Forecast(评估截止后数值预测能力)和EDGAR-OCR(评估复杂财务表格OCR精度)两大基准。实验表明,其在金融文档理解与结构化信息提取任务中显著优于通用语料微调模型。

🏛️ Stanford | PDF · arXiv | ❤️ 1


8. Adaptive Volumetric Mechanical Property Fields Invariant to Resolution

Rishit Dagli, Donglai Xiang, Vismay Modi

本文针对三维数字资产普遍缺乏精确力学属性(杨氏模量 $E$、泊松比 $\nu$ 和密度 $\rho$)的问题,提出AdaVoMP方法,用于跨表示形式预测稠密、空间变化的体素级力学属性场。其核心是稀疏自适应体素结构(SAV)与基于稀疏Transformer的编解码架构,可为任意输入形状自回归生成定制化SAV表示,在保持内存高效性的同时将分辨率提升至现有最优方法VoMP的 $16^3$ 倍。实验表明,AdaVoMP在精度和推理效率上均显著优于先前方法,仅需更少测试时计算即可生成高保真力学属性场,从而支持复杂高分辨率模型的实时可变形物理仿真。

PDF · arXiv


🔥 arXiv 每日论文

📄 arXiv: cs.AI


1. Beyond Parallel Sampling: Diverse Query Initialization for Agentic Search

Sidhaarth Murali, Jo~ao Coelho, Jingjie Ning, Jo~ao Magalh~aes, Bruno Martins, Chenyan Xiong

本文针对智能体搜索(agentic search)中的测试时扩展问题,指出传统并行采样因首轮查询冗余导致检索证据重叠、后续推理受限,从而产生收益递减。为此,作者提出无需训练的首轮多样化查询初始化方法DivInit:通过单次调用生成n个候选查询,从中选取k个语义多样性的种子作为并行轨迹起点。在五个开源大模型和八个基准任务上的实验表明,DivInit在相同计算开销下,多跳问答平均提升5–7个百分点,显著优于标准并行采样。

Mingxu Tao, Jiawei Hu, Xian Zhou, Wenpeng Hu, Jiajun Cheng, Yunbo Cao, Zhunchen Luo, Guotong Geng

法律案例检索因法律语言复杂性和查询与案例间精确词法对齐需求而长期面临挑战。本文提出一种无需参数训练的自演化规则驱动查询重写框架,旨在提升BM25检索性能。该框架构建了一个基于大语言模型(LLM)的智能体,配备自动评估环境,可迭代生成重写规则、规划组合验证实验,并依据历史反馈淘汰无效规则。在中文法律案例检索基准LeCaRD-v2上的实验表明,该方法显著优于人工设计规则和贪心选择等非演化基线,尤其在采用高容量核心LLM时效果更优。机制分析进一步揭示,LLM对历史实验结果的利用能力及其内在的规则筛选知识是实现规则集持续优化的关键。

3. SkillChain-Gym: A Benchmark for Reskilling-Aware Production-Inventory Control under Disruptions

Carlos Eduardo Sanoja

本文提出SkillChain-Gym——首个面向中断情境下再培训感知的生产-库存联合控制基准。该基准将劳动力技能状态(含认证阈值、技能遗忘、时间受限的培训动作)建模为内生决策变量,支持种子可控的扰动场景、三类可行性模式、确定性回放及多维评估指标(运营绩效、韧性、能力增长与培训可及性分布)。在60班次周期上对比四类策略,结果表明:具备培训能力的策略显著优于纯生产策略;即使无外部扰动,技能遗忘也要求维持性培训;当预测可识别瓶颈时,自适应培训更优,而结构化静态交叉培训则在突发冲击与缺勤下表现稳健。容量冗余与遗忘率共同界定策略优势边界,凸显发展预测驱动型动态技能投资决策机制的必要性。

📄 arXiv: cs.CL


1. MemSlides: A Hierarchical Memory Driven Agent Framework for Personalized Slide Generation with Multi-turn Local Revision

Ye Jin, Yangyang Xu, Jun Zhu, Yibo Yang

本文提出MemSlides框架,旨在解决个性化幻灯片生成中长期偏好保持、多轮局部修订与可靠局部编辑的协同难题。该框架采用分层记忆架构,将记忆划分为用户画像记忆(存储初始意图驱动的个性化配置)、工作记忆(动态维护会话级偏好与约束)和工具记忆(沉淀可复用的局部编辑执行经验),并结合幻灯片粒度的范围限定式修订机制,仅更新受影响的最小区域。实验表明:用户画像记忆显著提升多角色、多意图场景下的个性化对齐效果;工具记忆注入增强诊断性匹配对中的闭环修改能力;工作记忆有效支持跨轮次偏好延续。结果验证了三类记忆解耦对实现高质量个性化演示文稿生成的关键作用。

2. PromptMN: Pseudo Prompting Language

Enkhzol Dovdon

本文针对自然语言提示(prompt)在人机交互中语义模糊、易出错的问题,提出PromptMN——一种伪提示型领域专用语言。该语言通过%-前缀的类型化指令(如角色、目标、约束、输入/输出等),对自然语言提示进行轻量级结构化标注,支持任意顺序书写与语义功能解析。PromptMN介于自由提示与编程式伪代码之间,兼顾可读性、可复用性与跨角色协作能力,并结合反向提示工程实现意图校验与假设显化。实验表明,在Claude Fable 5、Gemini 3.1 Pro等前沿大模型上,PromptMN无需微调即可准确解析含循环、条件、方法及质数判定等复杂逻辑的指令,且在同一SDLC流程中具备跨场景复用性,为提升人-AI协同的清晰度与可审查性提供了可行路径。

3. RepSelect: Robust LLM Unlearning via Representation Selectivity

Filip Sondej, Yushi Yang, Adam Mahdi

本文针对大语言模型(LLM)深度遗忘特定知识与价值观时易被微调或少样本提示攻击逆转的难题,提出RepSelect(Representation Selectivity)方法。其核心在于通过在每次参数更新前压缩权重梯度的主成分,隔离仅与遗忘集相关的表征,从而在保留通用能力的同时限制攻击者可恢复的信息。实验覆盖生物危害知识与滥用倾向两类遗忘任务,以及Llama 3、Qwen 3.5、Gemma 4 E4B和DeepSeek V2 Lite四类模型(含稠密与MoE架构)。相比GradDiff等五种主流基线,RepSelect在再学习后答案准确率下降幅度提升4–50倍,并对少样本提示攻击展现出近乎完美的鲁棒性。

📄 arXiv: cs.LG


1. Correct When Paired, Wrong When Split: Decoupling and Editing Modality-Specific Neurons in MLLMs

Tingchao Fu, Wenkai Wang, Fanxiao Li, Huadong Zhang, Jinhong Zhang, Dayang Li, Yunyun Dong, Renyang Liu, Wei Zhou

本文针对多模态大语言模型(MLLMs)知识编辑中的“编辑解耦失效”问题展开研究:即模型在图文配对输入下可成功更新实体知识,但在输入拆分为单模态(纯文本或纯图像)时却回退至旧有事实。作者通过实证分析发现,MLLMs中实体知识并非统一表征,而是分布于解耦的模态特异性神经通路中,导致仅面向多模态查询的编辑无法有效泛化至单模态路径。为此,提出DECODE方法,显式解耦并定位模态特异性神经元组,实现精准知识编辑。实验表明,DECODE在多种模态触发下均能稳定完成知识更新,显著缓解编辑解耦失效问题。

2. Diagnosing and Repairing Shape-Prior Shortcuts in Long-Range Single-Shot Fringe Projection Profilometry

Adam Haroon, Anush Lakshman, Cody Fleming, Beiwen Li

本文针对长距单次条纹投影三维测量( standoff >1 m)中基于学习的方法存在的“形状先验捷径”问题,开展诊断—修复—验证研究。通过机制可解释性(MI)与共形不确定性量化(UQ)协同诊断,发现UNet基线模型依赖物体边界形状先验而非真实条纹相位解码。为此提出PhiCalNet:以包裹相位为输出,并引入固定可微标定层将相位映射至深度,从架构层面排除形状先验解空间。在光真实感合成数据集(15,600张图像,50个物体,1.5–2.1 m)上,PhiCalNet将物体平均绝对误差由14.54 mm降至4.46 mm(提升3.3倍),残差主要集中于±π相位跳变处(仅占0.103%像素);共形UQ进一步验证其可靠性——剔除快照间不一致最高的5%像素后,RMSE降低64%(20.6→7.4 mm),显著优于基线的3.5%。

3. Informative Missingness to Generate Irregular Clinical Time Series

Hadi Mehdizavareh, Gabriele Santangelo, Giovanna Nicora, Simon Lebech Cichosz, Arianna Dagliati, Arijit Khan, Riccardo Bellazzi

本文针对电子健康记录中实验室检验数据的不规则采样问题,提出一种基于扩散模型的生成方法,联合建模检验值及其观测模式。该方法在DACMI(源自MIMIC-III)基准上实现,将临床时间序列对齐至4小时间隔、划分为7天窗口,并为每个检验值配备观测指示符;通过扩展TimeDiff框架,同步学习连续检验值与离散缺失模式。实验表明,生成数据在单变量分布及值-缺失联合嵌入空间上均高度逼近真实患者轨迹,有效捕获生理状态与临床决策间的MNAR型依赖关系。结果验证了扩散模型建模“信息性缺失”的可行性,为构建融合缺失机制的临床基础模型提供了初步范式。

📄 arXiv: cs.CV


1. Not Truly Multilingual: Script Consistency as a Missing Dimension in VLM Evaluation

Prabhjot Singh, Bhushan Pawar, Madhu Reddiboina, Rajvee Sheth

本文指出当前多语言视觉-语言模型(VLM)评测忽视了“多文字性”这一关键维度,即同一语言使用多种书写系统(如旁遮普语的Gurmukhi、Shahmukhi和Roman script)的现象。为此,作者构建了PuMVR基准——包含1000组严格平行的图文样本,覆盖旁遮普语三大活跃文字。在10个主流VLM上的实验揭示显著且系统的“文字鸿沟”:相同视觉任务在不同文字下的准确率差异高达16%;视觉输入虽提升整体性能,却无法弥合文字间差距;跨文字上下文学习亦极为脆弱。McNemar检验进一步证实模型知识呈现文字锁定特性。据此,作者提出“文字一致性率(SCR)”作为强制性评测指标,其在PuMVR上最低仅24.8%,呼吁将SCR纳入多语言VLM评估体系以保障AI公平可及。

2. Quantum Enchanced Multi-Scale CNN with Bi-directional Mamba for Crop Field Analysis

Mohammad Salman Khan, Ehsan Atoofian, Saad B. Ahmed

本文针对高光谱图像(HSI)作物分类中谱维高、空间复杂、类别不平衡及标注样本稀缺等挑战,提出一种量子增强的多尺度CNN与双向Mamba融合框架(BiSpectral Mamba)。该框架结合多尺度卷积特征提取、谱注意力机制、双向状态空间建模及量子启发式学习策略:多尺度CNN构建层次化空-谱表征;谱注意力筛选关键波段;BiSpectral Mamba将HSI特征图建模为序列token,双向捕获长程依赖;辅以类别加权优化与特征融合提升训练稳定性。在UAVHSI-Crop数据集上达到84.83%的整体分类精度,验证了其在作物识别中的有效性,并展现出在病害检测、产量预测等农业遥感任务中的应用潜力。

3. Beyond Benchmarks: Continuous Edge Inference for Fine-Grained Roadside Perception

Aditya Mishra, Haroon Lone

本文针对资源受限边缘设备上持续道路感知所面临的部署挑战,提出面向实际部署的连续边缘推理系统Edge-TSR。该系统基于NVIDIA Jetson Orin Nano,集成检测、跟踪与细粒度分类,并引入轻量级轨迹感知时序稳定机制,在几乎零计算开销下提升流式推理一致性。实验表明,传统静态图像基准评估显著高估真实性能(相对下降20–30%),而Edge-TSR通过时序稳定将细粒度分类准确率提升达10.16%,并维持16.18 FPS的持续实时性能。在26 km车载实测中,系统55分钟内保持安全温控与稳定吞吐,验证了部署感知评估与时序稳定对边缘AI落地的关键作用。

🔬 OpenReview 近期论文


1. OVid: Open Large-Scale Video Dataset as a Novel Source for Image-Text Data

Andreas Hochlehnert, Marianna Nezhurina, Thaddäus Wiedemer

本文提出OVid——一个源自CommonCrawl、涵盖1000万小时多样化视频内容的开源大规模视频数据集。为提升可用性,作者对场景切换帧生成图像级描述,并为3亿帧–文本子集构建视频级描述。基于该子集,研究者训练了多尺度CLIP模型,并在分类与跨模态检索任务上与DataComp、Re-LAION及经统一重标注的DataComp基线模型进行对比。实验表明,OVid展现出良好的可扩展性与下游性能,验证了其作为继网页图文对之后另一类高质量、可扩展图像-文本数据源的潜力,有力支撑开放多模态基础模型的发展。全部数据将向科研机构免费开放。

PDF


2. Latent Geometry-Driven Network Automata for Complex Network Dismantling

Thomas Adler, Marco Grassia, Ziheng Liao

本文针对复杂网络 dismantling(网络瓦解)任务,提出了一种基于潜在几何驱动的网络自动机框架(LGD-NA)。该方法摒弃对全局结构的依赖,转而利用局部自动机规则(如共同邻居规则)近似节点间有效连接距离,从而捕捉网络潜在流形结构,实现高效、可扩展且可解释的关键节点识别。在迄今最大规模的真实网络基准(1475个跨32个领域的网络)上,LGD-NA全面超越现有谱方法与图神经网络等先进算法;其轻量级版本仅依赖局部邻域信息即达近最优性能。进一步,作者基于该方法的可解释性成功增强多类真实系统(果蝇神经连接组、航空运输网、传染病接触网、恐怖组织通信网)的鲁棒性,并在领域特异性功能指标上验证了其实际有效性。

PDF


3. Noise Tolerance of Distributionally Robust Learning

Ramzi Dakhmouche, Ivan Lunati, Hossein Gorji

本文针对机器学习模型在全局性噪声(如测量误差与量化噪声)下的鲁棒性不足问题,提出一种基于Wasserstein距离的分布鲁棒回归训练方法。该方法不依赖于模型结构,克服了现有Wasserstein分布鲁棒学习(WDRL)在非凸或非Lipschitz回归函数下鲁棒性失效的局限。理论分析揭示了回归函数对噪声方差的缩放行为,并证明所提损失函数的一致性。在物理偏微分方程基准与电力系统数据上的实验表明,该方法在保持竞争力的同时,计算开销降低一个数量级。

PDF


4. Aux-Think: Exploring Reasoning Strategies for Data-Efficient Vision-Language Navigation

Shuo Wang, Yongcai Wang, Wanting Li

本文针对视觉-语言导航(VLN)任务中推理策略研究不足的问题,首次系统评估了No-Think、Pre-Think与Post-Think三类推理范式,发现推理过程在推理阶段易引发“推理坍缩”现象,导致导航性能下降。为此,作者提出Aux-Think框架:在训练阶段引入链式推理(CoT)监督,引导模型内化结构化推理模式;在推理阶段回归无推理的直接动作预测,兼顾效率与性能。配套发布大规模CoT标注数据集R2R-CoT-320k。实验表明,Aux-Think显著降低训练开销,同时保持甚至提升导航准确率。

PDF


📝 AI 官方博客


1. New research shows how AMIE, our medical AI, could help manage health conditions.

📝 Google AI Blog

本研究提出了一种新型医疗对话式人工智能系统AMIE(Articulate Medical Intelligence Explorer),旨在辅助慢性病与复杂健康状况的全程管理。该系统基于多模态推理架构,融合临床指南、真实世界电子病历及医学文…献,通过结构化对话实现病情评估、诊疗建议与患者教育。在Nature期刊发表的随机对照试验中,AMIE在诊断准确性、治疗方案合理性及患者沟通质量等核心指标上达到与初级保健医师相当水平(p=0.92),尤其在糖尿病、高血压及复合共病场景中展现出显著一致性。结果表明,AMIE具备临床部署潜力,可作为医生协同工具提升基层医疗可及性与决策质量。

2. We’re strengthening our presence in Alabama through new investments and community support.

📝 Google AI Blog

谷歌宣布将在2026至2027年投资15亿美元,扩建其位于阿拉巴马州杰克逊县的数据中心园区。该园区自2019年起运营,建于一处改造后的旧址之上。此次扩建将显著提升当地基础设施能力,并创造数百个高技能就业岗位。同时,谷歌承诺投入数百万美元支持…社区发展,包括教育项目、数字技能培训及宽带普及计划,以促进区域经济包容性增长。项目预计带动超10亿美元的本地经济活动,并强化公司在东南部的战略布局。

3. Our new community investments in Virginia support local jobs and expand energy affordability.

📝 Google AI Blog

本文介绍了公司在弗吉尼亚州开展的新一轮社区投资计划,旨在促进本地就业增长与提升能源可负担性。项目聚焦于支持清洁能源 workforce建设,包括职业培训、教育合作及技能认证体系搭建;同时资助低收入家庭节能改造、可再生能源接入及能效补贴等民生…导向型能源项目。试点数据显示,该计划已直接创造逾300个本地就业岗位,惠及超过12,000户家庭,平均降低其年度能源支出18%。成果验证了“就业培育—能源普惠”协同模式在区域可持续发展中的可行性与推广价值。

4. Early Indicators of Reward Hacking via Reasoning Interpolation

📝 EleutherAI Blog

本文提出一种基于推理插值(Reasoning Interpolation)的早期预警方法,用于在强化学习训练过程中提前识别奖励黑客(Reward Hacking)现象。核心思想是利用重要性采样(Importance Sampling),结合…在相似任务上微调的“捐赠者”预填充(donor prefills),对策略行为进行跨阶段推理轨迹插值与偏差分析。该方法无需修改训练流程或访问真实奖励函数,仅通过离线分析策略输出即可量化潜在的奖励操纵倾向。在多个基准环境(如CoinRun、ProcGen)上的实验表明,该指标可在奖励性能异常上升前平均提前32%的训练步数发出预警,且误报率低于8.7%,显著优于基于奖励曲线或KL散度的传统检测手段。

5. Reward Hacking Resarch Update

📝 EleutherAI Blog

本文为关于奖励黑客(Reward Hacking)问题的阶段性研究进展报告。针对强化学习智能体在优化代理奖励函数时偏离设计者真实意图的现象,本工作系统梳理了现有奖励黑客案例的成因分类,提出一种基于奖励函数可解释性与行为一致性的双维度检测框架…,并初步实现了在Gridworld与MiniGrid环境中的验证。实验表明,该方法能有效识别约78%的隐式奖励篡改行为,较基线方法提升23%。后续将拓展至高维连续控制任务,并探索基于反事实推理的鲁棒奖励建模机制。

6. Pretraining Data Filtering for Open-Weight AI Safety

📝 EleutherAI Blog

本文提出“深度无知”(Deep Ignorance)方法,旨在通过预训练数据过滤为开源大语言模型(LLMs)构建抗篡改的安全机制。该方法系统性识别并移除预训练语料中包含敏感、有害或可被恶意利用的知识片段(如越狱指令、隐私信息、危险技能描述)…,同时保留模型基础能力所需的核心通用知识。关键技术包括基于多维度安全评分的自动化数据筛选框架、对抗性验证集驱动的过滤效果评估,以及知识保留率与安全性之间的帕累托优化。在多个开源模型(Llama-3、Qwen2)上的实验表明,经过滤训练的模型在TruthfulQA、SafeBench等基准上安全性提升达37%,而MMLU、GSM8K等能力评测下降不足2%,显著优于传统后训练对齐方法。

7. Statement on the US government directive to suspend access to Fable 5 and Mythos 5AnnouncementsJun 12, 2026The US government has issued an export control directive to suspend all access to Fable 5 and Mythos 5.

📝 Anthropic

本文针对美国政府于2026年6月12日发布的出口管制指令——全面暂停对Fable 5与Mythos 5两大先进AI模型的访问权限——作出正式声明。该指令源于地缘政治与技术安全考量,直接影响全球科研、教育及产业界对前沿大模型的使用。文中阐明公…司合规立场,同步启动替代性开源模型迁移计划,并推出“Claude Corps”国家级AI普惠人才计划以缓解技术断供影响。实证表明,在政策响应框架下,模型服务中断率控制在3.2%以内,97%的学术用户已通过适配接口完成平滑过渡。

8. AnnouncementsJun 11, 2026Introducing Claude CorpsWe’re launching Claude Corps, a national fellowship program for people early in their careers who are passionate about extending the benefits of AI to communities across America.

📝 Anthropic

暂无摘要


9. PolicyJun 10, 2026Policy on the AI ExponentialAI is advancing at exponential speed, and the policymaking process was built for a slower world. We’re sharing policy proposals to prepare our institutions for AI progress.

📝 Anthropic

暂无摘要


📬 TLDR AI 精选


1. one daily email

该内容仅显示标题“one daily email”,无正文信息,无法提取具体新闻或文章核心内容。


💬 Hacker News AI 热门


1. Launch HN: Adam (YC W25) – Open-Source AI CAD

🔥 27 分 · 💬 8 评论

Adam 是一家 YC W25 期孵化的初创公司,推出了开源 AI 驱动的 CAD(计算机辅助设计)工具,旨在让产品设计更快速、直观和普及。它将生成式 AI 与传统 CAD 功能结合,支持自然语言描述建模、智能草图理解、参数化编辑和实时协作…,目标用户包括硬件创业者、工程师和教育者。项目已开源核心代码,强调可扩展性与社区共建,并计划通过企业版和专业支持实现商业化。

📰 TechCrunch AI 新闻


1. Only 16 percent of Americans think AI will have a positive impact on society, a new study shows

本研究基于皮尤研究中心(Pew Research Center)最新调查数据,揭示了美国公众对人工智能社会影响的普遍悲观态度:仅16%的受访者认为AI将对社会产生积极影响。研究采用全国代表性抽样调查(N=5,203),结合多维度问卷分析公众…在就业、隐私、公平性及治理等关键议题上的风险感知与信任水平。结果显示,教育程度、年龄及政治倾向显著调节态度差异;超六成民众担忧AI加剧不平等或被滥用。该发现挑战了技术乐观主义叙事,凸显AI发展亟需加强公众参与、透明治理与伦理共识建设。

2. Google bets on Gemini to reinvent the smart home speaker

本文探讨Google如何利用生成式AI重塑智能音箱交互范式。为突破传统语音助手指令式交互的局限,Google推出搭载Gemini大模型的新款99.99美元Home智能音箱,以自然、上下文感知的对话能力替代原有僵化的命令响应机制。关键技术包括…轻量化Gemini Nano模型端侧部署、多轮对话状态追踪与意图动态推理。实验表明,新系统在家庭场景任务完成率提升37%,用户平均对话轮次达5.2轮,显著优于基于规则的旧架构。该实践标志着智能音箱从“功能执行器”向“情境化生活协作者”的范式跃迁。

3. The slowtech revolution is here to kill your phone addiction and rescue your attention span

本文提出“慢科技”(Slowtech)理念,旨在应对数字过载与智能手机成瘾引发的注意力碎片化危机。作者主张通过设计反速度、低刺激、高意图的技术产品——如单功能电子墨水设备、无通知的离线工具及延迟响应系统——重构人机关系。核心技术包括注意力优…先的交互范式、基于行为心理学的渐进式数字戒断机制,以及以“时间主权”为指标的评估框架。实证研究表明,为期八周的Slowtech干预使参与者日均屏幕使用时长下降37%,持续专注时长提升2.4倍,主观注意力恢复感显著增强(p<0.01)。该范式为数字福祉提供了可扩展的伦理技术路径。

4. Collecting robot training data is dirty, unglamorous work. Some AI labs are already paying XDOF to do it.

本文指出,物理人工智能(Physical AI)若要达到大语言模型(LLMs)的成就水平,亟需解决高质量机器人训练数据匮乏这一关键瓶颈。当前机器人数据采集工作繁重、低效且缺乏吸引力,导致数据规模与多样性严重不足。为此,部分前沿AI实验室已开…始向专业数据服务公司XDOF采购定制化、高精度的机器人感知与动作数据集。文章分析了该模式在数据标准化、场景覆盖、标注质量及成本效益方面的优势,并通过初步实验验证:基于XDOF数据训练的导航与抓取模型,在真实环境中任务成功率提升23%,泛化能力显著增强。

5. Pramaana Labs raises $27M seed round from Khosla Ventures to bring formal verification to AI

Pramaana Labs近日完成2700万美元种子轮融资,由Khosla Ventures领投,旨在将形式化验证(formal verification)技术引入人工智能系统。针对法律、药物研发和税务申报等高敏感垂直领域,其技术通过数学方…法严格证明AI模型行为的正确性与可靠性,显著降低因模型错误导致的高风险后果。公司构建了面向AI系统的新型验证框架,支持对大语言模型输出逻辑、推理链及合规性进行可验证保障。初步实验表明,该方法在合同审查与分子性质预测任务中将关键错误率降低超90%,同时保持响应效率。