AI 每日资讯 — 2026-06-11
AI 每日资讯 — 2026-06-11 🔥 HuggingFace 每日论文 1. Role-Agent: Bootstrapping LLM Agents via Dual-Role Evolution Xucong Wang, Ziyu Ma, Shidong Yang 本文针对大语言模型(LLM)智能体在复杂任务中因交互反馈低效、训练环境静态而导致泛化能力受限的问题,提出Role-Agent框架,通过单一LLM同时扮演“智能体”与“环境”角色,实现自举式双角色协同演化。其核心包含World-In-Agent(WIA)与Agent-In-World(AIW)两大模块:WIA利用状态预测一致性构建过程奖励,增强环境建模能力;AIW基于失败轨迹分析与相似任务检索,动态重构训练分布以强化薄弱环节。在多个基准测试中,Role-Agent平均性能提升超4%,显著优于强基线。 PDF · arXiv · 代码 | ❤️ 73 2. Lip Forcing: Few-Step Autoregressive Diffusion for Real-time Lip Synchronization Paul Hyunbin Cho, Jinhyuk Jang, SeokYoung Lee 本文提出Lip Forcing,首个面向视频到视频唇形同步的少步自回归扩散方法,旨在解决现有扩散模型因全序列双向注意力与大量去噪步骤导致的实时推理瓶颈。该方法通过知识蒸馏,将14B参数的音频条件双向视频扩散教师模型压缩为因果学生模型,并设计Sync-Window DMD调度、两步去噪推理机制及SyncNet奖励函数。实验表明:1.3B学生模型达31 FPS,较同规模双向模型快17.6倍;14B学生模型推理速度提升39.8倍,且保持相近参考保真度;首帧延迟低于1毫秒,显著优于所有扩散基线。 PDF · arXiv · 代码 · 项目 | ❤️ 27 3. EEVEE: Towards Test-time Prompt Learning in the Real World for Self-Improving Agents Weixian Xu, Shilong Liu, Mengdi Wang...