Aura · ArXiv AI

全部 OpenAI Hugging Face ArXiv AI Google AI VentureBeat AI MarkTechPost Pragmatic Engineer The Gradient One Useful Thing TechCrunch

350 条条目 · 10 个活跃源

2026年5月19日

04:00

ArXiv AI

RecMem：基于重复的记忆整合方法，用于高效且有效的长期运行LLM智能体

RecMem仅在重复出现相似语义交互时调用LLM整合记忆，用轻量嵌入模型处理日常交互，令牌消耗降低87%且准确率更高。

04:00

ArXiv AI

机器翻译的无参考强化学习微调：序列到序列视角

GRPO结合无参考奖励微调Seq2Seq翻译模型，无需并行数据，13种语言提升显著，低资源语言尤佳。

04:00

ArXiv AI

CitePrism：人在环路的人工智能引文审计与编辑诚信框架

CitePrism结合大模型与人工审查，初步验证可辅助编辑筛查引文质量，但尚需广泛验证。

04:00

ArXiv AI

超越内容：融合副语言线索的全面语音毒性数据集与检测框架

提出ToxiAlert-Bench音频数据集及双头神经网络框架，利用副语言特征使检测Macro-F1提升21.1%，准确率提升13.0%。

04:00

ArXiv AI

警务本体论：执法报告语义理解与推理的概念知识学习

提出符号框架，将执法报告叙述转为证据事实，事件提取置信度高，语义路径映射成功。

04:00

ArXiv AI

从扁平语言标签到类型学先验：面向多语言语音到语音翻译的结构化语言条件化

提出S2ST-Omni 2框架，用结构化类型学先验替代扁平标签，实现数据高效多语言语音翻译，仅3小时数据即可日英翻译。

04:00

ArXiv AI

约束潜在状态建模：竞争约束下表征学习的统一视角

提出CLSM统一框架，揭示核心属性权衡，将现有方法归为不同约束组合，解决辨识性不足。

04:00

ArXiv AI

视觉语言模型能否在数学教育中实现自适应？基于学习者模型的评估准则研究

提出基于学习者模型的自适应评估准则，测试表明当前VLMs在数学辅导中自适应能力有限，尤其缺乏学习者信息时。

04:00

ArXiv AI

从人类遥操作数据学习基于仿真引导的双臂绳索操控策略

基于3D粒子状态的策略相比视觉策略在绳索抓取误差降低30.8%，显示物理一致状态比像素更利于小样本泛化。

04:00

ArXiv AI

谁拥有这个代理？将AI代理追溯至其所有者

提出金丝雀注入归属协议，通过不可抑制标记追溯会话账户，解决AI代理责任归属问题，经评估可靠可扩展。

04:00

ArXiv AI

Multi-level Self-supervised Pretraining on Compositional Hierarchical Graph for Molecular Property Prediction

04:00

ArXiv AI

XSearch: 通过概念到代码对齐的可解释代码搜索

XSearch通过概念对齐重构代码搜索，实现可解释性，在分布外基准上性能提升15倍。

04:00

ArXiv AI

循环状态空间模型：深度循环与输入重塑用于时间序列分类

循环SSM通过参数共享优化，在更小假设空间匹配或超越标准模型；输入重塑提升精度1-6%，两者结合效果更佳。

04:00

ArXiv AI

Ada-Diffuser: 隐变量感知的自适应扩散决策方法

提出Ada-Diffuser，融合隐动态推理与扩散建模，实现自适应规划与控制，实验验证其有效性。

04:00

ArXiv AI

稳健先验引导的可编辑三维高斯溅射分割

利用SAM-HQ和先验引导标签重分配实现鲁棒3D高斯分割，支持实时编辑且保真度高。

04:00

ArXiv AI

错误设定的先探索后利用导致超竞争价格

算法定价中模型误设的探索-利用策略，在相似价格区间探索可导致超竞争价格，甚至达到垄断水平。

04:00

ArXiv AI

AgriMind: An Ensemble Deep Learning Framework for Multi-Class Plant Disease Classification

04:00

ArXiv AI

VideoSeeker：通过原生智能体工具调用来促进实例级视频理解

VideoSeeker利用视觉提示与智能体推理实现实例级视频理解，自建数据管道训练模型，性能超越GPT-4o等。

04:00

ArXiv AI

迈向关系数据库的基础模型：语言模型与图神经网络的结合

提出BART与GraphSAGE混合架构，在关系数据库任务中达67.40 AUC，接近监督基线，缩小与RDL差距，是高效迈向基础模型的路径。

04:00

ArXiv AI

面向感知模型的可信与可解释AI：从概念到原型车辆部署

提出融合鲁棒性、可解释性与不确定性校准的可信AI感知模块，部署原型车实现实时监控。

04:00

ArXiv AI

集中式与分散式联邦学习：一种性能权衡分析

用Fedstellar模拟器实验对比三种联邦学习架构，分析性能权衡。

04:00

ArXiv AI

多模态模型中模态竞争的二级多级方差校正

提出二阶优化框架ML-FOP-SOAP，多级方差校正抑制模态竞争，实现大batch稳定训练，样本效率提升1.4倍，训练加速1.5倍。

04:00

ArXiv AI

GeoGS-CE: 利用3D高斯学习延迟-波束信道先验用于高移动性场景

提出GeoGS-CE框架，用三维高斯建模散射，预测功率谱为先验，实现高移动性稀疏导频信道估计。

04:00

ArXiv AI

异构特征空间下的联邦插补

提出FedHF-Impute框架，利用全局特征图传递信息，在不重叠特征间实现跨客户端知识迁移，显著提升插补精度。

04:00

ArXiv AI

DebiasRAG：通过检索增强生成实现大语言模型公平生成的无调优路径

提出无调优动态去偏框架DebiasRAG，基于检索增强分三阶段实现公平生成，不损害模型原有能力。

04:00

ArXiv AI

动态图Transformer中的注意力分散：诊断与可迁移修复

发现动态图Transformer在时间分布偏移下注意力分散，提出差分注意力修复，新模型DiffDyG实现SOTA。

04:00

ArXiv AI

GenShield：面向AI生成图像的统一检测与伪影校正

提出GenShield统一自回归框架，实现AI图像可解释检测与伪影校正的闭环诊断修复，性能最优。

04:00

ArXiv AI

跨桥熵：流与薛定谔采样器的条件-边缘离散化

提出条件-边缘熵率调度，无需训练优化推理时间步，显著提升低预算流与桥采样器的样本质量。

04:00

ArXiv AI

代理神经网络架构协同设计包（SNAC-Pack）

SNAC-Pack开源框架，硬件感知协同设计神经架构与FPGA部署，用代理模型与压缩循环快速生成紧凑模型，大幅缩短设计时间。

04:00

ArXiv AI

几何感知的锐度最小化：导航损失景观中的坑洞

提出LLQR+SAM，用慢速学习的几何预条件器指导SAM扰动，在平坦区域稳定，在局部尖锐区域增强逃逸，优于单独方法。

04:00

ArXiv AI

无免费交换：Transformer中协议相关的层冗余

替换与互换两种协议评估Transformer层冗余时结果不一致，影响剪枝安全性，需提前诊断。

04:00

ArXiv AI

评估设计视频生成：构成保真度的度量

提出全自动评估框架，从布局、运动、时间、内容四维度衡量设计动画，避免主观评判。

04:00

ArXiv AI

IVGT：用于神经场景表征的隐式视觉几何Transformer

提出IVGT，从无位姿多视图隐式建模连续几何，支持任意3D空间查询，实现高质量几何与外观重建。

04:00

ArXiv AI

paper.json：一种面向LLM智能体可操作论文的协调规范

为LLM代理设计paper.json规范，通过JSON文件提供声明ID、声明边界和图表命令，提升论文可操作性。

04:00

ArXiv AI

AI中介的沟通能引导集体意见

AI编辑文本引入偏见，通过网络放大影响集体意见，X平台发现实例。

04:00

ArXiv AI

离线语义引导的高效视觉-语言-动作策略蒸馏

提出VLA-AD框架，利用离线语义监督将大模型蒸馏为轻量学生，模型缩小44倍，推理提速3.28倍，性能仅差0.27%。

04:00

ArXiv AI

Argus：面向可扩展深度研究智能体的证据组装

Argus通过搜索者与导航者协作，以组装证据碎片取代平行暴力搜索，显著提升深度研究智能体的可扩展性及性能。

04:00

ArXiv AI

面向智能能源基础设施的统一生成式AI框架：智能燃气分配、公用事业计费、碳分析与量子启发优化

智能计量、生成式AI与量子启发优化融合，重塑能源设施管理、客户参与及环境责任。

04:00

ArXiv AI

生成式AI框架：智能公用事业计费、CO2分析与可持续资源优化

提出端到端生成式AI框架，集成自然语言账单生成与碳排放追踪，实现负荷智能调度与资源优化。

04:00

ArXiv AI

面向AI时代的数据中心电力分层设计

AI时代数据中心功率密度激增，需优化分层设计以避免电力闲置，实现长期高效部署。

04:00

ArXiv AI

Traj-CoA：基于智能体链的患者轨迹建模用于肺癌风险预测

提出Traj-CoA多智能体系统，链式处理电子病历数据，在零样本肺癌风险预测中优于基线，实现临床对齐时间推理。

04:00

ArXiv AI

小型可泛化提示预测模型可引导大型推理模型的高效强化学习后训练

GPS方法用轻量生成模型进行贝叶斯推理，选择中等难度且多样化的提示批次，显著提升训练和测试效率。

04:00

ArXiv AI

亲爱的，我缩小了假设空间（通过逻辑预处理）

通过逻辑预处理排除无效规则，大幅缩减归纳逻辑编程的搜索空间，10秒预处理使学习时间从10小时降至2秒。

04:00

ArXiv AI

From Guidelines to Guarantees: A Graph-Based Evaluation Harness for Domain-Specific Evaluation of LLMs

04:00

ArXiv AI

QuickLAP：面向半自主代理的快速语言-动作偏好学习

QuickLAP融合语言与物理反馈实时推断奖励函数，误差降低70%以上，用户认为更易理解协作。

04:00

ArXiv AI

VideoGameBench：视觉语言模型能通关流行电子游戏吗？

提出VideoGameBench基准，测试视觉语言模型实时通关经典游戏，最佳模型仅完成0.48%。

04:00

ArXiv AI

人工智能意识与生存风险

AI意识与生存风险常被混淆，但智能才是直接威胁，意识可能正面或负面影响风险。

04:00

ArXiv AI

前沿大型语言模型媲美最先进规划器

最新一代前沿大模型在规划任务上超越最强规划器，性能随代际显著提升。

04:00

ArXiv AI

CodeDistiller：自动生成科学编码代理的代码库

自动从科学GitHub仓库蒸馏可用代码库，提升科学发现代理实验的准确性与科学性。

04:00

ArXiv AI

面向关键任务的量子人工智能：基础、架构要素与未来方向

系统性梳理QAI在关键任务系统中的基础、架构与挑战，提出资源管理框架并展望未来方向。

← 往后1 / 7往前 →