Aura · arXiv cs.LG

14 条条目 · 49 个活跃源

2026年5月20日

04:00

arXiv cs.LG

维度平衡提升大规模时空预测性能

基于熵匹配诊断，提出维度平衡框架，压缩空间维度并延长时间窗口，提升多领域时空预测精度。

04:00

arXiv cs.LG

全循环Transformer：简单稳定循环机制

提出全循环架构与注意力注入，解决梯度振荡和残差爆炸，训练稳定至12次循环，下游性能提升13.2%。

04:00

arXiv cs.LG

面向Transformer模型压缩的鲁棒B样条解耦

提出鲁棒B样条解耦算法压缩Transformer模型，大幅减少参数且保持精度。

04:00

arXiv cs.LG

HELLoRA：面向混合专家模型的热门专家层级低秩适配

仅对高频激活专家附加LoRA，减少参数与计算，提升性能，在多个MoE模型上优于基线。

04:00

arXiv cs.LG

UCCI：面向成本最优大语言模型级联路由的校准不确定性

UCCI通过校准不确定性实现成本最优路由，降低推理成本31%，ECE从0.12降至0.03。

04:00

arXiv cs.LG

ReCrit：面向科学批判推理的转变感知强化学习

ReCrit用转变感知强化学习分解批评交互为四个象限，奖励修正与鲁棒性，惩罚谄媚，显著提升科学推理批评准确率。

04:00

arXiv cs.LG

D-PACE：用于并行推测性草稿的动态位置感知交叉熵

提出D-PACE损失，动态调整权重提升推测解码接受长度与速度，仅增2.3%训练开销。

04:00

arXiv cs.LG

基于非参数生存分析的快速变点检测器准确评估

提出KM-ARL和KM-ADD非参数估计器，通过生存分析评估变点检测，证明渐近无偏，增强对有限序列的鲁棒性。

04:00

arXiv cs.LG

基于平坦度的理论最优量化

提出基于平坦度的理论最优量化方法BDQ，有效分散异常值，在低精度量化中性能优越。

04:00

arXiv cs.LG

PROWL：基于优先遗憾驱动的世界模型学习优化

KL约束对抗训练暴露模型高错误轨迹，优先缓冲区聚焦未解决故障，提升世界模型鲁棒性。

04:00

arXiv cs.LG

基于块的双解码器

提出双因果块注意掩码架构，兼具全监督训练与高效推理，KV缓存和计算减少2/3。

04:00

arXiv cs.LG

面向前向-前向学习的自适应多尺度优度聚合

提出AMSGA改进前向-前向学习，通过多尺度优度聚合等策略，MNIST和Fashion-MNIST准确率分别提升1.45%和1.50%。

04:00

arXiv cs.LG

指令微调大语言模型中的组合文学原语：跨架构SAE特征用于自我、风格与情感

在指令微调LLM中通过稀疏自编码器发现四类文学原语特征，实现27种情感的覆盖，并揭示跨架构不对称性。

04:00

arXiv cs.LG

稳定多智能体策略学习的度量梯度投影法

HPML通过Hodge投影将联合更新场转化为度量梯度流，提升多智能体学习的稳定性和归一化回报。