14 条条目 · 49 个活跃源
2026年5月20日
04:00
arXiv cs.LG

维度平衡提升大规模时空预测性能

基于熵匹配诊断,提出维度平衡框架,压缩空间维度并延长时间窗口,提升多领域时空预测精度。

04:00
arXiv cs.LG

全循环Transformer:简单稳定循环机制

提出全循环架构与注意力注入,解决梯度振荡和残差爆炸,训练稳定至12次循环,下游性能提升13.2%。

04:00
arXiv cs.LG

面向Transformer模型压缩的鲁棒B样条解耦

提出鲁棒B样条解耦算法压缩Transformer模型,大幅减少参数且保持精度。

04:00
arXiv cs.LG

HELLoRA:面向混合专家模型的热门专家层级低秩适配

仅对高频激活专家附加LoRA,减少参数与计算,提升性能,在多个MoE模型上优于基线。

04:00
arXiv cs.LG

UCCI:面向成本最优大语言模型级联路由的校准不确定性

UCCI通过校准不确定性实现成本最优路由,降低推理成本31%,ECE从0.12降至0.03。

04:00
arXiv cs.LG

ReCrit:面向科学批判推理的转变感知强化学习

ReCrit用转变感知强化学习分解批评交互为四个象限,奖励修正与鲁棒性,惩罚谄媚,显著提升科学推理批评准确率。

04:00
arXiv cs.LG

D-PACE:用于并行推测性草稿的动态位置感知交叉熵

提出D-PACE损失,动态调整权重提升推测解码接受长度与速度,仅增2.3%训练开销。

04:00
arXiv cs.LG

基于非参数生存分析的快速变点检测器准确评估

提出KM-ARL和KM-ADD非参数估计器,通过生存分析评估变点检测,证明渐近无偏,增强对有限序列的鲁棒性。

04:00
arXiv cs.LG

基于平坦度的理论最优量化

提出基于平坦度的理论最优量化方法BDQ,有效分散异常值,在低精度量化中性能优越。

04:00
arXiv cs.LG

PROWL:基于优先遗憾驱动的世界模型学习优化

KL约束对抗训练暴露模型高错误轨迹,优先缓冲区聚焦未解决故障,提升世界模型鲁棒性。

04:00
arXiv cs.LG

基于块的双解码器

提出双因果块注意掩码架构,兼具全监督训练与高效推理,KV缓存和计算减少2/3。

04:00
arXiv cs.LG

面向前向-前向学习的自适应多尺度优度聚合

提出AMSGA改进前向-前向学习,通过多尺度优度聚合等策略,MNIST和Fashion-MNIST准确率分别提升1.45%和1.50%。

04:00
arXiv cs.LG

指令微调大语言模型中的组合文学原语:跨架构SAE特征用于自我、风格与情感

在指令微调LLM中通过稀疏自编码器发现四类文学原语特征,实现27种情感的覆盖,并揭示跨架构不对称性。

04:00
arXiv cs.LG

稳定多智能体策略学习的度量梯度投影法

HPML通过Hodge投影将联合更新场转化为度量梯度流,提升多智能体学习的稳定性和归一化回报。