全部OpenAIHugging FaceArXiv AIGoogle AIVentureBeat AIMarkTechPostPragmatic EngineerThe GradientOne Useful ThingCrunchbase NewsTechCrunchGoogle DeepMindMicrosoft ResearchLlamaIndex BlogarXiv cs.AIarXiv cs.LGarXiv cs.CLarXiv cs.CVNature Machine IntelligenceLilian WengAndrej KarpathySebastian RuderBAIR BlogAgile Lab EngineeringGoogle AI BlogMeta NewsroomMIT Tech Review AITechCrunch AIWiredFull-Stack AI EngineerAgentplexa16zSequoia CapitalY CombinatorElad GilTomasz TunguzNot BoringThe GeneralistSimon WillisonSimon Willison NewsletterLatent SpaceImport AIInterconnectsHamel HusainDAIR.AIEnterprise AI GovernanceStratecherySemiAnalysisBenedict Evans
14 条条目 · 49 个活跃源
2026年5月20日
04:00
arXiv cs.LG
维度平衡提升大规模时空预测性能
基于熵匹配诊断,提出维度平衡框架,压缩空间维度并延长时间窗口,提升多领域时空预测精度。
04:00
arXiv cs.LG
全循环Transformer:简单稳定循环机制
提出全循环架构与注意力注入,解决梯度振荡和残差爆炸,训练稳定至12次循环,下游性能提升13.2%。
04:00
arXiv cs.LG
面向Transformer模型压缩的鲁棒B样条解耦
提出鲁棒B样条解耦算法压缩Transformer模型,大幅减少参数且保持精度。
04:00
arXiv cs.LG
HELLoRA:面向混合专家模型的热门专家层级低秩适配
仅对高频激活专家附加LoRA,减少参数与计算,提升性能,在多个MoE模型上优于基线。
04:00
arXiv cs.LG
UCCI:面向成本最优大语言模型级联路由的校准不确定性
UCCI通过校准不确定性实现成本最优路由,降低推理成本31%,ECE从0.12降至0.03。
04:00
arXiv cs.LG
ReCrit:面向科学批判推理的转变感知强化学习
ReCrit用转变感知强化学习分解批评交互为四个象限,奖励修正与鲁棒性,惩罚谄媚,显著提升科学推理批评准确率。
04:00
arXiv cs.LG
D-PACE:用于并行推测性草稿的动态位置感知交叉熵
提出D-PACE损失,动态调整权重提升推测解码接受长度与速度,仅增2.3%训练开销。
04:00
arXiv cs.LG
基于非参数生存分析的快速变点检测器准确评估
提出KM-ARL和KM-ADD非参数估计器,通过生存分析评估变点检测,证明渐近无偏,增强对有限序列的鲁棒性。
04:00
arXiv cs.LG
基于平坦度的理论最优量化
提出基于平坦度的理论最优量化方法BDQ,有效分散异常值,在低精度量化中性能优越。
04:00
arXiv cs.LG
PROWL:基于优先遗憾驱动的世界模型学习优化
KL约束对抗训练暴露模型高错误轨迹,优先缓冲区聚焦未解决故障,提升世界模型鲁棒性。
04:00
arXiv cs.LG
基于块的双解码器
提出双因果块注意掩码架构,兼具全监督训练与高效推理,KV缓存和计算减少2/3。
04:00
arXiv cs.LG
面向前向-前向学习的自适应多尺度优度聚合
提出AMSGA改进前向-前向学习,通过多尺度优度聚合等策略,MNIST和Fashion-MNIST准确率分别提升1.45%和1.50%。
04:00
arXiv cs.LG
指令微调大语言模型中的组合文学原语:跨架构SAE特征用于自我、风格与情感
在指令微调LLM中通过稀疏自编码器发现四类文学原语特征,实现27种情感的覆盖,并揭示跨架构不对称性。
04:00
arXiv cs.LG
稳定多智能体策略学习的度量梯度投影法
HPML通过Hodge投影将联合更新场转化为度量梯度流,提升多智能体学习的稳定性和归一化回报。