Parquet内容定义分块
你好,`hf`:一个更快、更友好的Hugging Face命令行工具 ✨
Hugging Face推出更快更友好的新CLI工具hf。
使用Diffusers和PEFT实现Flux的快速LoRA推理
通过Diffusers和PEFT加速Flux模型的LoRA推理
TimeScope: 你的视频大语言模型能处理多长的时间跨度?
未提供摘要内容
Gradio MCP 服务器的五大重要改进
Gradio MCP服务器迎来五大重要更新,显著提升功能与稳定性。
合议:当多个大语言模型协作时
多个LLM通过协作机制达成共识,提升决策质量与可靠性。
回到未来:评估AI代理预测未来事件的能力
该研究评估AI代理预测未来事件的表现,探讨其能力与局限。
艾廷套件:最先进的配对编码器和解码器
Kimina-Prover: 将测试时强化学习搜索应用于大型形式推理模型
提出将测试时强化学习搜索应用于大型形式推理模型,显著提升形式化证明成功率。
ScreenEnv:部署你的全栈桌面代理
ScreenEnv提供全栈桌面代理的部署方案。
异步机器人推理:解耦动作预测与执行
构建Hugging Face MCP服务器
指导用户创建Hugging Face MCP服务器。
Reachy Mini:面向当代和未来AI开发者的开源机器人
Reachy Mini是一个开源机器人,面向现在和未来的AI开发者。
为AMD MI300创建自定义内核
无可用摘要
用Gradio MCP服务器提升大语言模型的能力
通过Gradio MCP服务器,快速增强大语言模型的技能与实用性。
SmolLM3:小巧、多语言、长上下文推理模型
SmolLM3是一款面向多语言与长上下文的小型推理模型。
高效多模态数据管道
支撑Hugging Face生产基础设施的三个强大警报
Hugging Face生产基础设施依赖三个关键警报确保稳定运行。
使用Sentence Transformers训练和微调稀疏嵌入模型
讲解如何用Sentence Transformers库训练和微调稀疏嵌入模型,实现高效检索与压缩。
长提示阻塞其他请求的机制与LLM性能优化
长提示会阻塞其他请求,优化LLM性能可缓解。
5分钟学会Hugging Face Kernel Hub
快速了解Hugging Face内核中心的入门指南。
无羽毛AI 登陆 Hugging Face 推理提供商 🔥
无羽毛AI 在 Hugging Face 推理提供商上线,提供更轻量、高效的 AI 推理服务。
后训练 Isaac GR00T N1.5 用于 LeRobot SO-101 机械臂
无描述
推出训练集群即服务——与英伟达的新合作
与NVIDIA合作推出训练集群即服务。
在Arm上实时AI声音生成:个人创意自由工具
Arm平台实时生成AI声音,赋予个人创意自由。
Holo1:新的图形界面自动化视觉语言模型家族,驱动GUI代理Surfer-H
Holo1是全新GUI自动化视觉语言模型家族,为Surfer-H代理提供核心动力。
SmolVLA:基于Lerobot社区数据训练的高效视觉-语言-动作模型
基于Lerobot社区数据的高效视觉-语言-动作模型,实现多模态理解与动作生成。
不留任何GPU:在TRL中通过共置vLLM解锁效率
在TRL中使用共置vLLM,最大化GPU利用率,提升训练效率。
Dell Enterprise Hub is all you need to build AI on premises
Python中的微型智能体:一个约70行代码的MCP驱动智能体
用约70行Python代码实现一个基于MCP协议的轻量级智能体。
Falcon-H1:重新定义效率与性能的混合头语言模型家族
Falcon-H1混合头语言模型家族,重新定义效率与性能。
中文标题:Falcon-Arabic:阿拉伯语模型的突破
Falcon-Arabic实现了阿拉伯语语言模型性能的重大突破。
探索Diffusers中的量化后端
探讨Diffusers库中不同量化后端(如bitsandbytes、ONNX Runtime)的实现与效果,以优化模型推理性能。
nanoVLM:使用纯PyTorch训练你的VLM的最简仓库
最简VLM训练仓库,纯PyTorch实现