HuggingFace中的PatchTSMixer
PatchTSMixer是一种高效的时间序列预测模型,现已集成至HuggingFace,便于使用和部署。
使用🤗 Transformers微调W2V2-Bert实现低资源语音识别
利用Transformers库微调W2V2-Bert模型,提升低资源ASR性能。
人工智能研究的宏观图景
概述EMNLP 2023上“大图景”研讨会的主要内容。
使用直接偏好优化方法对大语言模型进行偏好微调
直接偏好优化微调LLM,无需强化学习,高效对齐模型偏好。
使用Gradio在Hugging Face Spaces上免费运行ComfyUI工作流
在HF Spaces用Gradio免费运行ComfyUI工作流
2023:开源大语言模型之年
欢迎Mixtral——Hugging Face上最先进的混合专家模型
Hugging Face推出Mixtral,采用混合专家架构,达到最先进性能。
混合专家模型详解
MoE通过动态选择专家子集,平衡模型容量与计算效率,是高效大模型的关键架构。
EMNLP 2023 概述
概述EMNLP 2023论文,涵盖问答、指令微调、任务适应、NLG评估及多语言模型与数据集。
Altimeter的Brad Gerstner谈宏观、科技与初创企业
Altimeter的Brad Gerstner在炉边谈话中讨论宏观、科技与初创企业。
告别冷启动:我们如何将LoRA推理速度提升300%
通过解决冷启动问题,LoRA推理速度提升三倍。
Optimum-NVIDIA:仅需一行代码即可实现极速LLM推理
一行代码解锁极速LLM推理
AMD + 🤗:大语言模型在AMD GPU上的开箱即用加速
AMD与Hugging Face合作推出基于AMD GPU的大语言模型加速方案,实现便捷高效推理。
资本高效型企业
全球巨头多从资本高效起步。
NeurIPS 2023 概览
综述20篇NeurIPS 2023大语言模型相关论文。
视频与文字记录:Apoorva Metha,Instacart创始人兼前CEO
Apoorva Metha炉边聊天的完整视频与文字记录。
开放LLM排行榜:DROP深度解析
深入分析DROP基准测试,评估大语言模型推理能力。
比较LLM性能:深入探讨Roberta、Llama 2和Mistral在灾难推文分析中结合Lora的表现
比较三种大模型结合Lora在灾难推文分析中的性能差异。
介绍Prodigy-HF:与Hugging Face的直接集成
Prodigy-HF实现与Hugging Face的直连,简化模型训练与部署。
借助AWS Inferentia2,让您的Llama模型生成速度飞升
利用AWS Inferentia2加速Llama模型推理,大幅提升生成效率。
对大型语言模型的对抗性攻击
大语言模型虽经对齐确保安全,但仍面临对抗攻击和越狱提示风险,文本攻击因梯度缺失更具挑战。
用一行代码交互式探索你的Huggingface数据集
一行代码即可交互式探索Huggingface数据集,提升数据分析效率。
探索SDXL的简单优化方法
未提供摘要内容,请补充。
部署嵌入模型与Hugging Face推理端点
利用Hugging Face推理端点快速部署嵌入模型,简化AI应用流程。
基于PPO的RLHF的N个实现细节
RLHF与PPO实现中的N个关键技术细节
使用ONNX Runtime加速超过13万个Hugging Face模型
ONNX Runtime优化了超13万Hugging Face模型,推理速度显著提升。
聊天模板:终结沉默性能杀手
聊天模板有效消除AI对话中隐藏的性能瓶颈问题,提升响应效率。
🧨 使用JAX在Cloud TPU v5e上加速Stable Diffusion XL推理
利用JAX和TPU v5e显著加速SDXL推理性能。