Aura · 时间线

HuggingFace中的PatchTSMixer

PatchTSMixer是一种高效的时间序列预测模型，现已集成至HuggingFace，便于使用和部署。

使用🤗 Transformers微调W2V2-Bert实现低资源语音识别

利用Transformers库微调W2V2-Bert模型，提升低资源ASR性能。

2024年1月18日

21:05

人工智能研究的宏观图景

概述EMNLP 2023上“大图景”研讨会的主要内容。

使用直接偏好优化方法对大语言模型进行偏好微调

直接偏好优化微调LLM，无需强化学习，高效对齐模型偏好。

2024年1月15日

加速SD Turbo和SDXL Turbo推理：使用ONNX Runtime和Olive

无摘要内容

2024年1月14日

使用Gradio在Hugging Face Spaces上免费运行ComfyUI工作流

在HF Spaces用Gradio免费运行ComfyUI工作流

2024年1月13日

18:12

深度学习用于单细胞测序：观察细胞多样性的显微镜

深度学习是推动单细胞测序技术发展的关键，揭示了细胞多样性。

2024年1月12日

搭建你自己的 Hugging Face 排行榜指南：以 Vectara 的幻觉排行榜为例的端到端示例

未提供摘要

2024年1月10日

使用Unsloth和🤗 TRL使LLM微调速度提升2倍

利用Unsloth和TRL框架，LLM微调速度翻倍。

2024年1月4日

欢迎aMUSEd：高效的文本到图像生成

高效文本到图像生成模型，旨在快速、高质量地生成图像。

2024年1月2日

全世界的LoRA训练脚本，联合起来！

呼吁全球LoRA训练脚本统一联合，以提升效率与协作。

2023年12月20日

推测解码实现Whisper推理速度翻倍

通过推测解码技术，在不损失质量的情况下将Whisper模型推理速度提升2倍。

2023年12月19日

20:48

大语言模型时代的NLP研究

探讨计算资源是NLP研究的主要限制，并强调五个无需大量算力的研究方向。

2023年12月18日

2023：开源大语言模型之年

2023年12月16日

17:00

回路中的鲑鱼

探讨鱼类计数在数字化转型中的复杂社会技术问题。

2023年12月11日

欢迎Mixtral——Hugging Face上最先进的混合专家模型

Hugging Face推出Mixtral，采用混合专家架构，达到最先进性能。

混合专家模型详解

MoE通过动态选择专家子集，平衡模型容量与计算效率，是高效大模型的关键架构。

2023年12月6日

SetFitABSA：基于SetFit的小样本方面级情感分析

无摘要

2023年12月5日

20:29

EMNLP 2023 概述

概述EMNLP 2023论文，涵盖问答、指令微调、任务适应、NLG评估及多语言模型与数据集。

16:52

Altimeter的Brad Gerstner谈宏观、科技与初创企业

Altimeter的Brad Gerstner在炉边谈话中讨论宏观、科技与初创企业。

告别冷启动：我们如何将LoRA推理速度提升300%

通过解决冷启动问题，LoRA推理速度提升三倍。

Optimum-NVIDIA：仅需一行代码即可实现极速LLM推理

一行代码解锁极速LLM推理

AMD + 🤗：大语言模型在AMD GPU上的开箱即用加速

AMD与Hugging Face合作推出基于AMD GPU的大语言模型加速方案，实现便捷高效推理。

2023年12月4日

22:25

资本高效型企业

全球巨头多从资本高效起步。

2023年12月1日

22:33

NeurIPS 2023 概览

综述20篇NeurIPS 2023大语言模型相关论文。

16:46

视频与文字记录：Apoorva Metha，Instacart创始人兼前CEO

Apoorva Metha炉边聊天的完整视频与文字记录。

开放LLM排行榜：DROP深度解析

深入分析DROP基准测试，评估大语言模型推理能力。

2023年11月15日

20:03

指令微调数据概览

介绍常用指令微调数据集、数据特征及使用最佳实践。

2023年11月9日

使用潜在一致性LoRA实现4步SDXL

利用潜在一致性LoRA将SDXL采样压缩至4步，大幅提速。

2023年11月8日

13:43

微软CEO萨提亚·纳德拉的炉边谈话

微软CEO纳德拉在Stripe的炉边谈话视频与文字记录。

2023年11月7日

比较LLM性能：深入探讨Roberta、Llama 2和Mistral在灾难推文分析中结合Lora的表现

比较三种大模型结合Lora在灾难推文分析中的性能差异。

介绍Prodigy-HF：与Hugging Face的直接集成

Prodigy-HF实现与Hugging Face的直连，简化模型训练与部署。

借助AWS Inferentia2，让您的Llama模型生成速度飞升

利用AWS Inferentia2加速Llama模型推理，大幅提升生成效率。

2023年11月3日

在HF Hub上引入存储区域

HF Hub新增存储区域功能，提升数据管理效率。

2023年10月27日

个人副驾驶：训练你自己的编码助手

训练专属编程助手，提升编码效率与个性化体验。

2023年10月25日

Lilian Weng

对大型语言模型的对抗性攻击

大语言模型虽经对齐确保安全，但仍面临对抗攻击和越狱提示风险，文本攻击因梯度缺失更具挑战。

用一行代码交互式探索你的Huggingface数据集

一行代码即可交互式探索Huggingface数据集，提升数据分析效率。

2023年10月24日

探索SDXL的简单优化方法

未提供摘要内容，请补充。

部署嵌入模型与Hugging Face推理端点

利用Hugging Face推理端点快速部署嵌入模型，简化AI应用流程。

基于PPO的RLHF的N个实现细节

RLHF与PPO实现中的N个关键技术细节

2023年10月19日

Gradio-Lite: 完全在浏览器中运行的无服务器Gradio

在浏览器中无服务器运行Gradio，无需后端，轻量便捷。

2023年10月14日

15:30

神经算法推理

探索将经典算法与神经网络结合，实现可学习、可泛化的推理过程。

2023年10月7日

16:00

The Artificiality of Alignment

2023年10月4日

使用ONNX Runtime加速超过13万个Hugging Face模型

ONNX Runtime优化了超13万Hugging Face模型，推理速度显著提升。

2023年10月3日

聊天模板：终结沉默性能杀手

聊天模板有效消除AI对话中隐藏的性能瓶颈问题，提升响应效率。

🧨 使用JAX在Cloud TPU v5e上加速Stable Diffusion XL推理

利用JAX和TPU v5e显著加速SDXL推理性能。

2023年10月2日

使用推理API部署AI漫画工厂

通过API快速部署，实现AI漫画生成。

2023年9月29日

使用DDPO通过TRL微调Stable Diffusion模型

无摘要内容

伦理与社会通讯第5期：Hugging Face前往华盛顿及其他2023年夏季思考

本期探讨Hugging Face在华盛顿的活动及2023年夏季AI伦理与社会议题。

2023年9月28日