Quanto:Optimum的PyTorch量化后端
Quanto为Optimum提供PyTorch量化后端,简化模型量化流程。
在NVIDIA DGX Cloud上使用H100 GPU轻松训练模型
未提供摘要内容
CPU Optimum Intel 与 fastRAG 优化嵌入
在CPU上利用英特尔优化工具和fastRAG高效生成嵌入向量。
解锁将网页截图转换为HTML代码:WebSight数据集的应用
利用WebSight数据集,实现网页截图到HTML代码的高效转换,为自动化前端开发提供数据支持。
文本嵌入能否完美编码文本?
Vec2text可准确还原嵌入为文本,急需重新审视嵌入数据安全。
介绍ConTextual:多模态模型在文本丰富场景中的图文联合推理能力如何?
ConTextual评估多模态模型在文本丰富场景中的图文联合推理能力。
为生成式AI解锁第三维度(第一部分)
探讨生成式AI突破二维局限,拓展三维创作的核心技术与未来方向。
数据协同更优:利用 Argilla 和 Hugging Face Spaces 赋能社区共建更优数据集
社区借助Argilla和Hugging Face Spaces协作,共同构建更优质的数据集。
使用llama-index-networks查询知识网络
真正的零样本机器翻译
讨论长上下文基准、零样本机器翻译及教LLM新语言的方法。
LlamaIndex 2024年2月27日新闻简报
LlamaIndex 2月27日简报:展示最新特性与改进。
TTS竞技场:在真实环境中评估文本转语音模型
在真实场景中系统评测TTS模型的基准平台。
为什么我的模型不起作用?
模型在真实数据上惨败?你不是一个人。
中文标题:弥合危机咨询的鸿沟:介绍咨询师副驾
摘要:通过引入Counselor Copilot,弥合危机咨询中的鸿沟,提升服务质量。
中文标题
推出红队对抗能力排行榜,评估AI模型防御鲁棒性。
在 Hugging Face 中微调 Gemma 模型
介绍如何在 Hugging Face 框架下对 Gemma 模型进行参数微调。
🪆 套娃式嵌入模型入门
套娃嵌入模型的多层级向量表示,实现灵活调整维度,平衡精度与效率。
关于AI我所不知道的事
越了解AI市场,越感到无知,于是列出问题与思考。
欢迎Gemma——谷歌全新开源大语言模型
谷歌发布开源大语言模型Gemma。
LlamaIndex 2024年2月20日新闻简报:LlamaCloud 正式登场
本期简报正式推出LlamaCloud云服务平台,提升数据索引和检索效率。
LlamaCloud与LlamaParse简介
推出LlamaCloud和LlamaParse两大新服务。
介绍Open Ko-LLM排行榜:引领韩国LLM评估生态系统
介绍韩语LLM评估新标杆,推动生态发展。
基于LlamaIndex和LanceDB的多模态RAG高级视频处理
利用LlamaIndex和LanceDB构建多模态RAG,实现高级视频分析处理。
合成数据:通过开源节省资金、时间和碳
开源合成数据能大幅降低金钱、时间和碳排放成本。
LlamaIndex v0.10
LlamaIndex v0.10版本发布,带来多项更新。
关于2024年AI就业市场的思考
本文讨论2024年AI就业市场的宏观趋势及作者加入新公司的原因。
NPHardEval排行榜:通过复杂度类别与动态更新揭示大语言模型的推理能力
通过复杂度类别和动态更新,发布NPHardEval排行榜,评估大模型推理能力。
宪法AI与开放大语言模型
未提供摘要,无法提炼。
Hugging Face文本生成推理现可用于AWS Inferentia2
Hugging Face推理服务支持AWS Inferentia2,加速文本生成。