Hugging Face
Models
Datasets
Spaces
Community
Docs
Enterprise
Pricing
Log In
Sign Up
帖子、文章和讨论
New Article
分析和解读
社区动态
教程
开源协作
合作伙伴
科研相关
NLP
Audio
CV
RL
AI 伦理
扩散模型
游戏开发
Community Articles
view all
OVHcloud on Hugging Face Inference Providers 🔥
8 days ago
•
66
Norm-Preserving Biprojected Abliteration
25 days ago
•
42
Curating datasets directly on the Hub
5 days ago
•
21
Uncensor any LLM with abliteration
Jun 13, 2024
•
731
KV Caching Explained: Optimizing Transformer Inference Efficiency
Jan 30
•
187
Code a simple RAG from scratch
Oct 29, 2024
•
257
Gemini-3 Benchmarkathon
4 days ago
•
8
Building Jobly: Semantic Job Matching with RAG and Vector Embeddings
4 days ago
•
8
From GRPO to DAPO and GSPO: What, Why, and How
Aug 9
•
63
A Guide to Hugging Face’s Papers Page
7 days ago
•
7
How MCP Blockly Makes MCP Server Creation Accessible for Everyone
4 days ago
•
7
Apriel-H1: The Surprising Key to Distilling Efficient Reasoning Models
13 days ago
•
25
Building Deep Research: How we Achieved State of the Art
8 days ago
•
10
Building and evaluating Multimodal Rerankers
1 day ago
•
4
The 1 Billion Token Challenge: Finding the Perfect Pre-training Mix
29 days ago
•
46
10 Best Open-Source LLM Models (2025 Updated): Llama 4, Qwen 3 and DeepSeek R1
19 days ago
•
5
Introduction to State Space Models (SSM)
Jul 19, 2024
•
194
makeMoE: Implement a Sparse Mixture of Experts Language Model from Scratch
May 7, 2024
•
108
LLM数据工程3——数据收集魔法:获取顶级训练数据的方法
Jun 4, 2024
•
30
Model2Vec: Distill a Small Fast Model from any Sentence Transformer
Oct 14, 2024
•
99
research
time-series
使用 🤗 Transformers 进行概率时间序列预测
1
2022年12月1日
guide
expert-acceleration-program
加速 Document AI (文档智能) 发展
2022年11月21日
guide
inference
Hugging Face 提供的推理(Inference)解决方案
2022年11月21日
nlp
text generation
research
在 Transformers 中使用对比搜索生成可媲美人类水平的文本🤗
2022年11月8日
diffusers
stable-diffusion
dreambooth
使用 Diffusers 通过 Dreambooth 技术来训练 Stable Diffusion
2022年11月7日
guide
audio
使用 🤗 Transformers 为多语种语音识别任务微调 Whisper 模型
4
2022年11月3日
guide
research
open-source-collab
从 PyTorch DDP 到 Accelerate 到 Trainer,轻松掌握分布式训练
1
2022年10月21日
open-source-collab
community
research
优化故事: BLOOM 模型推理
1
2022年10月12日
research
nlp
SetFit: 高效的无提示少样本学习
+2
2022年9月26日
nlp
llm
bloom
使用 DeepSpeed 和 Accelerate 进行超快 BLOOM 模型推理
2022年9月16日
guide
nlp
如何使用 Megatron-LM 训练语言模型
2
2022年9月7日
nlp
llm
quantization
大规模 Transformer 模型 8 比特矩阵乘简介 - 基于 Hugging Face Transformers、Accelerate 以及 bitsandbytes
1
2022年8月17日
nlp
llm
千亿参数开源大模型 BLOOM 背后的技术
2
2022年7月14日
guide
使用 PyTorch 完全分片数据并行技术加速大模型训练
2022年5月2日
上一页
1
...
13
14
15
16
下一页
Community Articles
Sort: Trending
OVHcloud on Hugging Face Inference Providers 🔥
8 days ago
•
66
Norm-Preserving Biprojected Abliteration
25 days ago
•
42
Curating datasets directly on the Hub
5 days ago
•
21
Uncensor any LLM with abliteration
Jun 13, 2024
•
731
KV Caching Explained: Optimizing Transformer Inference Efficiency
Jan 30
•
187
Code a simple RAG from scratch
Oct 29, 2024
•
257
Gemini-3 Benchmarkathon
4 days ago
•
8
Building Jobly: Semantic Job Matching with RAG and Vector Embeddings
4 days ago
•
8
From GRPO to DAPO and GSPO: What, Why, and How
Aug 9
•
63
A Guide to Hugging Face’s Papers Page
7 days ago
•
7
How MCP Blockly Makes MCP Server Creation Accessible for Everyone
4 days ago
•
7
Apriel-H1: The Surprising Key to Distilling Efficient Reasoning Models
13 days ago
•
25
Building Deep Research: How we Achieved State of the Art
8 days ago
•
10
Building and evaluating Multimodal Rerankers
1 day ago
•
4
The 1 Billion Token Challenge: Finding the Perfect Pre-training Mix
29 days ago
•
46
10 Best Open-Source LLM Models (2025 Updated): Llama 4, Qwen 3 and DeepSeek R1
19 days ago
•
5
Introduction to State Space Models (SSM)
Jul 19, 2024
•
194
makeMoE: Implement a Sparse Mixture of Experts Language Model from Scratch
May 7, 2024
•
108
LLM数据工程3——数据收集魔法:获取顶级训练数据的方法
Jun 4, 2024
•
30
Model2Vec: Distill a Small Fast Model from any Sentence Transformer
Oct 14, 2024
•
99
View all articles