Edit Models filters

Model Tree

Apps

Docker Model Runner

Inference Providers

OVHcloud AI Endpoints

HF Inference API

Misc

Inference Endpoints

text-generation-inference

Eval Results (legacy)

text-embeddings-inference

4-bit precision

8-bit precision

Mixture of Experts

Carbon Emissions

Models

316

Base only

Active filters: fp4

nvidia/Qwen3.6-35B-A3B-NVFP4

Text Generation • 19B • Updated 5 days ago • 470k • 149

nvidia/GLM-5.1-NVFP4

Text Generation • 382B • Updated 7 days ago • 18.8k • 31

nvidia/Qwen3.5-122B-A10B-NVFP4

Text Generation • 65B • Updated about 19 hours ago • 12 • 5

nvidia/Kimi-K2.6-NVFP4

Text Generation • Updated 19 days ago • 758k • 29

AEON-7/Step-3.7-Flash-AEON-Ultimate-Abliterated-NVFP4

Image-Text-to-Text • 104B • Updated 3 days ago • 485 • 4

RedHatAI/gemma-4-31B-it-NVFP4

Image-Text-to-Text • 20B • Updated 15 days ago • 184k • 47

AEON-7/Qwen3.6-35B-A3B-heretic-NVFP4

Image-Text-to-Text • 21B • Updated 3 days ago • 91.2k • 45

sakamakismile/LFM2.5-8B-A1B-NVFP4

Text Generation • 5B • Updated 3 days ago • 582 • 3

tonera/FLUX.2-klein-9B-Nunchaku

Image-to-Image • Updated 21 days ago • 1.93k • 15

ussoewwin/Hybrid-Sensitivity-Weighted-Quantization-SDXL-fp8e4m3

Text-to-Image • Updated 3 days ago • 7

tonera/waiNSFWIllustrious_v150

Text-to-Image • Updated Jan 23 • 63 • 2

nvidia/Qwen3.5-397B-A17B-NVFP4

Text Generation • Updated Mar 30 • 851k • 98

OptimizeLLM/Qwen3.5-122B-A10B-heretic-MTP-NVFP4

Text Generation • 74B • Updated Apr 11 • 4.76k • 4

AEON-7/Gemma-4-31B-it-DECKARD-HERETIC-Uncensored-NVFP4-SVDQuant

Text Generation • 19B • Updated 3 days ago • 668 • 2

FreedomAISVR/Qwen3.6-35B-A3B-NVFP4-GGUF

Image-Text-to-Text • 35B • Updated 18 days ago • 984 • 3

OpenYourMind/Qwopus3.5-122B-A10B-Kimi-K2.6-destilled-abliterated-NVFP4

Image-Text-to-Text • 74B • Updated 10 days ago • 1.3k • 3

crushleorey/Qwopus3.6-27B-v2-NVFP4

Image-Text-to-Text • 15B • Updated 8 days ago • 6.4k • 3

TentaFlow/Bielik-1.5B-NVFP4

Text Generation • 0.9B • Updated 1 day ago • 14 • 1

dlsxj101/A.X-3.1-NVFP4

Text Generation • 18B • Updated 6 days ago • 34 • 2

mengqin1/RedidreamNSFWI1-bnb-4bit

Updated May 10, 2025 • 1

qingcheng-ai/QwQ-32B-fp4

Text Generation • 19B • Updated Jun 24, 2025 • 48 • 3

qingcheng-ai/Qwen3-32B-fp4

Text Generation • 19B • Updated May 19, 2025 • 77 • 4

qingcheng-ai/Qwen3-8B-fp4

Text Generation • 5B • Updated May 19, 2025 • 4 • 1

RedHatAI/Qwen3-30B-A3B-NVFP4

Text Generation • 17B • Updated Dec 4, 2025 • 73.8k • 2

RedHatAI/Llama-3.1-70B-Instruct-NVFP4

Text Generation • 41B • Updated Nov 21, 2025 • 435

RedHatAI/Llama-3.1-70B-Instruct-NVFP4A16

Text Generation • 41B • Updated Jun 30, 2025 • 4

RedHatAI/Qwen3-32B-NVFP4

Text Generation • 19B • Updated Nov 21, 2025 • 12.9k • 8

RedHatAI/Qwen3-32B-NVFP4A16

Text Generation • 19B • Updated Jun 30, 2025 • 82 • 2

nvidia/Qwen3-235B-A22B-NVFP4

Text Generation • 133B • Updated Jul 8, 2025 • 42.7k • 18

nvidia/Qwen3-30B-A3B-NVFP4

Text Generation • 16B • Updated Sep 10, 2025 • 51.7k • 31