Models

59

Full-text search

Active filters: gpu

magiccodingman/Qwen3-4B-Thinking-2507-MXFP4-Hybrid-GGUF

Text Generation • 4B • Updated Dec 3, 2025 • 35 • 1

magiccodingman/Qwen3-4B-Thinking-2507-Unsloth-MXFP4-Hybrid-GGUF

Text Generation • 4B • Updated Dec 3, 2025 • 36 • 1

magiccodingman/Qwen3-4B-Instruct-2507-Unsloth-MXFP4-Hybrid-GGUF

Text Generation • 4B • Updated Dec 3, 2025 • 109 • 2

magiccodingman/Seed-OSS-36B-Instruct-Unsloth-MXFP4-Hybrid-GGUF

Text Generation • 36B • Updated Dec 3, 2025 • 27 • 1

magiccodingman/Granite-4.0-H-350M-Unsloth-MXFP4-Hybrid-GGUF

Text Generation • 0.3B • Updated Dec 2, 2025 • 52

magiccodingman/Granite-4.0-H-1B-Unsloth-MXFP4-Hybrid-GGUF

Text Generation • 1B • Updated Dec 3, 2025 • 26

magiccodingman/Apriel-1.5-15b-Thinker-Unsloth-MXFP4-Hybrid-GGUF

Text Generation • 14B • Updated Dec 3, 2025 • 25

magiccodingman/Qwen3-VL-8B-Thinking-Unsloth-MXFP4-Hybrid-GGUF

Text Generation • 8B • Updated Dec 3, 2025 • 878 • 1

magiccodingman/Qwen3-VL-8B-Instruct-Unsloth-MXFP4-Hybrid-GGUF

Text Generation • 8B • Updated Dec 3, 2025 • 111 • 2

magiccodingman/Qwen3-VL-32B-Thinking-Unsloth-MXFP4-Hybrid-GGUF

Text Generation • 33B • Updated Dec 3, 2025 • 29

magiccodingman/Granite-4.0-H-350M-Unsloth-MagicQuant-Hybrid-GGUF

Text Generation • 0.3B • Updated Dec 3, 2025 • 81 • 1

magiccodingman/Qwen3-4B-Instruct-2507-Unsloth-MagicQuant-Hybrid-GGUF

Text Generation • 4B • Updated Dec 5, 2025 • 370 • 8

magiccodingman/Qwen3-4B-Thinking-2507-Unsloth-MagicQuant-Hybrid-GGUF

Text Generation • 4B • Updated Dec 5, 2025 • 319 • 2

magiccodingman/Qwen3-30B-A3B-Thinking-2507-unsloth-MagicQuant-Hybrid-GGUF

Text Generation • 31B • Updated Dec 5, 2025 • 173 • 5

magiccodingman/Qwen3-30B-A3B-Instruct-2507-unsloth-MagicQuant-Hybrid-GGUF

Text Generation • 31B • Updated Dec 6, 2025 • 106 • 4

magiccodingman/Seed-OSS-36B-Instruct-unsloth-MagicQuant-Hybrid-GGUF

Text Generation • 36B • Updated Dec 8, 2025 • 341 • 10

magiccodingman/Apriel-1.5-15b-Thinker-unsloth-MagicQuant-Hybrid-GGUF

Text Generation • 14B • Updated Dec 16, 2025 • 237 • 2

Stan31/quantumflow-prototypes

Updated Dec 19, 2025

Jong-Seong/qwen3-next-gb10-guide

Hellohal2064/vllm-dgx-spark-gb10

Text Generation • Updated Jan 6 • 3

Jens-Duttke/DepthPro-ONNX-HighPerf

Depth Estimation • Updated Jan 30 • 27 • 1

wekkel/Qwen3-32B-Instruct-DirectML-INT4

Text Generation • Updated Jan 17 • 5

raipolymath/triton-windows

Updated Jan 23 • 1

mahwizzzz/ur_int8_ct2

Updated Feb 17 • 10

Jay0515/onnxruntime-gpu-aarch64-cuda13-sm121

Other • Updated Mar 16 • 4

WeilJimmer/onnxruntime-gpu-aarch64-cuda13-sm121

Other • Updated 12 days ago

Qanatpharma/tensorflow-2.21.0-cuda13-aarch64

Updated 8 days ago

AEON-7/Gemma-4-31B-it-DECKARD-HERETIC-Uncensored-NVFP4-SVDQuant

Text Generation • 19B • Updated 5 days ago • 217

cahlen/bigcompute-cuda-kernels

Other • Updated 2 days ago