Ken3.5-9B-GGUF

Q8_0 GGUF quantization of Ken3.5-9B (Qwen3.5-9B fine-tuned on Ken instruct data).

Usage

llama-server -m Ken3.5-9B-Q8_0.gguf -ngl 99 -c 4096

GGUF

Model size

9B params

Architecture

qwen35

Hardware compatibility

8-bit

Inference Providers NEW

This model isn't deployed by any Inference Provider. 🙋 Ask for provider support

Base model

Finetuned

Quantized

(77)

this model