Models

202

Full-text search

Active filters: cuda

prism-ml/Bonsai-8B-gguf

Text Generation • 8B • Updated 23 days ago • 51.2k • 691

prism-ml/Bonsai-4B-gguf

Text Generation • 4B • Updated 23 days ago • 8.59k • 42

prism-ml/Bonsai-1.7B-gguf

Text Generation • 2B • Updated 23 days ago • 15.8k • 72

atomicmilkshake/llama-cpp-turboquant-binaries

Updated Apr 8 • 8

Prince-1/sarvam-m-onnx

Updated Jun 14, 2025 • 1

ussoewwin/Flash-Attention-2_for_Windows

Updated Mar 28 • 95

dougeeai/llama-cpp-python-wheels

Updated Nov 9, 2025 • 9

Hellohal2064/vllm-dgx-spark-gb10

Text Generation • Updated Jan 6 • 4

Multilingual-Multimodal-NLP/IndustrialCoder

Text Generation • 32B • Updated Mar 27 • 341 • 61

groxaxo/s2-pro-BnB-4Bits

Text-to-Speech • Updated Mar 25 • 264 • 4

elinas/chronos-13b-4bit

Text Generation • Updated Jun 23, 2023 • 14 • 23

CalderaAI/13B-Ouroboros-GPTQ4bit-128g-CUDA

Text Generation • Updated Jul 20, 2023 • 12

marcorez8/llama-cpp-python-windows-blackwell-cuda

Updated Jun 2, 2025 • 4

ValiantLabs/Qwen3-8B-ShiningValiant3

Text Generation • 8B • Updated Dec 9, 2025 • 25 • 3

mradermacher/Qwen3-8B-ShiningValiant3-GGUF

8B • Updated Jul 8, 2025 • 3.49k • 2

mradermacher/Qwen3-8B-ShiningValiant3-i1-GGUF

8B • Updated Jul 11, 2025 • 2.33k • 2

ValiantLabs/Qwen3-1.7B-ShiningValiant3

Text Generation • 2B • Updated Dec 9, 2025 • 9 • • 5

mradermacher/Qwen3-1.7B-ShiningValiant3-GGUF

2B • Updated Jul 11, 2025 • 120

mradermacher/Qwen3-1.7B-ShiningValiant3-i1-GGUF

2B • Updated Jul 11, 2025 • 340

ValiantLabs/Qwen3-4B-ShiningValiant3

Text Generation • 4B • Updated Dec 9, 2025 • 15 • • 7

sequelbox/Qwen3-8B-PlumEsper

Text Generation • 8B • Updated Jul 14, 2025 • 5

sequelbox/Qwen3-4B-PlumEsper

Text Generation • 4B • Updated Jul 15, 2025 • 3

mradermacher/Qwen3-Shining-Lucy-CODER-3.5B-Brainstorm20x-e32-GGUF

3B • Updated Jul 27, 2025 • 222 • 2

mradermacher/Qwen3-Shining-Lucy-CODER-2.4B-mix2-GGUF

2B • Updated Jul 27, 2025 • 89

mradermacher/Qwen3-Shining-Lucy-CODER-2.4B-GGUF

2B • Updated Jul 27, 2025 • 154

mradermacher/Qwen3-Shining-Lucy-CODER-2.4B-mix2-i1-GGUF

2B • Updated Dec 18, 2025 • 443 • 1

mradermacher/Qwen3-Shining-Lucy-CODER-2.4B-i1-GGUF

2B • Updated Dec 18, 2025 • 159

mradermacher/Qwen3-Shining-Lucy-CODER-3.5B-Brainstorm20x-e32-i1-GGUF

3B • Updated Dec 18, 2025 • 234 • 1

mradermacher/Qwen3-Shining-Valiant-Instruct-Fast-CODER-Reasoning-2.4B-GGUF

2B • Updated Jul 31, 2025 • 108

mradermacher/Qwen3-Shining-Valiant-Instruct-Fast-CODER-Reasoning-2.4B-i1-GGUF

2B • Updated Dec 25, 2025 • 191