AI Models

186 models · 18 new in 60d

Compare →

Live

Sort

Newest A→Z

Type

All Flagship Small Reasoning Code Embedding Image Video Vision Audio function-calling local AI multimodal

License

All Open Closed

Gemma 4 31B DenseOpen
Google · 256K tokens · self-host
▾
Best for: Self-hosted multimodal production, commercial use, multilingual apps
How: Dense 31B — fits on a single A100 or 2x RTX 4090. Apache 2.0 = fully commercial. Supports images and video natively.
Example: Deploy as a private multimodal assistant that reads screenshots, logs, and video clips.
LMSYS Arena #3 textMMLU ~82%
multimodalimages + video35+ languagesApache 2.0dense architecture
Hardware to self-host
VRAM: 20GB (quantized) / 62GB (FP16)
GPU: 1× A100 80GB or 2× RTX 4090 24GB
RAM: 32GB+ system RAM
31B dense. Native multimodal (images + video) increases compute cost vs text-only.
API: Ollama, vLLM, Hugging Face, Vertex AI. ollama run gemma4:31b
Brand new (Apr 2026). Ranked #3 on LMSYS Arena text leaderboard at launch.
DeepSeek V3.2Open
DeepSeek · 164K tokens · self-host
▾
Best for: Long-context coding, upgraded V3 deployments
How: Drop-in upgrade from V3. Uses Dynamic Sparse Attention for better long-context performance.
Example: Feed your entire microservice codebase and get cross-service dependency analysis.
HumanEval 94.0%
codingmathsparse attention (DSA)MIT licenseimproved context
Hardware to self-host
VRAM: 350GB (quantized)
GPU: 8× H100 80GB
RAM: 512GB+ system RAM
Same hardware footprint as V3 — 671B with sparse attention.
API: api.deepseek.com OR self-host via vLLM. Same OpenAI-compatible API.
Mistral Large 3Open
Mistral · 256K tokens · self-host
▾
Best for: European deployments, agent workflows, long-context multilingual apps
How: Major upgrade from Large 2. MoE architecture with 41B active params. Same API, just change model ID.
Example: Build a multi-tool agent that queries DBs, calls APIs, and generates reports in 30+ languages.
MoE 41B active / 675B totalmultilingualfunction calling256K context
Hardware to self-host
VRAM: 350GB (quantized)
GPU: 8× H100 80GB
RAM: 512GB+ system RAM
675B MoE (41B active). Datacenter class — most users go via api.mistral.ai.
API: api.mistral.ai OR self-host via vLLM. OpenAI-compatible.
Llama 4 MaverickOpen
Meta · 1M tokens · self-host
▾
Best for: Self-hosted production deployments, privacy-sensitive workloads
How: ollama run llama4-maverick OR deploy on vLLM with tensor parallelism. Also available hosted on Together/Groq.
Example: Deploy on 2x A100 GPUs behind your API gateway for private code review.
MMLU 88.4%HumanEval 84.8%
multilingualmultimodalMoE architecture17B active / 400B total
Hardware to self-host
VRAM: 200GB (quantized)
GPU: 2× H100 80GB or 4× A100 80GB
RAM: 256GB system RAM
400B total params (17B active). FP16 needs ~800GB, FP8 ~400GB, INT4 ~200GB.
API: Self-host via vLLM, Ollama, or use via Together, Fireworks, Groq
Llama 4 ScoutOpen
Meta · 10M tokens · self-host
▾
Best for: Processing entire codebases, very long documents, single-GPU deployments
How: Fits on a single H100. Best open model for extreme context lengths.
Example: Feed your entire monorepo into context and ask about cross-service dependencies.
MMLU 86.2%
longest context (10M)MoE 17B active / 109B totalfits single H100
Hardware to self-host
VRAM: 80GB
GPU: 1× H100 80GB
RAM: 128GB system RAM
17B active params, fits in a single H100 at FP8.
API: Same as Maverick — vLLM, Ollama, Together, Fireworks
Qwen 3 235BOpen
Alibaba · 128K tokens · self-host
▾
Best for: Flexible thinking control, commercial self-hosting, multilingual
How: Supports /think and /no_think tags to toggle reasoning on/off per request. Apache 2.0 = fully commercial.
Example: Use /no_think for fast classification, /think for complex debugging — same model.
AIME 2024 85.7%HumanEval 90.2%
hybrid thinkingMoE 22B activeApache 2.0multilingual
Hardware to self-host
VRAM: 140GB (quantized)
GPU: 4× A100 80GB or 2× H100
RAM: 256GB+ system RAM
235B total (22B active). MoE architecture — only 22B params active per forward pass.
API: Self-host via vLLM/SGLang or use via Together, Fireworks. Also on Alibaba Cloud.
Llama 3.3 70BOpen
Meta · 128K tokens · self-host
▾
Best for: Proven workhorse for self-hosted deployments, fine-tuning base
How: ollama run llama3.3:70b. For production: vLLM on 2x A100 or 4x A10G.
Example: Fine-tune on your internal docs for a private knowledge base chatbot.
MMLU 86.0%HumanEval 88.4%
mature ecosystemfine-tuning friendlywide hardware support
Hardware to self-host
VRAM: 40GB (4-bit) / 140GB (FP16)
GPU: 2× A100 80GB or 4× A10G 24GB
RAM: 64GB+ system RAM
70B dense. Widely supported — runs on Ollama with quantization on 48GB VRAM.
API: Ollama, vLLM, TGI, or hosted (Together $0.60/M, Groq, Fireworks)
DeepSeek V3Open
DeepSeek · 128K tokens · self-host
▾
Best for: Cost-sensitive production APIs, coding tasks, math-heavy pipelines
How: Cheapest top-tier API. OpenAI-compatible. Self-host needs 8x A100.
Example: Replace GPT-4 in your CI pipeline for automated code review at 1/10th the cost.
HumanEval 92.1%MMLU 88.5%
codingmathMoE 37B active / 671B totalMIT license
Hardware to self-host
VRAM: 350GB (quantized) / 1.3TB (FP16)
GPU: 8× H100 80GB or 8× A100 80GB
RAM: 512GB+ system RAM
671B total (37B active). Most users rent via API — self-hosting needs datacenter hardware.
API: api.deepseek.com ($0.27/M in, $1.10/M out) OR self-host
FastContext 1.0 4B SFTNewOpen
microsoft · self-host
▾
Best for: Trending on HuggingFace (114 likes this week)
How: Available on Hugging Face.
Example: from transformers import AutoModelForCausalLM; model = AutoModelForCausalLM.from_pretrained("microsoft/FastContext-1.0-4B-SFT")
transformerssafetensorsqwen3text-generationExplorer SubAgent
API: huggingface.co/microsoft/FastContext-1.0-4B-SFT
Auto-discovered from HuggingFace trending. 114 likes, 13 downloads.
MiMo V2.5 Pro FP4 DFlashNewOpen
XiaomiMiMo · self-host
▾
Best for: Trending on HuggingFace (115 likes this week)
How: Available on Hugging Face.
Example: from transformers import AutoModelForCausalLM; model = AutoModelForCausalLM.from_pretrained("XiaomiMiMo/MiMo-V2.5-Pro-FP4-DFlash")
transformerssafetensorsmimo_v2text-generationagent
API: huggingface.co/XiaomiMiMo/MiMo-V2.5-Pro-FP4-DFlash
Auto-discovered from HuggingFace trending. 115 likes, 4K downloads.
Gemma 4 12B Coder Fable5 Composer2.5 V1 GGUFNewOpen
yuxinlu1 · self-host
▾
Best for: Trending on HuggingFace (736 likes this week)
How: Available on Hugging Face. 20K downloads.
Example: from transformers import AutoModelForCausalLM; model = AutoModelForCausalLM.from_pretrained("yuxinlu1/gemma-4-12B-coder-fable5-composer2.5-v1-GGUF")
ggufgemma4codingcodereasoning
API: huggingface.co/yuxinlu1/gemma-4-12B-coder-fable5-composer2.5-v1-GGUF
Auto-discovered from HuggingFace trending. 736 likes, 20K downloads.
Nex N2 MiniNewOpen
nex-agi · self-host
▾
Best for: Trending on HuggingFace (220 likes this week)
How: Available on Hugging Face.
Example: from transformers import AutoModelForCausalLM; model = AutoModelForCausalLM.from_pretrained("nex-agi/Nex-N2-mini")
transformerssafetensorsqwen3_5_moeimage-text-to-texttext-generation
API: huggingface.co/nex-agi/Nex-N2-mini
Auto-discovered from HuggingFace trending. 220 likes, 8K downloads.
Gemma 4 12B OBLITERATEDNewOpen
OBLITERATUS · self-host
▾
Best for: Trending on HuggingFace (326 likes this week)
How: Available on Hugging Face. 71K downloads.
Example: from transformers import AutoModelForCausalLM; model = AutoModelForCausalLM.from_pretrained("OBLITERATUS/Gemma-4-12B-OBLITERATED")
transformerssafetensorsggufgemma4_unifiedimage-text-to-text
API: huggingface.co/OBLITERATUS/Gemma-4-12B-OBLITERATED
Auto-discovered from HuggingFace trending. 326 likes, 71K downloads.
Nex N2 ProNewOpen
nex-agi · self-host
▾
Best for: Trending on HuggingFace (288 likes this week)
How: Available on Hugging Face.
Example: from transformers import AutoModelForCausalLM; model = AutoModelForCausalLM.from_pretrained("nex-agi/Nex-N2-Pro")
transformerssafetensorsqwen3_5_moeimage-text-to-texttext-generation
API: huggingface.co/nex-agi/Nex-N2-Pro
Auto-discovered from HuggingFace trending. 288 likes, 4K downloads.
North Mini Code 1.0NewOpen
CohereLabs · self-host
▾
Best for: Trending on HuggingFace (394 likes this week)
How: Available on Hugging Face. 11K downloads.
Example: from transformers import AutoModelForCausalLM; model = AutoModelForCausalLM.from_pretrained("CohereLabs/North-Mini-Code-1.0")
transformerssafetensorscohere2_moetext-generationconversational
API: huggingface.co/CohereLabs/North-Mini-Code-1.0
Auto-discovered from HuggingFace trending. 394 likes, 11K downloads.
NVIDIA Nemotron 3 Ultra 550B A55B NVFP4NewOpen
nvidia · self-host
▾
Best for: Trending on HuggingFace (160 likes this week)
How: Available on Hugging Face. 91K downloads.
Example: from transformers import AutoModelForCausalLM; model = AutoModelForCausalLM.from_pretrained("nvidia/NVIDIA-Nemotron-3-Ultra-550B-A55B-NVFP4")
transformerssafetensorsnemotron_htext-generationnvidia
API: huggingface.co/nvidia/NVIDIA-Nemotron-3-Ultra-550B-A55B-NVFP4
Auto-discovered from HuggingFace trending. 160 likes, 91K downloads.
NVIDIA Nemotron 3 Ultra 550B A55B BF16NewOpen
nvidia · self-host
▾
Best for: Trending on HuggingFace (189 likes this week)
How: Available on Hugging Face. 59K downloads.
Example: from transformers import AutoModelForCausalLM; model = AutoModelForCausalLM.from_pretrained("nvidia/NVIDIA-Nemotron-3-Ultra-550B-A55B-BF16")
transformerssafetensorsnemotron_htext-generationnvidia
API: huggingface.co/nvidia/NVIDIA-Nemotron-3-Ultra-550B-A55B-BF16
Auto-discovered from HuggingFace trending. 189 likes, 59K downloads.
Mellum2 12B A2.5B ThinkingNewOpen
JetBrains · self-host
▾
Best for: Trending on HuggingFace (274 likes this week)
How: Available on Hugging Face. 18K downloads.
Example: from transformers import AutoModelForCausalLM; model = AutoModelForCausalLM.from_pretrained("JetBrains/Mellum2-12B-A2.5B-Thinking")
transformerssafetensorsmellumtext-generationconversational
API: huggingface.co/JetBrains/Mellum2-12B-A2.5B-Thinking
Auto-discovered from HuggingFace trending. 274 likes, 18K downloads.
Qwen3.6 35B A3B NVFP4NewOpen
nvidia · self-host
▾
Best for: Trending on HuggingFace (193 likes this week)
How: Available on Hugging Face. 822K downloads.
Example: from transformers import AutoModelForCausalLM; model = AutoModelForCausalLM.from_pretrained("nvidia/Qwen3.6-35B-A3B-NVFP4")
Model Optimizersafetensorsqwen3_5_moenvidiaModelOpt
API: huggingface.co/nvidia/Qwen3.6-35B-A3B-NVFP4
Auto-discovered from HuggingFace trending. 193 likes, 822K downloads.
LFM2.5 8B A1B GGUFNewOpen
LiquidAI · self-host
▾
Best for: Trending on HuggingFace (177 likes this week)
How: Available on Hugging Face. 87K downloads.
Example: from transformers import AutoModelForCausalLM; model = AutoModelForCausalLM.from_pretrained("LiquidAI/LFM2.5-8B-A1B-GGUF")
ggufliquidlfm2edgellama.cpp
API: huggingface.co/LiquidAI/LFM2.5-8B-A1B-GGUF
Auto-discovered from HuggingFace trending. 177 likes, 87K downloads.
Qwen3.6 27B OBLITERATEDNewOpen
OBLITERATUS · self-host
▾
Best for: Trending on HuggingFace (120 likes this week)
How: Available on Hugging Face. 17K downloads.
Example: from transformers import AutoModelForCausalLM; model = AutoModelForCausalLM.from_pretrained("OBLITERATUS/Qwen3.6-27B-OBLITERATED")
transformerssafetensorsggufqwen3_5_texttext-generation
API: huggingface.co/OBLITERATUS/Qwen3.6-27B-OBLITERATED
Auto-discovered from HuggingFace trending. 120 likes, 17K downloads.
LFM2.5 8B A1BNewOpen
LiquidAI · self-host
▾
Best for: Trending on HuggingFace (551 likes this week)
How: Available on Hugging Face. 135K downloads.
Example: from transformers import AutoModelForCausalLM; model = AutoModelForCausalLM.from_pretrained("LiquidAI/LFM2.5-8B-A1B")
transformerssafetensorslfm2_moetext-generationliquid
API: huggingface.co/LiquidAI/LFM2.5-8B-A1B
Auto-discovered from HuggingFace trending. 551 likes, 135K downloads.
Qwopus3.6 27B V2 MTP GGUFNewOpen
Jackrong · self-host
▾
Best for: Trending on HuggingFace (178 likes this week)
How: Available on Hugging Face. 125K downloads.
Example: from transformers import AutoModelForCausalLM; model = AutoModelForCausalLM.from_pretrained("Jackrong/Qwopus3.6-27B-v2-MTP-GGUF")
transformersggufllama.cppimage-text-to-textvision
API: huggingface.co/Jackrong/Qwopus3.6-27B-v2-MTP-GGUF
Auto-discovered from HuggingFace trending. 178 likes, 125K downloads.
MiniCPM5 1BNewOpen
openbmb · self-host
▾
Best for: Trending on HuggingFace (776 likes this week)
How: Available on Hugging Face. 101K downloads.
Example: from transformers import AutoModelForCausalLM; model = AutoModelForCausalLM.from_pretrained("openbmb/MiniCPM5-1B")
transformerssafetensorsllamatext-generationminicpm
API: huggingface.co/openbmb/MiniCPM5-1B
Auto-discovered from HuggingFace trending. 776 likes, 101K downloads.
Ring 2.6 1TNewOpen
inclusionAI · self-host
▾
Best for: Trending on HuggingFace (89 likes this week)
How: Available on Hugging Face.
Example: from transformers import AutoModelForCausalLM; model = AutoModelForCausalLM.from_pretrained("inclusionAI/Ring-2.6-1T")
transformerssafetensorsbailing_hybridtext-generationconversational
API: huggingface.co/inclusionAI/Ring-2.6-1T
Auto-discovered from HuggingFace trending. 89 likes, 3K downloads.
HRM Text 1BNewOpen
sapientinc · self-host
▾
Best for: Trending on HuggingFace (751 likes this week)
How: Available on Hugging Face. 135K downloads.
Example: from transformers import AutoModelForCausalLM; model = AutoModelForCausalLM.from_pretrained("sapientinc/HRM-Text-1B")
transformerssafetensorshrm_texttext-generationhrm
API: huggingface.co/sapientinc/HRM-Text-1B
Auto-discovered from HuggingFace trending. 751 likes, 135K downloads.
Deepseek V4 GgufOpen
antirez · self-host
▾
Best for: Trending on HuggingFace (139 likes this week)
How: Available on Hugging Face. 284K downloads.
Example: from transformers import AutoModelForCausalLM; model = AutoModelForCausalLM.from_pretrained("antirez/deepseek-v4-gguf")
ggufquantizeddeepseekdeepseek-v4deepseek-v4-flash
API: huggingface.co/antirez/deepseek-v4-gguf
Auto-discovered from HuggingFace trending. 139 likes, 284K downloads.
NVIDIA Nemotron 3 Nano Omni 30B A3B Reasoning GGUFOpen
unsloth · self-host
▾
Best for: Trending on HuggingFace (100 likes this week)
How: Available on Hugging Face. 45K downloads.
Example: from transformers import AutoModelForCausalLM; model = AutoModelForCausalLM.from_pretrained("unsloth/NVIDIA-Nemotron-3-Nano-Omni-30B-A3B-Reasoning-GGUF")
ggufnvidiaunslothnemotron-3multimodal
API: huggingface.co/unsloth/NVIDIA-Nemotron-3-Nano-Omni-30B-A3B-Reasoning-GGUF
Auto-discovered from HuggingFace trending. 100 likes, 45K downloads.
Ling 2.6 1TOpen
inclusionAI · self-host
▾
Best for: Trending on HuggingFace (111 likes this week)
How: Available on Hugging Face.
Example: from transformers import AutoModelForCausalLM; model = AutoModelForCausalLM.from_pretrained("inclusionAI/Ling-2.6-1T")
transformerssafetensorsbailing_hybridtext-generationconversational
API: huggingface.co/inclusionAI/Ling-2.6-1T
Auto-discovered from HuggingFace trending. 111 likes, 642 downloads.
Granite 4.1 30bOpen
ibm-granite · self-host
▾
Best for: Trending on HuggingFace (100 likes this week)
How: Available on Hugging Face.
Example: from transformers import AutoModelForCausalLM; model = AutoModelForCausalLM.from_pretrained("ibm-granite/granite-4.1-30b")
transformerssafetensorsgranitetext-generationlanguage
API: huggingface.co/ibm-granite/granite-4.1-30b
Auto-discovered from HuggingFace trending. 100 likes, 6K downloads.
Granite 4.1 8bOpen
ibm-granite · self-host
▾
Best for: Trending on HuggingFace (157 likes this week)
How: Available on Hugging Face. 20K downloads.
Example: from transformers import AutoModelForCausalLM; model = AutoModelForCausalLM.from_pretrained("ibm-granite/granite-4.1-8b")
transformerssafetensorsgranitetext-generationlanguage
API: huggingface.co/ibm-granite/granite-4.1-8b
Auto-discovered from HuggingFace trending. 157 likes, 20K downloads.
Ling 2.6 FlashOpen
inclusionAI · self-host
▾
Best for: Trending on HuggingFace (456 likes this week)
How: Available on Hugging Face.
Example: from transformers import AutoModelForCausalLM; model = AutoModelForCausalLM.from_pretrained("inclusionAI/Ling-2.6-flash")
safetensorsbailing_hybridtext-generationconversationalcustom_code
API: huggingface.co/inclusionAI/Ling-2.6-flash
Auto-discovered from HuggingFace trending. 456 likes, 1K downloads.
Laguna XS.2Open
poolside · self-host
▾
Best for: Trending on HuggingFace (228 likes this week)
How: Available on Hugging Face. 14K downloads.
Example: from transformers import AutoModelForCausalLM; model = AutoModelForCausalLM.from_pretrained("poolside/Laguna-XS.2")
transformerssafetensorslagunatext-generationlaguna-xs.2
API: huggingface.co/poolside/Laguna-XS.2
Auto-discovered from HuggingFace trending. 228 likes, 14K downloads.
Qwen3.6 27B DFlashOpen
z-lab · self-host
▾
Best for: Trending on HuggingFace (262 likes this week)
How: Available on Hugging Face. 29K downloads.
Example: from transformers import AutoModelForCausalLM; model = AutoModelForCausalLM.from_pretrained("z-lab/Qwen3.6-27B-DFlash")
transformerssafetensorsqwen3feature-extractiondflash
API: huggingface.co/z-lab/Qwen3.6-27B-DFlash
Auto-discovered from HuggingFace trending. 262 likes, 29K downloads.
Qwen3.6 35B A3B DFlashOpen
z-lab · self-host
▾
Best for: Trending on HuggingFace (165 likes this week)
How: Available on Hugging Face. 27K downloads.
Example: from transformers import AutoModelForCausalLM; model = AutoModelForCausalLM.from_pretrained("z-lab/Qwen3.6-35B-A3B-DFlash")
transformerssafetensorsqwen3feature-extractiondflash
API: huggingface.co/z-lab/Qwen3.6-35B-A3B-DFlash
Auto-discovered from HuggingFace trending. 165 likes, 27K downloads.
Hy3 PreviewOpen
tencent · self-host
▾
Best for: Trending on HuggingFace (189 likes this week)
How: Available on Hugging Face. 14K downloads.
Example: from transformers import AutoModelForCausalLM; model = AutoModelForCausalLM.from_pretrained("tencent/Hy3-preview")
transformerssafetensorshy_v3text-generationconversational
API: huggingface.co/tencent/Hy3-preview
Auto-discovered from HuggingFace trending. 189 likes, 14K downloads.
MiMo V2.5 ProOpen
XiaomiMiMo · self-host
▾
Best for: Trending on HuggingFace (506 likes this week)
How: Available on Hugging Face. 40K downloads.
Example: from transformers import AutoModelForCausalLM; model = AutoModelForCausalLM.from_pretrained("XiaomiMiMo/MiMo-V2.5-Pro")
safetensorsmimo_v2text-generationagentlong-context
API: huggingface.co/XiaomiMiMo/MiMo-V2.5-Pro
Auto-discovered from HuggingFace trending. 506 likes, 40K downloads.
DeepSeek V4 FlashOpen
deepseek-ai · self-host
▾
Best for: Trending on HuggingFace (1371 likes this week)
How: Available on Hugging Face. 3525K downloads.
Example: from transformers import AutoModelForCausalLM; model = AutoModelForCausalLM.from_pretrained("deepseek-ai/DeepSeek-V4-Flash")
transformerssafetensorsconversationallicense:miteval-results
API: huggingface.co/deepseek-ai/DeepSeek-V4-Flash
Auto-discovered from HuggingFace trending. 1371 likes, 3.5M downloads.
DeepSeek V4 ProOpen
deepseek-ai · self-host
▾
Best for: Trending on HuggingFace (4867 likes this week)
How: Available on Hugging Face. 2935K downloads.
Example: from transformers import AutoModelForCausalLM; model = AutoModelForCausalLM.from_pretrained("deepseek-ai/DeepSeek-V4-Pro")
transformerssafetensorsdeepseek_v4text-generationconversational
API: huggingface.co/deepseek-ai/DeepSeek-V4-Pro
Auto-discovered from HuggingFace trending. 4867 likes, 2.9M downloads.
Qwen3.6 35B A3B Claude 4.6 Opus Reasoning Distilled GGUFOpen
hesamation · self-host
▾
Best for: Trending on HuggingFace (200 likes this week)
How: Available on Hugging Face. 129K downloads.
Example: from transformers import AutoModelForCausalLM; model = AutoModelForCausalLM.from_pretrained("hesamation/Qwen3.6-35B-A3B-Claude-4.6-Opus-Reasoning-Distilled-GGUF")
ggufllama.cppqwenqwen3.6qwen3_5_moe
API: huggingface.co/hesamation/Qwen3.6-35B-A3B-Claude-4.6-Opus-Reasoning-Distilled-GGUF
Auto-discovered from HuggingFace trending. 200 likes, 129K downloads.
Qwopus GLM 18B Merged GGUFOpen
Jackrong · self-host
▾
Best for: Trending on HuggingFace (201 likes this week)
How: Available on Hugging Face. 70K downloads.
Example: from transformers import AutoModelForCausalLM; model = AutoModelForCausalLM.from_pretrained("Jackrong/Qwopus-GLM-18B-Merged-GGUF")
ggufmergefrankenmergeqwen3.5reasoning
API: huggingface.co/Jackrong/Qwopus-GLM-18B-Merged-GGUF
Auto-discovered from HuggingFace trending. 201 likes, 70K downloads.
Gemma 4 31B It NVFP4 TurboOpen
LilaRest · self-host
▾
Best for: Trending on HuggingFace (247 likes this week)
How: Available on Hugging Face. 105K downloads.
Example: from transformers import AutoModelForCausalLM; model = AutoModelForCausalLM.from_pretrained("LilaRest/gemma-4-31B-it-NVFP4-turbo")
transformerssafetensorsgemma4text-generationgemma-4-31b-it
API: huggingface.co/LilaRest/gemma-4-31B-it-NVFP4-turbo
Auto-discovered from HuggingFace trending. 247 likes, 105K downloads.
Supergemma4 26b Uncensored Mlx 4bit V2Open
Jiunsong · self-host
▾
Best for: Trending on HuggingFace (172 likes this week)
How: Available on Hugging Face. 14K downloads.
Example: from transformers import AutoModelForCausalLM; model = AutoModelForCausalLM.from_pretrained("Jiunsong/supergemma4-26b-uncensored-mlx-4bit-v2")
mlxsafetensorsgemma4uncensoredapple-silicon
API: huggingface.co/Jiunsong/supergemma4-26b-uncensored-mlx-4bit-v2
Auto-discovered from HuggingFace trending. 172 likes, 14K downloads.
Gemma 4 E4B It OBLITERATEDOpen
OBLITERATUS · self-host
▾
Best for: Trending on HuggingFace (526 likes this week)
How: Available on Hugging Face. 128K downloads.
Example: from transformers import AutoModelForCausalLM; model = AutoModelForCausalLM.from_pretrained("OBLITERATUS/gemma-4-E4B-it-OBLITERATED")
safetensorsggufgemma4abliterateduncensored
API: huggingface.co/OBLITERATUS/gemma-4-E4B-it-OBLITERATED
Auto-discovered from HuggingFace trending. 526 likes, 128K downloads.
Supergemma4 26b Uncensored Gguf V2Open
Jiunsong · self-host
▾
Best for: Trending on HuggingFace (627 likes this week)
How: Available on Hugging Face. 267K downloads.
Example: from transformers import AutoModelForCausalLM; model = AutoModelForCausalLM.from_pretrained("Jiunsong/supergemma4-26b-uncensored-gguf-v2")
ggufgemma4uncensoredfastllama.cpp
API: huggingface.co/Jiunsong/supergemma4-26b-uncensored-gguf-v2
Auto-discovered from HuggingFace trending. 627 likes, 267K downloads.
GLM 5.1Open
zai-org · self-host
▾
Best for: Trending on HuggingFace (1472 likes this week)
How: Available on Hugging Face. 171K downloads.
Example: from transformers import AutoModelForCausalLM; model = AutoModelForCausalLM.from_pretrained("zai-org/GLM-5.1")
transformerssafetensorsglm_moe_dsatext-generationconversational
API: huggingface.co/zai-org/GLM-5.1
Auto-discovered from HuggingFace trending. 1472 likes, 171K downloads.
MiniMax M2.7Open
MiniMaxAI · self-host
▾
Best for: Trending on HuggingFace (1052 likes this week)
How: Available on Hugging Face. 469K downloads.
Example: from transformers import AutoModelForCausalLM; model = AutoModelForCausalLM.from_pretrained("MiniMaxAI/MiniMax-M2.7")
transformerssafetensorsminimax_m2text-generationconversational
API: huggingface.co/MiniMaxAI/MiniMax-M2.7
Auto-discovered from HuggingFace trending. 1052 likes, 469K downloads.