Models
Datasets
Spaces
Docs
Enterprise
Pricing
Log In
Sign Up

MiniLLM

community

https://github.com/microsoft/LMOps/tree/main/minillm

t1101675

AI & ML interests

Training efficient language models (MiniLLM, MiniPLM)

MiniLLM 's collections 2

Pre-trained models in MiniPLM: Knowledge Distillation for Pre-Training Language Models

MiniLLM/MiniPLM-Qwen-200M

Text Generation • 0.2B • Updated Oct 27, 2024 • 80 • 9
MiniLLM/MiniPLM-Qwen-500M

Text Generation • 0.5B • Updated Mar 25, 2025 • 9 • 7
MiniLLM/MiniPLM-Qwen-1.2B

Text Generation • 1B • Updated Mar 25, 2025 • 10 • 4
MiniLLM/MiniPLM-Mamba-130M

Text Generation • 0.1B • Updated Mar 25, 2025 • 47 • 3

MiniLLM/MiniLLM-gpt2-120M

Text Generation • 0.1B • Updated Sep 26, 2024 • 729
MiniLLM/MiniLLM-gpt2-340M

Text Generation • Updated Apr 11, 2025 • 876 • 4
MiniLLM/MiniLLM-gpt2-760M

Text Generation • Updated Sep 26, 2024 • 103
MiniLLM/MiniLLM-OPT-1.3B

Text Generation • Updated Sep 26, 2024 • 5 • 1

Pre-trained models in MiniPLM: Knowledge Distillation for Pre-Training Language Models

MiniLLM/MiniPLM-Qwen-200M

Text Generation • 0.2B • Updated Oct 27, 2024 • 80 • 9
MiniLLM/MiniPLM-Qwen-500M

Text Generation • 0.5B • Updated Mar 25, 2025 • 9 • 7
MiniLLM/MiniPLM-Qwen-1.2B

Text Generation • 1B • Updated Mar 25, 2025 • 10 • 4
MiniLLM/MiniPLM-Mamba-130M

Text Generation • 0.1B • Updated Mar 25, 2025 • 47 • 3

MiniLLM/MiniLLM-gpt2-120M

Text Generation • 0.1B • Updated Sep 26, 2024 • 729
MiniLLM/MiniLLM-gpt2-340M

Text Generation • Updated Apr 11, 2025 • 876 • 4
MiniLLM/MiniLLM-gpt2-760M

Text Generation • Updated Sep 26, 2024 • 103
MiniLLM/MiniLLM-OPT-1.3B

Text Generation • Updated Sep 26, 2024 • 5 • 1

Company

TOS Privacy About Careers

Website

Models Datasets Spaces Pricing Docs