NVIDIA/Model-Optimizer

A unified library of SOTA model optimization techniques like quantization, pruning, distillation, speculative decoding, etc. It compresses deep learning models for downstream deployment frameworks like TensorRT-LLM, TensorRT, vLLM, etc. to optimize inference speed.

Python2,737 stars404 forksApache-2.0

Rankings

Daily

#505

Weekly

#1137

Monthly

#1221

Engagement

Total stars

Daily new stars

Get badge

This repository is tracked by Trending Repos. The badge upgrades automatically if it ever cracks the top 100.

Markdown

![Trending Repos](https://trending-repos.com/badge/NVIDIA/Model-Optimizer.svg)

HTML

<img src="https://trending-repos.com/badge/NVIDIA/Model-Optimizer.svg" alt="Trending Repos" />

Raw URL

https://trending-repos.com/badge/NVIDIA/Model-Optimizer.svg

Back to trending