NVIDIA/TransformerEngine

A library for accelerating Transformer models on NVIDIA GPUs, including using 8-bit and 4-bit floating point (FP8 and FP4) precision on Hopper, Ada and Blackwell GPUs, to provide better performance with lower memory utilization in both training and inference.

Python3,349 stars726 forksApache-2.0

cudadeep-learningfp4fp8gpujaxmachine-learningpythonpytorch

Rankings

Daily

#4322

Weekly

#6417

Monthly

#6584

Engagement

Total stars

Daily new stars

Get badge

This repository is tracked by Trending Repos. The badge upgrades automatically if it ever cracks the top 100.

Markdown

![Trending Repos](https://trending-repos.com/badge/NVIDIA/TransformerEngine.svg)

HTML

<img src="https://trending-repos.com/badge/NVIDIA/TransformerEngine.svg" alt="Trending Repos" />

Raw URL

https://trending-repos.com/badge/NVIDIA/TransformerEngine.svg

Back to trending