FineGrainedFP8Config(dequantize=true) materializes full BF16 model per rank before sharding

May 1, 2026 · #2114

Python Difficulty: Medium

Parent Repository

NVIDIA-NeMo/Automodel

Python repository

All Issues Back to Automodel

Sign in required

Authenticate to use favourites & bookmarks

5