Cerebras launches inference for Llama 3.1; benchmarked at 1846 tokens/s on 8B



Melden Sie sich an, um einen Kommentar hinzuzufügen