Cerebras launches inference for Llama 3.1; benchmarked at 1846 tokens/s on 8B



Accedi per aggiungere un commento