Cerebras launches inference for Llama 3.1; benchmarked at 1846 tokens/s on 8B



Ak chcete pridať komentár, prihláste sa