Cerebras launches inference for Llama 3.1; benchmarked at 1846 tokens/s on 8B



Inicia sesión para agregar comentarios