Cerebras Inference now 3x faster: Llama3.1-70B breaks 2,100 tokens/s



Autentifică-te pentru a adăuga comentarii