Serving 70B-Scale LLMs Efficiently on Low-Resource Edge Devices [pdf]

Creato 7mo | 3 ott 2024, 17:11:07


Accedi per aggiungere un commento