DeepSeek: Inference-Time Scaling for Generalist Reward Modeling

созданный 13h | 4 апр. 2025 г., 19:20:33


Войдите, чтобы добавить комментарий

Другие сообщения в этой группе

Show HN: OCR pipeline for ML training (tables, diagrams, math, multilingual)

Hi HN,

I’ve been working on an OCR pipeline specifically optimized for machine learning dataset preparation. It’s designed to process complex academic materials — including math formulas, tables

5 апр. 2025 г., 06:50:06 | Hacker news