Dongwei
/

DeepSeek-R1-Distill-Qwen-7B-GRPO_Math

Text Generation

Generated from Trainer

text-generation-inference

Model card Files Files and versions

DeepSeek-R1-Distill-Qwen-7B-GRPO_Math

Commit History

End of training

129f0a3
verified

Dongwei commited on Feb 4, 2025

Model save

a73762d
verified

Dongwei commited on Feb 4, 2025

Model save

6c50d3f
verified

Dongwei commited on Feb 3, 2025

initial commit

dc19b17
verified

Dongwei commited on Feb 3, 2025