REASONING GYM: Reasoning Environments for Reinforcement Learning with Verifiable Rewards

2505.24760

Total: 1

#1 REASONING GYM: Reasoning Environments for Reinforcement Learning with Verifiable Rewards [PDF⁸] [Copy] [Kimi¹⁶] [REL]

Authors: Zafir Stojanovski, Oliver Stanley, Joe Sharratt, Richard Jones, Abdulhakeem Adefioye, Jean Kaddour, Andreas Köpf

We introduce Reasoning Gym (RG), a library of reasoning environments for reinforcement learning with verifiable rewards. It provides over 100 data generators and verifiers spanning multiple domains including algebra, arithmetic, computation, cognition, geometry, graph theory, logic, and various common games. Its key innovation is the ability to generate virtually infinite training data with adjustable complexity, unlike most previous reasoning datasets, which are typically fixed. This procedural generation approach allows for continuous evaluation across varying difficulty levels. Our experimental results demonstrate the efficacy of RG in both evaluating and reinforcement learning of reasoning models.

Subjects: Machine Learning , Artificial Intelligence , Computation and Language

Publish: 2025-05-30 16:20:18 UTC

2505.24760

#1 REASONING GYM: Reasoning Environments for Reinforcement Learning with Verifiable Rewards [PDF8] [Copy] [Kimi16] [REL]

#1 REASONING GYM: Reasoning Environments for Reinforcement Learning with Verifiable Rewards [PDF⁸] [Copy] [Kimi¹⁶] [REL]