Spaces:

ZhiyuanZeng
/

RLVE_Gym

Running

ZhiyuanZeng commited on 13 days ago

Commit

7769657

1 Parent(s): e9c193a

add os env-variable in RlveGym initialization

Files changed (1) hide show

server/RLVE_Gym_environment.py CHANGED Viewed

@@ -8,6 +8,7 @@
 RLVE-Gym Environment Implementation.
 """
 from typing import Optional, Tuple
 import random
@@ -27,13 +28,33 @@ class RlveGymEnvironment(Environment):
     def __init__(
         self,
-        environment_identifier: str = "Multiplication",
-        difficulty: int = 0,
         answer_markers: Optional[Tuple[str, str]] = None,
-        initial_seed: int = 0,
     ):
         """Initialize the RLVE_Gym environment."""
         self._state = RlveGymState(
             seed=initial_seed,
             problem_input=None,
@@ -41,10 +62,6 @@ class RlveGymEnvironment(Environment):
             sum_accuracy=0,
         )
-        self.environment_identifier = environment_identifier
-        self.difficulty = difficulty
-        self.answer_markers = answer_markers
         self.problem = None
     def reset(self) -> RlveGymObservation:

 RLVE-Gym Environment Implementation.
 """
+import os
 from typing import Optional, Tuple
 import random
     def __init__(
         self,
+        environment_identifier: str = None,
+        difficulty: int = None,
         answer_markers: Optional[Tuple[str, str]] = None,
+        initial_seed: int = None,
     ):
         """Initialize the RLVE_Gym environment."""
+        if environment_identifier is not None :
+            self.environment_identifier = environment_identifier
+        else :
+            self.environment_identifier = os.getenv("RLVEGYM_ENVIRONMENT_IDENTIFIER", default = "Multiplication")
+        if difficulty is not None :
+            self.difficulty = difficulty
+        else :
+            self.difficulty = int(os.getenv("RLVEGYM_DIFFICULTY", default = "0"))
+        if answer_markers is not None :
+            self.answer_markers = answer_markers
+        else :
+            self.answer_markers = (os.getenv("RLVEGYM_ANSWER_MARKER_START", default = r"<answer>"), os.getenv("RLVEGYM_ANSWER_MARKER_END", default = r"</answer>"))
+        if initial_seed is not None :
+            pass
+        else :
+            initial_seed = int(os.getenv("RLVEGYM_INITIAL_SEED", default = "0"))
         self._state = RlveGymState(
             seed=initial_seed,
             problem_input=None,
             sum_accuracy=0,
         )
         self.problem = None
     def reset(self) -> RlveGymObservation: