window.env 提供 reset() / step(a) / getState() 供外部訓練腳本串接。?command=train、?command=eval、?command=continue、?command=stop、?command=reset(亦可用 ?cmd= / ?action=)。?profile=lane-h2(讀取 .bop/lanes/*.json 並展開預設)、?headless=1(1=headless)、?speed=1|2|4|max、?preset=lane-h3、?train=1、?start=1(等同自動啟動)、?targetSpeed=0.24(目標角速度)、?orbitPath=orbit|figure8|triangle|sin、?bouncePath=figure8|orbit|triangle|sin|center(bounce 水平目標軌跡)、?minOrbitSpeed=0.5(解題速度門檻倍率)、?speedPriority=1(軌跡速度偏好,越高越偏好快)、?lockRoll=1(舊參數名,實際鎖定 Y/高度軸)、?controllerMode=mpc(純 MPC baseline)、?controllerMode=mpc-gain(HPPO 調 MPC 參數)、?trainRestore=current|builtin|best-train|best-eval|none、?evalRestore=current|builtin|best-train|best-eval|none、?seed=builtin(訓練起始權重)、?snapshot=...(同時套用到 train 與 eval)。http://127.0.0.1:4173/?profile=lane-h2