強化學習中代理與環境的互動