強化學習中代理與環境的互動
SELF-ICL 框架