恒常性制御を伴う好奇心駆動型強化学習