它不会提前估算,它只看重过程结果,然后根据这个结果,判断你是应该接受惩罚还是奖赏。