Cho phép hệ thống tự đặt mục tiêu, lập kế hoạch hành động và học hỏi từ kinh nghiệm để đạt được mục tiêu.