در الگوریتم یادگیری با ناظر مجموعه‏ای از زوج‏های داده‏ها به داده‏های یادگیری موسوم هستند پس از اعمال ورودی X به شبکه عصبی خروجی حاصل از شبکه y با مقدار ایده آل مقایسه شده و خطا برای تنظیم پارامتر های شبکه نظیر w محاسبه می‏شود به گونه‏ای که اگر دفعه بعد به شبکه همان ورودی X اعمال شود خروجی شبکه به y همگرا شده باشد