در الگوریتم یادگیری با ناظر مجموعهای از زوجهای دادهها به دادههای یادگیری موسوم هستند پس از اعمال ورودی X به شبکه عصبی خروجی حاصل از شبکه y با مقدار ایده آل مقایسه شده و خطا برای تنظیم پارامتر های شبکه نظیر w محاسبه میشود به گونهای که اگر دفعه بعد به شبکه همان ورودی X اعمال شود خروجی شبکه به y همگرا شده باشد