شرطی سازی عامل: رفتار از طریق تقویت تکرار می شود
شرطی سازی عامل یکی از مهمترین نظریههای رفتارگرایی است و در کل رشته روانشناسی و پیشبرد آن به سمت یک رشتهی علمی بسیار تآثیرگذار بوده است. شرطی سازی عامل در کنار شرطی سازی کلاسیک یکی از پایههای اصلی رفتاردرمانی است.
شرطی سازی عامل نظریهای است که توسط بی اف اسکینر مطرح شده است. اسکینر افکار پیشینیان خود از قبیل ایوان پاولف و جان بی واتسون را گسترش داده و این کار را از طریق بررسی سفت و سخت نظریات رفتارگرایان و موضع جنجالبرانگیز رفتارگرایی رادیکال خود انجام داد.
بی اف اسکینر پدر شرطی سازی عامل است. او با نظریه های خود در مورد شرطی سازی عامل به یکی از مهمترین و پرنفوذترین روانشناسان تاریخ شد.
یکی از ابداعات اسکینر، تحلیل آزمایشی رفتار بود. او با استفاده از ابزار ثبتکنندهای به نام تراکمنگار نشان داد که پاسخ ارگانیسم به آنچه پس از رفتار رخ میدهد، بستگی دارد. اسکینر نشان داد که تقویت از طریق پیامدهای خود، رفتار را کنترل میکند، یعنی به آن شکل میدهد، آن را مستقر میکند، تداوم میبخشد و خاموش میکند.
تحلیلهای آزمایشی رفتار توسط اسکینر، زمینهساز تحلیل رفتار کاربردی شد که کاربرد اصول یادگیری در کار بالینی است. درمانگران با شرطی سازی عامل توانستند رفتار بیماران روانی را که اختلالات جدی داشتند، اصلاح کنند. آنها از مدیریت وابستگی و اقتصاد ژتونی استفاده کردند تا در بخشهای بیمارستان روانی تعامل اجتماعی را رواج دهند.
شرطی سازی عامل
بنا بر اصول شرطی سازی عامل، رفتار تحت تأثیر پیامدهای خود قرار میگیرد. اگر پیامد یک رفتار، دریافت پاداش باشد احتمالا آن رفتار تکرار خواهد شد و اگر پیامد یک رفتار تنبیه شدن باشد احتمالا کمتر تکرار میشود.
اسکینر به عنوان پدر شرطی سازی عامل در نظر گرفته میشود، اما کار او بر اساس قانون اثر ثورندایک (1898) است. بر اساس قانون اثر، رفتاری که پیامدهای خوشایندی به دنبال دارد، احتمال دارد که تکرار شود و رفتاری که پیامدهای ناخوشایندی به دنبال دارد، کمتر تکرار میشود.
اسکینر اصطلاح جدیدی را در قانون اثر – تقویت معرفی کرد. رفتاری که تقویت میشود تمایل به تکرار دارد (یعنی نیرومند میشود). رفتاری که تقویت نمیشود، تمایل به از بین رفتن یا خاموش شدن دارد (یعنی ضعیف میشود).
اسکینر (1948) شرطی سازی عامل را با انجام آزمایشهایی از طریق چیزی که جعبه اسکینر نامیده میشود با استفاده از حیوانات مورد مطالعه قرار داد.
اسکینر در نظریه شرطی سازی عامل سه نوع پاسخ یا عامل را شناسایی کرد که میتوانند به دنبال رفتار رخ دهند:
- عاملهای خنثی: پاسخهایی از سمت محیط که نه احتمال تکرار یک رفتار را افزایش و نه کاهش میدهند.
- تقویتکنندهها: پاسخهایی از سمت محیط که احتمال تکرار یک رفتار را افزایش میدهند. تقویتکنندهها میتوانند مثبت یا منفی باشند.
- تنبیهکنندهها: واکنشهایی از سمت محیطی که احتمال تکرار یک رفتار را کاهش میدهند. تنبیه رفتار را ضعیف میکند.
همه ما میتوانیم به مثالهایی فکر کنیم که چگونه رفتار خودمان تحت تأثیر تقویتکنندهها و تنبیهکنندهها قرار گرفته است. در دوران کودکی، احتمالاً تعدادی از رفتارها را امتحان کردهاید و از عواقب آنها درس گرفتهاید.
تقویت مثبت
تقویت مثبت اصطلاحی است که توسط اسکینر در نظریه شرطی سازی عامل توصیف شده است. در تقویت مثبت، یک پاسخ یا رفتار با پاداش تقویت میشود و منجر به تکرار رفتار مطلوب میشود. پاداش یک محرک تقویتکننده است و انواع مختلفی دارد.
تقویتکنندههای اولیه محرکهایی هستند که بهطور طبیعی تقویتکننده هستند، زیرا آموخته نشدهاند و مستقیماً نیازی مانند غذا یا آب را برآورده میکنند.
تقویتکنندههای ثانویه در شرطی سازی عامل محرکهایی هستند که از طریق ارتباط با یک تقویتکننده اولیه، مانند پول، تقویت میشوند. آنها مستقیماً یک نیاز ذاتی را برآورده نمیکنند، اما ممکن است وسیلهای برای تأمین نیازها باشند. بنابراین یک تقویتکننده ثانویه میتواند به اندازه تقویتکننده اولیه یک محرک قوی باشد.
تقویت مثبت با ارائه پیامدی که برای فرد پاداش مییابد، رفتار را تقویت میکند. به عنوان مثال، اگر معلم شما هر بار که تکالیف خود را انجام میدهید، 5 تومان به شما میدهد (یعنی یک جایزه)، احتمال تکرار این رفتار در آینده بیشتر خواهد شد.
اصل پریماک (Premack) شکلی از تقویت مثبت در شرطی سازی عامل است و به آن اصل مادربزرگ نیز گفته میشود. مطابق با این اصل، میتوان از یک فعالیت لذتبخش برای تقویت یک رفتار کمتر خوشایند استفاده کرد. به عنوان مثال میتوان از تماشای تلویزیون برای انجام دادن تکالیف استفاده کرد. مادر به فرزندان خود میگوید که برای تماشای تلویزیون لازم است که ابتدا تکالیف خود را انجام دهند.
این روش با مرتبط ساختن آن با یک نتیجه مطلوب، رفتار کمتر مطلوب را تحریک میکند و در نتیجه رفتار کمتر مطلوب را تقویت میکند.
تقویت منفی
در شرطی سازی عامل تقویت منفی خاتمه دادن به یک حالت ناخوشایند به دنبال یک پاسخ است. به عبارت دیگر حذف کردن یک محرک ناخوشایند به عنوان پاداش یک رفتار، تقویت منفی میگویند.
به عنوان مثال اگر معلم یک کلاس بعد از اینکه دانشآموزان تکالیف خود را انجام بدهند نمرههای منفی آنها را حذف کند، از تقویت منفی استفاده کرده است.
تقویت منفی رفتارها را تقویت میکند زیرا باعث توقف یا حذف یک تجربه ناخوشایند میشود.
تنبیه
تنبیه برعکس تقویت است زیرا هدف آن ضعیف کردن یا از بین بردن یک پاسخ است نه افزایش آن. تنبیه محرک آزارندهای است که رفتار قبل از خود را کاهش میدهد.
همانند تقویت، تنبیه میتواند از طریق ارائه مستقیم یک محرک ناخوشایند به دنبال یک رفتار صورت بگیرد (تنبیه مثبت) یا از طریق حذف کردن یک محرک خوشایند (تنبیه منفی).
نمونههایی از شرطی سازی عامل
تقویت مثبت: فرض کنید که شما مربی هستید و میخواهید که دقت پاس دادن تیمتان افزایش پیدا کند. هنگامی که یکی از بازیکنان در حین تمرین کردن پاس دقیقی میدهد، شما او را تشویق میکنید. این فیدبک مثبت آنها را ترغیب میکنند که پاس دادن دقیق را تکرار کنند.
تقویت منفی: اگر متوجه شوید که اعضای تیم به خوبی با هم کار میکنند و در تمرینات سخت روحیه خود را از دست نمیدهند ممکن است تصمیم بگیرید که تمرین را زودتر از آنچه برنامهریزی کردهاید تمام کنید تا اعضای تیم استراحت کنند. آنها یاد میگیرند که کار تیمی به نتایج مثبتی منتهی میشود بنابراین رفتارشان تقویت میشود.
تنبیه مثبت: اگر یکی از پرسنل همیشه دیر به محل کارش میآید، مدیر مجموعه میتواند با حذف کردن امتیاز ساعت کاری انعطافپذیر با این رفتار او مقابله کند. در نتیجه پرسنل یاد میگیرند که وقتشناس باشند.
کاربرد اصل پریماک: شما میتوانید فرزندتان را از طریق پیشنهاد دادن یک فعالیت جذاب بعد از تمام کردن مشقهایش تقویت کنید.
مفاهیم شرطی سازی عامل
در شرطی سازی عامل، مفاهیم متعددی وجود دارد که یادگیری آنها به شما کمک می کند به خوبی نظریه شرطی سازی عامل را درک کنید. این مفاهیم عبارت اند از:
شرطی سازی عامل یا شرطی سازی کنشگر یا اسکینری (operant conditioning): تحکیم رفتار از طریق تقویت رفتار، تضعیف رفتار از طریق تنبیه آن.
رفتار عامل (operant behavior): رفتاری که توسط پیامدهای خود صادر میشود و تحت تأثیر پیامدهاست. به عبارت دیگر، رفتار عامل، رفتاری است که به واسطه پیامدهای بعد از خود تقویت شده اشت.
پیشایند (antecedent): به رویدادی گفته میشود که پیش از رفتار میآید.
پیامد یا پسایند (consequent): به رویدادی گفته میشود که بعد از رفتار میآید.
تقویتکننده (reinforcer): رویداد، شیء یا مشوقی است که باعث افزایش رفتار میشود و احتمال اینکه شخص رفتار مورد نظر را در آینده تکرار کند افزایش میدهد.
- تقویتکننده اولیه (primary reinforcer): رویداد، شیء یا مشوقی که به طور طبیعی خوشایند است و باعث افزایش رفتار میشود.
- تقویتکننده ثانویه (secondary reinforcer): محرکی است که ابتدا از طریق تداعی با تقویتکننده اولیه ارزش تقویتکنندگی پیدا میکند. این محرک از طریق تداعی، ویژگیهای تقویتکنندهی اولیه را پیدا میکند. به عنوان مثال پول یک تقویتکنندهی ثانویه است، زیرا به خودی خود ارزشی ندارد ولی چون میتوان با آن تقویتکنندههای اولیه مانند غذا، آب و امنیت تهیه کرد، به تقویتکنندهی ثانویه تبدیل میشود.
- تقویت مثبت (positive reinforcement): تقویت مثبت محرک خوشایندی است که به رفتار اضافه میشود و احتمال وقوع و تکرار آن را افزایش میدهد. به عبارت دیگر اگر یک رفتار مانند سلام کردن کودک با یک پاداش (محرک خوشایند) مانند تعریف و تمجید دریافت کردن همراه شود، میگوییم تقویت مثبت رخ داده است.
- تقویت منفی (negative reinforcement): اگر یک محرک آزارنده را به منظور افزایش یک رفتار خذف کنیم تقویت منفی رخ داده است. به عنوان مثال اگر یک کودک به دلیل انجام ندادن تکالیف مدرسه از تماشای تلویزیون محروم شده باشد، حذف محرومیت از تلویزیون یک تقویت منفی است و احتمال انجام تکالیف را افزایش میدهد.
- تنبیه (punishment): تنبیه فرآیندی است که باعث کاهش یک رفتار میشود. در واقع تنبیه دقیقاً برخلاف تقویت است.
- تنبیهکننده (punisher): محرک آزارندهای است که باعث کاهش یک رفتار میشود. دو نوع تنبیهکننده وجود دارد:
- استفاده از محرک آزارنده (تنبیه مثبت) (application of an aversive stimulus): تنبیه مثبت اضافه کردن یک محرک ناخوشایند به رفتار انجام شده است. به عنوان مثال اگر کودکی تکالیف خود را انجام ندهد و یکی از والدین سر او داد بزند یا او را کتک بزند در واقع در حال استفاده از یک محرک آزارنده (کتک زدن) است. از این رو ممکن است رفتار انجام ندادن تکلیف در آینده کاهش پیدا کند.
- حذف تقویتکننده مثبت (removal of a positive reinforcer): اگر کودکی یک رفتار نامطلوب انجام دهد مانند انجام ندادن تکلیف و والدینش او را از یک تقویتکننده مثبت مانند بازی با اسباببازیها محروم کند، حذف تقویتکننده مثبت رخ داده است که به آن تنبیه منفی هم گفته میشود.
شکلدهی (shaping): برای ایجاد رفتارهای مختلف میتوان، رفتار مورد نظر را به صورت متوالی تقویت کنیم تا آن رفتار به طور کامل رخ دهد.
تعمیم (generalization): پاسخی که به یک محرک داده میشود به خاطر شباهت محرکها به یکدیگر، به محرک دیگری هم داده میشود. برای مثال کبوتری که به خاطر نوک زدن به دایرهها تقویت میشود به بیضیها هم نوک میزند.
تمیز (discrimination): در این حالت، پاسخی که به یک محرک اول داده میشود به محرک دوم دیگر داده نمیشود زیرا محرک دوم به اندازه کافی شبیه محرک اول نیست. برای مثال، کبوتر به خط صاف که شبیه دایره نیست نوک نمیزند چون دایره و خط صاف شبیه هم نیستند و کبوتر میتواند این دو را از هم تمیز دهد.
کنترل محرک (stimulus control): به رفتار در یک موقعیت یا محیط پاداش داده میشود (یا تنبیه میشود) و در محیط یا موقعیتی دیگر نه پاداش نه تنبیه به آن رفتار ارائه میشود.
خاموشی (extinction): در حالت خاموشی تقویت رفتار متوقف میشود و میزان پاسخ به سطح پیش از شرطی سازی یا یادگیری بر میگردد.
بازگشت خودبهخودی (spontaneous recovery): وقتی رفتار خاموششده به صورت موقت و کوتاهمدت بدون ارائه تقویت برمیگردد.
گریز (escape): فرار از محرک آزارنده یا مضر پس از ارائه آن در شرطی سازی عامل گریز نامیده میشود.
اجتناب (avoidance): پرهیز کردن از یک محرک ترسناک پیش از وقوع آن بر اساس نشانهای که با آن محرک ترسناک تداعی شده است. اجتناب یک تقویت کننده است زیرا اضطراب را کاهش میدهد بنابراین اجتناب میتواند فرآیند مستمری باشد.
برنامههای تقویت (schedules of reinforcement): در شرطی سازی عامل برای ارائه تقویت کننده ها برنامه های مختلفی وجود دارد و منظور از آن ارائهی تقویتکنندهها بر اساس یک برنامهی زمانی یا تعداد پاسخها. چند نوع برنامه تقویت وجود دارد:
- تقویت مستمر (continuous reinforcement): ارائهی تقویتکننده بعد از هر پاسخ مطلوب. این برنامه برای ایجاد و استقرار رفتارهای جدید مناسب است.
- تقویت سهمی یا نامستمر (partial or intermittent reinforcement): در این برنامه فقط برخی از رفتارهای مطلوب تقویت میشود.
برنامهی فاصلهای (interval schedule): در این برنامهی تقویت، مبنای ارائهی تقویت زمان سپریشده است.
- برنامهی فاصلهای ثابت (fixed interval): در این برنامه یک دوره زمانی تعریف میشود که اگر ارگانیسم (فرد یا هر موجود زنده دیگری) رفتار مورد نظر را بدهد در پایان آن دوره تقویت میشود. به عنوان مثال، ارائه تقویتکننده در پایان هر هفته. در برنامه فاصلهای ثابت، در طول زمان تعریف شده، از پاسخدهی یا انجام آن رفتار میکاهد و هرچه به پایان دوره میرسد پاسخدهی خود را افزایش میدهد.
- برنامه فاصلهای متغیر (variable interval schedule): در این برنامه، پاسخهای صحیح یا رفتارهای مطلوب در فواصل زمانی متغیر تقویت میشوند. در این برنامه یک میانگین زمانی تعریف میشود. به عنوان مثال رفتار مورد نظر بعد از ۷ روز تقویت میشود. اما ممکن است در برخی موارد بعد از ۵ روز و در برخی موارد بعد از ۹ روز، و گاهی بعد از دو روز و الی آخر. در این حالت ارگانیسم مجبور است همیشه رفتار مورد نظر را انجام دهد زیرا دریافت تقویتکننده قابل پیشبینی نیست.
برنامه نسبتی (ratio schedule): یکی از اصلیترین برنامههای تقویت در شرطی سازی عامل برنامه نسبتی ثابت است. این برنامه تقویت مبتنی بر تعداد پاسخهاست نه زمان.
- برنامه نسبتی ثابت (fixed ratio schedule): در این برنامه، رفتار مورد نظر بعد از اینکه به تعداد مشخصی تکرار شد تقویتکننده ارائه میشود. به عنوان مثال به کودک گفته میشود بعد از هر سه مرتبه مسواک زدن به او پاداش داده میشود.
- برنامه نسبتی متغیر (variable ratio schedule): در این برنامه، تقویتکننده ممکن است بعد از تعداد نامشخصی از رفتار مورد نظر ارائه شود. این نوع برنامه تقویت به شدت در برابر خاموشی مقاوم است.
اسکینر با ارائه نظریات خود درباره شرطی سازی عامل به یکی از پرنفوذترین مدافعان رفتارگرایی و رفتاردرمانی تبدیل شد. مباحث و نظریههای او در مورد شرطی سازی عامل بر پایه نتایج روش کاری دقیق و علمی بود.
اسکینر یک مخترع زبردست و ماهر بود. اما او در واقع دانشمندی با پشت کار زیاد بود. مطالعاتی که اسکینر در مورد شرطی سازی عامل انجام داد در جدا کردن رشته روانشناسی از ریشههای دروننگری و فلسفی کمک بسیاری کرد تا در نهایت روانشناسی به یک رشته مجزای علمی تبدیل شد.
کارهای اسکینر درباره شرطی سازی عامل در واقع در ادامه کارهایی بود که ایوان پاولف و جان بی واتسون شروع کرده بودند. اسکینر به هر آنچه نادیدنی بود و نمیشد آنها را به صورت دقیق در آزمایشگاه مورد اندازه گیری قرار داد علاقهای نداشت. به عنوان مثال انگیزه، تفکر و هیجان از جمله مواردی هستند که در آزمایشگاه نمیتوان آنها را بررسی کرد. بنابراین این موارد جایگاهی در علم روانشناسی به معنای دقیق آن ندارند.
از نظر اسکینر، افکار درونی یک مشکل دارند و آن هم این است که قابل استفاده در تحلیلهای کاربردی نیستند.
برای ارتباط با ما در انتهای مطلب کامنت بگذارید. علاوه بر این میتوانید در اینستاگرام و تلگرام ما را دنبال کنید.
- اینستاگرام: schema.therapy
- تلگرام: psychologistnotes
- ایمیل: schemalogy@gmail.com
Bandura, A. (1977). Social learning theory. Englewood Cliffs, NJ: Prentice Hall.
Dallery, J., Meredith, S., & Glenn, I. M. (2017). A deposit contract method to deliver abstinence reinforcement for cigarette smoking. Journal of Applied Behavior Analysis, 50(2), 234–248.
Eckerstorfer, L., Tanzer, N. K., Vogrincic-Haselbacher, C., Kedia, G., Brohmer, H., Dinslaken, I., & Corbasson, R. (2019). Key elements of mHealth interventions to successfully increase physical activity: Meta-regression. JMIR mHealth and uHealth, 7(11), e12100.
Ferster, C. B., & Skinner, B. F. (1957). Schedules of reinforcement. New York: Appleton-Century-Crofts.
Kohler, W. (1924). The mentality of apes. London: Routledge & Kegan Paul.
Kumar, D., Sinha, N., Dutta, A., & Lahiri, U. (2019). Virtual reality-based balance training system augmented with operant conditioning paradigm. Biomedical Engineering Online, 18(1), 1-23.
Michie, S., Abraham, C., Whittington, C., McAteer, J., & Gupta, S. (2009). Effective techniques in healthy eating and physical activity interventions: A meta-regression. Health Psychology, 28(6), 690–701.
Rosén, E., Westerlund, J., Rolseth, V., Johnson R. M., Viken Fusen, A., Årmann, E., Ommundsen, R., Lunde, L.-K., Ulleberg, P., Daae Zachrisson, H., & Jahnsen, H. (2018). Effects of QbTest-guided ADHD treatment: A randomized controlled trial. European Child & Adolescent Psychiatry, 27(4), 447–459.
Skinner, B. F. (1948). ‘Superstition’in the pigeon. Journal of experimental psychology, 38(2), 168.
Schunk, D. (2016). Learning theories: An educational perspective. Pearson.
Skinner, B. F. (1938). The behavior of organisms: An experimental analysis. New York: Appleton-Century.
Skinner, B. F. (1948). Superstition” in the pigeon. Journal of Experimental Psychology, 38, 168-172.
Skinner, B. F. (1951). How to teach animals. Freeman.
Skinner, B. F. (1953). Science and human behavior. Macmillan.
Thorndike, E. L. (1898). Animal intelligence: An experimental study of the associative processes in animals. Psychological Monographs: General and Applied, 2(4), i-109.
Twohig, M. P., Whittal, M. L., Cox, J. M., & Gunter, R. (2010). An initial investigation into the processes of change in ACT, CT, and ERP for OCD. International Journal of Behavioral Consultation and Therapy, 6(2), 67–83.
Watson, J. B. (1913). Psychology as the behaviorist views it. Psychological Review, 20, 158–177.