زندگی و دستاوردهای بروس فردریک اسکینر
بی اف اسکینر
بی اف اسکینر که نام کاملش بروس فردریک اسکینر است در سال ۱۹۰۴ در ساسکیوهانای پنسیلوانیا بهدنیا آمد. او در دانشگاه همیلتون، زبان انگلیسی خواند و قصد داشت نویسنده شود اما خیلی زود دریافت که زندگی ادبی مخصوص او نیست. تحت تاثیر آثار ایوان پاولوف و جان بی واتسون، وی روانشناسی را در هاروارد خواند و مدرک دکترای خود را در سال ۱۹۳۱ دریافت کرد. در سال ۱۹۳۶ به دانشگاه مینه سوتا رفت و از ۱۹۴۶ تا ۱۹۴۷ در دانشگاه ایندیانا، گروه روانشناسی را راه اندازی کرد. در ۱۹۴۸ بی اف اسکینر به هاروارد برگشت که در آنجا بقیه عمرش را گذراند. او در دهه ۱۹۸۰ مبتلا به سرطان خون تشخیص داده شد اما به کار ادامه داد و مقاله ای از سخنرانی آخرش در روز مرگش یعنی ۱۸ آگوست ۱۹۹۰ را به اتمام رساند.
شرطیسازی عامل اسکینر (کنشگر)
شرطیسازی عامل اسکینر یک روش یادگیری است که از طریق پاداش و تنبیه در ازای یک رفتار واقع میشود. از طریق شرطیسازی عامل، یک فرد ارتباطی را بین یک رفتار خاص و یک نتیجه برقرار میسازد (Skinner, 1938).
در حدود دههی ۱۹۲۰، جان بی واتسون روانشناسی آکادمیک را ترک کرد و دیگر رفتارگرایان نیز در حال قدرت یافتن و نفوذ بودند که در نتیجه فرمهای جدیدی از یادگیری به غیر از شرطیسازی کلاسیک را پیشنهاد میدادند. شاید مهمترین آنها برحاس (با توجه به تفاوت لهجهی امریکن و بریتیش، بوریس هم گفته میشود) فردریک اسکینر بود. اگر چه به دلایلی آشکار، او بیشتر با عنوان B.F. Skinner شناخته شده است.
دیدگاههای بی اف اسکینر، اندکی از شدت کمتری نسبت به واتسون (۱۹۱۳) برخوردار بود. اسکینر معتقد بود که مثلا ما چیزی را به عنوان یک ذهن داریم، اما این امر (توجه به مسائل بیرونی) نسبت به مطالعهی وقایع داخلی روحی و روانی، حقیقتا سازندهتر و مؤثرتر خواهد بود.
کار بی اف اسکینر ریشه در نگاهی داشت که بیان کنندهی این مطلب بود که شرطیسازی کلاسیک برای توضیح کامل رفتار پیچیدهی انسانی بسیار ساده انگارانه است. او معتقد بود که بهترین راه برای درک رفتار این است که نگاه به علتهای یک عمل و عواقب و پیامدهای آن باشد. او این رویکرد را شرطیسازی عامل یا کنشگر نامید.
بی اف اسکینر: شرطیسازی عامل اسکینر
به اسکینر بهعنوان پدر شرطیسازی عامل نگریسته میشود، اما کار او بر اساس قانون اثر ثرندایک (۱۸۹۸) استوار بود. با توجه به این اصل، رفتاری که به دنبال نتایجی دلپذیر هستند، احتمالا تکرار میشود و رفتاری که ناشی از نتایجی ناخوشایند باشد از احتمال کمتری برای تکرار شدن برخوردار است.
بی اف اسکینر یک اصطلاح جدید را به قانون اثر معرفی کرد – تقویت. رفتار تقویت شده تمایل به تکرار شدن دارد (به عبارت دیگر تحکیم شده)؛ رفتار تقویت نشده نیز تمایل دارد تا که از بین رفته یا خاموش شود (به عبارت دیگر تضعیف شده).
بی اف اسکینر (۱۹۴۸) شرطیسازی عامل را با انجام آزمایشی که در طی آن حیواناتی را در جعبه اسکینر قرار داده بود و شبیه به جعبه پازل ثرندایک بود مورد مطالعه قرار داد. اسکینر سه نوع پاسخ یا عامل را مورد شناسایی قرار داد که میتوانند دنبال کنندهی رفتار باشند.
عاملهای خنثی:
پاسخهایی از جانب محیط که نقشی در افزایش یا کاهش احتمال تکرار یک رفتار ندارند.
تقویت کنندهها:
پاسخهایی از جانب محیط که باعث افزایش احتمال تکرار رفتار میشوند. تقویت کنندهها میتوانند مثبت یا منفی باشند.
تنبیهات:
پاسخهایی از جانب محیط که احتمال تکرار وقوع یک رفتار را کاهش میدهند. تنبیه رفتار را تضعیف میکند.
همهی ما میتوانیم نمونههایی از نحوه رفتار خودمان توسط تقویتکنندهها و تنبیهات را در نظر بگیریم. احتمالا هنگامی که کودک بودید، شما تعدادی از رفتارها را آزمایش کرده و از نتایج آن مطلع شدهاید.
مثلاً وقتی جوانتر بودید، سعی کردید در مدرسه سیگار بکشید و نتیجه برجستهی این اقدام این بوده است که شما با گروهی که همیشه می خواستید همراه شدید. در این حال ممکن است شما با تقویت مثبت مواجه شده باشید (مثلا پاداش) و در نتیجه احتمالا این رفتار را تکرار کردهاید.
با این حال چنانچه نتیجه اصلی این اقدام این بود که شما گرفتار میشدید، حضور شما در مدرسه به حالت تعلیق در میآمد و والدین شما نیز درگیر این موضوع شده و مطمئنا با تنبیه مواجه میشدید، نتیجه این میشد که به احتمال کمتری در حال حاضر سیگاری بودید.
تقویت مثبت اسکینر
بی اف اسکینر نشان داد که تقویت مثبت چگونه با قرار دادن یک موش گرسنه در جعبهی اسکینر کار میکند. جعبه حاوی یک اهرم در یک سمت بود و هنگامی که موش به جعبه انتقال یافت، به طور اتفاقی به اهرم ضربه وارد کرد. بلافاصله پس از انجام این کار قطعهای از غذا به داخل ظرفی که در کنار اهرم قرار داشت میافتاد.
موشها پس از اینکه چندین بار در جعبه قرار داده شدند، به سرعت آموختند که باید مستقیما به سراغ اهرم بروند. دریافت غذا در صورت فشار دادن اهرم یک نتیجهی تضمین شده بود و به همین دلیل آنها دوباره و دوباره آن کار را تکرار میکردند.
تقویت مثبت تقویت کنندهی رفتاری است که در نتیجهی آن فردی پاداش دریافت میکند. به عنوان مثال، اگر معلم شما هر بار که تکالیف خود را انجام میدهید (به عنوان پاداش) به شما پنج پوند بدهد، احتمال بیشتری دارد که شما این رفتار را در آینده تکرار کنید، بنابراین این اقدام، رفتار انجام تکالیف شما را تقویت خواهد کرد.
تقویت منفی اسکینر
حذف یک تقویت کنندهی ناخوشایند نیز میتواند رفتاری را تقویت کند. این مورد با عنوان تقویت منفی شناخته میشود، زیرا حذف یک محرک نامطلوب میباشد که برای حیوان یا شخص «پاداش» را در پی خواهد داشت. تقویت منفی موجب تقویت رفتار میشود، زیرا تجربهای ناخوشایند را متوقف کرده یا آن را از بین میبرد.
به عنوان مثال، اگر شما تکالیف خود را انجام ندهید، باید به معلم خود ۵ پوند بدهید. شما برای اینکه از پرداخت ۵ پوند جلوگیری کنید، تکالیف خود را انجام میدهید. بنابراین این اقدام، رفتار انجام تکالیف شما را تقویت خواهد کرد.
بی اف اسکینر نشان داد که تقویت منفی بدین صورت کار میکند که یک موش در جعبه اسکینر قرار داده شده و در صورتیکه برخی از موارد نامطلوب (از جانب موش) رخ دهد، یک جریان برق ناخوشایند به جعبه (و در نتیجه به موش) اعمال خواهد شد. هنگامی که موش به جعبه منتقل شد، به طور تصادفی با اهرم برخورد کرد و بلافاصله پس از آن جریان الکتریکی خاموش میشود.
موشها پس از اینکه چندین بار در جعبه قرار داده شدند، به سرعت آموختند که باید مستقیما به سراغ اهرم بروند. مطمئن بودن از خلاصی یافتن از جریان الکتریکی(توسط تماس با اهرم)، سبب میشد تا آنها دوباره و دوباره این عمل را تکرار کنند.
بی اف اسکینر حتی موشها را به این صورت نیز آموزش داد که برای جلوگیری از جریان الکتریکی، چراغی قبل از اینکه جریان الکتریکی وارد شود روشن میشد. موشها به زودی یاد گرفتند که وقتی که نور آمد، اهرم را فشار دهند، زیرا میدانستند که این امر جریان برق را متوقف خواهد کرد.
این دو پاسخ یادگیری شده با عناوین یادگیری گریز و و یادگیری اجتناب شناخته میشوند.
تنبیه مثبت و منفی اسکینر (تضعیف رفتار)
تنبیه در مقابل تقویت تعریف میگردد. زیرا به جای اینکه به دنبال افزایش دادن یک پاسخ باشد، در پی کاهش یا حذف آن است. این یک رویداد ناگوار است که در نتیجه رفتاری را که در پی آن اتفاق میافتد را کاهش میدهد.
همانند تقویت، مجازات هم میتواند به طور مستقیم با استفاده از یک محرک ناخوشایند مانند یک شوک پس از پاسخ اعمال شود و یا با حذف محرک بالقوه پاداش دهنده همراه باشد. برای مثال، کم کردن پول توجیبی یک فرد به منظور تنبیه او در ازای رفتاری نامطلوب.
نکته: همیشه ایجاد تمایز بین تنبیه و تقویت منفی آسان نیست.
مشکلات زیادی از قبیل موارد زیر در خصوص استفاده از تنبیه وجود دارد:
* رفتار مورد تنبیه واقع شده فراموش نمیگردد، بلکه سرکوب میشود- وقتی مجازات دیگر وجود نداشته باشد، رفتار دوباره باز میگردد.
* باعث افزایش تهاجم و خشونت میشود- نشان میدهد که تهاجم یک راه برای مقابله با مشکلات است.
* میتواند باعث ایجاد ترس شود و به رفتارهای نامطلوب تعمیم یابد، مثلا ترس از مدرسه.
* لزوما به رفتار مورد نظر منتهی نمیشود- تقویت به شما میگوید که چه کار باید بکنید، مجازات تنها به شما میگوید که نباید آن کار را انجام دهید.
برنامه تقویت
یک موش را در «جعبه اسکینر» تصور کنید. در شرطیسازی عامل، اگر هیچغذایی بلافاصله بعداز فشاردادن اهرم تحویل دادهنشود، پس از چندینبار آزمایش، موش فشاردادن اهرم را متوقفمیکند. (اگر کارفرمایی پرداخت حقوق به کارکنان خود را متوقف کند، آنها تا چه مدت به کار خود ادامه خواهند داد؟). رفتار خاموش شده است.
رفتارگرایان کشف کردند که الگوهای مختلف (یا برنامههای مختلف) تقویتی، اثراتی متفاوت بر سرعت یادگیری و خاموشی دارند. فستر و اسکینر (۱۹۵۷) روشهای مختلفی را برای ارائه و ایجاد تقویت کشف کردند. و دریافتند که این امر بر روی این موارد اثر گذاشته است:
۱- نرخ پاسخ: نرخی که نشان دهندهی فشار دادن اهرم توسط موشها است ( یعنی موش تا چه حد موثر بوده است).
۲- نرخ خاموشی: نرخی که نشاندهندهی از بین رفتن فشار دادن اهرم است (یعنی چه زمانی موشها (از فشار دادن اهرم) دست میکشند).
اسکینر دریافت نوع تقویتکنندهای که کمترین سرعت خاموشی را بهوجود میآورد (یعنی طولانیترین زمانیکه افراد بدونتقویت بهتکرار ادامهمیدهند) نسبتمتغیر تقویتمیباشد. نوع تقویتی که دارای سریعترین میزان خاموشی است نیز تقویت پیوسته است.
(A) تقویت پیوسته
یک حیوان یا انسان هر بار که رفتار خاصی رخ میدهد، به طور مثبت تقویت میشود. مثلاً هربار که یک اهرم فشار دادهمیشود یک قطعه غذا تحویل داده میشود و سپس تحویل غذا خاموش میگردد.
• نرخ پاسخ آهسته است
• نرخ خاموشی سریع است
(B) تقویت نسبت ثابت
رفتار تنها هنگامی تقویت میشود که در چندین دفعهی مشخص رخ دهد. به عنوان مثال، پس از ارائهی چند پاسخ صحیح یک تقویت داده شود، مثلا پس از هر پاسخ پنجم. برای مثال؛ یک کودک پس از تلفظ صحیح هر پنج کلمه، یک ستاره دریافت میکند.
• نرخ پاسخ سریع است
• نرخ خاموشی متوسط است.
(C) تقویت فاصله ثابت
یک تقویت بعد از یک فاصله زمانی ثابت دادهمیشود که در این بین باید حداقل یک پاسخ صحیح ارائه شدهباشد. یک مثال پرداخت در هر ساعت است. مثال دیگر میتواند این باشد که هر ۱۵ دقیقه (نیمساعت، یکساعت، یا سایر زمانها) یک قطعه غذا آزاد شود (حداقل یکبار فشار دستگیره باید انجام شده باشد) و سپس آزادسازی غذا خاموش میشود.
• نرخ پاسخ متوسط است
• نرخ خاموشی متوسط است
(D) تقویت نسبت متغیر
رفتار پس از چندین بار اقدام غیرقابل پیشبینی (از لحاظ تعداد) تقویت میشود. برای مثال قمار یا ماهیگیری.
• نرخ پاسخ سریع است
• نرخ خاموشی آهسته (به دلیل غیرقابل پیشبینی بودن، خاموش شدن بسیار سخت است)
(E) تقویت فاصله متغیر
یک پاسخ صحیح ارائه میشود، اما تقویت پس از گذشت یک میزان غیرمنتظره از زمان ارائه میشود. به عنوان مثال، بهطور متوسط هر ۵ دقیقه. یک مثال در اینجا؛ یک فرد دارای شغل آزاد یا خوداشتغالی است که پرداختیهایش در زمانهای غیرقابل پیشبینی است.
• نرخ پاسخ سریع است
• نرخ خاموشی آهسته است
اصلاح رفتار
اصلاح رفتار به مجموعهای از درمانها یا تکنیکهای مبتنی بر شرطیسازی عامل اطلاق میشود. اصل مهم شامل تغییر رویدادهای محیطی است که مربوط به رفتار فرد میشود. به عنوان مثال، تقویت رفتارهای مورد نظر و نادیده گرفتن یا تنبیه در خصوص موارد نامطلوب.
این امر به همان سادگی که گفته میشود نیست. برای مثال، تقویت همیشگی رفتار مورد نظر، اساسا رشوه محسوب میشود.
انواع مختلفی از تقویت مثبت وجود دارد. تقویت اولیه زمانی است که یک پاداش، یک رفتار را به خودی خود تقویت میکند. تقویتثانویه مربوط بهزمانی است که یکچیز باعث تقویت رفتاری میشود، زیرا (آن رفتار درنهایت) بهیک تقویت اولیه منجرمیشود.
نمونههایی از درمان تغییر رفتاری عبارتند از: اقتصاد نشانهای (یا اقتصاد ژتونی) و شکلگیری رفتار.
اقتصاد نشانهای (یا اقتصاد ژتونی)
اقتصاد نشانهای سیستمی است که در آن رفتارهای هدفمند توسط نشانهها (تقویت کنندههای ثانویه) تقویت شده و بعدها بهمنظور پاداش (تقویت کنندههای اولیه) مبادله میشوند.
نشانهها یا ژتونها میتوانند در قالب پول جعلی، دکمه ها، ورقهای پوکر، برچسبها و غیره باشند. در حالی که پاداش میتواند هر محدودهای، از خوراکیهای مختصر تا امتیازات و فعالیتها را دربر بگیرد. مثلاً معلمان در مدرسه ابتدایی با دادن برچسب بهبچههای کوچک بهعنوان پاداشی در ازای رفتار خوب از این روش استفادهمیکنند.
اقتصاد نشانهای در مدیریت بیماران روانی بسیار موثر است. با این حال بیمارانی که به نشانهها متکی شده باشند، سازگاری یکبارهی آنها با جامعه پس از ترک بیمارستان، زندان یا سایر موارد میتواند دشوار باشد.
کارکنانی که یک برنامه اقتصاد نشانهای را اجرا میکنند قدرت زیادی دارند. این موضوعی مهم است که کارکنانی که در این برنامه کار میکنند، افراد خاصی را مورد توجه قرار نداده یا آنها را رد نکنند (اصطلاحا همه را باید به یک چشم ببینند). بنابراین، کارکنان باید آموزش داده شوند تا علامتها را حتی زمانی که تغییرات شیفت کاری مانند زندان یا در یک بیمارستان روانی وجود دارد، بهصورت عادلانه و مداوم ارائه دهند.
شکلگیری رفتار
یکی دیگر از کمکهای مهم ارائه شده توسط بی اف اسکینر (۱۹۵۱)، مفهوم شکلگیری رفتار بهواسطهی تقریبهای متوالی است. اسکینر استدلال میکند که اگر پاداش و تنبیه بهگونهای ارائه شود که انگیزهی حرکت یک ارگانیسم را در هر زمانی به رفتار مورد نظر نزدیک و نزدیکتر کند، اصول شرطیسازی عامل میتواند برای تولید رفتار بسیار پیچیده مورد استفاده قرار گیرد.
برای انجام این کار، شرایط (یا احتمالات) مورد نیاز برای دریافت پاداش، در هر باری که ارگانیسم یک گام به سمت رفتار مطلوب نزدیکتر میشود، باید تغییر کند. بنابه گفتهی اسکینر، اکثر رفتارهای حیوانی و انسانی (ازجمله زبان) را میتوان بهعنوان محصولی از این نوع تقریب متوالی توضیحداد.
برنامههای آموزشی
در شرایط متعارف یادگیری، شرطیسازی عامل بهجای محتوای یادگیری، عمدتا به مسائل مربوط به مدیریت کلاس و شاگرد بستگی دارد. این امر برای شکل دادن عملکرد مهارت بسیار مهم است.
یک روش ساده برای شکلدادن رفتار، ارائه بازخورد در عملکرد یادگیرنده است، مانند تعریف، تایید، تشویق و تصدیق. نسبت متغیر، بالاترین نرخ پاسخ را برای دانش آموزان بهمنظور یادگیری یک کار جدید ایجاد میکند. به این ترتیب در ابتدا تقویت (مثلاً ستایش) در فواصلی مکرر اتفاق میافتد. و این تکرار عملکرد تقویت به تدریج کاهش یافته، تا اینکه درنهایت تنها نتایج استثنایی موردنظر مورد تقویت قرار میگیرند.
مثلاً اگر معلمی بخواهد دانشآموزان را تشویق به پاسخگویی در کلاس کند، باید آنها را برای هر تلاشی (بدون در نظر گرفتن اینکه آیا پاسخ درست است یا خیر) تحسین کند. به تدریج معلم تنها دانشآموزان را زمانی ستایش میکند که پاسخ آنها درست است. و به مرور زمان تنها پاسخهای استثنایی مورد ستایش قرار خواهد گرفت.
رفتارهای نامطلوب، مانند دیر رسیدن به کلاس و بحث و جدلهای کلاسی، میتواند از طریق نادیده گرفته شدن توسط معلم (به جای تقویت شدن به وسیلهی توجه به آن دسته از دانشآموزان و یا اصطلاحا بیمحلی کردن به آنها) خاموش شود. البته این یک کار ساده نیست. زیرا اگر معلم بیش از حد مشغول رفتار باشد، ممکن است غیرصمیمی و بیعاطفه به نظر برسد.
آگاهی از موفقیت نیز مهم است، زیرا باعث ایجاد انگیزه بهمنظور یادگیری در آینده میشود. با این حال این امر نیز مهم است که نوع تقویت داده شده به گونهای باشد که رفتار حفظ شود.
خلاصه نظریه اسکینر
در نگاهی بهمطالعات کلاسیک بی اف اسکینر درخصوص رفتار کبوتران یا موشها، میتوان برخی مفروضات برجستهی رویکرد رفتارگرایانه را شناساییکرد.
* روانشناسی باید به عنوان یک علم در نظر گرفته شود تا در نتیجه به صورت علمی مورد مطالعه قرار گیرد. مطالعه اسکینر در مورد رفتار در موش صحرایی تحت شرایط آزمایشگاهی و با دقتی کنترل شده انجام شد.
* رفتارگرایی عمدتا مربوط به رفتار قابل مشاهده میباشد و از این جهت در مقابل وقایع داخلی مانند تفکر و احساسات است. توجه کنید که بی اف اسکینر نمیگوید که موشها یاد گرفتهاند چون غذا میخواهند اهرم را باید فشاردهند. او به جای آن، بر روی توصیف رفتاری که بهراحتی از سوی موشها مشاهده میشود تمرکز کرده است.
* یادگیری از محیط تاثیر عمدهای بر رفتار انسان دارد. در مطالعه بی اف اسکینر به دلیل اینکه مواد خوراکی بهدنبال رفتار خاصی ارائه میشدند، موشها یاد گرفتند که این رفتار را تکرار کنند که مثالی برای شرطیسازی عامل است.
* بین یادگیری که در انسان و حیوانات دیگر اتفاق میافتد تفاوت کمی وجود دارد. بنابراین تحقیق (به عنوان مثال، شرطیسازی عامل) میتواند هم بر روی حیوانات (موشها / کبوترها) و هم بر روی انسان انجام شود. اسکینر چنین مطرحساخت که شیوهی یادگیری رفتار در انسانها بسیار شبیه نحوهی رفتار موشی است که یک اهرم را فشارمیدهد.
بنابراین اگر تصور عامیانهی شما از روانشناسی همیشه افرادی بوده که روپوشی سفید برتن داشته و در حال تماشای موشهای بیچارهای هستند که برای دستیابی به شامشان تقلا میکنند، پس احتمالا به روانشناسی رفتاری فکر میکنید.
رفتارگرایی و انشعابات آن، در میان علمیترین دیدگاههای روانشناختی قرار دارد. تاکید روانشناسی رفتاری بر نحوه یادگیری رفتارهای خاص ما میباشد.
همهی ما دائما در حال یادگیری رفتارهای جدید و نحوهی تغییر رفتار فعلی خود هستیم. روانشناسی رفتاری رویکردی روانشناختی است که بر روی این نکته تمرکز دارد که چگونه این یادگیری اتفاق میافتد.
ارزیابی بحرانی
شرطیسازی عامل میتواند برای توضیح انواع مختلف رفتارها، از فرایند یادگیری تا اعتیاد و یادگیری زبان مورد استفاده قرار گیرد. همچنین دارای کاربردی عملی (مانند اقتصاد نشانهای) است که در کلاسهای درس، زندانها و بیمارستانهای روانپزشکی میتوان آن را استفادهنمود.
با این حال، شرطیسازی عامل نمیتواند نقش عوامل ارثی و شناختی را در یادگیری در نظر بگیرد. در نتیجه یک توضیح ناقص از فرایند یادگیری در انسان و حیوانات میباشد.
مثلاً کوهلر (۱۹۲۴) دریافت اغلب اینچنین بهنظر میرسد راستهی نخستیان (شامل انسانها، میمونها و گوریلها) بهجای آزمون و خطا، مشکلاتشان را با بینشی لحظهای حلمیکنند. همچنین، نظریهی یادگیری اجتماعی نشانمیدهد انسانها میتوانند بهطور خودکار نه از طریق تجربه شخصی، بلکه از طریق مشاهده یاد بگیرند.
استفاده از تحقیقات روی حیوانات در مطالعات شرطیسازی عامل نیز مسئله برونیابی را مطرح میسازد. برخی از روانشناسان معتقدند که ما نمیتوانیم مطالعات حیوانات را به انسان تعمیم دهیم. زیرا آناتومی و فیزیولوژی آنها با انسانها متفاوت است. همچنین آنها نمیتوانند در مورد تجربیاتشان فکر کنند و خرد، صبر، حافظه یا خاطره و آرامش خود را بیان کنند.