التعلم الارتباطي أو الربطية Connectionism

واطسن والتعلم:

يرى واطسن  John Broadus Watson (1878– 1958)، مؤسس المدرسة السلوكية أن علم النفس هو علم السلوك. وان الطريقة المناسبة لدراسة موضوعاته هي الطريقة الموضوعية المستخدمة في الميادين العلمية الطبيعية وليست طريقة الاستبطان التي كانت شائعة قبله في دراسة الظواهر النفسية.



ذلك لأن العلم يدرس من الظواهر ما هو ظاهر منها وقابل للقياس فيها, وعلى الرغم من الشهرة التي حظي بها واطسن John B.

 Watson كمؤسس للمدرسة السلوكية لكنه لم يكن صاحب نظرية بالمعنى الدقيق للكلمة.

فقد وجد واطسن John B. Watson في مفهوم الإشراط عند بافلوف Pavlov ما يبرهن بما فيه الكفاية على قوة الإشراط وتأثيره في السلوك الإنساني ولا سيما في دراسة عملية التعلم والعمليات العقلية العليا.

على العموم يؤكد واطسن John B. Watson من خلال الأعمال التي قام بها على دور البيئة الاجتماعية في تكوين ونمو شخصية الفرد وكذلك أهمية دراسة وقياس آثار المثيرات المختلفة في عملية التعلم وفي السلوك بصفة عامة.

لقد قام واطسن John B. Watson بإجراء عدد من التجارب كان من بينها تلك التي أجراها على الطفل ( ألبرت Albert ) الذي كان سليم الجسم والنفس معاً, ليس لديه مخاوف غير عادية وإنما كان كغيره من الأطفال يخاف من الأصوات المدوية والمفاجئة... الخ وقد جيء بفأر أبيض إليه فصار يلعب معه حتى ألف ذلك وتعود عليه, وبعد مضي فترة من الزمن وبينما كان الفأر يقترب من الطفل أحدث المجرب صوتاً مرتفعاً مفاجئاً ( وهو مثير مناسب إحداث الخوف ) وبعد تكرار هذا الاقتران مرات عديدة أظهر ( البرت Albert ) خوفاً ملحوظاً من الفأر الأبيض وحين رأى حيوانات أخرى لها فرو شبيه بفرو الفأر بدا عليه الخوف أيضاً.

وهكذا نجح واطسن John B. Watson في إثارة الخوف لدى الطفل عن طريق تقديم مثير يستدعي الخوف بطبيعته عند الطفل وهو الصوت القوي المفاجئ بمصاحبة الفأر. وهو مثير حيادي كان الطفل قد تعود اللعب معه, بحيث اكتسب الفأر صفة المثير الطبيعي للخوف وهكذا تكون ارتباط بين الفأر واستجابة الخوف ثم عممت بعد ذلك هذه الإستجابة.

 ويمكن تمثيل إحداث هذه التجربة على النحو التالي:

·         مثير ( صوت قوي مفاجئ ). استجابة ( الشعور بالخوف).

·         مثير ( رؤية الفأر ). استجابة التوجه إلى الفأر وعدم الخوف منه.

·         مثير ( ظهور الفأر أولاً ثم إصدار صوت قوي مفاجئ وتكرار ذلك ). استجابة الخوف.

·         ظهور الفأر وحده بعد ذلك. استجابة الخوف.

كما قام واطسن John B. Watson  بتجربة أخرى استطاع فيها أن يزيل الخوف لدى طفل كان يخاف من الأرانب وذلك عن طريق تقديم أرنب ابيض بمصاحبة مثير يستدعي السرور لدى الطفل (تقديم بعض الحلوى مثلاً) إلى أن استطاع تدريجياً التخلص من هذا الخوف المرضي.

ويمكن تمثيل إحداث هذه التجربة على النحو التالي:

أ. مثير ( تقديم بعض الحلوى ). استجابة ( الشعور بالسرور ).

ب. مثير ( ظهور أرنب ). استجابة الشعور بالخوف.

ج. ظهور أرنب أولاً ثم تقديم بعض الحلوى لمرات متكررة. استجابة الشعور بالسرور.

د. ظهور الأرنب لوحده. استجابة الشعور بالسرور.

إن هذه الدراسات قدمت لواطسن John B. Watson  دليلاً على أن السلوك المرضي يمكن اكتسابه كما يمكن التخلص منه, وأنه بالتالي لا يوجد فرق بين طريقة اكتساب السلوك العادي وطريقة اكتساب السلوك المرضي, لأن العملية الرئيسة في كلتا الحالتين هي أصلاً عملية تعلم وعملية تكوين ارتباطات بين مثيرات واستجابات وقد أدى نجاح واطسن John B. Watson  في تجاربه هذه إلى الاعتقاد بأنه يستطيع السيطرة على السلوك بطرائق لا حصر لها تقريباً عن طريق ترتيب تتابع المثيرات والاستجابات.

وقد توج دعواه بقوله المشهور:

(أعطوني عشرة أطفال أصحاء سليمي التكوين، وسأختار أيا منهم أو أحدهم عشوائياً ثم أعلمه فاصنع منه ما أريد طبيباً أو مهندساً أو محامياً أو فناناً أو تاجراً أو مسؤولاً أو لصاً وذلك بغض النظر عن مواهبه وميوله واتجاهاته وقدراته أو سلالة إسلافه ).

 

دراسات ثورندايك:

كان ثورندايك Edward Lee Thorndike (1874 –1949) من أوائل علماء النفس الذين حاولوا تفسير التعلم بحدوث ارتباطات تصل أو تربط بين المثيرات والاستجابات, ويرى أن أكثر أشكال التعلم تميزاً عند الإنسان والحيوان على حد سواء, هو التعلم بالمحاولة و الخطأ, أو التعلم بالاختيار والربط, كما يدعو هو Learning by Selecting and Connecting, ويتضح هذا النوع من التعلم عندما يواجه المتعلم وضعاً مشكلاً, يجب حلّه أو التغلب عليه للوصول إلى هدف ما .

ففي نفس الوقت الذي كان فيه بافلوف Pavlov يجري دراسته حول الاشراط الكلاسيكي,  كان ثورندايك Thorndike يجري دراسته حول قطة جائعة موضوعة في صندوق. وحتى تخرج منه لابد من ضرب الباب بيدها. فتحصل على الطعام. فعلى القطة أن تتعلم كيف يفتح الباب.

لاحظ ثورندايك Thorndike أن القطة تبدأ بالقيام بحركات عشوائية بالضرب بيدها في أماكن مختلفة من القفص. بالصدفة تحدث الضربة في المكان المطلوب لفتح القفص فتخرج لتحصل على الطعام.

عندما تعاد إلى القفص مرة أخرى لوحظ أن عدد الضربات الفاشلة تقل تدريجياً وبتكرار نفس الموقف تعلمت القطة الضربة الناجحة مباشرة دونما حاجة لضربات فاشلة.

من هذا الموقف التجريبي طوّر ثورندايك Thorndike " قانون الأثر " Law of effect ومفاده أن العضوية تميل إلى تكرار السلوك الذي يترك لديها أثراً طيباً. بتعبير آخر فإن السلوكيات التي تتبع بنتائج إيجابية تتقوى أكثر ويصير القيام بها مباشرة بعد المثير, وعلى العكس فإن هذه السلوكيات تضعف إذا تلاها نتائج سالبة (عقاب ).

فنوعية النتائج المترتبة على السلوك هي التي تقرر قوة الرابطة بين ( المثير. الاستجابة).

لذا عرفت نظرية ثورندايك Thorndike باسم نظرية " المثير – الاستجابة " لأن سلوك العضوية يعزى إلى الرابطة بين المثير والاستجابة .

نظرية ثورندايك: (نظرية المحاولة والخطأ)

سميت نظرية ثورندايك Edward Lee Thorndike ( 1949 – 1874 ) بأسماء كثيرة: المحاولة والخطأ، الوصلية, الانتقاء والربط, الإشراط الذرائعي أو الوسيلي.

لقد اهتم ثورندايك Thorndike بالدراسة التجريبية المخبرية وساعد على ذلك كونه اختصاصياً في علم نفس الحيوان.

 

وكانت اهتماماته تدور حول الأداء والجوانب العملية من السلوك مما جعله يهتم بسيكولوجية التعلم وتطبيقاته في التعلم المدرسي في إطار اهتماماته بعلم النفس والاستفادة منه في تعلم الأداء وحل المشكلات.

ولذلك اتسمت الأعمال والأبحاث التي قام بها بقدر من مواصفات التجريب المتقن وبالموضوعية النسبية.

 

تجربة ثورندايك Thorndike

·         وضع قطاً جائعاً داخل قفص حديد مغلق, له باب يفتح ويغلق بواسطة سقاطة، عندما يحتك القط بها يفتح الباب ويمكن الخروج منه.

·         يوضع خارج القفص طعام يتكون من قطعة لحم أو قطعة سمك.

·         يستطيع القط أن يدرك الطعام خارج القفص عن طريق حاستي البصر والشم.

·         إذا نجح القط في أن يخرج من القفص يحصل على الطعام الموجود خارجه.

·         تتسم المحاولات الأولى لسلوك القط داخل القفص بقدر كبير من الخربشة والعض العشوائي.

·         بعد نجاح القط في فتح باب القفص والوصول إلى الطعام وتناوله إياه كان يترك حراً خارج القفص وبدون طعام لمدة ثلاث ساعات ثم يدخل ثانية إلى القفص إلى أن يخرج مرة أخرى وهكذا تتكرر التجربة إلى أن يصبح أداء الحيوان وقدرته على فتح باب القفص أكثر يسراً أو سهولة مما نتج عنه انخفاض الفترة الزمنية نتيجة لاستبعاد الأخطاء وسرعة الوصول إلى حل المشكلة.

وبالتالي فقد تعلم القط القيام بالاستجابة المطلوبة إذ بمجرد أن يوضع في القفص سرعان ما كان يخرج منه أي وصل إلى أقل زمن يحتاجه لإجراء هذه الاستجابة وهذا دليل على أن الحيوان وصل إلى أقصى درجات التعلم.

وصف التجربة:

لقد أراد ثورندايك Thorndike أن يقيس التعلم الناتج من جراء محاولات الحيوان للخروج من القفص فاتخذ لذلك سبيلين أو معيارين وهما:

عدد المحاولات والزمن الذي تستغرقه كل محاولة.

وهكذا لاحظ أن القط استغرق في محاولته الأولى لفتح الباب (160 ثانية), واستغرق في الثانية زمناً أقل (156 ثانية), وفي الثالثة أقل من الثانية وهكذا إذ أخذ الزمن يتناقص تدريجياً في المحاولات التالية حتى وصل إلى (7 ثوان) في المحاولة رقم (22). ومن ثم استقر في المحاولة الأخيرة عند ثانيتين.

تفسير ثورندايك للتعلم:

يرى ثورندايك Thorndike أن التعلم عند الحيوان وعند الإنسان هو التعلم بالمحاولة والخطأ.

فحين يواجه المتعلم موقفاً مشكلاً ويريد أن يصل إلى هدف معين فإنه نتيجة لمحاولاته المتكررة يبقي استجابات معينة ويتخلص من أخرى وبفعل التعزيز تصبح الاستجابات الصحيحة أكثر تكراراً وأكثر احتمالاً للظهور في المحاولات التالية من الاستجابات الفاشلة التي لا تؤدي إلى حل المشكلة والحصول على التعزيز.

وقد وضع ثورندايك Thorndike عدداً من القوانين التي تفسر التعلم بالمحاولة والخطأ، وعدل بعض هذه القوانين أكثر من مرة وذلك سعياً للإجابة عن سؤال:

لماذا يتناقص عدد الحركات الخاطئة بينما تبقى الحركات الناجحة أثناء معالجة الموقف وحل المشكلة ؟

قانون التكرار:

يعد قانون التكرار من أقدم القوانين المعروفة في التعلم وقد تناوله واطسن John B. Watson بالتحليل والتفسير, حيث رأى أن الحركات التي تبقى ويحتفظ بها الحيوان هي التي تتكرر كثيراً وهي الحركات التي تؤدي إلى تحقيق الهدف في حين أن الحركات الفاشلة التي قام بها الحيوان لا تعود للظهور في سلوكه بعد أن عرف طريقة الاستجابة الصحيحة.

معنى ذلك انه كلما حدثت حركة فاشلة تعقبها حركة ناجحة ولكن كلما حدثت حركة ناجحة فإنها تؤدي إلى الهدف ولا تعقبها حركة فاشلة.

قوانين التعلم:

لم يكتف ثورندايك بوصف التعلم, بل حاول تفسيره بارتباطات مباشرة بين المثيرات والاستجابات, يتحكم في قوتها أو ضعفها قوانين رئيسة وثانوية.

و يجب الانتباه في هذا الصدد, إلى أن هذه قوانين, وليست قوانين بالمعنى العلمي لهذه الكلمة, بل هي قوانين تفسيرية أبدت تجارب ثورندايك صدقها, وحاول من خلالها أن يفسر سيكولوجية التعلم.

أ – قوانين التعلم الرئيسية:

1 ـ قانون الأثر    Law of effect

رأينا في الوضع التجريبي النموذجي أن الارتباطات بين الوضع المثيري ( الوجود داخل الصندوق المشكل ) والاستجابات الصحيحة ( فتح باب الصندوق ) تتقوى تدريجياً بدليل الزمن المستغرق في الوصول إلى الحل الصحيح في كل محاولة. ورأينا أيضاً أن الاستجابة الصحيحة متبوعة بالطعام الذي يشبع جوع الحيوان الذي تحرر من القفص. والسؤال الذي يطرح نفسه في هذا المجال هو: ما العوامل المسؤولة عن تقوية هذه الارتباطات أو إضعافها ؟ أي ما الشروط التي تتحكم في السلوك وتؤدي إلى تغييره ؟

 يرى ثورندايك أن أثر الرضا أو الإشباع الناجم عن تناول الطعام, والذي يتلو استجابة فتح باب القفص مباشرة, هو المسؤول عن تقوية الارتباط, أما الأثر غير المرضي الذي يتلو الاستجابات الفاشلة, فهو المسؤول عن إضعافه, لذا يعتبر الأثر اللاحق الذي يتلو الاستجابات هو المسؤول عن تقوية الارتباطات أو إضعافها, وقد صاغ قانون الأثر على النحو التالي:

" تتقوى الارتباطات بين أوضاع مثيرية معينة, واستجابات معيّنة, إذا كانت هذه الاستجابات متبوعة بحالة من السرور والرضا أو الإشباع, وتضعف هذه الارتباطات إذا كانت متبوعة بحالة من الضيق أو الألم أو الإزعاج ".

يشير هذا القانون إلى أن الأثر الناجح عن النجاح والفشل, هو المسؤول قام ثورندايك بتصنيف التعلم في أربعة أنماط :

0. تكوين الرابطة.

1. تكوين الرابطة مع الأفكار.

2. التحليل أو التجريد.

3. التفكير الانتقائي أو الاستدلال.

في تنظيمه الهرمي لأنماط التعلم هذه يعتبر ثورندايك Thorndike المرحلة الأولى: مرحلة تكوين الرابطة ( و هو نمط يحدث أيضاً في تعلم الحيوان ): مرحلة صفرية فهي أدني الأنماط جميعاً. ولهذا يسميها بالمرحلة الصفرية في التعلم وهو يضرب مثلاً على هذا بالطريقة التي يتعلم بها طفل عمره عشرة شهور كيف يدق الطبلة.

و نمط التعلم الأعلى من تكوين الرابطة هو التعلم عن طريق الرابطة مع وجود الأفكار و يمكن التمثيل عليه بطفلة عمرها سنتان تفكر في أمها بعد أن تسمع كلمة ” أم ” أو طفل يردد كلمة ” حلوى ” و هو ينظر إلى قطعة من الحلوى موضوعة أمامه.

 

و النمط الثالث الأعلى هو التعلم عن طريق التحليل و التجريد وهو ذلك النمط من التعلم الذي يحدث لطالب يدرس الموسيقى مثلاً ويحاول التمييز بين ألوان الأنغام الموسيقية أو الاستجابة لنغم إضافي في صوت من الأصوات.

أما التعلم عن طريق التفكير الانتقائي أو الاستدلال فيحدث عندما يتعلم تلميذ المدرسة معنى جملة من الجمل في لغة أجنبية عن طريق استخدام قواعد النحو والصرف و معاني الكلمات.

و قد يعترض الطالب الذي يدرس نظريات التعلم الحديثة علي نظرية ثورندايك المبسطة هذه و من الصعب حقاً أن نساوي حتى بين أعلى نمط من أنماط ثورندايك التعليمية وهو التفكير الانتقائي و الاستدلال و بين الأفعال و ردود الأفعال المعقدة التي يحتاجها العلماء في إجراء عمليات عقلية بالغة التعقيد في عصر الذرة الذي نعيشه و مع ذلك فحتى الآن لا نجد سوى إضافات قليلة إلى نظرية التعلم يمكن أن يقال عنها أنها تدعم ضرورة إيجاد مستوى أعلى من أنماط ثورندايك الأربعة أو ضرورة إضافة خطوات أخرى في تنظيمه الهرمي لأنماط التعلم.

 

الإشراط الإجرائي  Operant Conditioning

ما هو الإشراط الإجرائي ؟

للإجابة على هذا السؤال دعنا نستقرئ, الأمثلة التالية:

المثال الأول:

لاحظ أحد المعلمين أن مشاركة أحمد في الأنشطة الصفية ضعيفة, فهو بالكاد يحاول الإجابة على سؤال يوجه له, ويفضل التزام الصمت ونادراً ما يبدي أي رأي أو يقدم أية مشورة أو اقتراح.

قرر هذا المعلم أن يعتني بأحمد فراح يكلفه بمهمات بسيطة ويخصص له مكافأة كلما أنجز المهمة فتارة يشكره وتارة يعطيه درجة إضافية, وأخرى يطلب من زملائه أن يصفقوا له, فلاحظ أن أحمد قد بدأ يتغير وصار يشارك في الأنشطة الصفية.

المثال الثاني:

لاحظت إحدى الأمهات إعجاب ابنها بمعلمته في الروضة, فكثيراً ما يمدحها ويثني عليها ويكرر " أنا أحبها".

 حاولت الأم أن تبحث عن أسباب هذا الإعجاب وطاعة المعلمة. فوجدت أن هذه المعلمة تشجع طفلها بمنحه نجوماً أو توجه له مديحاً, أو تقربه منها كلما أبَدَّى تعاوناً ومشاركة في الحصة.

المثال الثالث:

وجد من خلال الدراسات التي أجريت على الحمام في المختبر أن الحمامة قد تعلمت أن تنقر في مكان معين كلما أرادت أن يعطيها المجرب حبة قمح.

إن تأمل هذه الأمثلة يتيح لنا فرصة استخلاص مفهوم الاشراط الإجرائي ( الوسيلي In – Strumental ), والذي يمكن التعبير عنه بالشكل التالي:

مثير . استجابة. النتائج ( تعزيز, عقاب )

أي أن النتائج المترتبة عن الاستجابة هي التي تشجع الكائن الحي على أداء تلك الاستجابة كلما ظهر المثير الأصلي. بتعبير آخر فإن الاشراط الإجرائي عملية بموجبها يترابط السلوك بنتائجه .

دراسات سكينر B. Skinner:

أول من أظهر وجهة النظر السلوكية الإجرائية في دراسة التعليم العالم السلوكي الأمريكي الشهير ب.ف سكينر Burrhus Frederic Skinner (1904–1990) ويسمى بعضهم نظريته بالاشراطية الحديثة, أو الإشراطية الإجرائية, أو السلوكية الحديثة, وقد تركز كتابات سكينر على الإشراط الإجرائي، وبرمجة التعلم, والتحليل التجريبي للسلوك, وهذا الذي أعطاه أهمية بين علماء النفس, وجعله أكثر احتراماً في الدوائر الأخرى.

يرى سكينر, أننا إذا راقبنا السلوك عن قرب, فإننا نرى أن الفرد يتعلم أي شيء يقدم له نتائج بصورة أخرى إننا إذا حددنا مكافأة, تلحق بسلوك معين, فإننا نلاحظ أن ذلك السلوك يزداد ظهوره بشكل متكرر. وأن السلوك الذي لا يتبعه تعزيز يتناقص.

لذلك فإن السلوك يتشكل بواسطة ما يحدث بعد الاستجابة, وهذا ما يسميه سكينر بالتعزيز Reinforcement وتتطور الاستجابات عن طريق التحكم في التعزيز. وتزداد تلك الاستجابات, التي تميل إلى الظهور وتتكرر, وبإيقاف تقديم التعزيز لاستجابة ما فإن ذلك يؤدي إلى إيقاف الاستجابة أو عدم تطورها, أو زيادتها.

يلاحظ أن سكينر قد بدأ بفكرة ثورندايك الأساسية, ولكنه أضاف الإجراء النظامي System – atic Procedure إجراء خطوة, خطوة, أو التقاربات المتسلسلة المصحوبة بتعزيز, لتغيير وتعديل السلوك, وقد سمي هذا الإشراط بالإشراط الإجرائي Operant Conditioning .

و يمكن تمييز الإشراط الإجرائي عن الاشراط الكلاسيكي, من خلال النظر إلى السلوك المشروط, ففي الشرطية الكلاسيكية, يستجيب الحافز ( طعام، شراب،. الخ)، استجابة معينة محددة من الفرد. ففي تجربة بافلوف, استجاب الطعام استجابة آلية, هي سيلان اللعاب, أما في الإشراط الإجرائي, فإن السلوك يكون مشروطاً, ونابعاً من الفرد, وأن المثير لا يسبب الاستجابة بمجرد عرضه, لذا فإن على المجرب أن ينتظر من الفرد, أن يظهر السلوك المرغوب, ومن ثم يعزز ذلك السلوك.

ويعتمد الاشراط الإجرائي على نتائج الاستجابة في حين يركز الاشراط التقليدي على اقتران المثير بالاستجابة, ويرى سكينر أن معظم التعلم, وخاصة في المستويات العليا, يتبع الاشراط الإجرائي, ويكون المتعلم أمام عدد كبير من المثيرات التي تثير الاستجابة, أكثر من كون هذه المثيرات دليلاً عليها, إذ أن الاستجابات المعززة تتزايد باستمرار, وأن الاستجابات غير المعززة تتناقص, فيصبح بالتالي المتغير الرئيس, هو التغير في السلوك.

ومن الجدير بالذكر أن الاشراط الإجرائي غالباً ما يرتبط باسم سكينر  Skinner, عالم النفس الأمريكي المشهور, والذي انطلقت دراساته مما انتهى إليه ثورانديك, أي من قانون الأثر، حيث طور ما عرف باسم "صندوق سكينر   Skinner box" للكشف عن مبادئ ضبط السلوك. و استطاع من خلاله إشراط سلوك الفئران والحمام وهي موجودة داخل الصندوق للقيام بعدد من الاستجابات التي حددها هو. و توصل من خلال تجاربه لمبادئ الاشراط الإجرائي, فالحمامة مثلاً كان عليها إما أن تنقر على دائرة من الضوء داخل الصندوق أو أن تنفر جناحها أو تمشي في حركة دائرية أو ترفع عنقها فوق مستوى معين, أو حتى أن تضرب طابة التنس الصغيرة من مكان لآخر قبل حصولها على الطعام. وبموجب مبادئ الاشراط التي توصل إليها, استطاع أن يعلم الحمامة أن تنقر في مكان معين ( رافعة ) إذا ما أرادت الحصول على حبة القمح, وأن تدور حول نفسها أو تسير في خط مستقيم نحو الرافعة. وبالمثل علم الفأر أن يضرب على رافعة للحصول على الطعام.

ولقد أفرزت هذه الدراسات والتجارب عن تبلور فكرة سكينر  Skinner عن الإشراط الإجرائي والتي أبرزها في كتابه (نظم التعزيز).

 الاشراط الوسيلي  Instrumental Conditioning:

إن طائفة كبيرة من الإجراءات التي استخدمت على نطاق واسع في المختبر لتوليد الاشراطات هي من نوع الاشراط الإجرائي. وفي هذه الإجراءات فإن الاستجابة الشرطية هي إجرائية وذلك لكون العضوية تقوم في حالتها بعمل شيء ما. إن الاستجابة هي بالضبط إجرائية من حيث كون العضوية في حالتها إما أن تسعى للحصول على مكافأة أو إنها تحاول تجنب موقف مؤلم.

إن الاستجابة تحدث في حالة واحدة من الحالات الآتية:

1. خفض مثير مؤذٍ أو الهرب منه.

2. تجنب مثير مؤذٍ.

3. تأمين باعث إيجابي كالطعام والماء.

4. طمس حالة ما لها إرتباط مع 1 , 2 , 3 أعلاه.

إن نتائج الاستجابات المشروطة هو تعزيز  Reinforcement لهذه الاستجابات.  ولذا فإن النتائج تدعى بالمعززات والحصول عليها يسمى بالتعزيز. ففي حالة أسلوب بافلوف في الاشراط, فإن مسحوق اللحوم الذي كان يوضع على لسان الكلب كان بمثابة المكافأة لاستجابة سيلان اللعاب, وهو في الوقت نفسه المثير غير الشرطي.

إن الاستجابة في حالة الاشراط الكلاسيكي هي من النوع الثابت تماماً, والذي يحدث باستمرار وأنه من الممكن التوقع بحدوثه في حالة حدوث المثير غير الشرطي. ولكن الأمر ليس كذلك في حالة الاشراط الإجرائي. ففي حالة هذا النوع من الاشراط فإن الاستجابة هي النوع الذي يجب ربطه بالمثير الشرطي من خلال التعلم.

إن المثير غير الشرطي في حالة الاشراط الكلاسيكي يمكن التعرف إليه بسهولة, بينما في حالة الاشراط الإجرائي فإنه من الصعب التعرف إليه. إن المثير الشرطي يمكن أن يكون عدداً من المثيرات المحددة مثل الحرمان من الأكل والماء. بالإضافة إلى الجهاز المستخدم في التجربة والعديد من المثيرات الداخلية والخارجية التي تتحد معاً لتكون مثيراً قادراً على توليد الاستجابة غير الشرطية بالطرق الإجرائية.

و فيما يأتي بعض مظاهر الاشراط الإجرائي و أنواعه:

أولاً: التدريب على الهرب Escape Training:

إن أحد أساليب الاشراط الإجرائي هو التدريب على الهرب, وفي هذا الأسلوب توضع العضوية في موقف بحيث يؤثر فيها مثير مؤذ ينتهي مفعولة عندما تقوم العضوية بعمل معين وذلك مثل الهروب من الجزء المكهرب من قفص, وفي مثل هذا الموقف. فإن التيار الكهربائي هو المثير غير الشرطي والذي يولد الاستجابة غير الشرطية التي هي عبارة عن الزيادة في توتر الجسم, أو القفز.... الخ.

وفي أسرع وقت ممكن, فإن الحيوان يتعلم الهروب من المثير المؤذي Noxious إلى الجزء غير المكهرب من الصندوق. إن هروبه هو إجراء ينتج عن توقف الإثارة الكهربائية. إن اختزال الألم هنا يعمل بمثابة المعزز, كما أن الهروب من الجزء المكهرب من الصندوق هو الاستجابة الشرطية.

إن التدريب على الهروب هي مواقف قلما تستخدم عن قصد من قبل المربين, ولكنها غالباً ما تستعمل إذا كان جو المدرسة هو العقاب والقمع. وفي هذه الحالات. فإنه يمكن الهروب من الموقف المخيف أو المهدد بالحال, إن الطفل قد يدرس بجدية أو يتظاهر بذلك حتى يمكنه أن ينصرف من المدرسة في الوقت المناسب وحتى لا يضطر إلى التأخر هناك, وبذلك فإنه يهرب.

إن الهروب النفسي من المواقف المؤذية يمكن أن يأخذ شكل أحلام اليقظة. إن مثل هذا الأسلوب قد يصبح غير مقبول وداعياً لعدم التكيف إذا كان له صلة بالمواقف الأكاديمية. وإذا أصبح مثل هذا السلوك هو النمط السائد, فإنه يسبب لصاحبه الكثير من المتاعب و المشاكل الشخصية.

ثانياً: التدريب على التجنب أو الابتعاد Avoidance Training:

إن الظروف الخاصة بالاشراط يمكن أن يجري ترتيبها, حيث أن العضوية لا تكتفي بالهروب حتى تتفادى الإثارة المؤذية عندما تحدث وإنما تتجنبها تماماً. وبتوظيف الأسلوب نفسه في حالة التدريب على الهروب بالإضافة إلى مثير أخر. فإن التدريب على التجنب يمكن توليده. فبالنسبة للقفص الذي يوجد به جزء يمكن كهربته في حالة التدريب على الهرب.

فمن الممكن إضافة مثير أخر ليسبق الصدمة الكهربائية. فالحيوان في البداية تعلم الهروب من الجزء المكهرب من القفص عندما يسير فيه التيار الكهربائي. وفي هذا الموقف فإن الضوء أو الجرس هو المثير الشرطي والصدمة الكهربائية هي المثير غير الشرطي. أما الاستجابة غير الشرطية فهي الركض لتفادي الصدمة. والاستجابة الشرطية لتجنب الصدمة.

وفي داخل الصف فهناك بلا شك, مجالات عديدة للتدريب على التجنب, فالطلاب يمكن أن يتعلموا ضرورة تسليم الواجبات في مواعيدها حتى يتحاشوا الظروف المحرجة التي تصاحب التأخر فيها, وأنهم يدرسون تفادي اللوم على الرسوب, وأنهم قد يتعلمون التهجية حتى يتفادون الانزعاج المصاحب لعدم القدرة على تهجية الكلمات بشكل صحيح. كما أنهم يسلكون سلوكاً جيداً حتى يتجنبوا النقد الاجتماعي.

 ثالثاً: التدريب من أجل الحصول على المكافأة ايجابية:

إن ترتيب الشروط لحصول التعلم تحت تأثير التدريب من أجل الحصول على المكافأة الإيجابية تختلف عن التدريب الخاص بالهروب أو الابتعاد,  إن الموقف هنا يكون أكثر تعقيداً وأن اكتشاف السلوك المناسب هو أكثر صعوبة فإذا وضع حيوان جائع في قفص توجد به رافعة من الواجب الضغط عليها قبل الحصول على الطعام, فمن الضروري أن يتعلم الحيوان الضغط عليها للوصول إلى ذلك. إن المثير غير الشرطي غير معروف بشكل جيد في هذا الموقف. ولكن المثيرات هي بلا شك تلك الخاصة بالجوع وتلك الممثلة بالجهاز التجريبي. إن الاستجابات غير الشرطية هي على وجه الاحتمال عبارة عن عدد من الدوافع العامة ذات المستوى المرتفع.

ومن بين الاستجابات التي أمكن توليدها, عن طريق الموقف المثير فإن استجابة الضغط على الرافعة هي التي يتم تعزيزها ( أي يصبح الطعام متوفراً ) إن الضغط على الرافعة هو الاستجابة الشرطية إن التدريب من أجل الحصول على المكافأة يمكن أن تفسيره من وجهة نظر التعزيزات الموجبة أو من خلال الإطار المرجعي للهروب والابتعاد والمثيرات المؤذية.

وفي هذا الموقف, إذا تم استهلاك الأكل, وقل مستوى الجوع, فإن تأثير المثير المؤلم يكون قد انتهى وبذا فإن العضوية تكون قد هربت من المثير المؤلم. إن هذا التفسيرات المتباينة يمكن أن تنتج التفضيلات الشخصية, أي اعتماداً على ما إذا كانت العبارات الموجبة أو السالبة هي المفضلة. إن الحيوان يمكنه أن يضغط على الرافعة للحصول على الطعام أو التخفيف من وطأة المثير المؤلم, وذلك اعتماداً على ماذا نقرر أن يكون الهدف.

إن استخدام التعزيزات الموجبة في العملية التربوية وفي تدريب الأطفال قد تم النظر إليها منذ زمن بعيد على أنها أسلوب مؤثر. فعن طريق تعزيز الاستجابات المطلوبة فإن الآباء والمعلمين يواجهون أو يعدلون السلوك التربوي والأكاديمي للأطفال الذين يشرفون عليهم. إن التعزيزات الإيجابية تستعمل بكيفيات مختلفة وفي مواقف متعددة بحيث إنه يسهل على القارئ أن يتعرف إلى قسم كبير منها .

 وقد أفرزت هذه الدراسات التي قام بها سكينر  Skinner و مجموعة كبير من علماء النفس السلوكي, عدداً من المفاهيم الهامة في مجال الاشراط الإجرائي وفهم آليته ومنها التعزيز, والعقاب, والتشكيل Shaping, وسنتناول في ما يلي هذه المفاهيم بشيء من التفصيل.

 التعزيز Reinforcement :

التعزيز هو العملية التي بموجبها يكتسب المثير أو الحدث قوة تزيد من احتمالية تكرار السلوك الذي يليه.

والتعزيز هو التقوية والتدعيم والتثبيت بالإثابة.

فالسلوك يتعلم ويقوى ويدعم ويثبت إذا تم تعزيزه. والتعزيز قد يكون إثابة أولية مثل إشباع دافع فسيولوجي, أو قد يكون إثابة ثانوية مثل زوال الخوف. ويؤدي التعزيز بالإثابة إلى تدعيم السلوك وإلى النزعة لتكرار السلوك المعزز.

ويرتبط مفهوم التعزيز في التعلم باسم كلارك هل   Clark Hull (1952–1884).

لقد ركز سكينر  Skinner  على قيمة التعزيز وقال أن تعلم أي سلوك يجب أن يقسم إلى خطوات صغيرة متتابعة كل خطوة تتم بنجاح. وكل خطوة يجب أن يتم تعلمها بدرجة صحيحة وتعزز قبل الانتقال إلى الخطوة التالية. وبطبيعة الحال يجب أن ترتب الخطوات الواحدة تلو الأخرى بحيث تؤدي إلى اللاحقة وتعتبر إعداداً لها.

ويؤكد سكينر Skinner أنه من الأفضل والأكثر فعالية تعزيز التعلم الصحيح بإثابته أكثر من العقاب على التعلم غير الصحيح, ويلاحظ أن النموذج الذي قدمه سكينر Skinner طبق في التعلم المبرمج وآلات التدريس وفي الإرشاد والعلاج السلوكي خاصة في المخاوف والسلوك القهري.

وقد حدد سكينر  Skinner أهمية مبدأ الإشراط والتعزيز في عملية الإرشاد النفسي بأنه تعزيز استجابة صحيحة لدى عميل ( متعلم ) فإنه يميل إلى تكرارها والقيام بامتحانات مماثلة في المستقبل. ويتجنب العقاب والإصغاء والتقبل يعزز المرشد محاولات العميل وهو يتكلم عن سلوكه المضطرب في جو خال من التهديد.

 مفهوم التعزيز:

يستخدم الثواب و العقاب في حياتنا اليوميّة على نحو واسع, لما ينتج عنهما من آثار في السلوك, ويكرس الكائن البشري جزءاً من نشاطاته اليومية, محاولاً الحصول على الخبرات الإثابية وتجنب الخبرات العقابيّة, لمعرفته الأكيدة بأن السلوك المرغوب متبوع بالتعزيز أو الاستحسان عادة, في حين يتلو العقاب السلوك غير المرغوب فيه.

إن التعزيز هو الحادث أو المثير الذي يؤدي إلى زيادة احتمال تكرار حدوث الاستجابة موضوع التعزيز, أي الاستجابة المسبوقة بالتعزيز مباشرة. وقد يكون إيجابياً. وذلك في حالة تقديم أو تطبيق بعض المثيرات المرغوب فيها على النمط السلوكي, تؤدي إلى زيادة احتمال تكرار حدوثه مستقبلاً. وقد يكون التعزيز سلبياً, عندما تتم إزالة بعض المثيرات غير المرغوب فيها, بعد أداء نمط سلوكي معّين, فإنهاء حالة العقاب أو الألم أو الإزعاج, يؤدي إلى زيادة احتمال تكرار حدوث الاستجابات أو الأنماط السلوكيّة التي سبقت هذه الإزالة في المستقبل.

إن تعريف التعزيز على هذا النحو, يعتمد على آثاره السلوكيّة, أي على ما ينتج من تغيرات في السلوك, دون أية ضرورة للرجوع إلى بعض الخصائص الانفعاليّة له. فالمثير أو الحادث يغدو معززاً إذا أدى إلى ازدياد احتمال حدوث السلوك المعزز مستقبلاً. وابتسامة المعلمة لا تقوم بوظيفة المعزز, إلا إذا أدت إلى تقوية السلوك الذي ترغب في تقويته عند تلاميذها. بيد أن تعريف التعزيز على هذا النحو الإجرائي يثير بعض الصعوبات. فالمثيرات التي تحيط بأية استجابة كثيرة جداً, ولا بد من تحديد عدد محدود منها يعمل كمعززات, كما تشير الدلائل إلى المعززات قد تختلف من حيث آثارها التعزيزية من فرد لآخر, أي أن ميكانيزم التعزيز يعمل على نحو مختلف لدى الأفراد المختلفين, حتى في حالة استخدام المعزز ذاته.

لهذا حاول بعض الباحثين تطوير تعريفات نظرية للتعزيز, بالإضافة إلى التعريف الإجرائي, في محاولة منهم لفهم طبيعة التعزيز على نحو أفضل, وأخذوا ينظرون إليه كعمليّة افتراضيّة تؤثر بشكل أو بآخر, في ميكانيزمات الدافعيّة أو الارتباط, بحيث تغدو ظاهرة ازدياد احتمال تكرار الاستجابة المعززة أمراً أكثر وضوحاً وأقرب إلى الفهم, فتحديد العلميات المؤدية إلى تغيّر السلوك, يشرح الآلية التي يُنتجُ فيها التعزيز آثاره التعزيزية, و يبين لماذا تعمل بعض المثيرات أو الحوادث كمعززات, في حين تفشل مثيرات وحوادث أخرى في أداء وظيفة المعززات, كما يساعد على تفسير تباين آثار التعزيز عند الأفراد المختلفين.

ولدراسة مثل هذه العلميات, تناول الباحثون البحث في النتائج الحسيّة للمعززات, وطبيعة الاستجابات المعززة, والتغيرات الدافعيّة التي تتلو التعزيز  وخرجوا بما يلي:.

أولاً: الخصائص الاستثارية للمعززات:

 يرى بعض الباحثين أن آلية التعزيز تعزى إلى قدرة المعززات على استثارة أعضاء الاستقبال الحسيّة عند العضوية, فالفأر الذي يتعلم الضغط على الرافعة لدى وجود ضوء أحمر مثلاً, يقوم بهذه الاستجابة نتيجة استثارة الضوء لبعض الأعصاب الحسيّة لديه, بحيث يحدث اقتران بين الاستجابة ( الضغط على الرافعة ) والإثارة الحسية التي ينتجها الضوء في مكان ما من الجهاز العصبي للفار ( Old and Milner , 1954 ), وقد أكدت دراسة أخرى هذا التفسير لآلية التعزيز, مبيّنة أن تباين الاستثارة الذوقيّة يؤدي إلى تباين في أداء بعض الاستجابات, حيث يزداد معدل أداء هذه الاستجابات بازدياد تركيز السكر في الماء ( Stebbins, 1962 ).

يوحى هذا الاتجاه في تفسير ميكانزم التعزيز بأن قدرة المثير على إنتاج الإثارة الحسيّة هو الشرط الضروري لإحالة هذا المثير إلى معزز. قد يبدو ذلك صحيحاً, لكن اتصاف المثير بمثل هذه القدرة, رغم ضرورتها, لا يجعل من المثير معززاً, لأن تحديد المعزز بخاصية الإثارة الحسيّة, شرط ضروري لكنه غير كاف, فالمثير الذي ينتج إثارة حسية, ليس معززاً بالضرورة, لأن الاستثارة الحسيّة في ذاتها غير كافية لتحديد المعززات. فبعض المثيرات يؤدي إلى تناقض الاستجابة في حالة تزايد قدرتها على الإثارة, وبعضها الآخر لا ينتج تغيراً في السلوك على الإطلاق, كما أن الإثارة الناجمة عن بعض المثيرات, كالطعام والشراب, تختلط بعوامل أخرى قد تؤثر في فاعلية التعزيز كتخفيض الحاجة إلى الطعام أو الشراب.

ثانياً: خصائص الاستجابة والمعززات:

ما هو دور العوامل الاستجابية في التعزيز ؟ وهل تؤثر بعض الأنماط السلوكيّة في بعض الأنماط الأخرى, فتعمل على زيادة احتمال تكرارها ؟ إن المنحنى الإجرائي المتبع لبيان ما إذا كان احتمال تكرار حدوث بعض أنماط الاستجابات, يزداد بالنسبة لبعض أنماط الاستجابات الأخرى, يعتمد على التسلسل الزمني الذي تحدث طبقاً له أنماط الاستجابات بتكرارات مختلفة ( Premack, 1959 ), وتسمى هذه الظاهرة بمبدأ بريماك.

مبدأ بريماك  The Premack Principle:

تخيل أنك معلم رياضة في احدى المدارس الثانوية وأن طلبتك يحبون لعبة كرة القدم ولكنهم أقل حماسة للمشاركة في حملة نظافة المدرسة. فكيف تُفعّل من حماسهم بهدف المشاركة الجادة في تلك الحملة ؟

يمكن ذلك من باستخدام مبدأ بريماك Premack المنسوب إلى صاحبه ديفيد بريماك Premack (1965).

يؤكد بريماك Premack أن الانخراط في نشاط مرغوب فيه ( لعبة كرة القدم يمكن أن يكون معززاً للانخراط في نشاط أقل مرغوبية ) المشاركة في حملة النظافة.

فإذا كان لدينا نمطان من الاستجابات, النمط ( أ ) والنمط ( ب ) وكان احتمال حدوث نمط الاستجابة ( أ ) أكبر من احتمال حدوث نمط الاستجابة ( ب ), فإن احتمال حدوث النمط ( ب ) سوف يزداد إذا كان متبوعاً بالنمط ( أ ) والعكس صحيح, أي أن احتمال حدوث النمط ( أ ) سوف ينخفض إذا كان متبوعاً بالنمط ( ب ).

ويمكن إيضاح هذا المبدأ بالمثال التالي, لنفرض أن احتمال مشاهدة الأطفال للأفلام الكرتونية التلفزيونية ( نمط أ ) أكبر من احتمال مطالعتهم لكتبهم المدرسية ( نمط ب ), ولتقوية استجابة المطالعة أو القراءة عند هؤلاء الأطفال, يجب أن يكون مشاهدة التلفزيون شرطاً لاستجابة المطالعة أو القراءة, أي يستجيب الأطفال بالقراءة والمطالعة على النحو المرغوب فيه أولاً, ومن ثم يشاهدون التلفزيون, وبما أن مشْاهدة التلفزيون أكثر تواتراً من القراءة أو المطالعة وتتلوهما, فستؤدي هذه المشاهدة إلى تقوية القراءة, أي أن الاستجابة للتلفزيون تعزز الاستجابة للقراءة. ويمكن القول على نحو أكثر عموميّة, بأن السلوك الأكثر تواتراً يمكن أن يعزز السلوك الأقل تواتراً .

وقد أعتبر سكينر  Skinner مبدأ بريماك Premack مستنداً على فرصة التعزيز الإيجابي. إذ يفترض مبدأ بريماك Premack " وعد الطفل بالمكافأة بعد إتمامه عملاً أو مهمة ما تم تحديدها " هي بمثابة تعزيز يقدم للطفل يضمن له ممارسة ذلك الأداء في كل مرة يتم فيها تحديد الأداء و تحديد المكافأة – ممارسة ما يرغبه الطفل .

 من الأمثلة أيضاً على تطبيق هذا المبدأ اتفاق الأم مع أبنها أن تسمح له بممارسة العاب الكمبيوتر بعد أن ينهي واجباته المدرسية, أو أن تقول له كلْ طعامك أولاً وبعد ذلك تأكل الحلوى. في المثالين: ممارسة العاب الكمبيوتر نشاط مرغوب فيه. إنجاز الواجبات المدرسية أقل مرغوبية. أكل الطعام أقل مرغوبية. أكل الحلوى مرغوب فيه أكثر .

إن إحدى التضمنات الهامّة المترتبة على مبدأ بريماك Premack, تشير إلى أن العلاقة التعزيزية بين الاستجابات قابلة للعكس, فالاستجابات الأكثر تواتراً يمكن أن تزيد احتمال حدوث الاستجابات الأقل تواتراً, وأن الاستجابات الأقل تواتراً, يمكن أن تخفض احتمال حدوث الاستجابات الأكثر تواتراً.

و قد بيّن بريماك Premack صدق مثل هذه العلاقة العكسيّة على نحو تجريبي, فقد تزداد استجابة الأكل عن الفئران من أجل الركض, كما يمكن أن تزداد استجابة الركض من أجل الطعام. وبما أن العلاقة التعزيزيّة بين الاستجابات ذات اتجاهين, لذا يجب الانتباه إلى أن السلوك ذا التواتر الضعيف, قد يغدو سلوكاً تعزيزياً في حالة زيادة احتمال حدوثه أو تواتره, فالاستجابات غير المرغوب فيها وذات المعدل التكراري المرتفع كالكذب مثلاً, يمكن أن تغدو معززات لاستجابات أخرى أقل تواتراً, كالضرب, فإذا كانت استجابة الضرب ( الاستجابة الأقل تواتراً ) متبوعة باستجابة الكذب (الأكثر تواتراً ) فسيزداد احتمال تكرار استجابة الضرب مستقبلاً. ولعل هذا ما يفسر, جزئياً على الأقل, اقتران العديد من الأنماط السلوكيّة غير المرغوب فيها عند بعض الأطفال ذوي المشكلات السلوكيّة, لأن هذه الأنماط تعزز بعضها بعضاً حسب معدل تواترها وتسلسل حدوثها. ويبدو أن العلاقة التعزيزية بين الاستجابات, تنطبق بشكل خاص على استجابات صغار الأطفال, فالطفل الذي يحب اللعب أو الركض أو مشاهدة التلفزيون ( استجابات ذات تواتر مرتفع ) يمكن أن يمارس نشاطات مدرسية متنوعة, كالقراءة والكتابة والحساب, ( استجابات ذات تواتر منخفض ) إذا كانت هذه النشاطات شرطاً يجب أداؤه من أجل ممارسة اللعب أو الركض أو مشاهدة التلفزيون.

على الرغم من أهمية مبدأ بريماك Premack وفائدته في مجال تغير السلوك, وبخاصة في الأوضاع التي تتطلب الضبط الذاتي, إلا أن مشكلة مقارنة أنماط أو فئات الاستجابات بناء على معدلات تكرارها فقط, يشكل بعض الصعوبة لدى استخدام هذا المبدأ في أوضاع تطبيقية. إذا يفترض أن الاستجابة ذات التكرار الأعلى, هي الاستجابة المتعلّمة على نحو أفضل, وبما أن الاستجابات ليست بمستوى واحد من حيث الصعوبة أو السهولة, فإن أداء بعض الاستجابات أصعب من أداء استجابات أخرى, لذا يبدو من غير المنطقي أن نساوي بين الاستجابات من حيث معدل الأداء, معتمدين في التمييز بينها على عدد مرات تكرارها فقط, فقد ينخفض معدل أداء بعض الاستجابات بسبب الجهد اللازم توافره لأدائها, أو بسبب عدم تعلّمها على نحو جيد. لذلك لا بد من تحديد بعض الخصائص الأخرى للاستجابة, لبيان مدى فاعليتها التعزيزية كالشدة والديمومة وعوامل أخرى يمكن أن تتدخل في هذه الفاعلية, وربما هذا ما حدا ببعض الباحثين إلى استخدام مفهوم الدافعية من أجل تحديد الخصائص التعزيزية للمثير أو الحادث التعزيزي .

ثالثاً: الدافعيّة والتعزيز:

  تشير الدلائل إلى وجود ارتباط وثيق بين الدافعية والتعزيز, فالطعام مثلاً, يقوم بوظيفة المعزز الفعال في حالة جوع العضويّة فقط, فما لم يكن الحيوان " مدفوعاً " بالجوع, فإن الاستجابات التي تسبق تقديم الطعام مباشرة لن تتقوى. إن مثل هذه الملاحظات من جهة, و التأكيد الوظيفي على قدرة العضويّة على التكيف مع بيئة من جهة أخرى, أدت إلى القول بأن عملية تكوين الارتباطات, ناتجة عن تغير الحالة الدافعيّة للعضوية, وأن التعلم, طبقاً لوجهة النظر هذه, هو عمليّة تقوية ارتباطات محددة ناجمة عن تخفيض أو اختزال حافز ينشأ عادة عن حاجة ما, أو ناجمة عن تخفيض في خصائص الحوادث أو المثيرات التي تستثير ذلك الحافز.

لهذا فإن المثيرات التي تؤدي وظيفة المعززات, لا تقوي الاستجابات التي تسبقها على نحو عشوائي, بل تقوي الاستجابات المتخذة وسيلة أو ذريعة لتحقيق الحافز فقط. لذلك تعتبر عملية تخفيض الحافز شرطاً ضرورياً للتعلم, فالاستجابة التي تفشل في تحقيق حافز ما, لا يتم تعلمها. ويمكن القول عموماً بأن المثير المعزز, هو المثير الذي ينتج استجابات تؤدي إلى تخفيض الحافز أو اختزاله.

و ينسب كلارك هل Clark Hull (1952–1884) للحافز وظيفتين أساسيتين, فهو يزود العضوية بالقوة, فالحيوان يكون أكثر نشاطاً عندما يكون مدفوعاً, ويمكّنها من تقرير حالتها الدافعيّة بتوجيهها نحو المثيرات التي تتفق مع هذه الحالة, وهي الوظيفة الاستثارية للحافز التي تجعل الحيوان قادراً على التمييز بين المثيرات المتباينة, إن الطبيعة المزدوجة للحافز تثير إشكالاً لدى تحديد ميكانيزمات التعزيز, فالتغير في الأداء الناجم عن تغير في الدافعية يمكن أن يعود إلى التغير في الحالة الاستثارية للعضوية, أي إلى اختزال الحافز, أو إلى تغير في خصائص المثير الذي يضبط الاستجابة, بحيث يضعف النزعة إلى القيام بالاستجابة. وتبقى الفكرة الأساسية في هذا المنحنى أن تخفيض مستوى الدافعية شرط ضروري وأساسي للتعزيز.

و للتحقق من صدق هذا الشرط, قام شيفيلد وروبي ( Sheffield and Roby , 1950 ) بدراسة تجريبية بينت أن الفئران تتعلم القيام باستجابات معينة نتيجة تعزيزها بمحلول السكرين ذي الطعم الحلو الخالي من القيمة الغذائية, أي أن الفئران تعلمت دون أن ينخفض مستوى الجوع لديها, وأشارت دراسة تجريبية أخرى إلى تخفيض مستوى الدافعية يؤدي إلى تقوية الاستجابات فعلاً ( Miller and Kessen , 1952 ),  وهنا يمكن القول بأن تخفيض مستوى الدافعيّة شرط كاف للتعزيز, إلا أنه ليس شرطاً ضرورياً.

أما سكينر  Skinner, فيرفض أصلاً استخدام مفاهيم الدافعية لدى تناوله مشكلة تغير الأداء, ويفضل الحديث عن عدد ساعات حرمان الحيوان من الطعام, وبيّن تجريبياً أن قوة الاستجابة ( في حال قياسها بقوة مقاومتها للمحو ) لا ترتبط بعدد ساعات حرمان الفئران من الطعام, بل بعدد مرات تعزيز هذه الاستجابة, أي بالتاريخ التعزيزي السابق للحيوان (التعلم السابق ) وليس بحالته الدافعية ( Hilgard and Bower, 1975 ). ويمكن القول عموماً بأن الحالة الدافعية للحيوان قد تقوى لديه بعض الاستجابات التي تختزل مستوى هذه الدافعية, إلا أن هذا الاختزال ليس شرطاً ضرورياً لإنتاج آلية التعزيز, إذ يمكن حصول التعلم دون دافعيّة مبدئية على الإطلاق .

أهمية التعزيز Reinforcement :

إن تفوق نظرية سكينر  Skinner في فهم السلوك وتفسيره, تكمن في تحليله المفصل, لطبيعة التعزيز, إذ يوجد هناك أربعة أحداث يمكن أن تحدث, بعد ما يجري المتعلم الاستجابة:

1. يمكن لبعض المثيرات الإيجابية, أن تتبع الاستجابة, ( ويسمى هذا بالمكافأة ).

2. يمكن لبعض المثيرات, أن تتبع الاستجابة التي يجريها المتعلم.

3. يمكن أن تؤدي الاستجابة إلى التخلص من المثيرات السلبية.

4. يمكن أن لا يتبع الاستجابة شيء ما.

إن الطفل الذي يقول: " من فضلك ", يكافأ ببعض الحلوى, فيفرح, ثم يكرر " من فضلك " في المرات التالية, ويحصل على حلوي. إن استجابة الطفل مشروطة, ويسمى هذا النوع التعزيز الإيجابي Positive Reinforcement. فالاستجابة "من فضلك " تلحق بمثير إيجابي – حلوى –  يتعلم  الطفل أن نوع الحالة هذه من الاستجابة – تفصل –  أن يحصل على نتيجة مرغوبة.

وفي حالة أخرى, يتكئ ولد بوجهه على ذراعه المثني, يئن ويتأوه ويقول " عمي " حتى تحل ذراعيه, وإذا هوجم في يومٍ تال وواجه ألماً فإنه سيقول " عمي " بسرعة أكبر, لأن الطفل اعتاد أن يقول " عمي " لينجو من ألم يواجهه.

إن الطالب الذي يمارس سلوك الحركة الزائدة داخل الصف لعدد من المرات, ومن ثم إنزال المعلم عقوبة الجلوس في المقعد المخصص لمن يمارس سلوكاً غير مرغوب فيه Time out chair, وذلك بعد أن يوضح له المدرس سبب معاقبته ومن ثم سحب المثير المؤلم عن الطفل ( وهو جلوسه في المقعد Time out chair ) ورجوعه لمكانه العادي وممارسته لسلوك الهدوء المرغوب وقد تغير سلوكه نحو الأفضل بفعل التعزيز السلبي Negative Reinforcement.

ومن هنا يلاحظ أن كلاً من:

التعزيزين السلبي Negative Reinforcement

والإيجابي Positive Reinforcement

 يقويان السلوك المرغوب ويضعفان السلوك المرغوب ويضعفان السلوك غير المرغوب.

وقد كان لفرضيات التعزيز التي توصل إليها أهمية كبيرة حيث أمكن استخدامها في التعليم الصفي, في تشجيع ممارسة النشاطات البناءة المفيدة لدى الأطفال في مرحلة الروضة والمدرسة الابتدائية على وجه الخصوص.

و من تقصي وبحث ما يميل إليه الأطفال من معززات مهمة أمكن التوصل إلى ما سمى " بقائمة التعزيز " حيث يختار الطفل من هذه القائمة ما يميل إلى ممارسته بعد إنهائه النشاط المحدد أو بعد إنهاء السلوك الذي طلب إليه ممارسته.

وقد اشتقت هذه النشاطات من آراء الأطفال, وكانت تعرض أمامهم في كل موقف يصل فيه الطفل إلى مناسبة الحصول على تعزيز ومن هذه القائمة ما يظهر في الشكل .

   لقد طور العلماء السلوكيون في الاشراط الإجرائي بقيادة سكينر عدداً من مبادئ التعزيز منها:

أ ـ مبدأ التعزيز الإيجابي والسلبي.

المثيرات المفرزة ليست جميعها من نوع واحد بمعنى لا تؤدي جميع أنواع التعزيز إلى زيادة احتمال حدوث الاستجابة في حال تكرار نفس الموقف المعزز وإنما تصنف المفرزات إلى فئتين مختلفتين شكلاً متشابهتين من حيث الوظيفة.وهما:

1. المعززات الإيجابية Positive Reinforcement:

إن المعزز الإيجابي مثير مرغوب يتبع السلوك ويزيد من احتمال تكراره كالطعام الذي يقدم للقطة في تجارب ثوراندايك، حيث يعمل الطعام كمعزز إيجابي للإنسان والحيوان وكذلك فإن الألعاب والنقود والجوائز والأشياء غير المحسوسة كالمديح والاهتمام تعمل كمعززات إيجابية.

في بعض الحالات فإن الصراخ على الطفل الذي يعرض سلوكاً غير مقبول يعتبر معززاً إيجابياً إذا كان ذلك هو الطريقة الوحيدة التي يعبر بها الأب أو الأم عن الاهتمام بالطفل.

 ومن الأمثلة على التعزيز الإيجابي:

  •   العمولة التي يحصل عليها الفرد الذي يعمل في مجال المبيعات.
  •  السماح للطفل بمشاهدة برامج التلفزيون بعد أن يقوم بترتيب غرفته ولذلك فإنه يقوم بترتيبها كل يوم.
  •   مدح الطالب الذي يحصل على علامة عالية مما يدفعه إلى بذل مزيد من الجهد في دراسته.

2. المعززات السلبية Negative Reinforcement:

التعزيز السلبي: إنهاء أو سحب مثير غير مرغوب بعد القيام بالسلوك المناسب وهو يعمل أيضاً على زيادة تكرار السلوك.

إن ضغط الفأر داخل صندوق سكينر Skinner box على القاطع بحيث يتوقف سريان التيار الكهربائي مثال على التعزيز السلبي.

إن المعلم الذي يستخدم الإقصاء مع الطالب المشاغب إنما يستخدم التعزيز السلبي مع الطالب إذا كان الطالب يرى في الإقصاء كفترة استراحة وتحرر من إتمام المهام مع الطلبة في غرفة الفصل, إن المعلم في هذه الحالة ودون أن يقصد يعزز سلبياً السلوك المعطل.

يبكي الطفل ليحصل على ما يريد, يستجيب الأب لهذا البكاء ويتوقف الطفل عن البكاء ما الذي حدث ؟

المثير المنفر ( البكاء ) ثم التخلص منه وبالتالي فإن الطفل قد تمّ تعزيزه سلبياً من خلال سلوك الأب ومن المحتمل أن يستجيب الأب بنفس الطريقة في المرة القادمة.

إن مبدأ التعزيز السلبي هو الذي يفسر عندما يستخدم الفرد المسكن للتخلص من الصداع, إن المسكن قد قام بتعزيز سلبي وأدى إلى التخلص من الموقف المزعج.

يشار إلى التعزيز السلبي في بعض الأحيان على أساس ظروف أو عوامل الهروب, لأن الفرد يتعلم أن يقوم بسلوك يقلل أو يوقف مثيراً منفراً, فإغلاق النوافذ ووضع القطن في الأذن هروباً من الضجة هو تعزيز سلبي.

ومن الأمثلة على التعزيز السلبي:

  •    لعب الموسيقى لإنهاء حالة الضجر.
  •    تنظيف الغرفة للتخلص من تعليقات الزميل المقيم معك.
  •     إيقاف ساعة المنبه .

إن هذا التصنيف للمعززات يقابل الثواب والعقاب وأثر كل منهما في التعلم.

ب ـ مبدأ التعزيز الأولي و الثانوي.

رأينا أن المعززات تعرّف بآثارها, فأي حادث أو مثير, يؤدي إلى زيادة احتمال تكرار حدوث استجابة ما, يمكن اعتباره معززاً، ورأينا أيضاً أن المعززات تقسم إلى نوعين, معززات إيجابية, وهي المثيرات التي تزيد من احتمال حدوث الاستجابة نتيجة تطبيقها على نمط سلوكي معين, ومعززات سلبيّة, وهي المثيرات التي تزيد احتمال حدوث الاستجابة نتيجة إزالتها أو حذفها من سياق سلوكي ما, والمعززات, إيجابية كانت أم سلبية, تؤدي إلى زيادة احتمال تكرار السلوك موضع الاهتمام. وبالإضافة إلى تقسيم المعززات إلى سلبية و إيجابية, يمكن تقسيمها إلى معززات أولية و معززات ثانوية.

 و تشير المعززات الأولية إلى المثيرات أو الحوادث التي تنتج آثاراً في السلوك دون تعلم سابق أو دون تاريخ تعزيزي سابق, وعليه نستطع أن نقول إن المعزز الأولى هو الحدث المثير الذي يملك إمكانية تعزيز السلوك بدون خبرة تعلم سابقة, فالطعام معزز للشخص الجائع, وكذلك الماء لمن يشعر بالعطش, والنوم يشبع الحاجات البيولوجية. و كلها تصنف كمعززات أولية إيجابية, لأنها تحدث أثر في السلوك دون تعلم مسبق, ولأنها تضاف إلى سياق الوضع التعليمي. أما المعززات الأولية السلبيّة, فهي المثيرات المنفرة  Aversive Stimuli, كالصدمة الكهربائية والضوضاء الشديدة والبرد والحر الشديدين.. وتعتبر هذه المثيرات معززات, لأن حذفها أو إزالتها من الوضع التعليمي يقوي السلوك, لذلك هي سالبة, وتعتبر أولية, لأنها تؤثر في السلوك دون تعزيز سابق.

أما المعززات الثانوية, فهي المثيرات أو الحوادث التي لا تملك بطبيعتها خصائص التعزيز, أي المثيرات الحيادية التي لا تؤدي بسبب طبيعتها الأصلية إلى زيادة احتمال تكرار الاستجابات, ولكنها بسبب ارتباطها أو اقترانها المتكرر بالمعززات, اكتسبت قيمة التعزيز ذاته, و نستطيع أن نقول بأن المعزز  الثانوي قد اكتسب قيمته التعزيزية لاقترانه بمعزز أولى, فإذا تعلم الفأر الضغط على الرافعة من أجل الحصول على الطعام, ثم اقترنت هذه الاستجابة ( الضغط على الرافعة ) بضوء أخضر  مثلاً, فسيكتسب هذا المثير ( الضوء الخضر ) خاصيّة أو قيمة التعزيز, ويغدو قادراً على الحفاظ على الاستجابة، بل وعلى تقويتها أيضاً, ويسمى الضوء في هذه الحالة معززاً ثانوياً.

 ولان الفرد يتعلم أن هذه المثيرات أصبحت مغرزات يمكن تسميتها مغرزات شرطية, وأفضل مثال على المعززات الثانوية هو النقود إنها لا تملك قيمة ذاتية ولكن يتعلم الأفراد أنها يمكن أن تستبدل بمعززات أولية فمن خلال النقود يحصل الفرد على الطعام والمأوى.

تأخذ المغرزات الثانوية قيمتها خلال الخبرات التي يتعرض لها الفرد. هناك عدد هائل من المعززات الثانوية في حياة الأفراد. ففي المواقف الاجتماعية: التربيت على الظهر, المديح أو الإطراء, والتواصل البصري أمثلة على تلك المغرزات.

و يكون المعزز الثانوي إيجابياً, إذا اقترن بمعزز أولي إيجابي, فاقتران الضوء بالاستجابة التي تؤدي إلى الحصول على الطعام, يجعل من الضوء معززاً ثانوياً إيجابياً, لأن الطعام معزز إيجابي أولي. ويكون المعزز الثانوي سلبياً, إذا اقترن بمعزز أولي سلبي, فاقتران الضوء باستجابة الهرب الناتجة عن إنهاء صدمة كهربائية, يجعل الضوء معززاً ثانوياً سلبياً, بحيث يؤدي حضوره إلى حدوث استجابة الهرب وتقويتها.

ومن الجدير بالذكر في هذا الصدد, إن المعززات الثانوية التي اكتسب خاصية التعزيز, لا تعزز الاستجابات الأصلية التي اقترنت بها في البدء فحسب, بل يمكن أن تعزز استجابات أخرى جديدة لا صلة بينها و بين الاستجابات الأصلية, أي أن المعززات الثانوية, يمكن أن تقوي أو تعزز أنماطاً سلوكية جديدة, غير تلك الأنماط التي اقترنت بها أثناء عملية اكتسابها لخاصية التعزيز . 

شروط التعزيز:

هناك عدد من العوامل أو الشروط ذات علاقة وثيقة بفاعلية التعزيز وأثره في معدل التعلم و مستوى الأداء المطلوب. وقد تناول بعض علماء النفس دراسة ثلاثة من هذه الشروط, مبينين أثرها في التعزيز, وهي, مقدار المثير المعزز ( حجم الإثابة )، وإرجاء المعزز ( تأجيل تقديم الإثابة ), وتواتر المعزز ( معدل تكرار تقديم الثواب ), و نتناول فيما يلي شرح هذه الشروط وأثرها في معدل الأداء بشكل مختصر.

 أولاً: حجم المثير المعزز أو مقداره:

تعتبر كمية المثير المعزز ( الإثابة ) متغيراً هاماً من متغيرات التعزيز, إذ يعتقد أن قوة الارتباط تزداد بازدياد حجم المعزز، هذا إن اعتبرنا أن معدل الأداء دليلاً على هذه القوة. وتبيّن أيضاً أن إدراك العضوية لهذا الحجم يؤثر في معدل الأداء, بغض النظر عن الحجم الفيزيائي الواقعي له. فالكمية الواحدة من الطعام تؤثر في الأداء على نحو متباين, نتيجة لتباين الشكل الذي يأخذه هذا الطعام عند تقديمه, حيث أسفر بعض الدراسات عن نتائج مفادها أن الفئران التي تتلقى كميّة من الطعام على شكل كريات متعددة, تتفوق من حيث الأداء على الفئران التي تتلقى كمية الطعام ذاتها ولكن على شكل كرية واحدة. وقد يعود السبب في ذلك إلى كون الحجم المادي للمثير المعزز ليس مكافئاً للحجم المدرك ( أي كما تدركه العضويّة ), فقطعة الشوكولاة التي تزن 50 غ مثلاً, تبدو أقل حجماً من خمس قطع تزن كل منها 10 غرامات. كما قد يعود السبب أيضاً على طبيعة النشاط السلوكي الذي يجري تحت شرطين تعزيزيين مختلفين, أي إلى أنماط الاستجابات الاستهلاكية التي يتناول الحيوان بها الطعام المقدم له.

و أياً كانت الأسباب أو العوامل التي تؤدي إلى هذه الظاهرة, أو تساهم في ظهورها – ظاهرة تغير الأداء بتغير كمية المعزز وطريقة إدراكه – فإن حجم المثير المعزز أو مقدار الثواب أو المكافأة, يؤثر في فاعلية المثير التعزيزية ويؤدي إلى تباين في مستوى الأداء, لذا يجب الانتباه في ميدان التعلم الإنساني, إلى هذه الظاهرة, وتزويد المعلمين بمعززات ذات مقادير وأشكال تناسب الأنماط السلوكية المرغوب في تقويتها أو تعزيزها.

 ثانياً: إرجاء المعزز :

إن الفترة الزمنيّة التي تفصل بين الاستجابة وتقديم المثير الذي يعززها تشكل متغيراً هاماً من المتغيرات التي تؤثر في فعالية التعزيز. وتشير عدد من الدراسات إلى وجود علاقة ذات طبيعة عكسية بين قوة الارتباط ( أو التعلم ) وفترة الأرجاء, فكلما طالت فترة إرجاء تقديم المثير المعزز كان مستوى الأداء أدنى.

ولكن على أي حد يمكن إطالة فترة الإرجاء والإبقاء على خاصيّة التعزيز للمعزز ؟

حاول عدد من الباحثين الإجابة على هذا السؤال تجريبياً, وذلك بتدريب الفئران على القيام ببعض الاستجابات في شروط تتفاوت فيها الفترات الزمنيّة بين حدوث الاستجابة وتقديم المعزز, وقد تراوحت مدة هذه الفترات ( أي مدة فترة الإرجاء ) بين صفر وثلاثين ثانية. وتبين أن أفضل مستوى للأداء, يحدث عندما تقترن الاستجابة بالثواب أو التعزيز, أو عندما لا تتجاوز الفترة الزمنيّة التي تفصل بينهما نصف ثانية. كما تبين أن التعلم يمكن أن يحدث, ولكن بمستوى أداء أضعف عندما تبلغ فترة الإرجاء عشر ثوانٍ, في حين يندر أن يحدث التعلم عندما تصبح هذه الفترة 30 ثانية.

( Berin, 1943 ; Grice , 1948 ; Jenkins, 1950 ),

تشير هذه النتائج إلى أن المثيرات التي تتزامن من حيث حدوثها مع تقديم المعزز ( الثواب ), تكتسب خصائص المعزز ذاته, فإذا كان هذا المعزز قادراً على استثارة بعض الاستجابات, فستكتسب تلك المثيرات القدرة على استثارة هذه الاستجابات ذاتها. وهنا يجب الانتباه إلى أمرين أساسين:

الأول, وهو إمكانية اكتساب عدد من المثيرات لخاصية التعزيز, إذا تزامنت في حدوثها مع عملية التعزيز, لذا يجب على المعلم أن يحدد الاستجابات التي يرغب في تعزيزها فعلاً, بحيث يجعل المتعلم قادراً على تميزها من بين المثيرات الأخرى التي يمكن أن تتوافق معها.

والثاني, وهو الإسراع في تعزيز الاستجابات المرغوب فيها, فعندما يقوم المتعلم بأداء استجابة نرغب فيها, يجب تعزيزه مباشرة, بالمديح أو الاستحسان.... الخ... لكي نضمن مستوى أداء أفضل في المستقبل.

 ثالثاً: تواتر المعزز أو تكراره:

لا يتأثر السلوك في الأوضاع التعليمية بحجم المعزز وفترة إرجائه فحسب, بل يتأثر بتواتر المعزز أو تكراره أيضاً, وتشير وقائع الحياة اليوميّة إلى أن التعزيز لا يحدث بشكل مستمر, بحيث يتم تعزيز كل استجابة يقوم بها الفرد, بل على النقيض من ذلك, إن بعض الاستجابات يتم تعزيزها, في حين استجابات أخرى من النمط ذاته, لا تلقى مثل هذا التعزيز, فالصياد مثلاً, لا يحصل على السمك ( تعزيز ) في كل مرة يلقي بشباكه في البحر ( استجابة ), والمزارع قد لا يجني ثمار ( تعزيز ) مزروعاته باستمرار ( استجابة).

تسمى هذه الظاهرة بالتعزيز الجزئي, أي تعزيز بعض الاستجابات دون البعض الأخر, ويبدو من غير العادي أن يتم تعزيز كل استجابة, إلا في حالات تعليمة محددة على نحو شديد, وتناولت دراسات عديدة جداً بحث هذه الظاهرة لبيان أثر تكرار التعزيز في مستوى الأداء. وقام الباحثون من أجل الوقوف على هذا الأثر بدراسات تجريبية عززوا فيها بعض الاستجابات على نحو منتظم, كتعزيز إحدى الاستجابات وإهمال الأخرى, أو على نحو عشوائي, كتعزيز الاستجابة الأولى فالثالثة فالرابعة فالسابعة فالثامنة... الخ.

( Skinner,1957 ; Amrel, 1976 ; Logan and Wagner , 1965 )

  و بينت نتائج الدراسات أن مستوى أداء الاستجابات المعززة أسرع من مستوى أداء الاستجابات غير المعززة, وأن هذا المستوى يأخذ في التحسّن, كلما كان المتعلم غير قادر على التنبؤ بالاستجابات التي سوف تعزز, هذا و سنتناول بحث ظاهرة التعزيز الجزئي بمزيد من التفصيل عند الحديث عن جداول التعزيز .

جداول التعزيز عند سكينر B. Skinner:

 تعتبر جداول التعزيز عاملاً حاسماً بالنسبة للسلوك المتعلم, ويقصد بها النمط أو الطريقة المتبعة في تقديم التعزيز, فبعد أن يتم تشكيل السلوك المطلوب يمكن أن يقدم التعزيز وفق خطة أو طريقة معينة, و تصنف الجداول عادة إلى نوعين.

حيث يميز سكينر Skinner   بين نوعين أساسين من التعزيز هما:

التعزيز المستمر:

فيه يقدم التعزيز بعد كل استجابة, ولعل هذه الطريقة في التعزيز ابسط وأسرع في بناء الاستجابة.

فعلى سبيل المثال يحصل الفأر على الطعام في صندوق سكينر Skinner box في كل مرة يضغط فيها على الرافعة, ويحصل البائع على عمولة لكل سيارة يبيعها, هذا النوع من التعزيز ينتج أو يؤدي إلى سرعة عالية من الاستجابة. ولكن عندما يفقد المعزز فعاليته فإن الاستجابة تنخفض بسرعة. فالفأر غير الجائع تصبح هذه المعززات المستمرة غير فعالة ويكون استخدام التعزيز المستمر مفيداً عند تعلم الاستجابات الجديدة.

التعزيز المتقطع:

أو التعزيز الجزئي ويقصد به تعزيز الاستجابة في بعض مرات حدوثها وليس في كلها حيث يمكن بلوغ هدف التعلم وذلك بتعزيز كل استجابتين متتاليتين أو استجابة من كل ثلاث استجابات أو أربع أو خمس... الخ. ويهدف بشكل عام إلى المحافظة على السلوك المتعلم.

وبهذا الصدد فقد وجد أن بعض الفئران قد تعلمت الاستجابة المطلوبة عندما عززت استجابتها بمعدل تعزيز واحد لكل 192 استجابة. ويستخدم هذا الأسلوب بعد أن يتم تدريب المتعلم على المعالجة المطلوب القيام بها أي بعد استخدام أسلوب التعزيز السابق.

ويشير سكينر  Skinner في كتابه (نظم التعزيز) إلى كثير من أساليب التعزيز المتقطع وتأثيرها في سلوك المتعلم, ولأن أغلب ما يصدر عنها من الاستجابات، يتعزز بطريقة متقطعة.

إن هذه المسوغات تشير إلى أن آثار التعزيز المتقطع في السلوك أكثر أهمية وإثارة للانتباه من التعزيز المستمر ويمكن تصنيف جداول التعزيز المتقطع على أساس بعدين هما:

1. جداول النسبة: مدى التغير أو الثبات في جدول التعزيز.

2. جداول الزمن: الطريقة التي ينتج بها السلوك التعزيز، حيث يحدث التعزيز وفق نظام زمني يحدده المجرب.

جداول النسبة:

في هذه الجداول فإن عدد الاستجابات يقرر أو يحدد حصول العضوية على التعزيز أم لا. في بعض الحالات يُحَدَّد عدد من الاستجابات التي يجب أن تظهر حتى يقدم التعزيز.

مثال ذلك فإن على الحمامة أن تقوم باستجابة الضغط على الرافعة خمس مرات قبل أن يقدم لها الطعام. عندما يكون عدد الاستجابات المطلوب لتقديم التعزيز محدداً فإن هذا الجدول يسمى جدول "النسبة الثابتة ". ويمكن أن يقدم التعزيز بعد عدد غير ثابت من الاستجابات كان تعزز الاستجابة السابعة والثانية عشرة والخامسة والعشرين ويسمى هذا الجدول بجدول " النسبة المتغيرة ".

في كلا النوعين من جداول النسبة فإن على العضوية أن تقدم عدداًً كبيراً من الاستجابات, فكلما قدمت عدداً أكبر من الاستجابات فإنها تحصل على عدد أكبر من التعزيزات ولكن لوحظ أن معدل الاستجابات يكون الأعلى في حالة جدول " النسبة المتغيرة ".

عند استخدام " جدول النسبة الثابتة " لوحظت ظاهرة التوقف لفترة قصيرة بعد التعزيز, هذا التوقف لا يظهر في " جداول النسبة المتغيرة ". في حالة استخدام "جدول النسبة الثابتة " فإن المعزز يعمل كمؤشر لأخذ استراحة قصيرة. إذا كنت تستجيب وفق " جدول النسبة الثابتة " فكأنك تقول بعد خمس استجابات أخرى سوف احصل على التعزيز ويمكنني أن أخذ فترة راحة قصيرة قبل أن أبدأ في الاستجابة من جديد.

أفرض أنك كنت تقوم بعمل وضع أوراق في مغلف, وتحصل على دينار عندما تعبأ 200 مغلف, فلكي تحصل على مبلغ أكبر فإنك تعمل بأقصى جهدك وعندما تكمل مجموعة من 200 مغلف تأخذ استراحة قصيرة وتعد كم مجموعة قد أكملت.

إن مدة التوقف بعد التعزيز لا تكون بنفس الطول في كل " جداول النسبة الثابتة " حيث إذا كان عدد الاستجابات المطلوبة للحصول على التعزيز أكبر كلما كانت فترة التوقف أطول. كذلك كلما استغرق تقديم الاستجابات وقتاً أطول كلما كانت فترة التوقف أطول. لكن برهة التوقف لا تظهر عند استخدام " جداول النسبة المتغيرة " لأن الفرد لا يستطيع أن يتنبأ متى سيقدم التعزيز.

جداول الزمن:

 النوع الثاني يسمى " جداول الزمن "  ويعتمد على مرور الزمن قبل تقديم التعزيز, ففي جدول الزمن الثابت فإن فترة محددة يجب أن تمر قبل تقديم التعزيز. إن الاستجابات التي تتم قبل إنتهاء المدة المحددة لا تعزز في هذا النوع من الجداول. يسعى الأفراد إلى تقدير الزمن الذي مَرَّ ويقومون بمعظم الاستجابات في نهاية المدة المحددة عند اقتراب موعد التعزيز.

تميل العضوية عند تطبيق هذا النوع من الجداول إلى القيام بما يسمى الاستجابات المتوقعة An-ticipatory responses  في جدول الفترة الزمنية المتغيرة لا تستطيع أو العضوية أن تعرف بدقة طول الفترة التي ستمر قبل تقديم التعزيز ولأن التعزيز يمكن أن يقدم في أي وقت فإن الفرد يحاول أن يحافظ على مستوى ثابت ولكن ليس مرتفعاً للاستجابة.

إن معدل الوقت الذي يجب أن يمر قبل الحصول على التعزيز يؤثر على مستوى الاستجابة كلما كانت الفترة أطول قبل معدل أو مستوى الاستجابة. فقد لوحظ في التجارب أن الحمامة التي كانت تعزز كل دقيقتين, كررت الاستجابة ما بين 100-60 في الدقيقة, بينما عندما كانت تعزز كل 7 دقائق كررت الاستجابة ما بين 70-20 في الدقيقة .

أي هذه الجداول أكثر فعالية ؟

للإجابة على هذا السؤال يمكن الإشارة إلى النقاط التالية:

1. كلما كان الجدول المطبق أقرب إلى التعزيز المستمر كان التعلم أسرع.

2. تعمل جداول التعزيز المتقطع على المحافظة على السلوك المتعلم.

3. يختلف مستوى السلوك باختلاف الجداول المستخدمة, حيث:

‌أ- تتصف الاستجابة التي تعزز من خلال " جدول النسبة الثابتة " بمعدل عالٍ " وتوقف بعد التعزيز.

‌ب- يكون معدل الاستجابة أعلى في " جداول النسبة المتغيرة " مقارنة مع الجداول الأخرى.

‌ج- سرعة الاستجابة أقل عند استخدام " جداول الزمن ".

‌د- عند استخدام " جداول الفترة الزمنية الثابتة " تكون سرعة الاستجابة بطيئة وتتزايد مع اقتراب موعد التعزيز.

‌ه- عند استخدام " جداول الفترة الزمنية المتغيرة " تكون سرعة الاستجابة بطيئة ولكنها مستقرة.

4. تؤثر في الجداول واستخدامها مبادئ التعميم والتميز والامحاء.

 

العقاب:

يعتبر العقاب حدثاً غير سار يتبع السلوك ويقلل من احتمال إعادة ظهور السلوك, وبعكس التعزيز بنوعيه الذي يزيد من احتمال ظهور السلوك, ومع أن هناك خلط بين العقاب والتعزيز السلبي, إلا أنهما مختلفان, فبينما يقلل العقاب من احتمال ظهور السلوك فإن التعزيز السلبي يزيد الاحتمال من خلال إبعاد النتائج السلبية للسلوك .

يمكن تعريف العقاب إجرائياً بأنه الحادث أو المثير الذي يؤدي إلى إضعاف أو كف بعض الأنماط السلوكية, وذلك أما بتطبيق مثيرات منفّرة غير مرغوب فيها Aversive Stimuli على هذه الأنماط, أو بحذف مثيرات مرغوب فيها ( معززات إيجابية ) من السياق السلوكي, بحيث ينزع السلوك موضع الاهتمام إلى الزوال.

يشير هذا التعريف إلى أن العقاب كالتعزيز, يعرف بآثاره في السلوك, فالحادث أو المثير الذي يؤدي إلى كف استجابة يعتبر عقاباً, وعلى نحو شبيه بالتعزيز أيضاً, يمكن تقسيم العقاب إلى نوعين, عقاب إيجابي, ويحدث لدى تطبيق مثيرات منفّرة على بعض الاستجابات, وعقاب سلبي, ويحدث لدى حذف أو إزالة أو إيقاف بعض المثيرات المرغوب فيها من السياق التعليمي والتي تعمل كمعززات إيجابيّة. كالصدمة الكهربائية, أو الضرب, أو النور الشديد, أو الضجة الشديدة... الخ ومثيرات عقابية سلبيّة كمنع الطعام أو الراحة أو النوم, الذي يؤدي إلى الشعور بالحرمان والألم.

ويجدر الانتباه هنا إلى أن تحديد المثير كمعزز إيجابي أو عقاب سلبي, يتوقف على الإجراءات المتبعة في استخدامه وعلى ما ينجم عنه من آثار سلوكيّة. فإذا طبّق هذا المثير على وضع تعليمي وأدى إلى تقوية السلوك الذي نرغب فيه, أعتبر معززاً إيجابياً, وإذا حُذف من الوضع التعليمي, وأدى إلى كف السلوك الذي لا نرغب فيه, اعتبر عقاباً سلبياً, وعلى نحو مشابه, يحدد المثير كعقاب إيجابي أو تعزيز سلبي, بناء على الإجراءات المتّبعة في استخدامه وعلى ما ينجم عنه من آثار سلوكيّة. فإذا طبّق هذا المثير على وضع تعليمي وأدى إلى كف السلوك غير المرغوب فيه, اعتبر عقاباً إيجابياً, وإذا حذف من الوضع التعليمي وأدى إلى تقوية السلوك المرغوب فيه, اعتبر تعزيزاً سلبياً.

ويمكن إيضاح ذلك على النحو التالي: إن تقديم قطع الحلوى يعتبر تعزيزاً إيجابياً إذا قوّى بعض الاستجابات, ويعتبر حذفها عقاباً سلبياً إذا كف بعض الاستجابات. وإن تقديم الصدمة الكهربائية يعتبر عقاباً إيجابياً إذا كف بعض الاستجابات, ويعتبر حذفها تعزيزاً سلبياً, إذا قوّى بعض الاستجابات.

وعلى نحو شبيه بالمعززات أيضاً, يمكن تقسيم المثيرات العقابيّة إلى مثيرات عقابيّة أوليّة, ومثيرات عقابيّة ثانويّة, حيث تشير المثيرات العقابيّة الأوليّة إلى المثيرات أو الحوادث التي تنتج أثراً كفياً في السلوك, دون تعلم سابق, أو دون تاريخ عقابي سابق, كالضرب أو الصدمة الكهربائية أو الحرمان من الطعام أو الشرب أو الراحة... الخ. أما المثيرات العقابيّة الثانوية, فهي المثيرات أو الحوادث التي لا تملك بحكم طبيعتها القدرة على كف السلوك أو إزالته, و إنما تكتسب هذه القدرة بسبب ارتباطها أو اقترانها المتكرر بالمثيرات العقابيّة الأوليّة.

ويكون المثير العقابي الثانوي إيجابياً, إذا ارتبط أو اقترن بمثير عقابي أولي إيجابي, فالضوء الذي يقترن بالصدمة الكهربائية أو يرتبط بها, ويكتسب الخاصيّة العقابيّة للصدمة الكهربائية, يغدو مثيراً عقابياً ثانوياً إيجابياً, لأن الصدمة الكهربائية مثير عقابي أولي إيجابي. ويكون المثير العقابي الثانوي سلبياً, إذا ارتبط أو اقترن بمثير عقابي أولي سلبي, فالضوء الذي يقترن أو يرتبط بالحرمان من الطعام أو الشراب, يكتسب الخاصيّة العقابيّة للحرمان, ويغدو مثيراً عقابياً ثانوياً سلبياً, لأن الحرمان من الطعام أو الشراب عقاب سلبي أولي.

ومما يجدر بالذكر هنا, أن المثيرات الحياديّة, أي المثيرات التي لا تملك بحكم طبيعتها خصائص التعزيز ( تقوية السلوك ) أو خصائص العقاب ( كف السلوك ) يمكن أن تغدو مثيرات ثانوية تعزيزية أو عقابية على حد سواء, وذلك طبقاً للمثيرات الأوليّة التي تقترن أو ترتبط بها. فصوت الجرس مثلاً, قد يصبح معززاً إيجابياً ثانوياً إذا اقترن بتقديم الطعام, ومعززاً ثانوياً سلبياً, إذا اقترن باستجابة الهروب المؤدية إلى إنهاء أثر الألم الناجم عن الصدمة. وقد يغدو الجرس عقاباً ايجابياً ثانوياً إذا اقترن بتقديم الصدمة الكهربائية, وعقاباً سلبياً ثانوياً, إذا اقترن بإيقاف تقديم الطعام .

 

آثار العقاب في السلوك:

نظراً للاستخدام الشائع للعقاب في المؤسسات المجتمعيّة والتربوية المختلفة, والهادف إلى حذف السلوك غير المرغوب فيه، وتعزيز السلوك المرغوب فيه, لا بد من التعرف إلى الظروف التي يكون فيها العقاب فعالاً ومناسباً.

لقد بين ثورندايك Thorndike و سكينر  Skinner  وايستس ( Estes , 1944 ), أن العقاب ليس فعالاً بالضرورة، أي لا يؤدي إلى حذف أو كف السلوك, بالطريقة التي يؤدي بها التعزيز إلى تقويته, فالتعزيز أكثر فعالية من العقاب في مجال تغيير السلوك أو تعديله. ويرى سكينر  Skinner أن آثار العقاب في السلوك مؤقتة, لأن الاستجابات المكفوفة بالعقاب, قد تعود إلى طبيعتها ووضعها الأصلي إذا قيست بمعدل تكرارها. ويرى باحثون آخرون أن نتائج دراسات سكينر  Skinner ليست مطلقة, ويمكن كف بعض الاستجابات على نحو نهائي أو مطلق ضمن شروط عقابيّة معينة,

  ( Ellis et al, 1979 )، يجب توافرها ليغدو العقاب فعالاً, فما هذه الشروط ؟ و العوامل التي تؤثر في فعالية العقاب وآثاره ؟ .

العوامل المؤثرة في نتائج العقاب:

أشارت نتائج بعض الدراسات إلى أن الاستجابات تتباين في مدى مقاومتها لعمليات الكف, فالاستجابات الختاميّة Consummatory responses وهي الاستجابات ذات العلاقة بالأكل والشرب والاتصال الجنسي, والتي تشبع حاجات أولية أو بيولوجية عرضة للتأثر بالعقاب على نحو شديد, الأمر الذي يناقض ما هو متوقع, إذ من المعتقد أن هذا النوع من الاستجابات أكثر مقاومة للكف الناجم عن العقاب, نظراً لأهميتها البيولوجيّة وعلاقتها الوثيقة ببقاء العضوية والنوع (Solomon , 1964 ) فقد تبيّن أن العقاب يؤثر بشكل قوي في التواصل الجنسي عند القوارض ( Beach et al, 1956 ) وفي العديد من الاستجابات التغذوية عند العديد من الحيوانات, كالفئران, والضفادع, والسمك والكلاب والقرود, (Masserman, 1943; Klee,1944 Masserman and pechtel, 1953; Myer and Ricci,1968) وتعني نتائج هذه الدراسات عموماً, أن العقاب يؤثر على نحو فعال جداً في الاستجابات السلوكية ذات العلاقة بإشباع الحاجات الأولية للعضوية, بحيث يمكن كفها أو إزالتها بإجراءات عقابيّة دون مقاومة كبيرة.

جذبت هذه الظاهرة اهتمام بعض الباحثين ( Church,1969 ; Bertsch,1972 ) وحالوا تبيان ما إذا كانت بعض الاستجابات الإجرائية أو الوسيليّة المتعلمة, كالضغط على الرافعة من أجل الحصول على الطعام مثلاً, تتأثر  بالعقاب على النحو الذي تتأثر به الاستجابات الختامية, وتبيّن أن الاستجابات الختامية, أكثر عرضة للتأثر بالعقاب من الاستجابات المتعلمة – الإجرائية أو الوسيلية – إذا قيس هذا التأثر بمعدلات انخفاض تكرار الاستجابات موضوع العقاب.

على الرغم من عدم توقع مثل هذه النتائج, وافتقارها إلى التعليل المنطقي, إلا أنها تنطوي على أهمية بالغة في مجال التعلم الإنساني, فالأم العقابية مثلاً, قد تؤدي برضيعها إلى عدم الإمساك بالثدي أو زجاجة الحليب, كما قد تفقد قطع الحلوى قيمتها التعزيزية الأولية فيما لو تكرر اقترانها بمعلمة تلجأ إلى استخدام الأساليب العقابية لدى تعاملها مع صغار الأطفال.

إن الاستجابات الختامية, كتناول الطعام والشراب, هي استجابات نمطيّة وفطرية وبسيطة نسبياً, إذا قورنت بالاستجابات المتعلمة, الأكثر عدداً وتنوعاً و تعقيداً.

لذلك تناولت تجارب العقاب في معظم الأحيان, دراسة أثر تطبيق مثيرات منفّرة ( مؤلمة أو غير سارة ) على بعض الاستجابات التي تم تعلّمها بأساليب التعزيز الإيجابي.

 وتكاد تجمع أغلب الدراسات على أنه حتى يؤدي العقاب وظيفته بفعالية فلا بد من مراعاة التالي :

1. ينبغي على المُعَاقِب أن يعلن عن لائحة العقوبات للسلوكيات الغير مرغوبة, ويراعي فيها البدائل.

2. على المُعَاقِب أن يطبق العقاب فور وقوع المخالفة السلوكية.

3. أن يكون العقاب قوياً لدرجة كافية, دون أن يحدث العقاب تلفاً أو ضرراً بليغاً بالمعاقب.

4. ينبغي تطبيق العقاب فور وقوع السلوك غير المرغوب فيه و بشكل مستمر.

حيث دلت نتائج معظم هذه التجارب على أن أثر العقارب يتوقف على أربعة عوامل رئيسة، هي: قسوة المثير العقابي, الفترة الزمنيّة الفاصلة بين تطبيق العقاب والاستجابة المعاقبة, والتاريخ العقابي السابق للعضويّة, وتوافر الاستجابات البديلة .

ونتناول فيما يلي العوامل التي يتوقف عليها أثر العقاب كلاً منها على حدة لتبينها:

  أولاً: قسوة العقاب:

استخدم الباحثون حوادث ومثيرات وإجراءات عديدة في دراساتهم التجريبيّة لبيان فعالية الإجراءات العقابيّة في كف السلوك, كصفع الأنف أو مقدمة الوجه, والصدمة الكهربائية أو الهوائية أو الصوت المرتفع... إلخ, غير أن الصدمة الكهربائية كانت أكثر هذه المثيرات استخداماً لسهولة التحكم في قدرها أو كميتها من الوجهة التجريبيّة, وسهولة التعرف إلى أثر تباين شدة المثير العقابي في كف الاستجابات موضع البحث. وتبيّن أن فعالية العقاب مرتبطة بقسوته التي يمكن تحديدها بعاملين, هما:

شدة الألم الناجم عن تطبيق المثير العقابي.

ديمومة هذا الألم أو فترة استمراره

حيث يتباين معدل الكف نتيجة لتباين قسوة العقاب, حيث توجد علاقة عكسية بين الاستجابات الصادرة أو المنبعثة عن العضوية, وشدة المثير العقابي وديمومته. فالصدمة الكهربائية الخفيفة والتي تستمر عشر الثانية مثلاً, أقل فعالية في كف الاستجابات من الصدمة الكهربائية الأقوى والتي تستمر نصف الثانية.

( Korsk , 1962 ; Azrin , 1963; Storms et at al, 1965 ; Boe, 1966 ).

 هذا وقام بعض الباحثين بتجربة أبدت هذه النتيجة, حيث دمجوا شدة العقاب وديمومته لبيان أثر هذين العاملين معاً في كف السلوك غي المرغوب فيه, ووجدوا أن الكف يرتبط بقسوة المثير العقابي على نحو مباشر, وأن هذه القسوة نتيجة تفاعل شدة المثير العقابي مع ديمومته, وتوصلوا إلى المعادلة التالية:

قسوة العقاب = الشدة × الديمومة           ( church et al , 1967 )

 توحي هذه النتائج بأن العقاب المستخدم في كف أنماط استجابيّة معينة, يجب أن يبلغ مستوى معيناً من القسوة لكي يغدو فعالاً وينتج التغيرات المطلوبة في السلوك, لذا يجب على المعلم أن يكون حكيماً لدى اختياره للمثيرات العقابيّة, بحيث تكون مناسبة للاستجابات المرغوب في كفها أو إزالتها, لأن نتائج الدراسات تشير بوضوح تام إلى أن التغير في معدل أداء الاستجابات يتباين بتباين قسوة العقاب .

 ثانياً: الفترة الزمنية الفاصلة بين تطبيق العقاب والاستجابة المعاقبة:

 هل يلعب الزمن الفاصل بين الاستجابة وتطبيق العقاب دوراً في تحديد فعالية العقاب وأثره في كف هذه الاستجابة ؟

أي هل يجب تقديم المثير العقابي بعد حدوث الاستجابة غير المرغوب فيها مباشرة ؟.

يرى ايستس ( Estes , 1944 ), أن مثل هذا الفاصل الزمني لا يؤثر في فعالية العقاب, ويفسّر أثر العقاب في السلوك بتزايد الحالة الانفعالية للعضوية والناجمة عن تطبيق المثيرات المنفرة أو المؤلمة, وليس باقتران الاستجابة بالمثير العقابي. وهذا ما دعا بعض الباحثين إلى دراسة ما إذا كان الاقتران بين الاستجابة والمثير المنفّر ضرورياً لإنتاج الأثر الكفّي في السلوك.

  لقد أشارت نتائج بعض الدراسات إلى أن الإجراءات العقابيّة التي تعالج الزمن كمتغير مستقل, تلعب دوراً هاماً في فعالية العقاب, وأن هذه الفعاليّة لا تعود بالضرورة إلى الحالة الانفعالية الناجمة عن توقيع العقاب, بل إلى العلاقة الزمنيّة بين المثير المنفر والاستجابة, وهذه العلاقة, هي علاقة عكسيّة, أي كلما قصرت الفترة الزمنيّة بين تقديم المثير المنفر والاستجابة موضوع العقاب, كان هذا المثير أكثر فعالية في كف الاستجابة.

( Azrin,1956; Comp et al,1967; Church,1970 )

الأمر الذي يشير إلى أهمية الاقتران بين الاستجابة والعقاب في تحديد فعالية العقاب, وإلى الدور الحاسم الذي يلعبه الزمن في عملية الكف الاستجابي .

 ثالثاً: التاريخ العقابي السابق:

يشكل تعرّض العضوية السابق للمثيرات المنفّرة, وخبرتها السابقة في هذا الصدد, عاملاً آخر من العوامل التي تحدد فعالية العقاب, غير أن نتائج الدراسات التي تناولت هذا العامل, لم تتفق على تحديد أثره ودوره في مجال كف السلوك. ففي الحين الذي أشار فيه بعض الدراسات إلى أن الخبرة المسبقة للعضوية بالمثيرات المنفرة أو المؤلمة يخفّض مستوى فعاليّة العقاب ( Mil-ler, 1963; Carch,1963 ), أشارة دراسات أخرى إلى أن مثل هذه الخبرة تزيد من فعالية العقاب.

( Pearl et al, 1964 )

  وفي ضوء هذه النتائج المتناقضة, قام رايموند ( Raymond, 1968 ) بعدد من التجارب لبيان الشروط العقابية السابقة التي تؤثر في زيادة أو خفض أثر العقاب اللاحق. ودلت نتائجه على أن أثر الخبرة العقابية السابقة يختلف باختلاف قسوة العقاب اللاحق, فإذا كانت هذه القسوة شديدة, فإن الخبرة العقابيّة السابقة تخفض أثر العقاب اللاحق أو تحدّ من فعاليته, أما إذا كانت القسوة معتدلة, فالخبرة العقابيّة السابقة تزيد من فعالية العقاب اللاحق.

يبدو أن تعارض نتائج الدراسات التي تناولت أثر الخبرة العقابية السابقة في العقاب اللاحق, يعود إلى تباين الإجراءات العقابيّة التجريبية المتّبعة, وتباين المثيرات المنفرة المستخدمة من حيث شدتها وديمومتها وعدد مرات تطبيقها. ولكن يمكن القول عموماً, بأن العقاب ( كخبرة تعلميّة سابقة ) يؤثر في السلوك اللاحق, و بخاصة في حال تشابه السياقات السلوكية التي لم يتم فيها إيقاع العقاب. وتحديد اتجاه هذا الأثر –  اتجاه زيادة الفعالية أو خفضها  –  يتوقف على معرفة التاريخ العقابي السابق للعضوية, و متغيرات الوضع العقابي اللاحق .

رابعاً: توافرية الاستجابات البديلة:

يسود اعتقاد مفاده أن العقاب أداة فعالة جداً في تعديل السلوك, إذا استخدمت فترة كف الاستجابات غير المرغوب فيها في تعليم استجابات جديدة, تتعارض مع الاستجابات القديمة, حيث يمكن للإجراء العقابي أن ينتج آثاراً كفيّة طويلة المدى, إذا توافرت استجابات إضافية تتمكن العضوية من تعلمها وأدائها في فترة العقاب, فالأم التي تعاقب طفلها بسبب مص إبهامه, تفعل خيراً فيما لو وفرت الظروف لهذا الطفل, بحيث يتمكن من استخدام إبهامه ذاته في أداء استجابات أخرى يتم تعزيزها, كالإمساك بالقلم والكتابة أو الرسم... الخ. ويبدو أن العقاب يغدو أكثر فعالية في تعديل السلوك, إذا كان المتعلم ( أو العضوية ) قادراً على تعديل أنماطه الاستجابيّة لعقاب مستقبلي.

إن عدم قدرة المتعلم على ضبط المثيرات العقابيّة, بسبب عدم توافر الاستجابات البديلة, كعدم قدرة الفأر على الهرب نتيجة إيقاع الصدمة الكهربائية عليه, يؤدي إلى ما يسمى بالعجز التعلمي Leamed Helplessness.

( Solomon et al , 1977 )

و قد أظهرت نتائج بعض الدراسات أن الكلاب التي تتلقى صدمة كهربائية, ولا تستطيع ضبط ظهور الصدمة ( أي التنبؤ بها ) أو إنهائها بأداء استجابة تجنبيّة ( استجابة الهرب من الصدمة ) تعَّوق على نحو شديد من حيث قدرتها على أداء الاستجابات التجنبيّة التي تعلمتها سابقاً, في حين تعلمت الكلاب على نحو سريع جداً القيام بأداء مثل هذه الاستجابات, لدى توافر الظروف التي تمكنها من الهرب و تجنّب الصدمة. و قد أشارت دراسات أخرى إلى صدق هذه النتائج في مجال التعلم الإنساني, فالفرد الذي يكون في سياق مؤذ أو غير مرغوب فيه, و يكون غير قادر على التنبؤ بالمثيرات المزعجة, أو غير قادر على إنهائها لدى حدوثها, يعوّق تعلمه وأداؤه على نحو شديد ( Gass and Singer , 1973 ), لذا يجب إيقاع العقاب على نحو يمكن التنبؤ به,  و توفير استجابات بديلة تمكن المتعلم من إنهاء الحالة العقابيّة بتعلم استجابات مرغوب فيها, وبهذا الإجراء, يمكن التخلص من أنماط سلوكية غير مرغوب فيها, وتعلم أنماط أخرى مرغوب فيها في الآن نفسه .

 العقاب و السلوك الإنساني:

إن الرجوع إلى نتائج الدراسات التي تناولت بحث الإجراءات العقابيّة المتنوعة, يتيح فرصة استنتاج بعض القواعد العامة التي توجه إجراءات استخدام العقاب في تعديل بعض الأنماط السلوكية غير المرغوب فيها عند المتعلمين. واستنتاج مثل هذه القواعد, لا يعني دفاعاً عن استخدام العقاب أو تأييده أو تبريره, ولا يوحي باستخدام العقاب بديلاً عن التعزيز الإيجابي, و بخاصة في حال توافر الفرص لاستخدام هذا النوع من التعزيز. وبما أن العقاب أداة واقعية في حياتنا, ويلجأ إلى استخدامه الكثير من الآباء والمعلمين في أوضاع تعليمية وسياقات سلوكيّة مختلفة, لذا يجب معرفة شروط استخدام الإجراء العقابي في الأوضاع التي يكون فيها استخدامه أمراً لا مفر منه, بحيث يؤدي إلى نتائج ناجعة في مجال ضبط السلوك أو تعديله أو علاجه.

و يمكن في ضوء ما أسفرت عنه نتائج الدراسات المختلفة تقديم الموجهات أو النصائح التالية, في حال ضرورة اللجوء إلى استخدام العقاب:

1. يجب أن تكون شدة المثير العقابي ذات مستوى مرتفع نسبياً, وأن تبلغ فترة التعرض لهذا المثير مستوى معقولاً, بحيث تتوافر الفرصة المناسبة لإنتاج الألم أو الإزعاج القادر على كف الاستجابات غير المرغوب فيها.

2. يجب تقديم المثير العقابي في حدّه الأقصى دفعة واحدة ومنذ المرة الأولى لتطبيقه, أي يجب عدم تقديم المثير العقابي على نحو تدريجي, بحيث تزداد قسوته مرة تلو الأخرى, لأن البحوث أثبتت عدم جدوى العقاب إذا ازدادت قسوته تدريجياً.

3. يجب إيقاع العقاب بعد حدوث الاستجابة غير المرغوب فيها مباشرة, فقد تبين أن العقاب الفوري أكثر نجاعة من العقاب المؤجل, فكلما قصرت الفترة الزمنية الفاصلة بين الاستجابة والعقاب, كان العقاب أكثر فعالية ونجاعة.

4. يجب عدم استخدام العقاب على نحو متكرر, بحيث يغدو إستراتيجية شائعة, وبخاصة عندما تكون قسوة المثير العقابي معتدلة, فقد تبيّن أن العقاب المتواتر يسمح بظهور الاستجابات المعاقبة حتى في وجود المثير المنفرد.

5. يجب عدم تقديم الثواب أو المعززات الإيجابية بعد توقيع العقوبات, لأن العقوبة قد تكتسب خصائص التعزيز الإيجابي إذا كانت متبوعة بهذا التعزيز, فلدى القيام بمعاقبة الطفل, يجب عدم إظهار المحبّة له, فقد يعود إلى ممارسة الاستجابة التي عوقب من أجلها, للحصول على المعزز ( إظهار المحبة ).

6. يجب أن توافر الاستجابات البديلة عند توقيع العقاب, فتوافر الاستجابات السلوكية المقبولة التي يمكن أداؤها تجنباً للعقاب, يجعل فاعلية هذا العقاب أكثر نجاعة في كف الاستجابات السلوكية غير المقبولة.

7. يفضل في معظم الأوضاع العقابية, استخدام العقاب السلبي, أي الحرمان من المعززات الإيجابية, وهذا يتطلب معرفة التاريخ التعزيزي السابق للفرد, للوقوف على المثيرات التي يعتبرها معززات إيجابية, ولعل حرمان الطفل من مشاهدة فيلم كرتوني تلفزيوني من أفضل العقوبات التي يمكن توقيعها عليه, إذا كان مغرماً بمثل هذه الأفلام.

8. إن أحد أكثر المبادئ النفسية أهمية في العقاب, والذي يتجاهله الآباء والمعلمون عادة عندما يرغبون في تعديل سلوك الأطفال, هو أن العقاب يبلغ حدّه الأقصى من حيث الفاعلية, عندما يرتبط بالتعزيز الإيجابي للأنماط السلوكيّة المرغوب فيها, لأن الأداة الأساسية لتعديل السلوك تكمن في التعزيز الإيجابي, وليس في العقاب. وغالباً ما يسمع الأطفال بما لا يجب عليهم أداؤه أو القيام به من السلوك. ونادراً ما يتم تعزيز سلوكهم المرغوب فيه. إن التعزيز الإيجابي للسلوك المرغوب فيه, هو القاعدة, أما عقاب السلوك غير المرغوب فيه, فهو الاستثناء .

 المحو Extinction:    

ماذا يحدث لو توقف تعزيز الاستجابات التي تم تعلمها بالتعزيز ؟

يبدأ الطفل بالكف عن البكاء عادة عندما يتعلم أن هذه الاستجابة ( البكاء ) لم تعد متبوعة بالطعام أو الحلوى أو الحمل. كما يتوقف الطفل العدواني عن إطلاق تهديداته, عندما يتعلم أن ألآخرين يتجاهلون هذه التهديدات باستمرار بغض النظر عن النتائج التي يمكن أن يسفر عنها. يشير هذان المثالان إلى أن الاستجابات تأخذ بالزوال إذا انقطع التعزيز عنها, بحيث يمكن القول عموماً, بأن رفع التعزيز عن الاستجابات التي تم تعلّمها به, يؤدي إلى إضعاف أو كف هذه الاستجابات على نحو تدريجي, أي سينخفض تواتر حدوثها مستقبلاً, وهو ما يسمى بالمحو.

على الرغم من اشتراك العقاب والمحو في بعض المظاهر, إذ يتضمّن كل منهما إضعاف بعض الاستجابات المتعلّمة أو كفها, إلا أنهما مختلفان, فالمحو يهدف إلى إضعاف الاستجابات أو كفها بالتوقف عن تقديم المعززات أو إزالتها, أي ينطوي المحو على إزالة مثيرات مرغوب فيها, أما العقاب فيهدف إلى إضعاف الاستجابات أو كفها بتطبيق مثيرات منفرة أو مؤلمة, أي ينطوي على تقديم مثيرات غير مرغوب فيها.

يقاس أثر المحو عادة بمدى مقاومته الاستجابات المتعلمة لعملية المحو الناتجة عن رفع أو إيقاف المثيرات التي تعززها, أي بعدد الاستجابات التي تؤديها العضوية بعد التوقف عن تقديم المعززات, فقد بينت الدراسات أن المحو لا يحدث بعد انقطاع التعزيز مباشرة, بل يحدث على نحو تدريجي, أي يتباطأ معدل أداء الاستجابات غير المعزّزة, إلى أن تأخذ بالزوال والاختفاء، وهذا ما دعا الباحثين إلى دراسة مقاومة الاستجابات للمحو, للتعرف إلى العوامل التي تؤثر فيه.

العوامل التي تؤثر في المحو:

    تشير نتائج البحوث إلى أن عملية المحو تتأثر بعدد من العوامل, تجعل الاستجابات موضوع المحو متباينة من حيث قدرتها على مقاومة هذه العمليّة.

ونتناول فيما يلي بعض أهم هذه العوامل وهي: عدد مرات التعزيز, كمية التعزيز, وتغاير المثير والاستجابة, وتغاير التعزيز.

أولاً: عدد مرات التعزيز:

يبدو أن العلاقة بين عدد مرات التعزيز التي يتم تطبيقها أثناء تعلم استجابة ما, و قدرة هذه الاستجابة على مقاومة المحو, من الأمور الواضحة التي أيدت صدقها بعض الدراسات المبكرة. فقد بين وليماس ( Williams, 1938 ), أن العضويات التي تتلقى تعزيزات أكثر من غيرها لدى تعلم بعض الاستجابات, كالضغط على الرافعة مثلاً, هي أكثر مقاومة لعمليات المحو, بحيث تزداد هذه المقاومة بازدياد مرات التعزيز. وتتسق هذه النتيجة مع الافتراض الرئيسي لمعظم نظريات التعلم السائد آنذاك, والقائل بأن ازدياد عدد المعززات يؤدي إلى ارتباطات أقوى بين المثيرات و الاستجابات.

ثانياً: كمية التعزيز:

تشير كميّة التعزيز إلى مقدار المثير المعزز أو حجمه, وليس إلى عدد مرات تقويمه أثناء التعلم. و تلعب كميّة التعزيز دوراً هاماً في تحديد قدرة الاستجابات المتعلمة على مقاومة المحو, بحيث تغدو هذه المقاومة أضعف في حال استخدام معززات كبيرة الحجم أثناء فترة التدريب على تعلم الاستجابات, فعلى الرغم من أن المعززات كبيرة الحجم تسهل التعلم, إلا أنها تؤدي إلى سرعة المحو أيضاً ( Hulse, 1958; Wagner, 1961 ). ويمكن تفسير هذه الظاهرة بالأثر الانفعالي للإحباط الناجم عن إيقاف التعزيز, بحيث يزداد هذا الأثر بازدياد حجم المثير المستخدم كمعزز أثناء التعلم, الأمر الذي يؤدي إلى سرعة محو الاستجابة بعد انقطاع التعزيز. ويتبدى ذلك من خلال إحساس الطلاب بالفشل, فالطلاب الذين اعتادوا الحصول على معدلات تحصيليّة مرتفعة ( معززات كبيرة الحجم ) يتأثرون بالفشل ( عدم الحصول على المعدلات العالية – أي إيقاف التعزيز ) أكثر من الطلاب الذين اعتادوا الحصول على معدلات تحصيليّة معتدلة ( معززات متوسطة الحجم ).

 ثالثاً: تغاير المثير والاستجابة:

توحي نتائج بعض الدراسات إلى أن الاستجابات المتعلّمة تقاوم المحو على نحو أكبر إذا كانت شروط التعلم أكثر تنوعاً وتبايناً وتغايراً. ( Logan,1976 ), وتتضمن هذه الشروط عادة كلاً من المثير والاستجابة.

    يكون التعلم أقوى وأكثر مقاومة للمحو عند تقديم المثيرات بأشكال وحجوم وألوان متنوعة ومتعددة, فالطفل الذي يتعلم استجابة النطق بكلمة " كتاب " لدى رؤية كتاب ما, تغدو استجابته أكثر مقاومة للمحو إذا قدم له المثير ( أي كتاب ) بأشكال وألوان و حجوم و أوضاع متباينة, أما إذا قدم هذا المثير بشكل واحد, وحجم واحد, ولون واحد, ووضع واحد، فستكون استجابته عرضة للمحو على نحو سريع.

و ما يصدق على تغاير المثير, يصدق على تغاير الاستجابة أيضاً, فإذا تعلم الطفل أداء الاستجابة بطرق متنوعة, كأن يلفظ كلمة " كتاب " بأصوات مختلفة أو متباينة, أو يكتبها بأشكال مختلفة, وفي سياقات متباينة, فستغدو هذه الاستجابة ( كتابة كلمة " كتاب " أو نطقها ) أكثر مقاومة للمحو, و سيحتفظ الطفل بها لفترة طويلة.

 رابعاً: تغاير التعزيز:

هل يجب أن نعزز كل استجابة صحيحة تقوم العضوية بأدائها, أم نقتصر على تعزيز بعض الاستجابات فقط ؟

أي ما دور التعزيز المستمر " تعزيز الاستجابات الصحيحة جميعها ", والتعزيز الجزئي " أي تعزيز بعض الاستجابات دون البعض الآخر ", في تحديد قدرة الاستجابات المتعلمة على مقاومة المحو ؟.

تشير نتائج دراسات عديدة إلى أن الاستجابات التي يتم تعلّمها ضمن شروط التعزيز الجزئي, قادرة على مقاومة المحو أكثر من الاستجابات المتعلمة في ضوء شروط التعزيز المستمر. هذا ويمكن اللجوء إلى طرق أخرى تعتمد بعض المتغيرات, كمتغير الزمن, أو نسبة الاستجابات المعززة للاستجابات الكلية, لأحداث التغاير أو التباين في تقديم المعززات. فقد يلجأ الباحث إلى تعزيز بعض الاستجابات حسب فترات زمنية معينة, ثابتة أو متغيرة, أو حسب معدل أداء ثابت أو متغير أيضاً.

 وأشارت نتائج الدراسات إلى أن الاستجابات التي يتم تعلمها في ضوء شروط التعزيز المعدل أكثر مقاومة للمحو من الاستجابات التي يتم تعلمها في ضوء شروط التعزيز الزمني, وأن شروط التعزيز المتغيرة, سواءً زمنيّة كانت أم معدّلة, تؤدي إلى مقاومة للمحو على نحو أفضل .

المحو والتعلم الإنساني:

لما كان التعلم يهدف أساساً إلى إحداث تغيرات ثابتة نسبياً في السلوك, أي قادر على مقاومة المحو والنسيان, فإن الوقوف على العوامل الأربعة السابقة التي تؤثر في قدرة المتعلمين على الاحتفاظ بما تعلموه من استجابات أو سلوك, يمكننا من استخلاص بعض النصائح التي تفيد في مجال تقوية الاستجابات المتعلمة, وجعلها أكثر قدرة على مقاومة المحو أو النسيان.

وفيما يلي أهم هذه النصائح:

1. اعتبار التعزيز إستراتيجية أساسية في التعلم, فتشجيع الطلاب على أداء الاستجابات المرغوب فيها, واستحسان هذا الأداء لدى القيام به, أو تصحيحه يمكن هؤلاء الطلاب من التعلم الجيد والاحتفاظ بما تعلموه لفترات طويلة.

2. تقديم المعززات ذات الحجوم المناسبة أو المعتدلة, وإذا اضطر المعلم إلى تقديم مكافآت أو إثابات ذات قيم كبيرة, فسيستحسن تقديم مثل هذه المكافآت والإثابات في بداية التعلم فقط, لأن ذلك يسهل اكتساب المهارات موضوع التعلم, لكنه لا يمكن من الاحتفاظ بها لمدة طويلة, لذا يجب تخفيض قيمة المعززات كلما تقدم المتعلم في مجال إتقان هذه المهارات، وعلى نحو تدريجي.

3. تقديم موضوعات التعلم ( المثيرات ) في سياقات تعلمية متنوعة ومتعددة, تتباين فيها هذه المثيرات من حيث الشكل والحجم واللون والوضع... الخ.

4. تدريب المتعلمين على أداء الاستجابات المرغوب فيها ذاتها بطرق متنوعة ومتعددة, وفي سياقات مثيرية متباينة, كتدريب الطفل على كتابة الكلمات الجديدة بألوان مختلفة وأشكال وحجوم مختلفة, وأن يكتبها على سطوح متباينة, بحيث يحتاج في كل استجابة إلى استخدام مجموعة حركات متباينة نوعاً ما.

5. استخدام التعزيز المستمر في بداية تعلم المهارات فقط, فمن المستحسن تعزيز كل استجابة صحيحة تصدر عن المتعلم عند البدء في اكتساب مهارة ما. واستخدام التعزيز الجزئي عندما يتقدم المتعلم في مجال اكتساب هذه المهارة, بحيث يتم تعزيز بعض الاستجابات الصحيحة دون البعض الآخر, لأن ذلك يمكنه من الاحتفاظ بالاستجابات المتعلمة على نحو أفضل.    

 التمييز و التعميم Discrimination and Generalization:

قد تكون الطبيعة الانتقائية للسلوك, من أكثر خصائصه أهمية, فالناس لا يستجيبون على نمط واحد للظواهر الطبيعية والاجتماعية المتنوعة التي تحيط بهم, بل يستجيبون على نحو مختلف للظواهر المختلفة, ولعل هذه الطبيعة الانتقائية هي التي تمكن الإنسان من إنتاج استجابات تناسب عالماً دائم الحركة والتغيّر, بحيث تتوافر له شروط البقاء والتكيف الأفضل مع الحياة. وتشير طبيعة السلوك الانتقائية أيضاً, إلى أن الإنسان يمتلك بعض المعرفة والمعلومات عن العالم الذي يعيش فيه, فلولا معرفته المسبقة بالمثيرات أو الحوادث المحيطة به, لما استطاع اختيار بعض المثيرات والاستجابة لها, وتجاهل المثيرات الأخرى بعدم الاستجابة لها. وحصول الفرد على مثل هذه المعرفة والمعلومات, يقع في مجال التعلم التمييزي, ويحظى باهتمام علم النفس التربوي المعاصر, لأن تعلم التمييز يشكل القاعدة الأساسية للتعلم كله.

إن قدرة العضوية على الاستجابة للمثيرات المناسبة, أو ذات العلاقة بالوضع التعليمي, وتجاهل المثيرات غير المناسبة, أو التي لا علاقة لها بهذا الوضع, هو ما يسمى بالتمييز.

فكيف تتعلم العضوية التمييز بين المثيرات المتنوعة, بحيث تستجيب على نحو مختلف لمثيرات مختلفة ؟

    يتخذ علماء النفس لدى تفسيرهم لظاهرة تعلم التمييز اتجاهين متعارضين:

الاتجاه الأول: ويؤيده الارتباطيون وأصحاب نظريات المثير والاستجابة, يفيد بأن العضوية تتعلم الاستجابة التمايزية بسبب امتلاكها لمعلومات حول الخصائص المطلقة أو الكليّة أو المجردة للمثير الذي يستثير هذه الاستجابة, أي أن مظاهر أو خصائص المثير جميعها, تستثير المستقبلات الحسيّة للعضوية, وترتبط بالاستجابة موضوع البحث.

الاتجاه الثاني: ويؤيده المعرفيون عموماً, يفيد بأن تعلم التمييز, يعكس عمليّة انتقاء بعض مظاهر أو خصائص المثير ذات العلاقة بالوضع أو الاستجابة, وتجاهل الخصائص والمظاهر الأخرى التي لا علاقة لها بهذا الوضع.

ويتضح من كلا التفسيرين أن المثيرات تكتسب القدرة على ضبط الاستجابات, أما كيف تكتسب المثيرات مثل هذه القدرة, فهو موضوع جدل طويل بين علماء النفس المعنيين ببحث التعلم.

يعالج مؤيدو الاتجاه الأول –  الارتباطيون وأصحاب نظريات المثير والاستجابة – التعلم كعملية مستمرة, حيث يتم ضبط المثيرات للاستجابات من خلال عمليّة تعلم تراكميّة تؤدي إلى نشوء نزعات إقدامية نحو المثيرات المنبئة بالتعزيز, ونزعات احجاميّة عن المثيرات المنبئة بعدم حدوث التعزيز أو تقديم المثيرات المنفّرة والمؤلمة. وإن مجموع هذه النزعات المتناقضة – الاقداميّة و الاحجامية –  ينتج قرائن دالة تنبئ بالتعزيز أو ترتبط به. و بذلك تتعلم العضوية التمييز بين المثيرات وتغدو قادرة على أداء الاستجابة التمايزيّة.

أما مؤيدو الاتجاه الثاني – المعرفيون –  فيذهبون في تفسيرهم لتعلم التمييز إلى افتراض وجود " بنى أو ادراكات معرفيّة" تمكن العضويّة من تشكيل " افتراضات " معينة قبل أداء الاستجابة. و تنعكس هذه الافتراضات في ظهور نزعات استجابيّة متّسقة. فإذا كان على العضويّة أن تختار دخول أحد ممرين للحصول على الطعام ستفترض موقفاً ما قبل الدخول, وينعكس هذا الافتراض في نزعتها المنهجيّة إلى دخول الممر الأيسر وتجاهل الأيمن مثلاً, وذلك قبل استخدام أية إستراتيجية أخرى للدخول, فإذا صدق الافتراض, وحصلت العضوية على الطعام – التعزيز –  فستزداد النزعة المنهجية لدخول الممر الأيسر, وتنخفض النزعة لدخول الممر الآخر, وبذلك تتعلم العضوية التمييز بين الممرين.

يؤكد هذا التفسير على استخدام العضويات للفرضيات لدى تعلم التمييز, وليس على اكتساب القرائن الدالة على المثير المناسب. ويتم ضبط المثير للاستجابة من خلال زيادة أو نقصان شدة النزعات الاستجابية المنهجيّة المتّسقة, بالتعزيز التمايزي بعض القرائن دون الأخرى. يفترض هذا النوع من التفسير توافر الانتباه الانتقائي, بحيث تختار العضوية بعض الخصائص المثيرية وتنتبه إليها وتهمل بعض الخصائص الأخرى فلا تلتفت إليها. إن الانتباه الانتقائي والتعزيز التمايزي شرطان ضروريان لتعلم التمييز, لكنهما ليسا كافيين لتفسيره, إذ لا بد من القول بوجود " افتراضات " تنعكس في نزعات استجابيّة منهجيّة, تشكلها العضوية قبل القيام بأداء أية استجابة تمايزية.

أياً كان تفسير علماء النفس لظاهرة الاستجابة التمايزيّة, فإن هذه الظاهرة قائمة, وتشكل البنية الرئيسة للتعلم, وتوحي بتفسيراتها المتباينة, بالعديد من الإستراتيجيات التي يمكن إتباعها في التعلم ليغدو أكثر نجاعة وفاعلية. فتزويد المتعلم بالقرائن الدالة الواضحة, وبيان خصائص التشابه والاختلاف بين المثيرات, وتعزيز الاستجابات المرغوب فيها, تمكن المتعلم من أداء هذه الاستجابات على نحو أفضل, وتحسّن قدرته على تعلم التمييز.

رأينا حتى الآن أن التمييز هو القدرة على الاستجابة على نحو مختلف لمثيرات مختلفة, لكن هذه القدرة بمفردها, غير كافية لإنتاج الاستجابات التي تمكن الإنسان من التكيف مع المثيرات والحوادث البيئية المحيطة به, إذ يجب عليه أن يتعلم الاستجابة بطريقة متشابهة للحوادث أو المثيرات المتشابهة أيضاً, ويتطلب ذلك غالباً تطبيق استجابة تم تعلمها بحضور مثير ما, على مثير آخر مشابهة له, وهو ما يسمى بالتعميم, فإذا تعلم الطفل الوقوف لدى رؤية إشارة المرور الموجودة لدى تقاطع شارعين بالقرب من مدرسة, عليه أن يقف لدى رؤيته لمثل هذه الإشارة حيثما كان التقاطع الموجودة فيه. وتشير الدلائل إلى أن مفهوم التعميم يصدق على الاتجاهات والاستجابات الانفعالية صدقة على الاستجابات السلوكية الأخرى. فإذا اتخذ الفرد اتجاهاً معيناً نحو فرد أو مجموعة ما. فسيعمم هذا الاتجاه على الأفراد والمجموعات المشابهة, سواءً كان الاتجاه الذي اتخذه إيجابياً أو سلبياً. ( Huston, 1976 ).

قام بعض الباحثين بدراسات تجريبيّة أكدوا من خلالها حدوث ظاهرة التعميم, حيث أسفرت نتائج هذه الدراسات عن إمكانية تعميم الاستجابات التي تم تعلمها بحضور مثيرات معيّنة, على مثيرات أخرى غير التي تم التدريب عليها (Gutman and Kalish, 1956).

 وتوحي نتائج هذه الدراسات بأمرين هامين حول عملية التعميم, ويرتبطان بالتعلم على نحو وثيق, الأول, ويشير إلى أن أثر التعلم ليس مقصوراً على المثيرات الأصلية المستخدمة لدى التدريب على أداء استجابة ما, بل ينتقل هذا الأثر إلى مثيرات أخرى تستثير تلك الاستجابة ذاتها, والثاني, وهو أن قدرة المثيرات الأخرى على استثارة الاستجابة المعمّمة, تزداد بازدياد الشبة بين خصائص المثير الذي تم اكتساب الاستجابة بوجوده, وخصائص المثير الآخر الذي تعمم عليه هذه الاستجابة ولم يكن موجوداً أثناء فترة الاكتساب ( Hulse et al,1975). وهذا يعني بوضوح أن التعميم يتم باستخدام التعلم السابق فقط, دون تدريب أو تعليم جديدين.

هذا ويمكن للمعلمين الاستفادة من ظاهرة التعميم في تسهيل تعلم طلابهم وضبط سلوكهم ( Marholin and Steinman,1977), بحيث يمكن تعميم الاستجابات ذات العلاقة بالأداء الأكاديمي التي يمارسها الطلاب في غرفة الصف أثناء الانهماك في واجب تعليمي ما, كالإصغاء, والانتباه, وعدم الخروج من المقعد, وعدم التكلم دون إذن... الخ. على السياقات المثيرية الأخرى ذات العلاقة بالاستجابات الاجتماعية, فيستجيب الطلاب للأوضاع التي تتطلب تفاعلاً اجتماعياً, بالطريقة ذاتها التي يستجيبون بها للأوضاع التي تتطلب تفاعلاً أكاديمياً. وإن بيان المعلم لأوجه الشبه بين المثيرات التي تبدو غير متشابهة للطلاب, يسهل تعلّمهم ويمكنهم من التعميم على نحو أفضل, فقد يتناول التشابه بين المثيرات مكوناتها الأساسيّة, أو المبادئ التي لا تحكمها, أو الإجراءات التي يجب إتباعها لدى أداء مهارة ما, وهي أمور قد لا يكتشفها الطالب بنفسه, لذا يجب على المعلم مساعدته على اكتشافها ليتمكن من التعميم و نقل التعلم .               

التشكيل Shaping:

إذا كان السلوك المراد تعليمه يحتاج إلى وقت طويل حتى يتعلمه الطفل من مثل الطباعة على الآلة الكاتبة, أو القراءة, أوالكتابة, فإن تعلم مثل هذا السلوك بالاشراط الإجرائي من خلال تعزيز كل أداء يعتبر خطوة في الطريق إلى تعلم السلوك النهائي. فعندما يتعرف على الحروف يعزز, وعندما يتعرف على الكلمات يعزز, وعندما يفهم المعنى يعزز, وهكذا, حتى يصل إلى إتقان مهارة القراءة. وهكذا في الكتابة فإن الإمساك السليم بالقلم, والخربشة, ورسم خطوط منحنية, ورسم خطوط مستقيمة, والرسم على السطر... كلها خطوات في الطريق إلى تعلم الكتابة, كل خطوة منها تعزز وهكذا يتشكل السلوك النهائي خطوة خطوة. نفس الشيء حدث مع حمامة سكينر عندما كانت تبدأ النقر في أرضية الصندوق حيث تعزز كل نقرة تقرب الحمامة من الرافعة التي عليها أن تنقر عليها لتحصل على حبة القمح.

 

بنفس الطريقة يمكن تشكيل سلوك الأطفال مع الآخرين, وتشكيل سلوكهم في الحَمَّام, وتشكيل سلوك الأطفال في الصف المدرسي... إلخ.

 التسلسل   Chaining:

تقوم فكرة السلسلة في الاشراط الإجرائي على تجميع سلوكيات فرعية يمتلكها الطفل في شكل تتابعي بحيث تشكل في النهاية سلوكاً أكبر تعقيداً.

مثال ذلك: الطفل ذو الثلاث سنوات قدر على أداء السلوكيات الفرعية التالية: فتح صنبور الماء في المغسلة, الإمساك بالصابون, غسل اليدين, غسل الفم, غسل الوجه, تنشيف الوجه, يُعلم الطفل على ترتيب هذه الأفعال بحيث تشكل سلسلة من أفعال متتالية تهيء في مجموعها الطفل للذهاب إلى المدرسة مثلاً.

تختلف السلسلة عن التشكيل من حيث أنه في الحالة الأولى السلوكيات الفرعية موجودة. ولكن في حالة التشكيل هذه السلوكيات غير موجودة ويُعلم الطفل على كل منها.

ومن أشهر قوانين سكينر في التعلم:

1) قانون التنظيم أو الشكل الجيد

وهو قانون إدراكي أساسي وفحواه أن التنظيم النفسي الإدراكي يميل إلى الاتجاه دوماً نحو صيغة إجمالية جيدة أو شكل جيد نظراً لأن هذا الشكل يتميز بالبساطة والانتظام والثبات.

وبذلك يصبح هذا القانون من قوانين التوازن التي لها أهميتها في ( المجالات ) ذات الخصائص الدينامية.

وقد حدد كوفكا قانون التنظيم على النحو التالي: من خصائص التعلم الجيد انه يتضمن البساطة والدقة والتناسق.

2) قانون التشابه

يعني هذا القانون بأن الأشياء المتشابهة أو المتماثلة تميل إلى التجمع معاً في وحدة فتظهر الخطوط المتشابهة مثلاً أو النقاط المتماثلة على أنها وحدة إدراكية فالعناصر المتشابهة يسهل تعلمها اكثر من العناصر غير المتشابهة. ويحدث الربط بين العناصر نتيجة للتفاعل بينها.

3) قانون التقارب

أي أن تقارب الأشياء من بعضها مكانياً يساعد على ادراكها كمجموعة أو مجموعات إذا رسمت مجموعة من الخطوط المتوازية وغير المنتظمة في بعدها فإن أزواج الخطوط ذات الأبعاد القريبة الضيقة تدرك على أنها مجموعات كما في الشكل:

4) قانون الإغلاق

الأشكال الكاملة أو المغلقة اكثر ثباتاً من الأشكال الناقصة أو المفتوحة لأن هذه الأشكال تميل إلى أن تكمل نفسها وتكون صيغة كلية في الادراك الحسي ويصدق هذا على التعلم حيث نجد انه طالما كان النشاط ناقصاً فإن كل موقف يؤدي إلى النشاط يصبح مرحلة انتقالية بالنسبة للمتعلم، كما أن الأشكال والمواقف غير المكتملة تولد التوتر.

5) قانون الاستمرار الجيد

مغزى هذا القانون أن تنظيم المجال الإدراكي الحسي يميل إلى أن يحدث على نحو يستمر فيه الخط المستقيم مستقيماً والدائرة دائرة وهكذا.

 

تحديث فهم سكينر:

قبل تسعة أيام من وفاته, وقف سكينر  ( 1990 ) أمام الجمعية الأمريكية لعلم النفس ملمحاً بوجود عمليات خاصة ودعامات بيولوجية للسلوك, ومع ذلك فإن الكثيرين من علماء النفس انتقدوه لتقليله من أهمية هذه العمليات وتلك الاستعدادات. ومع ذلك فقد وجه في خطابه ذلك آخر نقد لعلم المعرفة Cognitive Science حيث أعتبره ارتداد إلى "استبطانية" بدايات القرن العشرين.

لقد مات وهو مازال يقاوم المعتقد المتنامي بأن العمليات المعرفية, والأفكار, والإدراكات, والتوقعات يجب أن تأخذ موقعها في علم النفس وحتى في الاشراط بنوعيه الكلاسيكي والإجرائي, لقد ظل يعتبر هذه العلميات سلوكيات ينطبق عليها مبادئ السلوك الأخرى.

ففي الاشراط الإجرائي يبدو وكأن العضوية تتوقع المكافأة ( التعزيز الإيجابي ) بعد أن تؤدي الاستجابة. وأن إعادة تلك الاستجابة سيستجر المكافأة من جديد. وفي دراسات الفئران في المتاهة بدأ وكأنها تطور خارطة معرفية Cognitive Map للتعلم الذي يظهر فقط عندما توجد بعض المحفزات لإخراجه. فالتعلم يمكن أن يتم في غياب التعزيز أو العقاب. والتعلم أكثر من مجرد ارتباطات بين الاستجابة ونتائجها.

إضافة إلى ذلك, يمكن تلمس دور الدافعية في الاشراطيين فالكلب الجائع, والقطة الجائعة, والحمامة الجائعة, تتحرك للمثير الطبيعي ( الطعام ) ولو كانت هذه العضويات غير جائعة لتغير ربما الوضع.

كذلك ثمة تلمس لفكرة الاستعداد Predisposition الذي تحدده الجينات من جهة والبيولوجيا من جهة أخرى. فالعضوية التي لا تملك الاستعداد لتعلم سلوك ما لن تتعلمه مهما تلقت من تدريبات مبنية على الاشراط الكلاسيكي أو الإجرائي.

إن نتائج الدراسات التي أُجريت حديثاً قد أكدت على حقيقة مفادها أنه بمقدار ما نعرف ونفهم كيف يعمل الدماغ بمقدار ما نلقي أضواء معتبرة على العمليات الأساسية للدماغ.

فالأبحاث الحديثة تقترح – على سبيل المثال – أن هناك نوعين من النواقل العصبية هما الاستيلكولين  Acetylcholine والدوبامين  Dopamine يلعبان دوراً حاسماً في مجالات التعلم المختلفة.

وحيث أن التعلم ليس عملية واحدة يمكننا القول أن التعلم يتضمن على الأقل مجالين رئيسين:

المجال الأول: أننا نتعلم كيف نميز الوضعية الأنسب لأداء الاستجابة وهنا يلعب الهيبوكامبس  Hippocampus  دوراً هاماً. وأن الناقل العصبي الاستيلكولين Acetylcholine ضروري لعمل الهيبوكامبس Hippocampus وأن السكوبولامين يعيق ذلك الناقل فلا نستطيع تعلم أي المثيرات يمكن تجميعها مع بعضها البعض لتشكل مجموعة لإعطاء الاستجابة الأنسب.

المجال الثاني: نتعلم الترابط ما بين " الاستجابة –  ونتائجها ". وبالتالي تشكل مفتاح الاشراط الإجرائي. إن أجزاء مختلفة من الدماغ تنتج والدوبامين Dopamine ولكن جزاء واحداً يقع خلف الاميجدالا  Amygdala يلعب دوراً مهماً لجعل المكافأة أكثر فعالية. عندما تمكن الباحثون من منع مستقبلات الدوبامين Dopamine لدى حيوانات التجربة فشلت تلك الحيوانات في الاستجابة للتعزيز الإيجابي أو السلبي.

خلاصة القول أن الناقلات العصبية هامة جداً لجميع مجالات التعلم وتثبت أن التعلم ليس نشاطاً واحداً. وهكذا مهدت محاولات تحديث مفاهيم سكينر لظهور النموذجين الثالث والرابع.