Translate

31/10/2012

Conclusões acerca dos três tipos de aprendizagem

  1. Aprendemos associando estímulos.
  2. Aprendemos com as consequências dos nossos próprios comportamentos, por experiência direta.
  3. Aprendemos observando o comportamento dos outros, por experiência indireta. Quando à aprendizagem observacional deve notar-se:

  • A base deste tipo de aprendizagem é a observação;
  • Observamos o comportamento de outros (chamados modelos);
  • A observação do comportamento de outros não implica necessariamente a sua imitação (podemos aprender observando o comportamento observável, isto é, em desempenho ou performance);
  • A tendência para imitar um modelo depende de razões pessoais, da influência do modelo e das consequências do comportamento observado;
  •  Embora imitar seja em muitos casos necessário para aprender nem toda a aprendizagem depende da imitação.

Em suma, a aprendizagem observacional ou social é, em termos rigorosos, uma forma de aprendizagem que privilegia a observação do comportamento dos outros e que também dá lugar relativamente importante à imitação desses comportamentos. 


30/10/2012

Resultados do experimento de Bandura

Que ilações retirou Bandura destes resultados?

Primeiro, ficou convicto de que, bem mais do que o reforço, o que condiciona a performance do que foi aprendido é a expetativa do reforço.
Segundo, o fator motivação é crucial para que a performance ou desempenho efetivo do que foi aprendido.

Há muito mais probabilidade de que um individuo imite um comportamento se houver a sua parte a expetativa de que tal produzirá reforço ou recompensa. Assim, virtualmente, todas as crianças eram capazes de imitar o comportamento agressivo visionado, mas a tendência a traduzir o aprendido em comportamento efetivo era bem mais acentuada no grupo do modelo recompensado do que no grupo do modelo punido.

A aprendizagem social, ou modelação (não confundir com modelagem) é um tipo de aprendizagem muito generalizado, mesmo entre alguns animais. Experiências realizadas por Cook e colaboradores em 1985, revelam que, em laboratório, macacos que não tinham receio de serpentes, passaram a desenvolver um acentuado medo desses répteis depois de observarem outros macacos a reagir apavorados.

Nos seres humanos as inibições e desinibições do comportamento podem resultar da observação do comportamento dos outros. Assim, se vemos na televisão de um turista americano foi severamente punido em Singapura por “decorar” automóveis com um spray é mais do que provável que evitemos tal comportamento, pelo menos em Singapura; os pais e os grupos de pares constituem-se também como modelos (exemplares ou não) de comportamento que podem conduzir determinados indivíduos, por exemplo, a desenvolver preconceitos e estereótipos racistas e sexistas, a tornarem-se agressivos e adeptos do consumo de cerveja, drogas, etc. Mas, como é óbvio, aprendemos muitas competências e atitudes úteis e desejáveis.

A aprendizagem social (por modelagem, imitação de outro que observamos) é um poderoso instrumento de socialização de longo do nosso desenvolvimento. Em 1995, um experimento realizado por Shroeder mostrou que as crianças revelam maior disposição para ajudar e partilhar depois de verem tais atos desempenhados por um modelo poderoso, afável e simpático, perdurando tal efeito meses depois de assistirem ao desempenho.

A aprendizagem observacional tem sido utilizada para ajudar as pessoas a desenvolverem capacidades positivas nas relações interpessoais. Tem-se revelado indispensável e mais eficaz e aconselhável do que outras formas de aprendizagem em situações profissionais como o treino de enfermeiras/s, pilotos, cirurgiões, eletricistas, policias, etc.

A aprendizagem social ou observacional desempenha um papel crucial de socialização. Com efeito, para Bandura, a modelação – outro nome para aprendizagem social – permite adquirir bem mais que competências cognitivas e motoras: aprendemos regras de comportamento (e também a infringi-las), adquirimos valores e atitudes.

Para Albert Bandura, a aprendizagem observacional não é uma cópia mecânica de comportamentos uma vez que envolve processos cognitivos que são ativos e implicam, enquanto juízos ou avaliações, um certo distanciamento em relação ao comportamento observado.

Deve notar-se que as experimentações e conclusões de Bandura despertarem o interesse pelo estudo dos efeitos da violência e da agressividade dos programas televisivos (dos desenhos animados, passando pelos filmes até à informação noticiosa) no comportamento das crianças e dos jovens. Tomou-se a partir daí consciência do impacto negativo da violência mediática (se a aprendizagem observacional é tão importante, então a televisão – hoje em dia um espécie de babysitter eletrónica – pode ensinar muitas coisas indesejáveis e antissociais às crianças. Atualmente, como se sabe, o debate continua aceso.  


28/10/2012

O famoso experimento de Bandura sobre a aprendizagem observacional do comportamento agressivo

Para ilustrar e demonstrar a sua teoria sobre a aprendizagem por modelação ou condicionamento vicariante, Bandura realizou uma famosa experimentação envolvendo a imitação de comportamentos agressivos.
Bandura mostrou a crianças com quatro anos de idade um filme em que um adulto esmurrava e pontapeava um boneco insuflável. Bandura dividiu o grupo de 66 crianças em idade pré-escolar em três grupos de 22 elementos cada. No filme um modelo adulto encaminhava-se  na direção do boneco insuflável (de dimensão apreciável) e ordenava-lhe que saísse da sua frente. Como facilmente se compreende o boneco não obedecia e era vitima de uma série de atos agressivos. Todas as crianças assistiram a estes comportamentos agressivos mas o pequeno filme tinha um final diferente por cada grupo de crianças, ou seja, três versões diferentes das consequências do comportamento do adulto eram exibidas.

Assim, um grupo de crianças viu que o adulto agressivo (homem ou mulher) era recompensado por um outro adulto que o elogiava chamando-lhe “campeão” e lhe dava uma grande quantidade de doces e de refrigerantes. Bandura designou este grupo de crianças como grupo do modelo recompensado; o segundo grupo de crianças, que, é claro, estava a ver o filme numa sala diferente, assistiu a uma versão final completamente diferente: o adulto agressivo foi asperamente censurado por um adulto que lhe chamou “má pessoa”. Bandura deu a este grupo de crianças o nome de grupo de modelo punido; quanto ao terceiro grupo, assistiu aos comportamentos agressivos mas não lhe foi exibido nenhum final mostrando se as consequências de tais comportamentos eram positivas ou negativas. Bandura deu-lhe o nome de grupo de condição neutral.



Depois da exibição das diferentes versões do filme foi permitido às crianças dos vários grupos brincarem com o boneco insuflável e outros brinquedos. Cada criança brincava sozinha numa pequena sala e era observada atrás de um espelho de sentido único.
Como Bandura previra, as crianças do grupo que vira o adulto ser recompensado pelo seu comportamento agressivo mostraram maior índice de agressividade do que as outras, imitando os atos do adulto.
Contudo, se a experimentação revelou que as crianças do grupo do modelo recompensado tinham tendência mais acentuada para desempenhar espontaneamente o comportamento do modelo, revelou também outros resultados interessantes.
As crianças de todos os grupos tinham aprendido de igual modo a reproduzir mentalmente os diversos comportamentos agressivos observados, isto é, estavam em condições de desempenhar o comportamento do modelo igualmente bem e de forma precisa.
O que quer isto dizer? Simplesmente que as crianças participantes na experimentação aprenderam comportamentos agressivos sem receberem qualquer reforço. Mais: aprenderam-nos (embora só os do grupo referido os desempenhassem espontaneamente) mesmo quando o modelo não era nem reforçado nem punido por se comportar agressivamente. 


26/10/2012

Fatores que influenciam a aprendizagem por observação

Fatores ou causas que influenciam a aprendizagem por observação

Várias são as causas ou fatores que podem conduzir um individuo a aprender e a desempenhar os comportamentos de um modelo:
  1. O nível de desenvolvimento do observador. Conforme vamos crescendo somos capazes de concentrar a nossa atenção durante mais tempo, de processar cada vez melhor a informação e de nos auto-motivarmos.
  2. O estatuto do modelo. As crianças, por exemplo, revelam uma acentuada tendência para imitarem as ações de pessoas que consideram prestigiadas, famosas e de quem gostam (pais, irmãos mais velhos, professores, atletas, heróis de filmes de ação, estrelas rock). Esta tendência depende da idade e dos interesses da criança.
  3. Consequências vicariantes. Observando as consequências das ações dos potenciais modelos obtemos informações sobre o que é apropriado para nós e sobre as prováveis consequências da imitação da conduta de quem observamos. As consequências positivas (que não são necessariamente de reconhecido valor moral) motivam os observadores. É mais provável a imitação e o desempenho segundo as ações dos modelos quando o observador acredita que os resultados serão gratificantes.
  4. Autoeficácia. Os observadores tendem a imitar determinados modelos quando acreditam que são capazes de aprender e de desempenhar o comportamento-modelo, isto é, quando possuem um certo nível de autoconfiança e de autoeficácia. 


23/10/2012

Condições necessárias da aprendizagem observacional

São quatro as condições fundamentais que devem estar presentes para que se processe a aprendizagem por modelação.
  1. Atenção. Não é suficiente observar. Deve-se prestar atenção ao que o modelo observado faz, identificando a sua conduta. A investigação psicológica revela que não só escolhemos os comportamentos a imitar como também as pessoas que se constituem como modelos. Prestamos mais atenção ao desempenho de pessoas consideradas atraentes, competentes, populares e admiradas.
  2. Retenção. Para imitar o comportamento de um modelo temos de o armazenar ativamente na memória, o que implica a representação mental das ações do modelo observado e a prática dos elementos, sequências ou etapas do comportamento.
  3. Execução ou produção. Memorizando o comportamento desejado, é necessário convertê-lo em ação, o que pode exigir bastante tempo e treino. Note-se que é preciso sempre algum motivo ou razão para converter o que se “sabe” ou aprendeu em comportamento, melhor dizendo, performance. Pode, segundo o teórico da aprendizagem social, ocorrer a aprendizagem sem alterações externas do comportamento.
  4. Motivação e reforço. O desempenho de algo que adquirimos mediante observação depende da motivação ou incentivo para o efetuar. O reforço tem um papel importante na aprendizagem observacional. Se anteciparmos ou prevermos que seremos reforçados ou recompensados por imitar as ações de um modelo, estaremos mais motivados para reter, reproduzir e desempenhar os comportamentos observados (o reforço pode ser a aprovação dos outros). Apesar das diferenças já indicadas deve notar-se que, até certo ponto, a aprendizagem por modelação contém um importante princípio presente no condicionamento operante. Com efeito, podemos aprender e efetuar muitas coisas por imitação mas a aquisição definitiva depende muito de sermos reforçados ou não. 

19/10/2012

A Aprendizagem Observacional como Condicionamento

A aprendizagem observacional como condicionamento indireto ou vicariante

A teoria da aprendizagem social é, em medida, uma reação critica às insuficiências e limitações dos condicionamentos clássico e operante. Estes processos de aprendizagem podem explicar como se formam respostas salivares, como se adquirem fobias, competências motoras, como transformar um aluno desinteressado ou tímido num aluno estudioso e participativo e como aprender muitas outras competências. Contudo, segundo Bandura, não conseguem explicar a rápida aquisição de novos comportamentos como pôr um automóvel a funcionar e o facto de pormos as mãos no volante para conduzir (estas repostas simples mas rápidas são aprendidas não por ensaio e erro mas porque observamos como se comporta quem conduz automóveis). Muitas das coisas que aprendemos, desde lavar os dentes a dançar, foram aprendidas observando os outros, lendo um livro de instruções ou recebendo instrução direta. Bandura salienta que o reforço ou punição não são a condição básica indispensável da aprendizagem. Uma das diferenças mais significativas entre a aprendizagem pode haver mudança de comportamento mesmo que o sujeito não receba diretamente nenhum reforço.

Apesar de tudo, Bandura não estabelece uma separação absoluta entre a aprendizagem observacional e os condicionamentos clássico e operante. Bandura demonstrou que os condicionamentos clássico e operante podem ocorrer de forma vicariante através da aprendizagem observacional. Na verdade, esta implica que quem aprende é condicionado indiretamente pela observação do condicionamento de outrem. Suponhamos que Miguel observa Rui é muito bem-sucedido junto do sexo oposto por ir para a escola numa moto vistosa e potente. O que observa Miguel? O reforço desse comportamento de Rui através do sucesso junto das raparigas (trata-se aqui de condicionamento operante). O que significará dizer que Miguel é indiretamente condicionado ou condicionado de forma vicariante? Significará dizer que a sua tendência para se comportar como o Rui aumentará. Note-se que o sucesso junto das raparigas aumentará muito provavelmente a frequência com que Rui se desloca de moto para a escola e indiretamente aumentará a tendência de Miguel em adotar o mesmo tipo de comportamento. Miguel tem experiência indireta do reforço de tal comportamento enquanto Rui tem experiência direta.


17/10/2012

Reforço vicariante e Punição vicariante

Embora a aprendizagem se baseie, para Bandura, na observação, é óbvio que não imitamos tudo o que vemos os outros fazer, ou seja, podemos adquirir a representação mental de certos comportamentos sem que isso nos conduza a desempenhá-los nós mesmos. Tal facto significa que a nossa inclinação para imitar atos que aprendemos por observação depende em parte do que acontece às pessoas cujo comportamento observamos. Assim, é mais provável a imitação dos atos de um modelo que vemos serem reforçados do que a imitação de atos que acarretam punição ou consequências desagradáveis. Uma vez que a aprendizagem observacional é geralmente indireta ou vicariante, o conceito de reforço assume neste contexto um significado distinto do que lhe era atribuído no condicionamento operante. No caso de aprendizagem observacional, o que é reforçado diretamente ou punido diretamente é dado comportamento ou modelo.
O reforço vicariante ou indireto ocorre quando vemos que as ações de um determinado modelo tem consequências favoráveis ou gratificantes para este e modificamos ou persistimos no nosso comportamento inspirados nessa observação. Por outras palavras, o reforço vicariante consiste no facto de a observação. Por outras palavras, o reforço vicariante consiste no facto de a observação do reforço do comportamento do modelo se poder traduzir num aumento de probabilidade do mesmo comportamento no observador.
A punição vicariante ocorre quando a punição do comportamento do modelo observado produz no observador a tendência para se afastar de tal comportamento. A punição do comportamento observado traduz-se, em princípio, na diminuição da probabilidade do mesmo comportamento no observador.

O que acontece quando na observação do comportamento de alguém não o vemos a ser reforçado ou punido?

Segundo Bandura a nossa tendência é a de imitar o comportamento de modelos atraentes, bem sucedidos, agradáveis e com elevado estatuto social. As crianças são especialmente influenciadas por adultos e pares que agem como modelos comportamentais. É poderosa a influência da modelação. Mediante este processo alguns seres humanos aprendem a considerar deliciosos alimentos que outros abominam, a falar línguas muito diferentes, a conduzir pela esquerda em Inglaterra e pela direita em Portugal, a adaptar determinado estilo de vestuário e todo um vastíssimo leque de padrões de comportamento. 


14/10/2012

A Aprendizagem Observacional

A aprendizagem pode ocorrer não só fazendo e agindo mas também observando o comportamento dos outros. Os condicionamentos clássico e operante entendiam a aprendizagem como algo que derivava da experiência própria – dirá em primeira mão ou direta – de cada individuo. Para Albert Bandura aprendemos muitos dos nossos comportamentos observando o comportamento dos outros. Esta forma de aprendizagem recebeu o nome de aprendizagem observacional ou social. A teoria de Bandura acentua o valor da aprendizagem indireta ou vicariante, afirma que observar as ações dos outros e processar essa informação, incluindo as consequências que delas derivam, influencia o nosso comportamento e torna provável que sob certas condições essas ações sejam imitadas. A pessoa cujas ações tendem a ser imitadas recebe o nome de modelo. Daí que a aprendizagem observacional seja também denominada aprendizagem por modelação.
Em termos gerais, há aprendizagem observacional quando adquirimos novos comportamentos ou respostas mediante a observação e imitação do comportamento dos outros.


12/10/2012

Os princípios básicos do condicionamento operante - Modelagem (Shaping)

Tal como no condicionamento clássico, a aquisição é, no condicionamento operante, a formação de uma nova resposta. Contudo, como o condicionamento operante implica em grande parte a emissão de respostas voluntárias (é o caso dos seres humanos, pelo menos) o processo de formação da resposta operante difere do processo de formação da resposta clássica. No condicionamento operante as respostas formam-se ou adquirem-se mediante um processo gradual designado modelagem.

A modelagem (shaping) consiste no reforço de aproximações cada vez mais bem-sucedidas à resposta desejada, ou seja, pequenas parcelas do comportamento global desejado são “recompensadas” (termo que Skinner considerava demasiado subjetivo) enquanto caminho para a resposta pretendida.
Por que razão é importante a modelagem? Porque em muitas situações a resposta que queremos reforçar (para assim ser adquirida, retida e aprendida) não ocorre. Por outras palavras, a modelagem é necessária quando por si só um organismo não emite a resposta esperada ou desejada.

Se algum dos ratos não pressiona o pedal há que conduzi-lo progressivamente a esse comportamento. Pode-se começar por reforçar com um pouco de comida o fato de o rato se virar na direção do pedal uma ou outra vez. Em breve o rato olhará cada vez mais para esse dispositivo. Trata-se em seguida de o fazer aproximar dele, de conseguir que o toque e finalmente de obter a resposta desejada: pressionar o pedal. A princípio, o ato de pressionar é pouco regular mas torna-se cada vez mais frequente à medida que vai sendo reforçado com comida. A modelagem do comportamento do rato está consumada.

Outro exemplo: imaginemos que João quer ensinar i cão a trazer-lhe as pantufas. Sem a aplicação da técnica da modelagem tal comportamento pode levar demasiado tempo a ser adquirido ou nunca o ser. João coloca as pantufas na zona de ação do animal. O mínimo movimento ou olhar do cão na direção das pantufas é imediatamente reforçado com um biscoito. Uma mais consistente aproximação ao comportamento desejado (trazer as pantufas) como, por exemplo, deslocar-se em direção ao objeto é reforçada com mais biscoitos e assim sucessivamente até que – o que ainda pode levar tempo – a resposta desejada ocorre.


A técnica da modelagem – indicar progressivamente, mediante reforço, as etapas comportamentais que conduzem ao comportamento desejado – é bastante utilizado pelos treinadores e domadores de animais. Basta referir os espetáculos com felinos no circo e com golfinhos e leões-marinhos nos jardins zoológicos e zoomarines. Podemos inferir como os animais aprenderam os comportamentos complexos a que assistimos.


11/10/2012

Os princípios básicos do condicionamento operante - Generalização de estímulos

Esta expressão significa que nem sempre diferenciamos estímulos semelhantes ou melhor dizendo, quanto maior a semelhança entre dois estímulos mais provável a ocorrência de uma resposta que os considere como se fossem iguais. A generalização de estímulos é, portanto, a tendência a responder do mesmo modo a estímulos semelhantes. O modo como respondemos a novos estímulos é quase igual ao modo como aprendemos a responder a estímulos anteriores. Assim, podemos sorrir a uma pessoa desconhecida mas que é muito parecida com alguém que conhecemos; um bebé que é beijado e abraçado quando ao ver a mãe diz «Mamã» pode começar a chamar «Mamã» a vários pessoas independentemente do seu sexo.


10/10/2012

Os princípios básicos do condicionamento operante - Discriminação de estímulos

Embora no condicionamento operante as respostas ou comportamentos sejam em última análise condicionadas pelas suas consequências, os estímulos que precedem a resposta podem influenciá-la.

Os estímulos discriminativos são “sinais” que influenciam o comportamento ao indicarem a provável consequência (ser reforçada ou não) de uma resposta.

Assim, um pombo, após várias respostas seguidas de reforço na presença constante de um dado estímulo, aprende que esse estímulo “assinala” que o comportamento será reforçado. Se dando bicadas num disco iluminado o pombo recebe comida e tal reforço não se segue quando dá bicadas num disco não iluminado, a ave rapidamente aprenderá a discriminar ou diferenciar os dois estímulos unicamente dando bicadas quando a luz está acesa. É habitual que um gato abandone a sua confortável sonolência quando ouve o som característico da abertura da lata de comida mas é pouco habitual que isso aconteça quando ouve o som da tampa de uma panela. Ao responder a um som e não ao outro deu-se a discriminação de estímulos (tendência para que uma resposta ocorra mais frequentemente na presença de certos estímulos do que na de outros).

A discriminação de estímulos é uma condição essencial de aprendizagem e das relações humanas em geral. Ninguém conseguirá obter aprovação no exame de código da estrada se não efetuar discriminação de estímulos (diferenciar neste caso os sinais uns dos outros); aprendemos a responder diferentemente a situações de alegria e de tristeza, a quem mostra interesse e simpatia por nós e a quem nos despreza, ignora ou insulta; sabemos que num comício político convém falar alto mas que tal comportamento será censurável numa sala de cinema ou num funeral; e se numa visita a casa de pessoas amigas um dos visitantes se dispõe a lavar loiça ou a ajudar nesse serviço é evidente que se não tivesse aprendido a discriminar loiça suja de loiça limpa, tal comportamento frequentemente bem visto (reforçado) poderia tornar-se absurdo e ridículo (ir, por exemplo, ao armário e retirar loiça limpa para a lavar).

A discriminação entre estímulos pode acontecer também quando a resposta a um estímulo é mais fortemente reforçada do que a resposta a outro estímulo. 


08/10/2012

Os princípios básicos do condicionamento operante - Recuperação espontânea

Tal como no condicionamento clássico, a extinção não anula ou apaga por completo um comportamento aprendido. A recuperação espontânea pode ocorrer passado um determinado período de tempo após a extinção inicial. No caso do rato da “caixa de Skinner” se a pressão sobre o pedal deixou repetidas vezes de ser reforçada com comida, o animal pode envolver-se noutras atividades- correr, tentar fugir da caixa, morder os cantos – que, interferindo com a ação aprendida em virtude do reforço, ajudam a que este se extinga. Mas como a resposta treinada foi a de pressionar o pedal, se alguns dias depois voltarmos a pôr o rato na caixa experimental, ao fim de pouco tempo voltará a pressionar o pedal. A completa extinção da resposta exigirá várias sessões e vários dias.


07/10/2012

Os princípios básicos do condicionamento operante - A extinção

A extinção é um princípio ou conceito aplicável quer no condicionamento clássico quer no condicionamento operante. Na primeira forma de aprendizagem quando o estímulo condicionado (som) é repetidas vezes apresentado sem o estímulo incondicionado (comida, para nos referirmos ao experimento de Pavlov) a resposta condicionada (salivação) gradualmente enfraquece e desaparece, dando-se assim a sua extinção. No caso do condicionamento operante, a extinção pode ocorrer quando a repetidas respostas e comportamentos não segue nenhum reforço.

Assim, a extinção é o gradual e progressivo enfraquecimento e desaparição de uma resposta aprendida porque nenhum reforço (positivo ou negativo) surge como sua consequência.

A retirada do reforço não produz um imediato decréscimo na frequência da resposta aprendida. Vários fatores condicionam a facilidade ou a dificuldade da extinção do comportamento aprendido.
  1. Quanto mais forte é a resposta aprendida (quanto maior o número de vezes que foi reforçada) tanto mais difícil é impedir a sua ocorrência;
  2. Quanto mais complexo é um comportamento aprendido tanto mais difícil a sua extinção dado que, consistindo num conjunto organizado de comportamentos, cada resposta particular que contribui para o comportamento global terá de ser extinta;
  3. Quanto mais diversos forem os locais em que se realiza (condiciona) a aprendizagem tanto mais difícil e morosa a sua extinção.


O processo básico da extinção foi descoberto por Skinner praticamente de forma acidental. Na sua ausência, um dos ratos estaria a pressionar o pedal que acionava o dispositivo que punha comida à sua disposição mas este avariou. Esfomeado, o rato acionou freneticamente o pedal sem receber comida alguma (algo que Skinner verificou porque a sua famosa “caixa” efetuava o registo das respostas do animal). Progressivamente, o rato deixou de pressionar o pedal acabando por se extinguir esse comportamento.


05/10/2012

Os princípios básicos do comportamento operante - A punição ou castigo

A punição ou castigo ocorre quando a consequência de uma resposta enfraquece a tendência para dar de novo essa resposta. É um estímulo que, como consequência de um comportamento, diminui a probabilidade de repetição desse comportamento.

O reforço negativo e o positivo têm o mesmo efeito: reforçam ou fortalecem a probabilidade de ocorrência das respostas que reforçaram. Embora punição e reforço negativo sejam muitas vezes confundidos, Skinner sublinhou que a punição tem efeito oposto: diminui a probabilidade de ocorrência ou repetição da resposta dada. Têm consequências opostas e efeitos antagónicos no comportamento.

Deve notar-se que no caso de punição o estímulo aversivo ocorre depois da resposta ou comportamento e eventualmente diminui a probabilidade de esta se verificar de novo; no caso do reforço negativo, o estímulo aversivo ocorre antes da resposta e a sua negação torna possível a repetição da mesma resposta.

Skinner não considerava a punição como uma forma efetivamente poderosa ou eficaz de influenciar o comportamento. Aplicando a punição a ratos verificou que a probabilidade do comportamento castigado acontecer de novo diminui. Contudo, apenas temporariamente se eliminou o comportamento indesejável. Além disso, pode conduzir ao desenvolvimento de comportamentos emocionais negativos, sem esquecer outros “efeitos secundários”.


04/10/2012

Os princípios básicos do condicionamento operante - O reforço

Os princípios fundamentais do condicionamento operante são o reforço, a punição, a extinção, a generalização, a recuperação espontânea, a discriminação e a modelagem.

Reforço
O reforço é o princípio fundamental do condicionamento operante (este é, por definição, a forma de controlar a frequência de um comportamento mediante o reforço).
O reforço, quer positivo quer negativo, é um estímulo que aumenta a frequência de uma resposta, isto é, aumenta as probabilidades de ser repetida. O reforço pode ser positivo ou negativo.

O reforço positivo é estímulo agradável que uma vez apresentado (melhor dizendo, suscitado por um comportamento) reforça a probabilidade de a resposta anteriormente dada ocorrer novamente.
O reforço negativo é um estimulo desagradável que uma vez removido ou evitado reforça a probabilidade de, a resposta ou o comportamento efetuado ocorrer novamente.

Os comportamentos que provocam prazer e satisfação e os comportamentos que nos permitem evitar a dor, o mal-estar ou a insatisfação são comportamentos reforçados, isto é, tendem a ser repetidos, a ocorrer com frequência. A frequência de um comportamento aumenta quando este provoca a apresentação de um estímulo agradável (reforço positivo) ou a remoção ou evitação de um estímulo desagradável (reforço negativo).

Deste modo, o reforço positivo envolve acrescentar algo positivo (agradável, desejável) a uma situação depois de ocorrer uma dada resposta, de modo a que a frequência desta se mantenha ou aumente no futuro; o reforço negativo implica remover, pôr termo a, evitar um estímulo ou situação desagradável e significa que a eliminação de um estímulo aversivo serve para fortalecer ou manter a resposta.

Quando um professor elogia um aluno pelo seu desempenho num teste estamos perante um reforço positivo que acrescentado à nota recebida aumenta a probabilidade de que tal desempenho (ou ainda melhor) se repita no futuro. Dinheiro, boas notas académicas, abraços, beijos, são reforços positivos. Quando a ingestão de duas aspirinas põe termo a uma desagradável dor de cabeça estamos perante um reforço negativo que fortalece a probabilidade de uma resposta idêntica numa mesma circunstância no futuro. Outro exemplo de reforço negativo verifica-se quando os pais dizem a uma criança: «Se comeres a salada não terás de comer a sopa.». Quando pomos o cinto de segurança para evitar uma multa, quando pelo mesmo motivo não estacionamos em cima do passeio, quando embalamos um bebé para que ele pare de chorar; «evitar a multa» e «pôr termo ao choro do bebé» são reforços negativos dos comportamentos descritos.


Em suma, o reforço, negativo ou positivo, dá-se quando um acontecimento posterior a uma resposta ou comportamento aumenta a tendência do organismo para dar de novo essa resposta ou realizar esse comportamento Se estudo com rigor e método e acabo por obter boas classificações, este acontecimento, consequência da minha ação, é um reforço positivo porque me agrada e predispõe a estudar com rigor e método em próximas ocasiões. Se faço exercício físico num ginásio e sigo uma dieta equilibrada acabando por perder peso a mais que tinha, eliminar algo que me desagradava é um reforço negativo que aumentará a tendência para seguir o mesmo regime quando eventualmente engordar outra vez.


02/10/2012

Skinner e a elaboração sistemática do condicionamento operante

A tese de que o comportamento e a aprendizagem de respostas são determinadas pelas suas consequências é uma ideia muito importante no campo da psicologia da aprendizagem. Contudo, foi necessário esperar quase quatro décadas para que a lei do efeito de Thorndike obtivesse reconhecimento generalizado. O mérito pertence em grande parte ao trabalho de Skinner, muito influenciado por Pavlov e Watson. É a Skinner que se deve o estabelecimento dos princípios básicos do condicionamento operante, a sua sistematização e aplicação à educação e a problemas clínicos e sociais.
Autodenominando-se behaviorista, Skinner propôs-se como objetivo fundamental da sua investigação descobrir a forma de medir objetivamente o comportamento.

Descrição de uma das experimentações de Skinner

O primeiro projeto de investigação de Skinner dizia respeito ao comportamento alimentar dos ratos. Utilizou um artefacto por ele próprio construído e que tem hoje o seu nome: «A caixa de Skinner». Colocou dentro um rato com fome. O rato só poderia obter comida pressionando uma alavanca que libertava pequenas bolas de queijo de um recipiente numa das paredes da caixa. O rato começou imediatamente a explorar a caixa e ao fim de algum tempo, acidentalmente, pressionou a alavanca e a comida caiu. Progressivamente, o animal começou a pressionar a alavanca em intervalos de tempo cada vez menores. Segundo Skinner isso significava que aprendeu a obter comida mediante uma resposta condicionada pelas consequências ou efeitos da sua ação (operação) no meio: a obtenção de comida é um reforço que fortalece a tendência para um determinado comportamento (pressionar a alavanca).

A partir desta e de muitas outras experimentações (diga-se que Skinner criou o protótipo de procedimento experimental para outros investigadores nesta área) o psicólogo americano definiu  a tese fundamental do condicionamento operante: um organismo tende a repetir aquelas respostas que têm consequências favoráveis.