- Rory Miller legt dit kort uit in een video
Bron: https://www.youtube.com/watch?v=G1aPbV_cZ5M
2. Een beetje meer uitleg in tekst vorm (vertaald via google translate dus …)
Bron: https://conflictresearchgroupintl.com/operant-conditioning-oc-rory-miller/
Er zijn een hoop cijfers die rondgaan: dat het 300-500 herhalingen kost om een nieuwe motorische vaardigheid bij te brengen, 3000-5000 als je een oude vaardigheid vervangt. Dat is training. Hoeveel herhalingen heb je nodig om te leren een hete kachel niet aan te raken? Een keer. En je trok je hand weg met perfecte lichaamsmechanica. Dat is het verschil tussen conditionering en training.
We hebben het niet over fysieke fitheid. Dat is ook belangrijk, maar het is niet leren. We hebben het over operante conditionering.
De principes van operante conditionering zijn eenvoudig en een gedragspsycholoog zal beweren dat dit het model is voor al het leren.
Stimulus-respons-beloning / straf
Er gebeurt iets. Dat is de stimulans. Dan doe je iets, dat is het antwoord. Wat je hebt gedaan, maakt de dingen ofwel beter (beloning) of slechter (straf).
Er zijn enkele regels en enkele waarschuwingen over hoe Operant Conditioning (OC) werkt. Ten eerste, als het goed wordt gedaan, is OC een zeer snelle methode om eenvoudige dingen te leren. Het is veel moeilijker en moeilijker om een complexe reeks acties te conditioneren, en u kunt niet conditioneren als de stimulus moet worden geïnterpreteerd.
De stimulus moet ondubbelzinnig zijn. Als je erachter moet komen dat deze gestileerde beweging een klap zou moeten zijn, moet je nadenken. Dit is voor veel aspecten van zelfverdedigingstraining geen probleem. Een mes dat op je buik komt, is niet dubbelzinnig. In het gezicht geslagen worden is niet genuanceerd.
Overtuig niet. Corrigeer en leg het minimum uit. Een van de schoonheden van OC is dat de wereld jouw onderwijs geeft en dat de student niet met de wereld in discussie kan gaan. Als je erin blijft, word je goed in ukemi of breuken, omdat alle verkeerde manieren pijn doen. Een van de gevaren is dat als je coacht, de student gaat denken in plaats van te reageren en je conditionering op magische wijze zal veranderen in training en onder druk zal mislukken.
Er is ook een psychische aandoening die ‘aangeleerde hulpeloosheid’ wordt genoemd. Als iets wat een leerling doet, wordt gecorrigeerd, of iets wat iemand doet, wordt gestraft, dan zullen ze minder met die reactie doen. Als ze echter worden gestraft, ongeacht wat ze doen of elke keer dat ze iets doen, worden gecorrigeerd, wordt de student geconditioneerd dat niets doen de beste strategie is. Door je vechtende leerlingen te veel te corrigeren, worden ze onder stress passief. Dat is precies het tegenovergestelde van uw doel.
Elke reactie die zelfs maar een kleine verbetering is, moet worden beloond. Dat is zo simpel als te zeggen: “Leuk!”
Beloning en straf zijn heel specifieke woorden in OC-training. Net als de woorden ‘positief’ en ‘negatief’. Beloning is alles dat gedrag bevordert. Het is bijna altijd iets dat mensen een goed gevoel geeft. Beloning verschilt voor verschillende mensen, omdat we niet allemaal van dezelfde dingen houden. Maar zelfs dingen die zo simpel zijn als een warme glimlach of ‘Goed gedaan’ zeggen, zijn beloningen. En zeggen: “Goed gedaan, maar dit is verkeerd, doe het op deze manier” is niet alleen een straf (alle correcties zijn straffen), maar geeft een gemengd signaal af en zorgt ervoor dat het diepere deel van het brein van de student je minder vertrouwt.
Positief en negatief zijn geen waardeoordelen, maar duiden alleen op aan- of afwezigheid. Beloning en straf zijn de waardenhouders.
Positieve beloning (PR): er gebeurt iets goeds. Puppy krijgt iets lekkers.
Negatieve beloning (NR): er gebeurt NIET iets slechts. Puppy wordt niet geschopt.
Positieve straf (PP): er gebeurt iets ergs. Puppy wordt geschopt.
Negatieve straf (NP): Iets goeds wordt achtergehouden. Puppy wordt genegeerd.
In een tegenaanval, zoals Dracula’s Cape, is de positieve beloning het neerhalen van de slechterik. De negatieve beloning is dat de aanval van de slechterik ontbreekt. Dubbele bevestiging.
Als je de techniek verkeerd toepast, word je geraakt (positieve straf) en zal de slechterik niet ten onder gaan (negatieve straf).
Timing op beloning is van cruciaal belang. Geen enkele crimineel waarvan ik op de hoogte ben, geeft zijn gevangenisstraf de schuld van zijn daden. Hij geeft hen altijd de schuld van de rechtszaak. De straf wordt schuldig bevonden (het is een positieve straf omdat het de kennis introduceert van de beoogde straf die later komt) en dat gebeurt aan het einde van de rechtszaak, maar vaak maanden na het misdrijf. Net zoals je een hond niet kunt straffen voor een vlek van een dag oud op het tapijt, heeft het geen zin om je leerlingen te vertellen dat ze het goed hebben gedaan aan het einde van de les. Beloning en bestraffing moeten zo onmiddellijk mogelijk plaatsvinden, net als in de echte wereld.
Een voorbeeld: Dracula’s Cape trainen voor Counter-Assault (tegenaanval)
Voordat we in de tegenaanval komen, is de basis zeer zorgvuldig gelegd. De leerlingen zijn al blootgesteld aan de hinderlaag als onderdeel van de geweldscontext en hebben een discussie gehad over Operant Conditioning als trainingsmethode. (Onderwijs). Ze hebben gewerkt met energieopwekking, met name drop step, en structuur. (Lesgeven, trainen, wat conditionering en wat spelen).
Eerst leggen we uit wat de cape van Dracula is en niet, waar hij voor is, wanneer en waarom hij nodig is en wat hij doet. Dat wordt geleerd.
Daarna oefenen ze een paar rondes om in de techniek te vallen. Dit is training en ik voel me vrij om hier te corrigeren, maar ik corrigeer niet voor of ze het doen zoals ik het doe of hoe het eruit ziet, ik corrigeer voor de vraag of het de missie zal volbrengen.
Vervolgens werken ze samen en testen ze de structuur van elkaars techniek. Dit geeft direct feedback. Het staat op de grens tussen conditionering en training.
De eerste fase van OC is om partners met trapschilden een stimulans te laten geven. Het is mogelijk om een specifieke reactie op een specifieke stimulus te trainen, maar het zou jaren duren om voor alle mogelijke aanvallen te conditioneren. Het mooie van Dracula’s Cape of Tony Blauer’s SPEAR is dat het werkt bij een breed scala aan aanvallen, zodat je het kunt conditioneren voor een meer algemene stimulus. In plaats van te proberen om vier reacties te conditioneren voor een prik, een kruis, een ronde huisstoot en een trap (mogelijk acht reacties, als je techniek anders werkt voor rechts- of linkse aanvallen), conditioneer je één reactie die werkt op de algemene stimulus van ‘een aanval.’
Deze trainingsfase heeft een zeer duidelijke uke en tori. Uke bestaat om tori de stimulans te geven om te reageren. Het is geen mix of wedstrijd en het is mogelijk dat een van de redenen waarom maar weinig mensen goed conditioneren, is dat het saai kan zijn als dat alles is wat je doet.
Tijdens deze fase loop ik rond en vertel ik mensen dat ze het goed doen. Ik corrigeer alleen als er iets duidelijk mis is dat de leerling niet zal ontdekken door pijn, en dat wordt bijna altijd op een positieve manier verwoord. Positief betekent niet opgewekt, positief in conditionerende zin: zeg waar mogelijk ‘probeer dit’ in plaats van ‘doe dat niet’. Ook corrigeer ik nooit als iemand een heel andere techniek doet die werkt. Dit gaat over effectiviteit, niet over het behouden van mijn techniek. Straf nooit succes.
Ik zal echter veel tijd besteden aan het corrigeren van de aanvallers. De schopschilden moeten stevig worden vastgehouden, anders krijgt de tori niet de juiste feedback. Uke moet heel dichtbij staan, de afstand die een crimineel zou hebben om een sukkel uit te lokken. De aanval moet realistisch en agressief zijn. Er moet een pauze zijn tussen de aanvallen zodat elke stimulus duidelijk is en de aanvallen een gebroken ritme moeten hebben.
De laatste fase is om de student het hoofd te bieden aan drie aanvallers, vooraan en opzij. Een vierde coach achter geeft aan welke van de drie aanvallers zal aanvallen. Deze oefening begint dingen op reflexsnelheid te krijgen. Het beloont ook een goede drop-stap, want als de drop-stap wordt uitgevoerd, werkt de techniek zelfs op meerdere gelijktijdige aanvallers. Idealiter zou de persoon in het midden een heel goede techniek moeten gebruiken, dus succes is de laatste herinnering.
Training komt niet naar voren in je eerste gevechten. Conditionering wil, goed of slecht. De dingen die je hebt geconditioneerd, zullen te snel gebeuren voor je besluitvormingsproces, en in een noodgeval van leven of dood is goede conditionering een redder in leven.
Als uw studenten hebben geoefend met het trekken van stoten en gestraft zijn voor gebrek aan controle wanneer ze contact maken, zullen ze onder stress hun stoten trekken. Als uw leerlingen altijd op tape en handschoenen hebben vertrouwd om hun vuisten veilig te houden, zullen ze hun handen vasthouden alsof ze zijn afgeplakt, en dat kan kostbaar zijn.
Het belangrijkste is dat als je iemand bent die je studenten leert vechten, maar een voorbeeld moet geven van elke student te veel vecht. Je hebt zojuist je eigen training ongedaan gemaakt. Je hebt een student geleerd om te winnen en je hebt ze gestraft voor het winnen. Je hebt het diepe deel van de hersenen geleerd dat verliezen de veiligste weg is. Je ego heeft een loser gecreëerd. Straf nooit, nooit, iemand omdat hij succesvol is in wat je haar hebt geleerd.
Het vierde element van training is spelen. Naar mijn mening is dit het belangrijkste. Elke ontmoeting met geweld is chaotisch met een bijna oneindig aantal variabelen. Je bewuste geest kan dat niet aan en het is te gecompliceerd voor eenvoudige conditionering. De enige manier die we weten om mensen te helpen omgaan met chaos, behalve het overleven van een enorme hoeveelheid ervaring, is door te spelen.
Dit is hoe dieren leren jagen. Zo heb je alles geleerd waar je echt goed in bent. U kunt duizenden woorden in een vreemde taal uit uw hoofd leren en alle grammaticaregels kennen, maar totdat u naar de markt kunt gaan en kunt afdingen en discussiëren en flirten, spreekt u de taal niet echt.
Het is een effectieve leermethode en we zijn vastberaden om op deze manier kennis op te nemen en te integreren. Hoe lang duurt het voordat een kind een videogame leert? De meeste kinderen zijn hoogstens bedreven in uren. Omdat ze de tutorial doorlopen en daarna spelen. Als we zouden proberen om een videogame meester te maken op de manier waarop we vechtkunstenaars proberen op te leiden, hoeveel jaar zou het dan duren om dat vaardigheidsniveau te bereiken, of helemaal niet?
Alles wat je leert, alles wat je traint, zal harder doordringen en meer beschikbaar zijn onder stress, als je er een goed, moeilijk fysiek spel van hebt gemaakt. Dit was Kano’s openbaring over judo.
In het spel is operante conditionering ingebouwd. Er is onmiddellijke feedback over wat wel en niet werkt en realistische (soort van, later meer) stimuli. En deze operante conditionering werkt in een kader van chaos en irrelevante prikkels en alle andere dingen die echte ontmoetingen zo moeilijk maken. Het leven lijkt heel erg op spelen, als je het achterstevoren wilt bekijken.
Een voorbehoud, en dit geldt voor het ontwerpen van spel en voor conditionering. Het spel is het spel. Het zal nooit een één-op-één correlatie hebben met de werkelijkheid, tenzij het aantal lichamen hetzelfde is. Goed worden in sparren of goed worden in push-hands of goed worden in rollen zijn allemaal stukjes. Bij sommige van deze spellen krijg je een diepgaand begrip van de principes. Maar als je gelooft dat het spel de realiteit is, heb je jezelf gewoon moedwillig verblind, en die blindheid kan worden doorgegeven aan je studenten.
Het spel of de conditionering is wat het is, niet noodzakelijkerwijs wat je bedoelde. Voorbeeld aan de speelzijde: ik hou van worstelen. Het is de beste manier om de vaardigheid te ontwikkelen om een lichaam te bewegen. Maar als ik in die positie ben, heb ik een van de drie doelen: hem manoeuvreren zodat ik kan ontsnappen, hem manoeuvreren zodat ik hem kan manoeuvreren of hem manoeuvreren zodat ik hem kan uitschakelen. In het echte leven worstelt u nooit om te bewijzen dat u beter bent in worstelen.
Aan de conditionerende kant keek ik naar een video van ‘woofing’. De instructeurs kwamen in de gezichten van de studenten en schreeuwden vreselijk misbruik en bedreigingen. De instructeurs dachten dat ze tegen adrenaline aan het inenten waren. Dat de studenten wennen aan de emotionele omgeving van een aanranding. Dat is misschien waar, maar wat de studenten aan het oefenen waren, was een slechterik hun ruimte laten binnendringen, bedreigen en beledigen (stimulus) en de studenten deden niets (reactie). In de veronderstelling dat ze zich aan het voorbereiden waren, oefenden ze passiviteit.
Geplaatst in: Rory Miller , Instructional Issues – For Teachers