Le cerveau joue-t-il aux dés ?

Résultats scientifiques Neuroscience, cognition

Pour optimiser les choix comportementaux, le cerveau générerait des prédictions sur son environnement à partir des informations acquises par l'expérience. Néanmoins, dans des situations extrêmes, nouvelles ou trop complexes, faire table rase du passé et opter pour une stratégie aléatoire peut être plus avantageux. Les chercheurs ont développé une expérience dans laquelle, pour faire face à un problème complexe et obtenir des récompenses, les souris apprennent à générer des séquences de choix aléatoires. Ces résultats, publiés dans la revue Communications biology, suggèrent donc un mécanisme actif afin de s'adapter au besoin de variabilité dans les comportements.

Bon nombre de nos choix consistent à répéter des actions réussies dans le passé. Cependant, dans certains cas, et même lorsque l’on est confronté à une même situation de manière répétée, produire un comportement inhabituel, variable ou imprévisible peut constituer un avantage stratégique. C’est par exemple le cas de proies qui échappent à un prédateur ou d’humains qui jouent à des jeux de compétition. La génération volontaire de comportements aléatoires est réputée difficile, notamment chez l’humain. Pour certains, la variabilité comportementale trouve son origine dans du bruit (sensoriel ou moteur) ou dans des erreurs du système. Il n'est donc toujours pas clair si le cerveau est capable de générer de la variabilité délibérément.

Les chercheurs ont conçu une expérience dans laquelle des séquences de choix non répétitives sont renforcées. Des souris sont entraînées à effectuer une séquence de choix binaires dans une arène où trois lieux (A, B et C) sont explicitement associés à des récompenses. Les animaux sont récompensés lorsque leur décision augmente la « complexité grammaticale » de leur dernière séquence de 9 choix (‘ACAB’ étant plus complexe que ‘ACAC’). Les récompenses sont délivrées suivant des règles déterministes, il n'y a pas de hasard. Si un animal rejoue une même séquence il recevra donc exactement les mêmes récompenses. La variabilité du comportement ne peut donc pas s'expliquer par une variabilité dans l'environnement.

Pour maximiser leur gain, les souris ont deux options : soit utiliser leur mémoire (se rappeler de la séquence de 9 choix), soit choisir au hasard. En accord avec d’autres travaux, les chercheurs ont constaté que les souris augmentaient progressivement la variabilité de leurs séquences de choix. Plus important encore, les résultats expérimentaux et la modélisation suggèrent qu'elles atteignent la meilleure performance possible en utilisant la sélection aléatoire, sans utiliser leur mémoire. Cela suggère l’existence d’un processus cérébral actif permettant l'ajustement des paramètres de décision afin de s'adapter au besoin de variabilité. Les résultats de cette étude ouvrent la voie à de nouvelles questions passionnantes : Le mode par défaut est-il la répétition ou la genèse de hasard ? Comment identifie-t-on les situations où il est avantageux de faire l’aléatoire ? Quelles sont les bases neurales permettant d’adopter une telle stratégie ?

figure
© Marwen Belkaid & Philippe Faure

Figure : Les souris sont entraînées à effectuer une série de choix binaires entre des récompenses obtenues lorsqu'elles rejoignent une des trois zones marquées au sol. Elles ne peuvent obtenir deux récompenses consécutivement sur la même zone. Aussi, les souris ont vite appris à se déplacer de zone en zone pour obtenir une récompense. Si les zones sont associées à l'obtention systématique d'une récompense, les souris produisent des séquences répétitives. Si l'obtention de la récompense est conditionnée par l’adoption d’un comportement plus variable, les souris génèrent des séquences en apparence aléatoire.

Pour en savoir plus:

Mice adaptively generate choice variability in a deterministic task
Belkaid M, Bousseyrol E, Durand-de Cuttoli R, Dongelmans M, Duranté E.K, Ahmed Yahia T, Didienne S, Hanesse B, Come M, Mourot A, Naudé J, Sigaud O,* Faure P*

Communications biology, 21 Janvier 2020.    doi.org/10.1038/s42003-020-0759-x

Contact

Philippe Faure
Directeur de recherche CNRS au Laboratoire de plasticité du cerveau (CNRS/ESPCI PARIS)