Le point de vue de la propagation en sciences sociales : sommaire de présentation de Dominique Boullier

Professeur des Universités en sociologie à l'IEP Paris (Sciences Po), chercheur au CEE

par Nicolas Sacchetti

Le Professeur Dominique Boullier a présenté « Traces numériques et méthodes des sciences sociales » lors de la première séance de la série des Webinaires sur les mégadonnées et techniques avancées démystifiées dans le domaine des sciences sociales et humaines (SSH), le 1er septembre 2022.

Cet événement, organisé par 4POINT0, a été une occasion d’explorer de nouvelles pistes de recherche rendues possibles par les mégadonnées, offrant des opportunités de mieux comprendre notre monde en constante évolution. 

Sociologue et linguiste, Dominique Boullier est professeur à l’Institut d’Études Politiques de Paris (Sciences Po) et à l’école de la Gestion de l’innovation (EMI). Il s’intéresse à la question de l’utilisation des données en SSH. Il met en lumière que le web et les mégadonnées ont changé notre façon de connaître et de comprendre le monde. Ainsi, ce nouveau paradigme justifie d’adopter une approche adaptée à ces nouvelles technologies. 

Les trois V des mégadonnées 

Les 3V (Volume – Variété – Vélocité) caractérisent les mégadonnées et décrivent les défis de leur gestion et analyse. En SSH, la vélocité est une dimension nouvelle qui suscite un intérêt croissant. « La vélocité est intéressante pour faire comprendre à quel point nous avons à faire à des données d’un genre nouveau qui sont des traces de très bas niveau à haute fréquence que les plateformes récupèrent (GAFAMT), » explique-t-il. En effet, cette dimension permet d’étudier les phénomènes sociaux en temps réel, et de comprendre les tendances qui émergent. 

Innovation de rupture 

Le professeur Dominique Boullier pose la question à savoir si, maintenant que nous avons accès aux mégadonnées, il est légitime de faire des sciences sociales amplifiées par le numérique. Il qualifie cela d’innovation incrémentale. « C’est très légitime, » ajoute-t-il. Cependant, le professeur Boullier croit qu’il est temps de mettre en place une innovation de rupture (concept développé par Christensen en 1997).  

Contrairement à l’innovation incrémentale, qui améliore et affine un produit existant, l’innovation de rupture introduit quelque chose de nouveau qui bouleverse complètement un marché ou une façon de penser. Selon le professeur à Sciences Po, une telle innovation est nécessaire dans notre époque de quantification. En se référant aux idées du sociologue et psychologue Gabriel Tarde (1890) qui a considéré l’imitation comme le fondement du lien social, Professeur Boullier est d’avis qu’il faut prendre acte d’une nouvelle époque de quantification, des chances de validation de questions jusqu’ici sous-estimées, et de points de vue jusqu’ici disqualifiés.  

Trois générations de quantification du social 

Professeur Boullier définit trois générations de dispositifs de collecte de données, aussi utilisés par les institutions gouvernementales, et encore d’usage de nos jours. 

Dès la fin du XIXe siècle, « l’époque de la société » (G1) repose sur le recensement, dont l’État est un acteur majeur. Ce recensement crée des conditions de possibilités pour certains paradigmes comme le pouvoir de la société (Durkheim, 1895). Le principe de validation du dispositif de collecte de données est l’exhaustivité du recensement. Toute la population est sensée participer à un recensement. 

Les années 30 (G2) sont les moments où l’on a fait émerger l’opinion au travers de sondages réalisés par les instituts de sondage pour le compte des médias de masse. « Ces sondages vont fonctionner à la représentativité, et reposent sur une population de référence qui a dû être construite au travers des recensements et d’autres registres, » explique Professeur Boullier. Le principe de représentativité est ce qui constitue la validation de ce dispositif de collecte de données. Il mentionne les auteurs fondateurs George Gallup qui prédit avec les sondages la victoire de Roosevelt en 1936, et Paul Felix Lazarsfeld qui va en élaborer la théorie. « Ensemble ils vont construire la légitimité scientifique des sondages, avec toutes les limites que ça comporte évidemment, » explique-t-il. 

« Nous entrons dans l’époque des propagations (G3), » affirme professeur Boullier. Ces propagations reposent sur la collecte massive de traces spécifiques, les mégadonnées, par les plateformes du web (GAFAMT). Ces traces sont les comportements des internautes, comme les clics et la durée de présence sur une page. Elles permettent l’analysent de corrélations. Toutefois, Professeur Boullier souligne que les critères de validations du dispositif de collecte via les mégadonnées restent à construire. Cette validation passe par la traçabilité des mégadonnées collectées. 

Il ajoute que les corrélations prédictives sont ce que propose l’apprentissage automatique (Machine Learning). Pour mesurer la propagation, on parle de score de viralité, comme les Trends de Twitter (tendances). Ces traces accumulées génèrent des palmarès selon le nombre de tweet/seconde sur un sujet donné. 

Agentivité

L’agentivité dans les sciences sociales réfère à la capacité des individus ou des groupes à agir et à exercer une influence sur leur environnement social. Elle implique une certaine autonomie et une capacité de faire des choix.  

« L’individu n’est pas une entité naturelle, mais une construction historique et sociale. C’est pourquoi l’agentivité est toujours déjà située dans une relation de pouvoir. » (Foucault, 1979) 

« L’action réfléchie est l’expression de l’agentivité dans laquelle l’individu, à la lumière de sa situation présente, s’efforce de créer une situation plus satisfaisante et plus complète. Cette action est en même temps un moyen d’acquérir un contrôle plus intelligent de la situation. » (Dewey, 1916) 

Selon Professeur Boullier, les experts en science des données font de l’agentivité en grande quantité sans s’en rendre compte, en disant qui est l’acteur principal d’une situation ou d’un ensemble de données. Il parle d’une distribution de l’agentivité selon des points de vue : « Il ne suffit pas d’avoir de grandes masses de données, il s’agit d’être conscient que nous avons des types d’approches et de points de vue différents. Il faut bien comprendre que les mégadonnées nous permettent d’introduire un autre point de vue sachant que, pour autant, ça n’invalide pas les autres points de vue. »  

Distribution de l’agentivité selon les points de vue 

Il parle de point de vue de structure, de préférences individuelles, et de propagation. Selon celui que l’on adopte, on y attribue l’agentivité principale : « Toutes les sciences sociales des structures sont en réalité une façon de distribuer l’agentivité. On va parler de système, de reproduction, de cause finale, de patterns, etc. »  

Du point de vue de l’opinion, on se centre sur la préférence individuelle : « L’économie comme la psychologie ont construit tout un dispositif théorique où l’accent est mis sur l’agentivité de l’individu, de l’acteur rationnel qui est capable de prendre des décisions, » explique-t-il.  

Professeur Boullier propose de prendre le 3e point de vue, la propagation. Il explique qu’elle a une généalogie d’imitation et de traçabilité, et que les concepts clés sont l’événement, l’incertitude, la propagation, le chaos, la crise, etc. Lorsqu’on aborde le point de vue de la propagation, on s’intéresse aux entités circulantes, idées, ondes, et mèmes : « Toutes choses qui n’ont pas droit de citer, quasiment, dans les deux autres approches. Puis ce que c’est en réalité c’est toujours, il y a des décideurs d’un côté, ou bien il y a des structures sociales de l’autre. Là, il y a des choses qui nous transpercent, qui nous traversent. Qui sont des influences d’un autre type qui ne sont pas forcément organisées autour d’une intention de stratège. » P. ex. Être percuté par un mème qui va nous rester à l’esprit pendant un moment alors que l’on est sur internet. 

Les acteurs humains peuvent être considérés comme des véhicules pour la propagation des mèmes. Professeur Boullier parle de la théorie de l’acteur-réseau pour faire comprendre « comment les artéfacts jouent un rôle, que ce soient des textes, des signes, ou des objets eux-mêmes. Ils construisent les situations et ils nous font agir. » 

Il indique qu’un défaut actuel des sciences sociales est de sous-estimer les propriétés et le pouvoir d’agir de ce qui circule. Il prend pour exemple la théorie de la Physique sociale (Social Physics) du Professeur Alex Pentland du MIT Media Lab, qui justement ne semble pas prendre en considération ce point.  

De nos jours, la distribution de l’agentivité ne se fait plus aux individus, comme par le passé. Elle ne se fait dorénavant à des entités que sont la structure sociale, les préférences individuelles, ou les propagations – qui sont alors des objets, des messages, ou des signaux. 

Le point de bascule 

Dans l’analyse des propagations, le point de bascule (Tipping Point) de Malcom Gladwell (2000) est un des éléments clés. Il cite Gladwell : « Le point de basculement est le moment magique où une idée, une tendance ou un comportement social franchit un seuil, bascule et se répand comme un feu de forêt. »  

Dès février 2023, le dernier livre du Professeur Dominique Boullier, Propagations – Un nouveau paradigme pour les sciences sociales (éd. Armand Colin), sera en vente. « Twitter c’est un artéfact certes, mais il crée les conditions d’une viralité extraordinaire qui précisément va nous permettre de comprendre ce qui circule et nous y intéresser. Twitter et les mèmes sont les drosophiles des sciences sociales de 3e génération et pourtant peuvent être traités selon chaque point de vue : un terrain expérimental naturel fabriqué. La drosophile c’est ce qu’on appelle la mouche à vinaigre. C’est celle qui a servi à tester des modèles en génétique […] sans trop de questions éthiques sur la vie et la mort de la pauvre drosophile. »  

Professeur Boullier qualifie Twitter de machine mémétique. Il parle de design d’affordance, soit la capacité du design à suggérer les actions à faire. Il ajoute que Twitter a le design de l’horloge atomique de l’attention. Entre autres avec ses brefs messages limités à 280 caractères, « l’alerte à haute fréquence » qu’est le bouton Retweet, le hashtag et les trending topics.  

« La contrainte c’est que du point de vue des sciences sociales, nos traces sont en réalité captées par l’oligopole de l’attention numérique (GAFAMT). Non seulement, ils les captent, mais les commercialisent, et les analysent prétendument bien mieux que les sciences sociales puisqu’ils ont un volume et qu’ils peuvent tester tout ce qui veulent comme corrélation. Qui en aura la responsabilité, ça c’est un autre sujet. Du point de vue éditorial, ce ne sont jamais eux, ce sont toujours les individus qui ont posté tel post, ils n’y sont pour rien. »  

Enfin, il souligne l’enjeu de la régulation des plateformes des GAFAMT, dont, en plus de la liberté d’expression, l’importance de l’accès aux données pour les sciences sociales : « des outils extrêmement riches pour une société pour acquérir une forme de réflexivité nouvelle. » 

La propagation numérique (clip) par Dominique Boullier

En bref

Les mégadonnées sont caractérisées par les 3V : Volume, Variété et Vélocité. En sciences sociales et humaines (SSH), les bases de données sont généralement constituées de micro-traces du comportement des internautes, qui gagnent en signification en raison de leur grande répétition. 

Au fil du temps, les dispositifs de quantification sociale ont permis l’analyse de la société par le recensement, et de l’opinion par le sondage. À l’ère numérique des propagations de l’information, par la collecte des micro-traces, les mégadonnées permettent une analyse des phénomènes sociaux circulant sur les technologies de communications. 

Dans les SSH, le taux de diffusion d’un contenu ou d’un comportement est devenu central pour la recherche. Le statut des acteurs humains tels que les influenceurs·ses, ainsi que leur pouvoir d’agir, ou agentivité, se modifient pour devenir des véhicules de diffusion d’un message ou d’un comportement. L’étude de la circulation de mèmes sur Twitter en est un exemple, les réseaux sociaux créant les conditions d’une viralité extraordinaire.  

Après le recensement et le sondage, l’analyse de la société par la collecte des mégadonnées se concentre sur l’analyse structurale des réseaux définie par les relations entre les différents acteurs, et de leurs flux, c.-à-d. les échanges qui y ont lieu. C’est le nouveau paradigme des SSH de 3e génération

Il convient de souligner que ce travail est actuellement expérimental et que les moyens pour aborder les grandes questions ne sont pas encore disponibles. Néanmoins, il est important de mettre à profit la formalisation des propriétés de propagation, tant sur le plan mathématique que dans le domaine des SSH, afin de continuer à avancer dans cette direction de recherche

Ce contenu a été mis à jour le 2023-06-14 à 21 h 55 min.