Problématique, question de recherche, modélisation des données et l’analyse

par Nicolas Sacchetti

Carl St-Pierre est un statisticien de formation. Il travaille à Polytechnique Montréal depuis plus de 25 ans où il y enseigne le cours Méthodes de recherche quantitatives. Dans le cadre des Webinaires 4POINT0 sur Les mégadonnées et techniques avancées démystifiées, le but de cet atelier est de voir la relation entre la problématique, la question de recherche, et les données.

I – Survol de la recherche

Le professeur Carl St-Pierre présente trois principaux types de recherche, avant de fournir cette définition, selon Cooper et Emory (1995) : « La recherche est une étude systématique visant à obtenir des informations afin de résoudre des problèmes. » Les types de recherche qu’il présente sont les suivants :

La recherche expérimentale, « savoir le potentiel d’un médicament, » est une méthode scientifique qui vise à déterminer si une cause spécifique produit un effet particulier. Les chercheurs·ses définissent une hypothèse, créent des conditions expérimentales pour tester cette hypothèse, et observent si les résultats confirment ou infirment l’hypothèse. Un·e chercheur·se pourrait vouloir savoir si une nouvelle méthode d’enseignement améliore les performances des élèves. Il ou elle effectuerait une expérience en introduisant cette méthode dans une classe (groupe expérimental) et en n’introduisant pas la méthode dans une autre classe (groupe de contrôle), puis en comparant les résultats des élèves.

La recherche post-théorique, « d’après une théorie, » est une approche systématique qui consiste à formuler des hypothèses sur la base d’une théorie existante, puis à tester ces hypothèses en collectant et en analysant des données. « Il y a des hypothèses et l’on veut vérifier s’il existe des relations, » explique-t-il. Cette approche est aussi souvent nommée méthode hypothético-déductive. Elle permet de parvenir à une compréhension plus précise et fiable du phénomène étudié.

La recherche appliquée vise à résoudre des problèmes concrets ou à améliorer des situations spécifiques. « Le problème va s’adresser directement à la communauté des praticiens·nes, » indique Carl St-Pierre. Elle vise à appliquer les découvertes de la recherche fondamentale à des problèmes pratiques. Par exemple, un·e chercheur·se en psychologie qui étudie les méthodes pour réduire l’anxiété avant les examens, conduit une recherche appliquée. Il ou elle pourrait appliquer les connaissances théoriques sur l’anxiété et le stress pour développer des techniques de relaxation spécifiques pour les étudiants·es avant les examens.

Lorsqu’on parle de problèmes à résoudre, il peut s’agir de problèmes théoriques ou appliqués. Un problème théorique renvoie à une question de recherche qui concerne les concepts, les idées ou les théories dans un domaine particulier d’étude. Alors qu’un problème appliqué fait référence à une question ou une situation réelle que l’on cherche à résoudre ou à améliorer grâce à la recherche. C’est généralement d’un problème concret, souvent rencontré dans un contexte professionnel ou pratique.

Les objectifs de la recherche

Le professeur St-Pierre met ensuite l’accent sur les principaux objectifs de la recherche. Chacun de ces objectifs répond à un type différent de question de recherche :

Témoigner : il s’agit de documenter un phénomène, une situation ou un événement. Les études qualitatives, comme les études ethnographiques et de cas, sont souvent utilisées pour cet objectif.

Décrire : l’objectif est de décrire en détail un phénomène, une population ou un problème. Les études descriptives, qu’elles soient qualitatives ou quantitatives, sont généralement mobilisées pour atteindre cet objectif.

Expliquer : le but est de comprendre les causes, les effets ou les mécanismes sous-jacents d’un phénomène. Les études explicatives, souvent basées sur des méthodes quantitatives, sont utilisées pour cet objectif.

Prédire : on cherche à prédire des événements futurs ou des résultats sur la base de certaines variables ou conditions. Les études prédictives, qui sont généralement quantitatives, sont utilisées pour cet objectif.

Ces objectifs de recherche sont souvent liés et peuvent se chevaucher dans une seule étude. Par exemple, une étude peut commencer par décrire un phénomène, puis tenter d’expliquer pourquoi il se produit et enfin prédire comment il évoluera à l’avenir.

La diffusion de la recherche

Il parle de la structure typique d’un rapport de recherche. Elle comprend une introduction, le corps du rapport, et une discussion/conclusion.

L’introduction donne un aperçu du sujet, pose la question de recherche, et établit l’importance et la pertinence du sujet. C’est là que le chercheur expose la problématique et les objectifs de l’étude.

Le corps du rapport est l’endroit où le chercheur expose en détail la méthodologie de l’étude, présente les données et les analyses effectuées, et partage les résultats de l’étude. Comme le professeur St-Pierre l’a mentionné, « si je veux relier la problématique et ma question de recherche aux données dont j’ai besoin, c’est dans le corps du rapport que cela se trouve. » Dans cette section, le chercheur présente les travaux et les résultats des études antérieures qui ont abordé le sujet de la recherche, les travaux qui justifient la problématique soulevée, et les travaux auxquels se réfère la recherche. Il est également important de montrer les lacunes dans la littérature existante, en mettant en évidence les points qui ont été l’objet d’études empiriques et ceux qui n’ont pas encore été explorés.

La discussion et la conclusion sont l’endroit où le chercheur interprète et explique les résultats, les relie à d’autres recherches existantes, et suggère des directions pour les recherches futures. C’est également là que le chercheur évalue les limites de l’étude et les implications de ses résultats.

Méthode de recherche (méthodologie)

Pour établir la méthodologie de recherche, le Professeur Carl St-Pierre souligne une série de questions essentielles que les chercheurs·ses doivent se poser. Premièrement, comment va-t-on mener la recherche ? Ensuite, quel type de recherche choisir – exploratoire, causale ou autre ? Doit-on opter pour une approche qualitative ou quantitative ?

Il faut aussi considérer le terrain d’étude, la méthode de collecte de données (questionnaires, entretiens, études de cas, etc.), et l’environnement dans lequel ces données seront recueillies. Est-ce que cela se passera en laboratoire, en simulation, ou dans un contexte de vie réelle ?

D’autres considérations comprennent l’identification des individus auprès de qui les données seront recueillies et le nombre d’observations nécessaires pour répondre à la question de recherche. Enfin, il faut réfléchir à la manière dont les variables de recherche seront mesurées, codifiées et construites.

II – Élaboration du design de recherche : relier les données à la problématique et aux questions de recherche

Le professeur Carl St-Pierre, spécialiste en méthodes de recherche quantitatives, insiste sur l’importance de l’élaboration du design de recherche. Il explique que le design de recherche est un plan qui guide la sélection des sources et des types de données nécessaires pour répondre aux questions de recherche. Il précise également les moyens utilisés pour collecter ces données.

Le design de recherche constitue le cadre conceptuel qui définit les relations entre les variables étudiées. Il sert à planifier le projet de recherche depuis la formulation de l’hypothèse jusqu’à l’analyse et l’interprétation prévue des résultats. Le design de recherche permet de lier efficacement les données à la problématique et aux questions de recherche, assurant ainsi une cohérence et une rigueur scientifique à l’ensemble du processus de recherche.

Questions à se poser lors de l’élaboration du design de recherche

Le choix de la méthode d’analyse des données dépend de la question de recherche (ou hypothèse), du type de résultats souhaités, et de la nature des données. Ces questions, tirées de Thietart et collab. (2007, p.154), peuvent aider à orienter le choix des méthodologies et à préciser les détails du design de recherche.

  • La méthode choisie permet-elle de répondre à la problématique ?
  • La méthode choisie permet-elle d’obtenir le type de résultats escomptés ?
  • Quelles sont les conditions d’utilisation de cette méthode ?
  • Quelles sont les limites ou les faiblesses de cette méthode ?
  • Quelles autres méthodes pourraient être utilisées pour répondre à la problématique ?
  • La méthode choisie est-elle préférable aux autres ? Si oui, pourquoi ?
  • Quelles compétences cette méthode requiert-elle ?
  • Ai-je ces compétences ou puis-je les acquérir ?
  • L’utilisation d’une méthode complémentaire pourrait-elle améliorer l’analyse ?
  • Si oui, cette méthode est-elle compatible avec la première ?

Questions à se poser sur le recueil des données

Thietart et collab. (2007, p.156-157)

Nature des données
  • Quelles sont les informations dont j’ai besoin pour répondre à la problématique ?
  • Le type de données est-il adapté à la méthode d’analyse retenue ?
Mode de collecte des données
  • Le mode de collecte des données est-il adapté à la problématique ?
  • Permet-il de recueillir les données dont j’aurai besoin pour effectuer les traitements que j’envisage ?
Nature du terrain d’observation et de l’échantillon
  • Le terrain choisi permet-il de répondre à la problématique ?
  • La taille de l’échantillon est-elle suffisante pour l’analyse que je souhaite mettre en œuvre ?
  • La composition de l’échantillon pose-t-elle des problèmes en termes de validité de la recherche ?
Sources de données
  • Les interlocuteurs·rices choisis·es sont-ils·elles aptes à me donner toute l’information dont j’ai besoin ?
  • Y a-t-il d’autres interlocuteurs·rices possibles ?
  • Si oui, ceux·celles que j’ai choisis·es sont-iels les meilleurs·es ?
  • Si oui, est-il intéressant d’interroger aussi ces autres interlocuteurs·rices ?
  • Les données secondaires correspondent-elles à celles que je recherche ?
  • Y a-t-il d’autres sources possibles, et si oui, sont-elles préférables ?
  • M’est-il possible d’améliorer ces données avant de les traiter ?
Faisabilité
  • Le coût et la durée du recueil de données sont-ils acceptables pour moi ?
  • Si le recueil est trop lourd, est-il possible d’en sous-traiter une partie ?
  • Le mode du recueil de données nécessite-t-il une formation particulière ?
  • Si oui, ai-je les compétences ou puis-je les acquérir ?
  • Mon terrain et mes sujets d’observation sont-ils accessibles ? Si oui, pendant combien de temps le seront-ils ?
  • Le mode de recueil de données choisi est-il acceptable pour le terrain et les sujets d’observation, en termes de forme, de durée, etc. ?
Exemple de design de recherche
Exemple de design de recherche : Thietart et collab., 2007, p.160 (Exemple 2)

Questions sur les résultats attendus

Thietart et collab. (2007, p.159)

  • Les résultats prévus répondent-ils à la problématique ?
  • Ces résultats se rattachent-ils correctement à la revue de la littérature ?
  • Quel est l’apport de la recherche dans le champ auquel je souhaite contribuer ?
  • Quel est le degré de généralisation ou de compréhension des résultats et du phénomène étudié ?

III – Passage du théorique à l’empirique

Professeur Carl St-Pierre précise que le passage du monde théorique à l’empirique consiste à relier les concepts issus de la littérature à des données réelles, pour en extraire les indicateurs potentiels. Il définit le monde théorique comme l’ensemble des connaissances existantes dans la littérature, et le monde empirique comme l’ensemble des données que l’on peut recueillir sur le terrain. (Thietart et collab. (2007, p.174)

Où repérer les mesures

Partant du monde théorique, le·la chercheur·se dispose d’un ensemble de travaux de recherche lié plus ou moins directement à son domaine. Les travaux sont des articles, thèses et mémoires, et tout autre ouvrage sur lequel s’appuyer pour formuler l’ensemble des définitions conceptuelles et aussi sur lequel s’appuyer pour rechercher les mesures disponibles. (Thietart et collab. (2007, p.183)

Comment faire un choix des indicateurs

« L’appréciation du choix des indicateurs se fait à partir de la littérature, du vécu des chercheurs·ses et de leur expérience, » explique-t-il. On considère la facilité de lecture et le nombre d’items pour mesurer une variable de recherche. S’ajoute la considération de la compréhension des items, c’est-à-dire la clarté des questions et des valeurs possibles des réponses. Il faut aussi se doter d’un instrument de mesure capable d’enregistrer des variations assez fines du concept mesuré.

IV – Type d’échelle et mode de collecte de données

Échelle nominale

Il s’agit de l’échelle de mesure qualitative la plus simple. Elle permet de catégoriser les données sans aucun ordre ou hiérarchie spécifique. Un exemple concret serait la question du secteur d’activité dans lequel une personne travaille. Les réponses possibles pourraient inclure des secteurs tels que la métallurgie, les PME, l’électricité, et bien d’autres. Dans ce contexte, il n’y a pas de hiérarchie ou d’ordre intrinsèque parmi les catégories. Il s’agit simplement d’étiquettes distinctes attribuées à différentes catégories.

Échelle ordinale

Cette échelle qualitative organise les données en catégories ordonnées, toutefois, les distances entre ces catégories ne sont pas équivalentes ni mesurables. Pour illustrer, prenons l’exemple du niveau d’éducation des répondants·es. Les catégories pourraient être : éducation primaire, éducation secondaire, éducation postsecondaire non universitaire, éducation universitaire de premier cycle, éducation universitaire de deuxième cycle, et éducation universitaire de troisième cycle. Il est évident qu’il existe une progression dans ces niveaux d’éducation, mais l’échelle ordinale ne permet pas de quantifier combien un niveau est supérieur à un autre. C’est comparable à une course où le classement ne reflète pas nécessairement l’écart de temps entre les concurrents.

Échelle d’intervalle

C’est une échelle quantitative où non seulement l’ordre est important, mais aussi la différence entre les valeurs. Par exemple, dans un questionnaire demandant le revenu annuel, on peut ordonner les réponses (qui gagne plus que qui) et quantifier les écarts (la différence de revenu entre deux personnes).

Échelle de ratio

C’est l’échelle la plus précise, permettant d’établir des ratios entre les mesures. Par exemple, si on demande aux répondants le pourcentage de leur revenu consacré à la nourriture, on peut comparer les proportions de manière significative, comme dire que quelqu’un dépense deux fois plus en nourriture si elle consacre 20% de son revenu par rapport à quelqu’un qui consacre 10%. Les échelles de ratio ne se limitent pas uniquement aux pourcentages, elles s’étendent également aux données continues, telles que l’âge, le poids ou la distance. Cela signifie que ces échelles peuvent mesurer des valeurs qui s’étendent sur une gamme continue, fournissant ainsi une richesse de données pour l’analyse.

Modes d’investigation

Le professeur St-Pierre discute du recueil de données. Il mentionne l’importance des données primaires, définies comme brutes, non formatées, non agrégées, et non colligées. Ces données peuvent être obtenues de plusieurs façons. Les études de cas en sont un exemple, où l’information est recueillie par des entrevues de groupe ou par des observations. Les enquêtes par questionnaire constituent un autre moyen, recueillant des informations à partir d’un échantillon. L’expérimentation et la quasi-expérimentation en laboratoire ou sur le terrain fournissent également des données primaires. Enfin, la simulation est une autre méthode, où l’information est colligée sur un site spécifique pour un ensemble de systèmes particuliers.

D’un autre côté, les données secondaires sont des données déjà traitées auparavant. Par exemple, les données que Statistique Canada publie.

L’expérimentation

« C’est une méthode destinée à mettre en évidence des relations de causalité entre les variables. Un lien de causalité : quel est l’impact de X sur Y, » explique-t-il.  X→Y

Un plan d’expérimentation se caractérise par le contrôle des facteurs externes de l’expérimentation. Mais pour observer la causalité, il est essentiel d’assurer une double affectation aléatoire. Elle permet de s’assurer que les résultats obtenus sont bien le fruit de l’expérimentation, et non de facteurs confondants. 

D’abord, les individus sont affectés aléatoirement aux différents groupes ou cellules expérimentales. En pratique, le chercheur ou la chercheuse recrute un échantillon de sujets. Par la suite, il ou elle affecte de façon aléatoire les sujets aux groupes de contrôle ainsi qu’aux groupes expérimentaux qui subiront le traitement. Enfin, les différents traitements seront également répartis aléatoirement parmi les groupes expérimentaux.

V – Nettoyage des données et génération des variables de recherche

Après avoir collecté les données, le contrôle de l’information est une étape essentielle. Il est nécessaire de s’assurer de la véracité des réponses fournies par les répondants·es en scrutant leurs réponses pour déceler les données potentiellement suspectes ou aberrantes. Cette étape peut impliquer le repérage et le traitement des valeurs manquantes, ce qui peut impliquer diverses stratégies, de l’omission à l’imputation statistique, en fonction de la nature et de l’ampleur des données manquantes.

Une fois que la base de données est nettoyée et que l’intégrité de l’information est assurée, on peut passer à la génération des nouvelles variables qui seront utilisées pour les analyses statistiques. Cela peut nécessiter la transformation de certaines variables, par exemple, une variable continue pourrait être catégorisée, ou plusieurs variables pourraient être combinées pour créer un indicateur composite.

Il est crucial de s’assurer que ces nouvelles variables respectent les conditions d’utilisation des analyses statistiques prévues pour tester les hypothèses. Cela pourrait impliquer une vérification de l’adéquation des données aux hypothèses de la méthode statistique prévue, comme la normalité de la distribution ou l’équivalence de la variance entre les groupes. Le choix des modèles statistiques appropriés dépendra alors de ces facteurs, ainsi que de la nature des données et des objectifs spécifiques de l’analyse.

Ce contenu a été mis à jour le 2023-07-06 à 13 h 06 min.