Aller au contenu principal

Taille de l'échantillon et reproductibilité

Des caissettes de plants de tomates

Des caissettes de plants de tomates (Alexander Shapovalov, iStockphoto)

Des caissettes de plants de tomates

Des caissettes de plants de tomates (Alexander Shapovalov, iStockphoto)

Sujets
Lisibilité
7,9

Quels sont les liens avec mon programme d'études?

Découvre comment les scientifiques utilisent la taille de l’échantillon et la reproductibilité pour mener des expériences.

Dans le cadre d’une expérience bien planifiée, il peut y avoir des variations et des erreurs sur lesquelles l’expérimentateur ou l’expérimentatrice n’a pas de contrôle. Il peut s’agir de petites variations des conditions environnementales (journées plus ou moins ensoleillées, changement d’humidité...) ou encore d’un manque de précision des relevés de données effectués par l’expérimentateur ou l’expérimentatrice (balances plus ou moins précises, règles plus ou moins précises...). Comment les scientifiques peuvent savoir si les résultats observés sont faussés par une de ces erreurs ou s’ils sont dûs aux effets de la variable indépendante (ce que l’expérimentateur ou l’expérimentatrice a volontairement modifié)?

Prenons un exemple. Supposons que tu décides de cultiver quatre plants de tomates et que tu souhaites observer l’effet d’un certain type d’engrais sur la hauteur des plants après un certain nombre de jours. Tu vas traiter les quatre plants de la même façon et tu vas contrôler ce qui te semble être l’ensemble des variables. Toutefois, à la fin de l’expérience, les tailles des quatre plants sont très différentes. Comme tu n’as qu’un petit nombre de plants, et que la différence entre leur taille est importante, il serait impossible de déterminer si l’engrais a réellement affecté la hauteur des plants ou s’il y a eu une quelconque erreur lors de la réalisation de l’expérience.

A row of plants growing in planters on a balcony
Plants de tomates près d'une fenêtre (Source : Yaraslau Saulevich via iStockphoto).
Image - Version texte

Une photographie en couleur montre quatre plants de tomates au soleil à l’extérieur d’une fenêtre.

Le soleil brille sur la vitre d'une fenêtre au cadre brun. Le ciel bleu se reflète également dans la vitre.

Au premier plan se trouve une rangée de quatre plantes dans des pots de carton. Chaque plante a de multiples branches et des feuilles vert pâle, et chacune est d'une taille légèrement différente.

 

Taille de l’échantillon

Pour réduire au minimum les conséquences des erreurs et des biais, comme la variation naturelle du milieu, l’expérimentateur ou l’expérimentatrice peut augmenter la taille de l’échantillon. La taille de l’échantillon fait référence au nombre de mesures répétées (par exemple, le nombre de plants cultivés). Dans l’exemple ci-dessus, la taille de l’échantillon est de quatre. En statistique, la taille de l’échantillon est représentée par la lettre n (ici n=4).

En général, plus la taille de l’échantillon est grande, plus l’expérimentateur ou l’expérimentatrice peut se fier aux résultats et aux conclusions. Avec un plus grand échantillon, il y a une plus grande probabilité que les facteurs aléatoires (les changements environnementaux, les erreurs de mesures...) s’annulent mutuellement et que le résultat moyen représente plus précisément le phénomène général, ou l’échantillon dans son ensemble.

Imaginons que nous faisons la moyenne de la hauteur des quatre plants dans l’exemple ci-dessus.

  • Hauteurs : 16 cm, 20 cm, 30 cm, 25 cm
  • Moyenne : 22,75 cm

On peut se demander si cette moyenne est représentative. Si nous cultivions d’autres plants, quelle hauteur ces plants devraient-ils atteindre?

Imaginons que nous augmentons la taille de notre échantillon à 10 sans modifier les variables. Les résultats que nous obtenons sont les suivants :

  • Hauteurs : 15 cm, 17 cm, 18 cm, 17 cm, 20 cm, 25 cm, 31 cm, 15 cm, 16 cm, 16 cm
  • Moyenne : 19 cm

Maintenant, nous avons une idée beaucoup plus précise de ce que serait la hauteur des plants si on leur donnait de l’engrais. Nous pouvons tirer des conclusions avec une plus grande certitude. Nous pouvons aussi voir que la plupart des plants (6 sur 10) mesurent entre 15 cm et 17 cm, et les autres plants sont plus grands. Nous pourrions même essayer de savoir pourquoi certains plants sont plus grands. Étaient-ils placés plus près de la fenêtre? Ont-ils reçu plus d’engrais? Et ainsi de suite.

Tomato seedlings in planters next to a window.
Groupe de jeunes plants de tomates près d'une fenêtre (Source : Natalia Kuzina via iStockphoto).
Image - Version texte

Groupe de jeunes plants de tomates près d'une fenêtre.

Une photographie en couleur montre 12 petits plants de tomates sur un large rebord de fenêtre.

Le soleil brille à travers la fenêtre, pénétrant à l'intérieur d'un plateau rectangulaire de plantes. Chaque plante se trouve dans une petite section d’une barquette en plastique brun-rougeâtre. Trois barquettes ont été placées dans une boîte en plastique transparent sur un large rebord de fenêtre blanc. Un petit râteau et une petite bêche ont été placés à côté de la boîte. Des rideaux blancs sont visibles à l'arrière-plan.

Les plantes hautes et fines comportent de grandes feuilles vert vif au sommet et des feuilles plus petites d'un vert plus pâle près de la base.

Tu te demandes peut-être quelle taille d’échantillon choisir. Si l’échantillon est trop petit, il y a des chances que l’effet réel de la variable indépendante passe inaperçu. Si l’échantillon est trop grand, tu risques de perdre des ressources (de la terre, des plants de tomate, de la place pour entreposer tes expériences...) et du temps.

La taille de l’échantillon dépend vraiment du type d’expérience et du type de différence que tu veux observer. Si tu souhaites observer des différences de très petites envergures (par exemple, la taille de différentes feuilles), tu as besoin d’un très grand échantillon, mais si tu souhaites observer des différences importantes (par exemple, si le plant est vivant ou mort après le test), tu peux utiliser un échantillon plus petit.

Pour les expériences en classe, le côté pratique de la taille de l’échantillon doit également être pris en considération. En général, il est préférable d’avoir un échantillon de la plus grande taille possible sans compromettre l’expérience et sans accaparer toute la classe!

Reproductibilité et répétabilité

Les façons dont les choses se comportent dans le monde naturel sont assez constantes. La nature n’est pas capricieuse. Elle ne fait pas d’erreurs, qu’elles soient systématiques ou aléatoires. Les scientifiques ne pourraient pas faire de progrès si la nature n’était pas fiable.

Imagine que tu as versé une cuillère de sucre dans un verre d’eau tiède. Tu remarqueras que tu ne peux plus voir le sucre. Intéressant! Tu te demandes alors si, en répétant l’expérience, tu obtiendrais les mêmes résultats. Tu fais donc exactement ce que tu as fait la première fois et tu fais des observations très semblables à celles de ta première expérience. Tu refais la même chose de nombreuses fois, et tu obtiens les mêmes résultats chaque fois.

Sugar being poured into water
Ajouter du sucre à l’eau (Source : artisteer via iStockphoto).
Image - Version texte

Une photographie en couleur montre un verre d’eau dans lequel du sucre est versé depuis le haut.

Un verre à boire transparent a été placé sur une surface grise contre un fond strié de bleu pâle, de gris et de gris foncé. Cela ressemble presque à un jour couvert. Le verre est rempli de liquide transparent. Un épais jet de poudre blanche tombe dans le verre depuis le haut, hors du cadre.

 

La répétition est le fait de reproduire ou de répéter une expérience exactement de la même manière. En faisant une expérience plus d’une fois, l’expérimentateur ou l’expérimentatrice peut s’assurer que la méthode fonctionne comme prévu et qu’elle donne des résultats fiables. On dit d’une expérience qu’elle est répétable quand le même expérimentateur ou la même expérimentatrice répète l’expérience en utilisant la même méthodologie, le même équipement, les mêmes appareils de mesure, le même endroit et obtient des résultats similaires.

Imagine que personne n’a jamais tenté de répéter ton expérience de dilution du sucre dans l’eau. Tu viens peut-être de faire une découverte! Ce qu’il faut maintenant, c’est que quelqu’un d’autre tente de réaliser ton expérience en utilisant les mêmes variables et les mêmes méthodes que celles que tu as utilisées. La reproductibilité est la capacité d’une expérience à être répétée par un autre expérimentateur ou une autre expérimentatrice.

La reproductibilité est l’un des principaux aspects des processus scientifiques. Si une expérience réalisée par un expérimentateur ou une expérimentatrice donne certains résultats et si d’autres expérimentateurs ou expérimentatrices obtiennent les mêmes résultats, alors on peut dire avec une plus grande certitude que les résultats sont fiables. C’est de cette façon que l’on bâtit de nouvelles connaissances.

En revanche, il arrive parfois que les expériences ne puissent pas être reproduites. Cela peut être attribuable au parti pris de l’expérimentateur ou de l’expérimentatrice, ou bien à des erreurs dans les méthodologies et les observations. Les expériences qui ne sont pas reproductibles fournissent aussi des renseignements utiles et permettent parfois aux scientifiques de découvrir des failles dans la réflexion de leurs confrères.

Pour en savoir plus sur les biais et les sources d’erreurs, consulte le document d’information sur les biais et les sources d’erreurs

Taille de l’échantillon, reproductibilité et TomatosphèreMC

Depuis 2001, chaque année, les élèves réalisent l’expérience sur les semences de TomatosphèreMC. Chaque année, des milliers de classes répètent cette expérience simple créée en partenariat avec le professeur Michael Dixon de l’Université de Guelph. En moyenne, 15 000 classes de partout au Canada et aux États-Unis ont fait pousser des semences de tomates et ont consigné les résultats de leur germination. C’est ce qu’on appelle un échantillon de grande taille! Pour voir les résultats de l’enquête sur les semences de TomatosphèreMC observés par toutes les classes participantes, assure-toi de télécharger tes propres résultats sur la page de soumission des résultats.

Students observing and making notes on growing seedlings
Des étudiantes examinent un échantillon de plants de tomates (©2019 Parlons sciences).
Image - Version texte

Une photographie en couleur montre trois étudiantes qui observent des plants de tomates et consignent de l’information à leur sujet.

Au premier plan se trouve un plat circulaire blanc rempli de petits plants de tomates dans des pots de plastique noir, sur une table de couleur crème. Trois étudiantes sont réunies autour de la table et regardent attentivement les plants.

L’étudiante de gauche est assise, et elle porte un chandail gris et une veste blanche. Elle a la peau brun clair et des cheveux bruns bouclés, tirés en arrière. Ses mains sont sous la table.

L’étudiante au centre est debout et penchée au-dessus de la table, en train d’écrire sur l’une des feuilles de papier qu’elle tient dans ses mains. Elle a les cheveux longs, ondulés, brun foncé, ainsi que la peau pâle.

L’étudiante de droite est également penchée au-dessus de la table et tient une règle blanche à graduations noires. Elle a la peau pâle et les cheveux brun clair réunis en une longue tresse.

Exercice dirigé

Exercice 1

Quelle est l’aire moyenne de la surface des feuilles des plants faisant partie des échantillons suivants?

  1. Aires : 15 cm2, 17 cm2, 18 cm2
  2. Aires : 15 cm2, 17 cm2, 18 cm2, 17 cm2, 20 cm2
  3. Aires : 15 cm2, 17 cm2, 18 cm2, 17 cm2, 20 cm2, 16 cm2, 17 cm2, 18 cm2
  4. Quelle a été l’influence de la taille de l’échantillon sur la moyenne?

Exercice 2

Quel est le nombre moyen de semences ayant germé?

  1. Nombre de semences ayant germé : 15, 20, 25
  2. Nombre de semences ayant germé : 21, 20, 22, 21, 20, 25, 21, 24
  3. Nombre de semences ayant germé : 21, 20, 22, 21, 20, 25, 21, 24, 20, 21, 22, 22
  4. Quelle a été l’influence de la taille de l’échantillon sur la moyenne?

Exercice 3 

Demandez aux élèves de trouver la moyenne, la médiane et le mode de la hauteur pour l’échantillon suivant composé de 10 plants.

Hauteur : 15 cm, 17 cm, 18 cm, 17 cm, 20 cm, 25 cm, 15 cm, 16 cm, 16 cm, 16 cm

Exercice 4

Fournissez le scénario suivant aux élèves et demandez-leur de répondre aux questions ci-dessous.

Une élève a réalisé une expérience dans laquelle elle a comparé l’effet de différentes marques d’engrais sur la croissance des plants de tomates. Elle a découvert que les plants qui ont reçu l’engrais A ont poussé BEAUCOUP plus haut que ceux qui ont reçu les autres marques d’engrais. Un autre étudiant qui s’intéressait aux résultats a fait pousser une plus grande quantité des mêmes plants de tomates en appliquant les mêmes variables, mais n’a pas remarqué que les plants qui recevaient l’engrais A avaient poussé beaucoup plus haut que tous ceux qui avaient reçu de l’engrais d’autres marques.

  1. L’expérience était-elle reproductible?
  2. Qu’est-ce qui pourrait expliquer les résultats observés?
  3. Quels types d’erreurs ou de biais ont pu se produire?

Exercice 5

Réfléchissez avec les élèves aux domaines de la science où la reproductibilité peut être difficile, voire impossible.

Réponses

Exercice 1

  1. 16,7
  2. 17,4
  3. 17,5
  4. Plus la taille de l’échantillon est grande, plus les données représentent précisément l’aire de la surface des feuilles.

Exercice 2

  1. 20 semences germées
  2. 21,75 semences germées
  3. 21,58 semences germées
  4. Plus la taille de l’échantillon est grande, plus les données représentent précisément le nombre de semences ayant germé.

Exercice 3 

Moyenne = 17,5 cm,

Médiane = 16,5 cm (Pour trouver la médiane, trie tes valeurs de la plus petite à la plus grande puis sépare les en 2. La médiane est la valeur au milieu de ton jeu de données) 15 15 16 16 16 (16.5) 17 17 18 20 25

Mode = 16 cm (C’est la valeur qui revient le plus souvent)

Exercice 4

  1. Non, un autre expérimentateur n’a pas retrouvé les mêmes résultats en reproduisant l’expérience.
  2. La taille de l’échantillon de la première élève était peut-être trop petite
  3. De nombreux éléments, comme la lumière, les plants, la variation dans les marques d’engrais, le parti pris de l’expérimentateur ou de l’expérimentatrice

Exercice 5

Réponses possibles : paléontologie, climatologie, météorologie, océanographie, sismologie, etc.

En savoir plus

Test d'hypothèse simple
Cette vidéo (8min 44s) du Khan Academy montre comment on peut utiliser les tests de statistiques pour distinguer les vrais différences versus les différences causées par la variabilité.

Qu'est-ce que les expériences contrôlées ?
Cette page par Voxco introduit les expériences contrôlées et explique pourquoi ses méthodes sont importantes pour la validité d’une expérience.

Déterminer la taille d'un échantillon - PostBac
Cette vidéo (5min) de la chaîne Yvan Monka explique comment on peut utiliser la mathématique pour déterminer la taille d’un échantillon nécessaire pour avoir un résultat valide.