Plan d'expérience

Infos
On nomme plan d'expérience l'organisation d'une expérience dont le déroulement lui-même sera conditionné par les résultats obtenus en cours de route. C'est une façon de procéder indispensable chaque fois que les essais et erreurs se traduisent par des coûts humains, de la souffrance animale ou des dommages financiers. Les "plans d'expériences" font partie de la chimiométrie (méthodes statistiques et mathématiques appliquées à la chimie).
Plan d'expérience

On nomme plan d'expérience l'organisation d'une expérience dont le déroulement lui-même sera conditionné par les résultats obtenus en cours de route. C'est une façon de procéder indispensable chaque fois que les essais et erreurs se traduisent par des coûts humains, de la souffrance animale ou des dommages financiers. Les "plans d'expériences" font partie de la chimiométrie (méthodes statistiques et mathématiques appliquées à la chimie).

Position du problème

Supposons que nous désirions savoir si la proportion de boules noires d'une urne est supérieure à 5%, l'urne contenant 1000 boules. Nous partons avec l'idée d'en tirer 100 dans l'espoir d'avoir une bonne approximation de la proportion.
-Si au cours du tirage, nous ramenons 51 boules noires, celui-ci peut être arrêté immédiatement : le poursuivre n'aurait pas de sens, puisqu'avec 51 boules noires sur 1000 une proportion supérieure à 5% est maintenant certaine.
-On peut raffiner encore en remarquant que la probabilité de tirer par exemple 5 boules noires dans les 5 premiers tirages ramène à 0, 3 x 10-6 la probabilité que la proportion de boules noires soit inférieure à 5%.
-Dans la pratique, le calcul permet d'établir des règles strictes indiquant en fonction des résultats à quel moment le tirage doit s'arrêter - avec décision prise dans un sens ou dans l'autre - ou s'il doit être poursuivi. Un plan d'expérience permet donc de réduire le nombre d'essais à ce qui est strictement nécessaire pour prendre une décision, ce qui peut sauver du temps, de l'argent et des vies. C'est un plan d'expérience de ce type qui a permis d'arrêter en cours de route une expérience visant à déterminer si l'aspirine avait un effet de prévention sur les crises cardiaques, les résultats établissant sans ambiguïté que c'était le cas (réduction de 25% des risques). Continuer l'expérimentation serait revenu dans ces conditions à priver jusqu'à la date initialement prévue les malades du lot-témoin d'accès à l'aspirine, ce qui aurait pu coûter la vie à certains d'entre eux.

Plans d'expérience en sciences appliquées (plans expérimentaux)

Il existe de nombreux processus qu'on sait dépendre d'un grand nombre de paramètres externes (on parle de facteurs) mais sans que l'on en ait des modèles analytiques. Lorsque l'on est intéressé de connaître la dépendance d'une variable de sortie F d'un tel processus, on se trouve confronté à plusieurs difficultés :
- Quels sont les facteurs les plus influents ?
- Existe-t-il des interactions entre les facteurs (corrélations) ?
- Peut-on linérariser le processus en fonction de ces facteurs et le modèle ainsi obtenu est-il prédictif ?
- Comment minimiser le nombre de points de mesure du processus pour obtenir le maximum d'informations ?
- Existe-t-il des biais dans les résultats des mesures ? La méthodologie du plan d'expérience répond à ces questions et peut ainsi être appliquée dans de nombreux processus qui vont par exemple des essais cliniques à l'évaluation de la qualité des processus industriels les plus complexes.

En sciences humaines

Les symboles utilisés

- = Emboîté, c'est-à-dire qu'il y a un groupe par modalité!
-
- ... = Croisé, c'est-à-dire qu'il n'y a qu'un seul groupe pour toutes les modalités.
- S = Signifie sujet.
- S10 = Signifie qu'il y a 20 sujets (car 10 sujets x 2 modalités)
- S10
-M2 = Signifie qu'il y a 10 sujets
- M2 = M est le symbole d'une VI, et 2 en indice, indique le nombre de modalités.

Plan monofactoriel

On peut avoir deux types de plan monofactoriel :

Plan multifactoriel

On aura ici, au moins 2 VI à tester en même temps. On peut avoir trois types de plan multifactoriel :

Limites des plans expérimentaux exhaustifs

Supposons que l'on soit en présence d'un processus qui dépende de 3 facteurs A, B et C qui ont chacun leur domaine de définition (discret) \a_i |i=1, .., l\ , \b_j |j=1, ..., m\ , \c_k |k=1, ..., n\. Une approche systématique consisterait à effectuer toutes les expériences possibles du processus en faisant varier chacun des paramètres dans son domaine de définition: Expérience 1: \a_1 , b_1 , c_1\ \Longrightarrow Résultat F_1 Expérience 2:\a_2 , b_1 , c_1\ \Longrightarrow Résultat F_2 Expérience 3:\a_3 , b_1 , c_1\ \Longrightarrow Résultat F_3 \vdots Expérience l\cdotm\cdotn:\a_l , b_m , c_n\ \Longrightarrow Résultat F_l\cdot m\cdot n Le nombre d'expériences nécessaires, qui est égal au produit l\cdotm\cdotn, peut être tout à fait considérable et hors de portée pour des raisons de coût et/ou de temps.

Exemple

Supposons que l'on souhaite caractériser un processus électrolytique par la mesure du courant entre les électrodes. Pour une solution d'électrolyte donnée, un modèle grossier laisse supposer que ce courant va dépendre de trois facteurs principaux: (1) la dilution de la solution C, comprise entre 10% et 90%, (2) la température de la solution T, comprise entre 50°C et 100°C, et (3) la nature des électrodes utilisées (étain, or et en platine). Dans ces conditions, en prenant des pas de 10% pour la concentration et de 10°C pour la température, le plan expérimental exhaustif sera constitué de 6x8x3, soit 124 expériences indépendantes qu'il faudra faire dans des conditions par ailleurs identiques. En supposant que chaque expérience prend 1 heure (en comptant le temps de préparation), l'étude de ce simple processus ne demanderait pas moins de 4 semaines de travail à plein temps. De plus, des expériences étalées sur un aussi grand laps de temps pourrait faire intervenir des facteurs non-connus mais variant sur la durée de cette étude et pouvant fausser les résultats. On comprend aisément que les points relevés ci-dessus deviennent dramatiques dès que l'on a affaire à des processus un peu plus complexes et le coût expérimental d'une étude exhaustive devient vite prohibitif, voir inapplicable. C'est un problème courant dans les processus industriels qui exigent une reproductibilité et un contrôle qualité total. La manière correcte d'aborder un plan d'expérience optimal est de procéder d'une manière tout à fait analogue au principe de la droite de régression en supposant que l'on a des dépendances linéaires (ou tout au plus quadratiques) du processus dans chacune de ces variables ainsi que des interactions entre les variables. On se basera le plus souvent sur des hypothèses simples et/ou des expériences limites pour se donner une idée de l'existence ou non de dépendances croisées. Reprenons le processus décrit plus haut en supposant que en plus de T et C, on définisse m comme une grandeur physique qui caractérise la matière de l'électrode (par exemple son poids moléculaire ou son électrovalence, etc.): On souhaite le décrire par une formule simplifiée du type: F(T, C, m)= b_1\cdotT^2 + b_2\cdotC^2 + b_3\cdotm^2 + b_4\cdotT + b_5\cdotC + b_6\cdotm + b_7\cdotT\cdotC + b_8\cdotT\cdotm + b_9\cdotC\cdotm + b_\cdotT\cdotC\cdotm + b_\cdotT^2\cdotC + b_\cdotT^2\cdotm + b_\cdotC^2\cdotT + b_\cdotC^2\cdotm + b_\cdotT\cdotm^2 + b_\cdotC\cdotm^2 Pour simplifier, on supposera raisonnablement que les termes en T^2\cdotC , T^2\cdotm , C^2\cdotT , C^2\cdotm , T\cdotm^2 et C\cdotm^2 sont négligeables par rapport aux termes du premier ordre, ce qui revient à dire que les coefficients b_ , b_, b_ , b_ , b_ et b_ sont nuls (en général, le terme en T\cdotC\cdotm est aussi négligeables). Il reste alors 10 variables b_1 , .. , b_ à déterminer pour avoir une connaissance analytique du processus dans les intervalles spécifiés. On « choisit » 10 points dans l'espace (T, C , m), pour lesquels on effectue l'expérience, obtenant ainsi les valeurs de \F_i\ pour chacun de ces points. On veillera évidemment à ce que tous les autres paramètres de l'expérience restent constants. nb: on travaille de préférence avec des variables réduites, c’est-à-dire des variables T, C et m qui sont sans dimensions et normalisées à 1 sur leur intervalle de définition Il en résulte le système de 10 équations à 10 inconnues: F_i = a_\cdotb_1 + a_\cdot b_2 + a_\cdot b_3 + a_\cdotb_4 + a_\cdotb_5 + a_\cdotb_6 + a_\cdotb_7 + a_\cdotb_8 + a_\cdotb_9 + a_\cdotb_ avec i = 1, .., 10. Les a_ sont obtenus simplement en remplaçant T, C et m par leur valeurs aux points où l'on a fait les expériences. En écriture matricielle: \begin F_1 \\ \vdots \\ F_ \end = \begin a_ & \cdots & a_ \\ \vdots & \ddots & \vdots \\ a_ & \cdots & a_ \end\cdot\begin b_1 \\ \vdots \\ b_\end Pour résoudre ce système, il faut inverser la matrice \begin a_\end: \begin b_1 \\ \vdots \\ b_ \end = \begin a_ & \cdots & a_ \\ \vdots & \ddots & \vdots \\ a_ & \cdots & a_ \end^\cdot\begin F_1 \\ \vdots \\ F_\end La théorie des plans expérimentaux permet à partir de modèles spécifiques plus ou moins complexes de déterminer précisément en quels points les mesures doivent être faites.

Les plans factoriels

Parmi les différents plans expérimentaux, les plans factoriels sont courants car il sont les plus simples à mettre en œuvre et ils permettent de mettre en évidence très rapidement l'existence d'interactions entre les facteurs. L'hypothèse de base est d'assigner à chaque facteur (
normalisé) sa valeur la plus basse (-1) et sa valeur la plus haute (+1). Ainsi, pour k facteurs, on se retrouve avec un ensemble de 2^k valeurs possibles. Sans entrer dans les détails, la matrice d'expérience \begin a_\end possède alors des propriétés intéressantes (on a par exemple: a^T\cdot a = k\cdot1) qui sont largement exploitées par les logiciels qui établissent des plans expérimentaux. En particulier, l'ajout d'expériences supplémentaires ainsi que des algorithmes de randomisation efficace du plan d'expérience initial permettent de mettre en évidence des biais systématiques et de les supprimer ou alors de mettre en évidence l'influence d'une variable cachée dont il faut tenir compte. Pour reprendre l'exemple ci-dessus, on se retrouve avec un plan à 12 expériences (2 températures extrêmes, 2 concentrations extrêmes et 3 paires d'électrodes). Travaillons avec la température et la concentration normalisée: t = \frac c = \frac On cherche maintenant uniquement des dépendances linéaires en t et en c, c'est-à-dire une relation du type: I_X(t, c) = b_1t+ b_2c+ b_3tc pour X=1, 2 ou 3 selon le type d'électrode. En effectuant les mesures du courant au 4 points (50°C, 10%) , (50°C, 90%) , (100°C, 10%), (100°C, 90%) correspondant aux points (-1, -1), (-1, +1), (+1, -1) et (+1, +1) dans l'espace des facteurs réduits, on a, pour chaque type d'électrode, on est ramené à un plan factoriel 2^2 \begin I_1 \\ I_2 \\ I_3 \\ I_4\end = \begin -1 & -1 & 1 \\ -1 & +1 & -1 \\ +1 & -1 & -1 \\ +1 & +1 & +1\end\cdot\begin b_1 \\ b_2 \\ b_3\end On vérifie effectivement que a^T\cdot a = k\cdot1, et on obtient la résolution du système: \Longrightarrow \begin b_1 \\ b_2 \\ b_3\end = \frac \begin -1 & -1 & +1 & +1 \\ -1 & +1 & -1 & +1 \\ +1 & -1 & -1 & +1\end\cdot\begin I_1 \\ I_2 \\ I_3 \\ I_4 \end Soit: b_1 = \frac (-I_1 - I_2 + I_3 + I_4) b_2 = \frac (-I_1 + I_2 - I_3 + I_4) b_3 = \frac (I_1 - I_2 - I_3 + I_4) Ainsi, moyennant quelques précautions, on a ramené une étude d'un processus non analytique constitué de 124 expériences distinctes à un processus d'une dizaine d'expériences, qui donne des résultats intéressants les intervalles considérés, en particulier sur l'existence et l'amplitude des interactions entre les différents facteurs.

Bibliographie

- Introduction aux plans d'expérience, Jacques Goupy et Lee Creighton, Dunod/L'usine nouvelle, 2006, ISBN 2100497448
- Pierre Dagnelie,
Principes d'expérimentation: planification des expériences et analyse de leurs résultats'', , Gembloux, 2003, 397 p. et

Liens

-
- (GFC)
- Formation de Chimiométrie de l'Université de Bretagne Occidentale (Brest, France)
-
-
- Catégorie:Chimie analytique Catégorie:Statistiques de:Statistische Versuchsplanung en:Design of experiments ja:実験計画法 nl:Experimenteel ontwerpen sv:Försöksplanering zh:實驗規劃方法
Sujets connexes
Bandit manchot (mathématiques)   Bien-être animal   Chimiométrie   Inférence bayésienne  
#
Accident de Beaune   Amélie Mauresmo   Anisocytose   C3H6O   CA Paris   Carole Richert   Catherinettes   Chaleur massique   Championnat de Tunisie de football D2   Classement mondial des entreprises leader par secteur   Col du Bonhomme (Vosges)   De viris illustribus (Lhomond)   Dolcett   EGP  
^