Recherche et Développement en Chimiométrie
Â
Définition de la chimiométrie :
Â
La chimiométrie est une discipline qui utilise des méthodes mathématiques et statistiques pour analyser des données de manière optimale. Elle inclut les domaines de la modélisation mathématique (analyse de données multivariées) et les plans d'expériences.
Â
Amélioration de la robustesse des modèles
Â
Contexte
Théorie
Bénéfices
Exemples d'application
Perspectives
Références bibliographiques
Â
Le développement de la chimiométrie va de pair avec le développement de la spectroscopie vibrationnelle. En effet, les spectromètres permettent une mesure non-destructive, en temps réel et peu coûteuse d'une grande variété d'échantillons. Cependant, afin d'être utilisés, ces spectromètres doivent être préalablement étalonnés, c'est-à -dire que leurs signaux optiques doivent être corrélés à des mesures dites "de référence", qui peuvent être des mesures chimiques ou des caractéristiques plus complexes. En effet, la spectroscopie est une méthode de mesure dite secondaire.
Le domaine d'excellence d'Ondalys est l'étalonnage de ces mesures issues de différents capteurs grâce à des techniques de modélisation multivariée à la pointe de la recherche. La problématique la plus cruciale pour l'application industrielle de la spectroscopie est la robustesse de la mesure, c'est-à -dire la stabilité du résultat de prédiction, quelles que soient les conditions d'exploitation, donc en présence de perturbations extérieures (température, hygrométrie, etc.). Pour résoudre cette difficulté, Ondalys collabore avec des groupes de recherche pour le développement de techniques chimiométriques innovantes.
Soit x le vecteur contenant les données servant à la modélisation (spectres, série de valeurs caractérisant un produit ou un procédé, etc.) et y la valeur référence à prédire (taux de sucre, degré de polymérisation, homogénéité, etc.).
Le modèle de prédiction multilinéaire est de la forme :
,
où b est le vecteur de régression (modèle linéaire),
est le biais, ![]()
, le vecteur transposé de x et
la prédiction de la valeur de référence.
Toute variation dans la mesure entraîne une perturbation sur le vecteur x (spectre). En conditions industrielles, ces variations sont liées :
- à l'échantillon (taille des particules, densité, température, etc.),
- au capteur (nouvelle sonde, transfert de spectromètres, changement de lampe, de système d'échantillonnage et de présentation
d'échantillons, etc.),
- aux conditions de mesure (température, pression, hygrométrie, etc.).
Cette perturbation,
, s'ajoute au spectre mesuré x, impliquant une perturbation sur la prédiction, qui devient donc ![]()
:
Optimiser la robustesse des modèles revient donc à minimiser ![]()
.
Or, ![]()
, ou encore
Â
Donc, afin de minimiser les erreurs ![]()
, il faut chercher à réduire les 3 termes suivants :
Â
1.
: minimiser les perturbations sur le vecteur x :
o en modifiant le système d'acquisition. Par exemple, dans de nombreux cas, la perturbation majeure vient de variations dans le signal de diffusion (changement de la structure physique de l'échantillon). De nouveaux capteurs sont en cours de mise au point afin de séparer l'information venant de l'absorption chimique « pure » de celle de la diffusion physique.
o en sélectionnant les longueurs d'onde insensibles à ces perturbations.
2.
: minimiser la norme du vecteur de régression, conforme au « principe de parcimonie » :
o en réduisant le nombre de variables du modèle (techniques de sélection de longueurs d'onde),
o en réduisant l'amplitude des coefficients de régression (minimiser l'overfitting) ;
3.
: minimiser la colinéarité entre x et b, c'est-à -dire entre la perturbation et le vecteur de régression
o En sélectionnant les variables sur lesquelles l'effet des perturbations est orthogonal aux coefficients de régression ;
o En intégrant cette contrainte d'orthogonalisation dans la construction du modèle.
Cette dernière stratégie est adoptée par une méthodologie développée en collaboration avec le Cemagref de Montpellier, centre de recherche public Français. Ces travaux ont donné lieu à une famille de méthodes basées sur la projection orthogonale des spectres dans un espace indépendant des perturbations.
En particulier, l'External Parameter Orthogonalisation (EPO) (1-2-3) vise à éliminer la part d'information contenue dans le spectre due à l'influence des paramètres extérieurs par orthogonalisation. Après orthogonalisation, ![]()
est nul, et donc l'impact des perturbations sur les résultats de prédiction est annihilé ![]()
.
Â
Bénéfices des méthodes de projection orthogonale
Â
- Robustesse garantie : après prétraitements par EPO, l'effet principal des perturbations est annulé.
- Robustesse durable : en cas de disparition de la perturbation, la performance du modèle ne s'en trouve pas affectée (contrairement à une « correction biais/pente », par exemple)
- Robustesse globale : les perturbations peuvent être multiples (température, ajout d'un composé, turbidité, taille des particules). Le modèle tiendra compte de l'ensemble de tous ces effets.
- Gain de connaissance sur l'origine des perturbations : l'espace des perturbations, orthogonal au signal utile, peut être analysé pour mieux connaître les sources de perturbation.
- Applicable au contrôle des procédés : dans cette famille de méthodes, il existe une version dynamique (DOP(3)), orthogonalisant l'étalonnage au fur et à mesure du procédé.
- En pratique : une fois le modèle développé sur les spectres prétraités, le vecteur de régression est intrinsèquement insensible aux facteurs d'influence (orthogonal au sous espace). Donc, les nouveaux spectres à prédire n'ont plus besoin d'être prétraités, ce qui permet à ces modèles d'être utilisés directement sur les spectromètres du commerce sans aucun changement.
Exemples d'application - Amélioration de la robustesse des mesures en condition industrielle
Â
- Spectroscopie en contrôle des procédés : Contrôle robuste de fermentations, en maîtrisant les paramètres critiques du procédé (température et teneur en azote)
- Spectroscopie portable au champ : comment maîtriser l'influence de la température pour une prédiction robuste de la maturité des pommes par spectrométrie proche infrarouge
- Mesure d'échantillons complexes et variables (échantillons biologiques par exemple) : caractérisation de tumeurs cancéreuses par spectroscopie de fluorescence, en maîtrisant l'influence de l'oxygénation du sang.
- Transfert d'étalonnage : transfert des modèles entre divers spectromètres par correction optique des spectres.
Â
Â
Notre service R&D reste focalisé sur les diverses techniques d'optimisation de la robustesse des modèles afin de répondre au mieux aux problématiques industrielles, en particulier en matière de contrôle des procédés. Ce thème est très vaste, et comprend aussi bien le développement de nouveaux prétraitements, de méthodes de sélection de variables que la combinaison d'outils linéaires et non linéaires ou les méthodes de modélisation basés sur des spectres purs.
(1) Roger J. M., Chauchard F., and Bellon-Maurel V. (2003). EPO-PLS external parameter orthogonalisation of PLS: Application to temperature-independent measurement of sugar content of intact fruits. Chemometrics and Intelligent Laboratory Systems, 66(2), 191-204.
(2) Chauchard F., Roger J. M., and Bellon-Maurel V. (2004). Correction of the temperature effect on near infrared calibration - application to soluble solid content prediction. Journal of Near Infrared Spectroscopy, 12(3), 199-205.
(3) Zeaiter M, Roger J.M, V. Bellon-Maurel (2005). Dynamic orthogonal projection. A new method to maintain the on-line robustness of multivariate calibrations. Application to NIR-based monitoring of wine fermentations. Chemometrics and Intelligent Laboratory Systems. 80 (2), pp. 227-235
Â
Si vous êtes intéressé par un de ces articles, n'hésitez pas à nous en demander une copie par mail.
En savoir plus sur nos services en analyse de données
Â
Â
Â