Méthodologie de conception d`un classificateur

Transcription

Méthodologie de conception d`un classificateur
Méthodologie de conception d’un classificateur hiérarchique.
Application à la classification de pièces de bois en fonction de leur aspect
et de la qualité de la finition.
Directeur de thèse : D. Brie (CRAN : [email protected])
Co-directeurs : V. Bombardier (CRAN : [email protected])
S. Ohnimus (CRITT-bois : [email protected])
Problématique générale - Contexte :
Cette thèse sera réalisée dans le cadre du Projet ANR OPTIFIN porté par le CRITT-Bois en partenariat
avec les départements ISET et SBS du CRAN, sous la forme d’un contrat CIFRE. Le projet OPTIFIN,
prévu sur 36 mois, regroupe 2 laboratoires (CRAN et LCPME), un centre technique (CRITT Bois) et 2
industriels (BERRY Wood et OGF Industrie). Il vise à optimiser la finition de pièces de bois (en
particulier le chêne) en établissant des classes de rendu après pose d’une finition (vernis, ..). Ces classes
seront estimées à partir d'une analyse de l’aspect de surface des pièces de bois avant l'application du
produit de finition. Il s’agit donc de développer des méthodes de classification couplant l’imagerie
couleur et l’imagerie hyperspectrale proche infrarouge (NIR. La prise en compte des aspects visuels et
physicochimiques doit conduire à une méthode d’analyse et de classification à même de prédire la
qualité des rendus du bois en temps réel.
Problématique scientifique détaillée :
Le sujet de ce travail de thèse concerne principalement les WorkPackages 1 et 2 du projet OPTIFIN, à
savoir la conception de la méthode de classification des pièces de bois avant finition. Elle peut se
décomposer en 3 parties :
-
Participation à l’étude et au développement du banc de mesures et des lots de données
références.
-
Définition et modélisation des classes de qualité métier et extraction, exploitation,
sélection des critères pertinents pour la classification.
-
Conception de la méthode de classification hiérarchique.
Un des premiers travaux que devra réaliser l’étudiant sera de participer à l’élaboration du banc de
mesures sur lequel seront installés les différents capteurs sélectionnés (Caméra linéaire couleur
intelligente, imageur hyperspectral NIR).
Un second aspect concerne la constitution d’une base de données « images » qui doit servir de
références à l’étude à partir des lots d’échantillons fournis par les partenaires industriels. Les images de
cette base seront doublement étiquetées, à savoir une étiquette « métier » définie a priori avant
l’application de la finition et une étiquette « rendu » définie après finition. Une attention particulière
sera donnée à la modélisation formelle des connaissances « métier » (méthodologie NIAM reposant
sur le formalisme « Object Role Modelling » [Halpin-2006]). Cette étude inclue une dimension
subjective qu’implique la définition des étiquettes par un expert [Blaise-2003], [Bombardier-2007],
[Almecija-2013]. L’objectif sera de fournir l’ensemble de primitives « visuelles » nécessaires à la
classification des types de singularités du bois. Il s’agira d’objectiver l’étiquetage « métiers » en le
confrontant à l’étiquetage « rendu » de façon à déterminer où l’imagerie hyperspectrale sera à même
d’apporter des informations utiles à la classification.
Le troisième aspect est relatif au développement de la méthode de classification permettant de
prendre en compte de façon efficiente les différentes modalités de mesures et satisfaisant aux
contraintes industrielles du projet (implantation temps réel). Un accent particulier sera porté aux
1
méthodes hiérarchiques (Arbre de décision, Classificateurs Hiérarchiques, …). Une des difficultés
principales sera de proposer une méthode permettant de générer automatiquement l’arborescence,
qu’il s’agira d’instancier au cas particulier de l’analyse de texture. Chacun des nœuds de cette
arborescence pourra être constitué d’un système de décision propre. On pourra s’appuyer sur les
travaux précédemment effectués dans l’équipe qui ont fait leur preuve dans des contextes analogues
[Bombardier-2010] [Bombardier-2009] où les jeux de données d’apprentissage sont réduits [Wang2008]. Un des objectifs sera également réduire les dimensions de l’espace de représentation des
variables en couplant la sélection de paramètres pertinents [Bombardier-2008] [Belmerhnia-2015&16]
avec une structuration hiérarchique du modèle [Horng-2009] [Liu-2014].
Les algorithmes développés précédemment seront appliqués aux données expérimentales venant du
banc de mesure. L’interprétation des résultats sera effectuée sous les angles conjoints de l’adéquation
aux données d’experts, de l’interprétabilité physico-chimique, de la précision et de la rapidité de
traitement. Un guide d’utilisation du logiciel de classification visera à donner les éléments relatifs aux
choix des descripteurs et classificateurs et permettant de s’approcher au plus près de l’analyse
effectuée par les industriels.
Bibliographie:
Almecija B. (2013), Apports des connaissances métiers pour la conception d’un système multi-capteurs
de tri Qualité Billon, PHD of Université de Lorraine, Nancy.
Belmerhnia L., Djermoune E-H, Carteret C., Brie D. (2015), Simultaneous regularized sparse
approximation for wood wastes NIR spectra features selection, International Workshop on
Computational Advances in Multi-Sensor Adaptive Processing, CAMPSAP 2015, Dec 2015, Cancun,
Mexico
Belmerhnia L., Djermoune E-H, Brie D., Carteret C. (2016), A regularized sparse approximation method
for hyperspectral image classification, 19th IEEE Workshop on Statistical Signal Processing, SSP 2016,
Jun 2016, Palma de Majorque, Spain.
Blaise J.C., Lhoste P., Ciccotelli J., (2003), Formalization of normative knowledge for safe design, Safety
Science, 41, 241-261.
Bombardier V., Mazaud C., Lhoste P., Vogrig R. (2007), Contribution of Fuzzy Reasoning Method to
knowledge Integration in a wood defect Recognition System, Computers in Industry Journal, 58(4),
355–366.
Bombardier V., Schmitt E., Wendling L. (2008), Improving Fuzzy Rule Classifier by Extracting Suitable
Features from Capacities with respect to Choquet Integral, IEEE Trans. on System, Man. and
Cybernetics, Part B, Vol 38 n°5, pp 1195-1206.
Bombardier V., Schmitt E., Charpentier P. (2009), A fuzzy sensor for color matching vision system,
Measurement, Elseviers, 42 (2), 189-201.
Bombardier V., Schmitt E. (2010), Fuzzy rule classifier: Capability for generalization in wood color
recognition, Engineering Applications of Artificial Intelligence, Elseviers, 23 (6), 978-988
Halpin T.A (2006), Object Role Modeling (ORM/NIAM), Handbook on Architectures of Information
Systems.
Horng, S.C., and Hsiao, Y.L. (2009). Fuzzy clustering decision tree for classifying working wafers of ion
implanter, IEEE International Conference on Industrial Engineering and Engineering Management, 703–
707
Liu, Wang, L., Zhang, J., Yin, J., and Liu, H. (2014). Global and Local structure Preservation for Feature
Selection, IEEE trans. Neu. net. And learn. Sys., 25 (6).
Wang, F., Man, L., Wang, B., Xiao, Y., Pan, W., Lu, X. (2008) Fuzzy-based algorithm for color recognition
of license plates, Pattern Recognition Letters 29, 1007–1020.
2