In the era of Industry 4.0, real-time process monitoring and quality control are crucial for industries aiming at optimising production, minimising waste and improving sustainability. Chemometrics is increasingly being considered in this context, providing efficient tools to deal with large amounts of data and extract useful information for enabling data-driven decision making. Among these tools, Partial Least Squares regression (PLS) is widely used for real-time quality prediction, a key step to monitor the behaviour of industrial processes. However, when dealing with data collected during different stages of a process or that encode information not accurately reflecting the relevant variability of the process itself, PLS can face significant challenges due to the presence of strong non-linearities and severe outliers. These issues can negatively affect predictive performance. Furthermore, the common need of processing multiple blocks of data of diverse nature at the same time may sometimes render such scenarios even more challenging. This thesis addresses these issues by introducing novel PLS-based algorithms. Two of the proposed methods, Locally-Weighted-Multiblock-PLS (LW-MB-PLS) and Local- Weighted-Response Oriented Sequential Alternation (LW-ROSA) were designed to handle non-linearities in situations where multiple data blocks are handled. In particular, for LW-MB-PLS, which fits a separate linear calibration model for each new incoming sample, a particular focus was also made on the interpretability of the local sub-models. To deal with both non-linearities and outliers simultaneously, this thesis introduces another novel method called Locally-Weighted-RoBoost-PLS (LW-RoBoost-PLS). This method combines the strengths of local modelling strategies to effectively handle non-linearities with those of robust regression techniques to mitigate the impact of outliers. It has also been extended to the multiblock framework. These methods were specifically developed and evaluated in two industrial continuous process scenarios. The first concerns a real Industry 4.0 setting, i.e. a chemical plant owned by Versalis S.p.A. where different in-line sensors monitor the nine-stage production of Acrylonitrile Butadiene Styrene (ABS). In this context, LW-MB-PLS, LW-ROSA and LW-RoBoost-PLS were found to yield significant improvements in terms of predictive performance compared to traditional approaches. In addition, in order to determine whether satisfactory estimates of ABS quality could be obtained before the end of the production process, the ensemble of data blocks resulting from all the process phases was modelled according to an incremental scheme. This way, it was possible to assess the evolution of the predictive ability of the aforementioned regression methods as the amount of information available increased. The second scenario relates instead to the production process of pesto alla Genovese sauce at Barilla G. e R. F.lli S.p.A. Here, typical Industry 4.0 challenges such as data synchronization as well as the construction of real-time control charts and predictive models were tackled. The analysis of images delivered by cameras installed along the manufacturing line was also performed to evaluate the quality of the raw materials exploited for the pesto sauce preparation. The proposed algorithms and methodologies constitute a significant contribution to the field of complex process data analysis, permitting to achieve improved predictive performance while overcoming several of the main limitations traditional multivariate regression approaches such as standard PLS suffer from. The results reported in this thesis could potentially boost the advancement of the domain of Industry 4.0, enhancing process control and sustainability.

Nell'era dell'Industria 4.0, il monitoraggio in tempo reale dei processi e il controllo della qualità rappresentano strumenti cruciali per le aziende che puntano a ottimizzare la produzione, ridurre gli sprechi e incrementare la sostenibilità. In questo scenario, la chemiometria assume un ruolo sempre più rilevante, offrendo metodologie efficaci per gestire grandi quantità di dati e per estrarre informazioni utili a supporto di decisioni basate sui dati. Tra gli strumenti più diffusi in questo ambito, la regressione Partial Least Squares (PLS) è ampiamente utilizzata per la previsione della qualità in tempo reale, aspetto centrale per il monitoraggio del comportamento dei processi industriali. Tuttavia, quando i dati riflettono fasi differenti di un processo o includono informazioni che non catturano adeguatamente la variabilità del sistema, PLS può incontrare difficoltà, a causa della presenza di non linearità e outliers. Inoltre, la necessità di trattare simultaneamente più blocchi di dati eterogenei rende questi scenari ancora più complessi. Questa tesi affronta tali problematiche proponendo nuovi algoritmi basati su PLS. Due di essi, Locally-Weighted-Multiblock-PLS (LW-MB-PLS) e Local-Weighted-Response Oriented Sequential Alternation (LW-ROSA), sono stati ideati per gestire le non linearità nei casi in cui è necessario trattare blocchi di dati multipli. Il metodo LW-MB-PLS adatta un modello di calibrazione lineare locale per ogni nuovo campione, mantenendo al contempo un'attenzione particolare all'interpretabilità dei modelli locali. Per affrontare simultaneamente le non linearità e la presenza di outliers, è stato sviluppato un terzo metodo, Locally-Weighted-RoBoost-PLS (LW-RoBoost-PLS), che va a combinare i vantaggi delle tecniche di modellazione locale, che gestiscono in modo efficace le non linearità, con quelli delle metodologie di regressione robusta, che riducono l'influenza degli outliers. Il metodo è stato inoltre esteso per l'applicazione a scenari multiblock. I metodi proposti sono stati testati in due contesti industriali. Il primo caso studio riguarda la produzione di Acrilonitrile Butadiene Stirene (ABS) presso Versalis S.p.A., un impianto dotato di sensori in-linea che monitorano diverse fasi del processo produttivo. In questo contesto, i metodi LW-MB-PLS, LW-ROSA e LW-RoBoost-PLS hanno mostrato significativi miglioramenti nelle prestazioni predittive rispetto agli approcci tradizionali. Per valutare la possibilità di predire accuratamente la qualità dell'ABS prima del completamento del processo, è stato implementato un approccio incrementale, basato sull'uso progressivo delle informazioni disponibili. Questo metodo ha consentito di analizzare l'evoluzione della capacità predittiva dei metodi proposti, fornendo indicazioni preziose sulla loro efficacia nelle varie fasi del processo. Il secondo caso studio si focalizza sulla produzione di pesto alla genovese presso Barilla G. e R. F.lli S.p.A., un esempio di Industria 4.0 in cui l'infrastruttura non è completamente equipaggiata per una raccolta dati completa. In questo contesto, sono state affrontate sfide come la sincronizzazione dei dati, lo sviluppo di modelli predittivi in tempo reale ed un’analisi delle immagini per valutare la qualità delle materie prime impiegate nella preparazione del pesto. Gli algoritmi e le metodologie presentati in questa tesi rappresentano un contributo significativo all'analisi di dati di processo complessi, migliorando le prestazioni predittive e superando molte delle limitazioni dei metodi tradizionali, come PLS. I risultati ottenuti possono contribuire all'evoluzione dell'Industria 4.0, migliorando il controllo dei processi, l'efficienza produttiva e la sostenibilità complessiva delle operazioni industriali.

Progettazione di nuovi approcci per il controllo della qualità dei prodotti in tempo reale per una produzione sostenibile

TANZILLI, DANIELE
2025

Abstract

In the era of Industry 4.0, real-time process monitoring and quality control are crucial for industries aiming at optimising production, minimising waste and improving sustainability. Chemometrics is increasingly being considered in this context, providing efficient tools to deal with large amounts of data and extract useful information for enabling data-driven decision making. Among these tools, Partial Least Squares regression (PLS) is widely used for real-time quality prediction, a key step to monitor the behaviour of industrial processes. However, when dealing with data collected during different stages of a process or that encode information not accurately reflecting the relevant variability of the process itself, PLS can face significant challenges due to the presence of strong non-linearities and severe outliers. These issues can negatively affect predictive performance. Furthermore, the common need of processing multiple blocks of data of diverse nature at the same time may sometimes render such scenarios even more challenging. This thesis addresses these issues by introducing novel PLS-based algorithms. Two of the proposed methods, Locally-Weighted-Multiblock-PLS (LW-MB-PLS) and Local- Weighted-Response Oriented Sequential Alternation (LW-ROSA) were designed to handle non-linearities in situations where multiple data blocks are handled. In particular, for LW-MB-PLS, which fits a separate linear calibration model for each new incoming sample, a particular focus was also made on the interpretability of the local sub-models. To deal with both non-linearities and outliers simultaneously, this thesis introduces another novel method called Locally-Weighted-RoBoost-PLS (LW-RoBoost-PLS). This method combines the strengths of local modelling strategies to effectively handle non-linearities with those of robust regression techniques to mitigate the impact of outliers. It has also been extended to the multiblock framework. These methods were specifically developed and evaluated in two industrial continuous process scenarios. The first concerns a real Industry 4.0 setting, i.e. a chemical plant owned by Versalis S.p.A. where different in-line sensors monitor the nine-stage production of Acrylonitrile Butadiene Styrene (ABS). In this context, LW-MB-PLS, LW-ROSA and LW-RoBoost-PLS were found to yield significant improvements in terms of predictive performance compared to traditional approaches. In addition, in order to determine whether satisfactory estimates of ABS quality could be obtained before the end of the production process, the ensemble of data blocks resulting from all the process phases was modelled according to an incremental scheme. This way, it was possible to assess the evolution of the predictive ability of the aforementioned regression methods as the amount of information available increased. The second scenario relates instead to the production process of pesto alla Genovese sauce at Barilla G. e R. F.lli S.p.A. Here, typical Industry 4.0 challenges such as data synchronization as well as the construction of real-time control charts and predictive models were tackled. The analysis of images delivered by cameras installed along the manufacturing line was also performed to evaluate the quality of the raw materials exploited for the pesto sauce preparation. The proposed algorithms and methodologies constitute a significant contribution to the field of complex process data analysis, permitting to achieve improved predictive performance while overcoming several of the main limitations traditional multivariate regression approaches such as standard PLS suffer from. The results reported in this thesis could potentially boost the advancement of the domain of Industry 4.0, enhancing process control and sustainability.
6-mag-2025
Inglese
Nell'era dell'Industria 4.0, il monitoraggio in tempo reale dei processi e il controllo della qualità rappresentano strumenti cruciali per le aziende che puntano a ottimizzare la produzione, ridurre gli sprechi e incrementare la sostenibilità. In questo scenario, la chemiometria assume un ruolo sempre più rilevante, offrendo metodologie efficaci per gestire grandi quantità di dati e per estrarre informazioni utili a supporto di decisioni basate sui dati. Tra gli strumenti più diffusi in questo ambito, la regressione Partial Least Squares (PLS) è ampiamente utilizzata per la previsione della qualità in tempo reale, aspetto centrale per il monitoraggio del comportamento dei processi industriali. Tuttavia, quando i dati riflettono fasi differenti di un processo o includono informazioni che non catturano adeguatamente la variabilità del sistema, PLS può incontrare difficoltà, a causa della presenza di non linearità e outliers. Inoltre, la necessità di trattare simultaneamente più blocchi di dati eterogenei rende questi scenari ancora più complessi. Questa tesi affronta tali problematiche proponendo nuovi algoritmi basati su PLS. Due di essi, Locally-Weighted-Multiblock-PLS (LW-MB-PLS) e Local-Weighted-Response Oriented Sequential Alternation (LW-ROSA), sono stati ideati per gestire le non linearità nei casi in cui è necessario trattare blocchi di dati multipli. Il metodo LW-MB-PLS adatta un modello di calibrazione lineare locale per ogni nuovo campione, mantenendo al contempo un'attenzione particolare all'interpretabilità dei modelli locali. Per affrontare simultaneamente le non linearità e la presenza di outliers, è stato sviluppato un terzo metodo, Locally-Weighted-RoBoost-PLS (LW-RoBoost-PLS), che va a combinare i vantaggi delle tecniche di modellazione locale, che gestiscono in modo efficace le non linearità, con quelli delle metodologie di regressione robusta, che riducono l'influenza degli outliers. Il metodo è stato inoltre esteso per l'applicazione a scenari multiblock. I metodi proposti sono stati testati in due contesti industriali. Il primo caso studio riguarda la produzione di Acrilonitrile Butadiene Stirene (ABS) presso Versalis S.p.A., un impianto dotato di sensori in-linea che monitorano diverse fasi del processo produttivo. In questo contesto, i metodi LW-MB-PLS, LW-ROSA e LW-RoBoost-PLS hanno mostrato significativi miglioramenti nelle prestazioni predittive rispetto agli approcci tradizionali. Per valutare la possibilità di predire accuratamente la qualità dell'ABS prima del completamento del processo, è stato implementato un approccio incrementale, basato sull'uso progressivo delle informazioni disponibili. Questo metodo ha consentito di analizzare l'evoluzione della capacità predittiva dei metodi proposti, fornendo indicazioni preziose sulla loro efficacia nelle varie fasi del processo. Il secondo caso studio si focalizza sulla produzione di pesto alla genovese presso Barilla G. e R. F.lli S.p.A., un esempio di Industria 4.0 in cui l'infrastruttura non è completamente equipaggiata per una raccolta dati completa. In questo contesto, sono state affrontate sfide come la sincronizzazione dei dati, lo sviluppo di modelli predittivi in tempo reale ed un’analisi delle immagini per valutare la qualità delle materie prime impiegate nella preparazione del pesto. Gli algoritmi e le metodologie presentati in questa tesi rappresentano un contributo significativo all'analisi di dati di processo complessi, migliorando le prestazioni predittive e superando molte delle limitazioni dei metodi tradizionali, come PLS. I risultati ottenuti possono contribuire all'evoluzione dell'Industria 4.0, migliorando il controllo dei processi, l'efficienza produttiva e la sostenibilità complessiva delle operazioni industriali.
Industria 4.0; chemiometria; dati multiblocco; modelli locali; modelli robusti
STRANI, LORENZO
COCCHI, Marina
LUGLI, Stefano
Università degli studi di Modena e Reggio Emilia
File in questo prodotto:
File Dimensione Formato  
Tesi_Definitiva_Daniele_Tanzilli.pdf

embargo fino al 06/05/2026

Dimensione 65.06 MB
Formato Adobe PDF
65.06 MB Adobe PDF

I documenti in UNITESI sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.14242/208603
Il codice NBN di questa tesi è URN:NBN:IT:UNIMORE-208603