Coffee authentication based on geographical origin remains a major analytical challenge due to the intrinsic chemical similarity among Arabica coffees and the natural variability introduced by environmental conditions and post-harvest practices. In this context, this thesis proposes a multimodal analytical framework based on a soft foodomics approach, employing ambient mass spectrometry, spectroscopic techniques, hyperspectral imaging, and chemometric modeling for the characterization and authentication of green coffee beans with controlled geographical origin, using coffees from the Cerrado Mineiro region as a case study. Sandpaper spray mass spectrometry (SPS-MS) proved to be a viable approach for the rapid acquisition of molecular profiles and, when combined with DD-SIMCA modeling using six principal components, enabled the construction of models with high sensitivity and good specificity for target-class authentication, achieving 84% classification efficiency. Multimodal data fusion combining Raman spectroscopy, X-ray fluorescence (XRF), and sensory analysis resulted in models with high classification performance, with superior results obtained when low- and mid-level fusion strategies were employed. The analytical sustainability of the proposed protocol was confirmed by AGREE (0.87) and GAPI (0.85) metrics, demonstrating strong alignment with Green Analytical Chemistry principles. Strategies for updating one-class models across different harvest years using UV-Vis spectroscopy and calibration transfer by PDS showed that instrumental standardization alone is insufficient to compensate for temporal variability, reinforcing the importance of representative training sets. The updated models were able to correctly recognize more than 90% of the samples. Additionally, HSI-NIR data combined with chemometric modeling enabled authentication with 100% sensitivity and specificity, while morphological descriptors provided complementary information regarding sample variability. Overall, this thesis demonstrates that multimodal analytical strategies combined with chemometric modeling constitute a robust, sustainable, and transferable approach for the authentication of specialty coffees with controlled geographical origin, with strong potential for application in geographical indication systems, fraud prevention, and quality control.

L’autenticazione del caffè basata sull’origine geografica rappresenta ancora una grande sfida analitica, a causa dell’intrinseca similarità chimica tra i caffè Arabica e della variabilità naturale introdotta dalle condizioni ambientali e dalle pratiche post-raccolta. In questo contesto, la presente tesi propone un framework analitico multimodale basato su un approccio di soft foodomics, impiegando spettrometria di massa ambiente, tecniche spettroscopiche, imaging iperspettrale e modellazione chemiometrica per la caratterizzazione e l’autenticazione di chicchi di caffè verde con origine geografica controllata, utilizzando i caffè della regione del Cerrado Mineiro come caso di studio. La spettrometria di massa sandpaper spray (SPS-MS) si è dimostrata una tecnica valida per la rapida acquisizione di profili molecolari e, combinata con la modellazione DD-SIMCA basata su sei componenti principali, ha permesso di costruire modelli con elevata sensibilità e buona specificità per l’autenticazione della classe target, raggiungendo un’efficienza globale dell’84%. La fusione multimodale dei dati, combinando spettroscopia Raman, fluorescenza a raggi X (XRF) e analisi sensoriale, ha prodotto modelli con elevate prestazioni di classificazione, con risultati superiori ottenuti mediante strategie di fusione low-level e mid-level. La sostenibilità analitica del protocollo proposto è stata confermata dalle metriche AGREE (0,87) e GAPI (0,85), dimostrando una forte coerenza con i principi della Chimica Analitica Verde. Le strategie di aggiornamento dei modelli one-class tra diverse annate, utilizzando spettroscopia UV-Vis e trasferimento di calibrazione mediante PDS, hanno evidenziato che la sola standardizzazione strumentale è insufficiente a compensare la variabilità temporale, rafforzando l’importanza di set di addestramento rappresentativi. I nuovi modelli sviluppati sono stati in grado di riconoscere correttamente oltre il 90% dei campioni. Inoltre, i dati HSI-NIR associati alla modellazione chemiometrica hanno consentito un’autenticazione con sensibilità e specificità del 100%, mentre i descrittori morfologici hanno fornito informazioni complementari sulla variabilità dei campioni. Nel complesso, questa tesi dimostra che strategie analitiche multimodali combinate con modellazione chemiometrica costituiscono un approccio robusto, sostenibile e trasferibile per l’autenticazione di caffè specialty con origine geografica controllata, con potenziale applicazione nei sistemi di indicazione geografica, prevenzione delle frodi e controllo qualità.

Arabica Coffee Beans Authentication: Soft Foodomics Applications

BATISTA DOS SANTOS, LARISSA
2026

Abstract

Coffee authentication based on geographical origin remains a major analytical challenge due to the intrinsic chemical similarity among Arabica coffees and the natural variability introduced by environmental conditions and post-harvest practices. In this context, this thesis proposes a multimodal analytical framework based on a soft foodomics approach, employing ambient mass spectrometry, spectroscopic techniques, hyperspectral imaging, and chemometric modeling for the characterization and authentication of green coffee beans with controlled geographical origin, using coffees from the Cerrado Mineiro region as a case study. Sandpaper spray mass spectrometry (SPS-MS) proved to be a viable approach for the rapid acquisition of molecular profiles and, when combined with DD-SIMCA modeling using six principal components, enabled the construction of models with high sensitivity and good specificity for target-class authentication, achieving 84% classification efficiency. Multimodal data fusion combining Raman spectroscopy, X-ray fluorescence (XRF), and sensory analysis resulted in models with high classification performance, with superior results obtained when low- and mid-level fusion strategies were employed. The analytical sustainability of the proposed protocol was confirmed by AGREE (0.87) and GAPI (0.85) metrics, demonstrating strong alignment with Green Analytical Chemistry principles. Strategies for updating one-class models across different harvest years using UV-Vis spectroscopy and calibration transfer by PDS showed that instrumental standardization alone is insufficient to compensate for temporal variability, reinforcing the importance of representative training sets. The updated models were able to correctly recognize more than 90% of the samples. Additionally, HSI-NIR data combined with chemometric modeling enabled authentication with 100% sensitivity and specificity, while morphological descriptors provided complementary information regarding sample variability. Overall, this thesis demonstrates that multimodal analytical strategies combined with chemometric modeling constitute a robust, sustainable, and transferable approach for the authentication of specialty coffees with controlled geographical origin, with strong potential for application in geographical indication systems, fraud prevention, and quality control.
30-mar-2026
Inglese
L’autenticazione del caffè basata sull’origine geografica rappresenta ancora una grande sfida analitica, a causa dell’intrinseca similarità chimica tra i caffè Arabica e della variabilità naturale introdotta dalle condizioni ambientali e dalle pratiche post-raccolta. In questo contesto, la presente tesi propone un framework analitico multimodale basato su un approccio di soft foodomics, impiegando spettrometria di massa ambiente, tecniche spettroscopiche, imaging iperspettrale e modellazione chemiometrica per la caratterizzazione e l’autenticazione di chicchi di caffè verde con origine geografica controllata, utilizzando i caffè della regione del Cerrado Mineiro come caso di studio. La spettrometria di massa sandpaper spray (SPS-MS) si è dimostrata una tecnica valida per la rapida acquisizione di profili molecolari e, combinata con la modellazione DD-SIMCA basata su sei componenti principali, ha permesso di costruire modelli con elevata sensibilità e buona specificità per l’autenticazione della classe target, raggiungendo un’efficienza globale dell’84%. La fusione multimodale dei dati, combinando spettroscopia Raman, fluorescenza a raggi X (XRF) e analisi sensoriale, ha prodotto modelli con elevate prestazioni di classificazione, con risultati superiori ottenuti mediante strategie di fusione low-level e mid-level. La sostenibilità analitica del protocollo proposto è stata confermata dalle metriche AGREE (0,87) e GAPI (0,85), dimostrando una forte coerenza con i principi della Chimica Analitica Verde. Le strategie di aggiornamento dei modelli one-class tra diverse annate, utilizzando spettroscopia UV-Vis e trasferimento di calibrazione mediante PDS, hanno evidenziato che la sola standardizzazione strumentale è insufficiente a compensare la variabilità temporale, rafforzando l’importanza di set di addestramento rappresentativi. I nuovi modelli sviluppati sono stati in grado di riconoscere correttamente oltre il 90% dei campioni. Inoltre, i dati HSI-NIR associati alla modellazione chemiometrica hanno consentito un’autenticazione con sensibilità e specificità del 100%, mentre i descrittori morfologici hanno fornito informazioni complementari sulla variabilità dei campioni. Nel complesso, questa tesi dimostra che strategie analitiche multimodali combinate con modellazione chemiometrica costituiscono un approccio robusto, sostenibile e trasferibile per l’autenticazione di caffè specialty con origine geografica controllata, con potenziale applicazione nei sistemi di indicazione geografica, prevenzione delle frodi e controllo qualità.
DE ALMEIDA, MARIANA RAMOS
MALEGORI, CRISTINA
GROTTI, MARCO
Università degli studi di Genova
File in questo prodotto:
File Dimensione Formato  
phdunige_7632253.pdf

embargo fino al 30/03/2027

Licenza: Tutti i diritti riservati
Dimensione 3.21 MB
Formato Adobe PDF
3.21 MB Adobe PDF

I documenti in UNITESI sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.14242/373471
Il codice NBN di questa tesi è URN:NBN:IT:UNIGE-373471