The focus on diseases lacking known molecular targets and the growing interest in unconventional therapeutic targets, such as non-canonical DNA/RNA secondary structures, have become increasingly significant within the scientific community. DNA/RNA G-quadruplexes (G4s) have recently garnered attention due to their presence in regulatory sequences within human and viral genomes, making them appealing targets for potential new drugs. Stabilizing G4s could induce the modulation of gene expression and block pathological processes in the human genome or the replication of pathogenic organisms, thereby opening new avenues for treating diseases that currently lack effective molecular therapies. However, the clinical and even preclinical development of G4-targeting therapies remains constrained by the challenge of identifying molecules that can selectively recognize G4 structures. Many known G4 binders also show affinity for double-helical DNA and lack of specificity for G4 sequences. An ideal binding molecule should be able to selectively target specific G4 structures implicated in disease progression, thereby modulating only the biological processes or signaling pathways in which these structures are involved. To address these challenges, a deeper understanding of the intricate structural relationships between G4 structures and potential small-molecule drug candidates is essential. Today, there is a fundamental need for research dedicated to the collection and codification of critical information required for designing biologically active and highly selective molecules.This PhD project aims at proposing an innovative and multifaceted approach to the development of new Schiff base transition metal complexes capable of selectively stabilizing human and viral G4 structures. The project’s originality lies in the integration of distinct yet complementary methodologies, encompassing synthetic chemistry, spectroscopic and biophysical techniques, computational modeling, and cutting-edge machine learning algorithms.In the experimental phase, conducted at the University of Palermo, the exploration of coordination chemistry was central to the synthesis of novel Ni(II), Pd(II), Zn(II), and Cu(II) complexes with Salphen ligands, renowned for their strong affinity toward G4 structures. These compounds have been characterized through nuclear magnetic resonance (NMR), mass spectrometry, CHN elemental analysis, and X-ray crystallography, providing detailed insight into their composition and structure. Subsequently, optical spectroscopic techniques, such as UV-Vis absorption, circular dichroism (CD), fluorescence, and Förster Resonance Energy Transfer (FRET), were employed to elucidate the affinity and the interactions between these complexes and both human and viral DNA and RNA G4 targets.The computational phase, predominantly carried out during a six-month stay in Paris at Université Paris Cité, involved computational modeling, specifically aimed at predicting the three-dimensional structures at atomic resolution of viral G4 sequences that are currently non present in the “Protein Data Bank” (PDB) database. This work enabled a detailed study of the motifs through classic and hybrid quantum mechanics/molecular mechanics (QM/MM) molecular dynamics (MD) simulations. These computational methods allowed for the theoretical determination of CD spectra of G4s in solution, providing a basis for direct comparison with experimentally obtained CD spectra and, consequently, the characterization of the investigated sequences. This approach strengthens the investigation by correlating theoretical predictions with empirical data, thus enhancing the understanding of G4 structures and their interactions with metal- based compounds.Finally, in collaboration with Fondazione Ri.Med, advanced machine learning (ML) approaches were implemented to predict binding activity toward G4 structures. A machine learning model was developed, leveraging classical and quantum chemical (QC) molecular descriptors, to predict the affinity of G4 binders and their stabilization capacity. This integration with artificial intelligence (AI) provides a novel method for exploring structure-function relationships in drug discovery, particularly focusing on G4-binding affinity and selectivity. This breakthrough not only opens new pathways for targeted therapeutic development but also highlights the increasingly pivotal role of AI in molecular science.This thesis is organized into three sections: I) Introduction, II) Results, and III) Conclusions. Every section is divided in chapters. In particular, in the “Results” section, the three chapters align with the three phases described above. The first chapter primarily focuses on the synthesis of novel Salphen complexes and their interaction with human G4s, aiming to elucidate their structural, chemical, and electronic properties. The second chapter shifts the focus to viral G4s, employing a combination of experimental and theoretical techniques to investigate their structure and interaction modes with thesynthesized complexes. Finally, the third chapter consolidates all the information gathered in the previous phases, both in terms of design and timeline, culminating in the development of the first open-source machine learning model capable of predicting the activity of organic and inorganic compounds toward G4 structures.

L'attenzione rivolta a malattie prive di target molecolari noti e l'interesse crescente verso bersagli terapeutici non convenzionali, come le strutture secondarie del DNA alternative alla nota doppia elica destrorsa (B-DNA), sono diventati temi di grande rilievo tra la comunità scientifica. In questo contesto, le strutture G-quadruplex (G4) del DNA/RNA hanno attirato l'interesse per la loro presenza in sequenze regolatorie dei genomi umani e virali, rendendoli target promettenti per lo sviluppo di nuovi farmaci. La stabilizzazione dei G4 potrebbe modulare l'espressione genica e interrompere processi patologici nel genoma umano o nella replicazione di organismi patogeni, aprendo nuove prospettive per il trattamento di malattie attualmente prive di terapie molecolari efficaci. Tuttavia, lo sviluppo clinico e preclinico di terapie mirate ai G4 è ancora limitato dalla difficoltà di identificare molecole in grado di riconoscere selettivamente questo tipo di strutture secondarie. Molti composti noti per interagire con questo target mostrano affinità anche per il DNA a doppia elica, un aspetto che ne limita la specificità. Una molecola dovrebbe idealmente essere in grado di colpire selettivamente specifiche strutture G4 implicate nella progressione della malattia, modulando unicamente i processi biologici in cui tali strutture sono coinvolte. Per affrontare queste sfide, è essenziale comprendere a fondo le relazioni strutturali tra i G4 e i potenziali candidati molecolari.Questo progetto di dottorato rappresenta un approccio innovativo e multidisciplinare per lo sviluppo di nuovi complessi metallici con leganti di basi di Schiff, capaci di stabilizzare selettivamente le strutture G4 umane e virali. L'originalità del progetto risiede nell'integrazione di metodologie distinte ma complementari, che includono chimica sintetica, tecniche spettroscopiche, computazionali e algoritmi avanzati di machine learning.Nella fase sperimentale, condotta presso l'Università di Palermo, l'esplorazione della chimica di coordinazione è stata centrale per la sintesi di nuovi complessi di Ni(II), Pd(II), Zn(II) e Cu(II) con leganti di tipo “Salfen”, noti per la loro forte affinità verso le strutture G4. Tali composti sono stati caratterizzati attraverso Risonanza Magnetica Nucleare (NMR), spettrometria di massa, analisi elementare CHN e cristallografia a raggi X. Successivamente, tecniche biofisiche, come la spettroscopia UV-Vis, il dicroismo circolare (CD), saggi di fluorescenza e di trasferimento di energia per risonanza di Förster (FRET), sono state utilizzate per studiare l'affinità e le interazioni tra questi complessi e i bersagli G4 umani e virali.La fase computazionale, condotta principalmente durante un soggiorno di sei mesi a Parigi presso l'Université Paris Cité, ha coinvolto l’applicazione di homology modeling, mirata in particolare alla predizione delle strutture tridimensionali di sequenze virali di G4 attualmente non caratterizzate sperimentalmente e disponibili quindi nel database Protein Data Bank (PDB). Questo lavoro ha permesso uno studio dettagliato delle sequenze selezionate, attraverso simulazioni di dinamica molecolare (MD) e tecniche ibride di meccanica quantistica/meccanica molecolare (QM/MM). I metodi computazionali utilizzati hanno consentito la determinazione teorica degli spettri di dicroismo circolare dei G4, fornendo una base per confronti diretti con gli spettri CD ottenuti sperimentalmente e, di conseguenza, per la caratterizzazione delle sequenze investigate. L’approccio usato rafforza l'indagine correlando le previsioni teoriche con i dati empirici, migliorando così la comprensione delle strutture G4 e delle loro interazioni con i composti metallici.Infine, in collaborazione con la Fondazione Ri.Med, sono stati implementati approcci avanzati di machine learning per prevedere l'attività di molecole di sintesi verso strutture di tipo G4. Nello specifico, è stato sviluppato un modello di machine learning basato su descrittori molecolari chimici classici e quantistici. L’utilizzo dell'intelligenza artificiale ha lo scopo di fornire un metodo innovativo per esplorare la relazione struttura-attività nella scoperta di potenziali farmaci, con un focus particolare sull'affinità e la selettività di legame con i G4. I risultatati ottenuti, non solo aprono nuove strade per lo sviluppo di terapie mirate basate sul “G-quadruplex targeting”, ma evidenzia anche il ruolo sempre più centrale di tecniche basate sull’intelligenza artificiale nella scienza molecolare.La tesi presentata è organizzata in tre sezioni: I) Introduzione, II) Risultati e III) Conclusioni. Ogni sezione è divisa in capitoli. In particolare, nella sezione “Risultati”, i tre capitoli si allineano con le tre fasi descritte sopra. Il primo capitolo tratta principalmente la sintesi di nuovi complessi metallici con leganti di tipo Salfen e la loro interazione con G4 umani. Il secondo capitolo, invece, si concentra sui G4 virali, utilizzando una combinazione di tecniche sperimentali e teoriche per esplorarne la struttura e le modalità di interazione con i complessi sintetizzati. Infine, il terzo capitolo consolida tutte le informazioni raccolte nelle fasi precedenti, sia dal punto di vista progettuale che temporale, convergendo nel primo modello di machine learning “open source" per predire l’attività di composti organici e inorganici verso strutture G4.

(2025). DNA/RNA G-Quadruplexes and SARS-CoV-2: An Innovative Target for Metal Complexes with Salphen Ligands.

DNA/RNA G-Quadruplexes and SARS-CoV-2: An Innovative Target for Metal Complexes with Salphen Ligands

D'ANNA, Luisa
2025-02-27

Abstract

The focus on diseases lacking known molecular targets and the growing interest in unconventional therapeutic targets, such as non-canonical DNA/RNA secondary structures, have become increasingly significant within the scientific community. DNA/RNA G-quadruplexes (G4s) have recently garnered attention due to their presence in regulatory sequences within human and viral genomes, making them appealing targets for potential new drugs. Stabilizing G4s could induce the modulation of gene expression and block pathological processes in the human genome or the replication of pathogenic organisms, thereby opening new avenues for treating diseases that currently lack effective molecular therapies. However, the clinical and even preclinical development of G4-targeting therapies remains constrained by the challenge of identifying molecules that can selectively recognize G4 structures. Many known G4 binders also show affinity for double-helical DNA and lack of specificity for G4 sequences. An ideal binding molecule should be able to selectively target specific G4 structures implicated in disease progression, thereby modulating only the biological processes or signaling pathways in which these structures are involved. To address these challenges, a deeper understanding of the intricate structural relationships between G4 structures and potential small-molecule drug candidates is essential. Today, there is a fundamental need for research dedicated to the collection and codification of critical information required for designing biologically active and highly selective molecules.This PhD project aims at proposing an innovative and multifaceted approach to the development of new Schiff base transition metal complexes capable of selectively stabilizing human and viral G4 structures. The project’s originality lies in the integration of distinct yet complementary methodologies, encompassing synthetic chemistry, spectroscopic and biophysical techniques, computational modeling, and cutting-edge machine learning algorithms.In the experimental phase, conducted at the University of Palermo, the exploration of coordination chemistry was central to the synthesis of novel Ni(II), Pd(II), Zn(II), and Cu(II) complexes with Salphen ligands, renowned for their strong affinity toward G4 structures. These compounds have been characterized through nuclear magnetic resonance (NMR), mass spectrometry, CHN elemental analysis, and X-ray crystallography, providing detailed insight into their composition and structure. Subsequently, optical spectroscopic techniques, such as UV-Vis absorption, circular dichroism (CD), fluorescence, and Förster Resonance Energy Transfer (FRET), were employed to elucidate the affinity and the interactions between these complexes and both human and viral DNA and RNA G4 targets.The computational phase, predominantly carried out during a six-month stay in Paris at Université Paris Cité, involved computational modeling, specifically aimed at predicting the three-dimensional structures at atomic resolution of viral G4 sequences that are currently non present in the “Protein Data Bank” (PDB) database. This work enabled a detailed study of the motifs through classic and hybrid quantum mechanics/molecular mechanics (QM/MM) molecular dynamics (MD) simulations. These computational methods allowed for the theoretical determination of CD spectra of G4s in solution, providing a basis for direct comparison with experimentally obtained CD spectra and, consequently, the characterization of the investigated sequences. This approach strengthens the investigation by correlating theoretical predictions with empirical data, thus enhancing the understanding of G4 structures and their interactions with metal- based compounds.Finally, in collaboration with Fondazione Ri.Med, advanced machine learning (ML) approaches were implemented to predict binding activity toward G4 structures. A machine learning model was developed, leveraging classical and quantum chemical (QC) molecular descriptors, to predict the affinity of G4 binders and their stabilization capacity. This integration with artificial intelligence (AI) provides a novel method for exploring structure-function relationships in drug discovery, particularly focusing on G4-binding affinity and selectivity. This breakthrough not only opens new pathways for targeted therapeutic development but also highlights the increasingly pivotal role of AI in molecular science.This thesis is organized into three sections: I) Introduction, II) Results, and III) Conclusions. Every section is divided in chapters. In particular, in the “Results” section, the three chapters align with the three phases described above. The first chapter primarily focuses on the synthesis of novel Salphen complexes and their interaction with human G4s, aiming to elucidate their structural, chemical, and electronic properties. The second chapter shifts the focus to viral G4s, employing a combination of experimental and theoretical techniques to investigate their structure and interaction modes with thesynthesized complexes. Finally, the third chapter consolidates all the information gathered in the previous phases, both in terms of design and timeline, culminating in the development of the first open-source machine learning model capable of predicting the activity of organic and inorganic compounds toward G4 structures.
27-feb-2025
L'attenzione rivolta a malattie prive di target molecolari noti e l'interesse crescente verso bersagli terapeutici non convenzionali, come le strutture secondarie del DNA alternative alla nota doppia elica destrorsa (B-DNA), sono diventati temi di grande rilievo tra la comunità scientifica. In questo contesto, le strutture G-quadruplex (G4) del DNA/RNA hanno attirato l'interesse per la loro presenza in sequenze regolatorie dei genomi umani e virali, rendendoli target promettenti per lo sviluppo di nuovi farmaci. La stabilizzazione dei G4 potrebbe modulare l'espressione genica e interrompere processi patologici nel genoma umano o nella replicazione di organismi patogeni, aprendo nuove prospettive per il trattamento di malattie attualmente prive di terapie molecolari efficaci. Tuttavia, lo sviluppo clinico e preclinico di terapie mirate ai G4 è ancora limitato dalla difficoltà di identificare molecole in grado di riconoscere selettivamente questo tipo di strutture secondarie. Molti composti noti per interagire con questo target mostrano affinità anche per il DNA a doppia elica, un aspetto che ne limita la specificità. Una molecola dovrebbe idealmente essere in grado di colpire selettivamente specifiche strutture G4 implicate nella progressione della malattia, modulando unicamente i processi biologici in cui tali strutture sono coinvolte. Per affrontare queste sfide, è essenziale comprendere a fondo le relazioni strutturali tra i G4 e i potenziali candidati molecolari.Questo progetto di dottorato rappresenta un approccio innovativo e multidisciplinare per lo sviluppo di nuovi complessi metallici con leganti di basi di Schiff, capaci di stabilizzare selettivamente le strutture G4 umane e virali. L'originalità del progetto risiede nell'integrazione di metodologie distinte ma complementari, che includono chimica sintetica, tecniche spettroscopiche, computazionali e algoritmi avanzati di machine learning.Nella fase sperimentale, condotta presso l'Università di Palermo, l'esplorazione della chimica di coordinazione è stata centrale per la sintesi di nuovi complessi di Ni(II), Pd(II), Zn(II) e Cu(II) con leganti di tipo “Salfen”, noti per la loro forte affinità verso le strutture G4. Tali composti sono stati caratterizzati attraverso Risonanza Magnetica Nucleare (NMR), spettrometria di massa, analisi elementare CHN e cristallografia a raggi X. Successivamente, tecniche biofisiche, come la spettroscopia UV-Vis, il dicroismo circolare (CD), saggi di fluorescenza e di trasferimento di energia per risonanza di Förster (FRET), sono state utilizzate per studiare l'affinità e le interazioni tra questi complessi e i bersagli G4 umani e virali.La fase computazionale, condotta principalmente durante un soggiorno di sei mesi a Parigi presso l'Université Paris Cité, ha coinvolto l’applicazione di homology modeling, mirata in particolare alla predizione delle strutture tridimensionali di sequenze virali di G4 attualmente non caratterizzate sperimentalmente e disponibili quindi nel database Protein Data Bank (PDB). Questo lavoro ha permesso uno studio dettagliato delle sequenze selezionate, attraverso simulazioni di dinamica molecolare (MD) e tecniche ibride di meccanica quantistica/meccanica molecolare (QM/MM). I metodi computazionali utilizzati hanno consentito la determinazione teorica degli spettri di dicroismo circolare dei G4, fornendo una base per confronti diretti con gli spettri CD ottenuti sperimentalmente e, di conseguenza, per la caratterizzazione delle sequenze investigate. L’approccio usato rafforza l'indagine correlando le previsioni teoriche con i dati empirici, migliorando così la comprensione delle strutture G4 e delle loro interazioni con i composti metallici.Infine, in collaborazione con la Fondazione Ri.Med, sono stati implementati approcci avanzati di machine learning per prevedere l'attività di molecole di sintesi verso strutture di tipo G4. Nello specifico, è stato sviluppato un modello di machine learning basato su descrittori molecolari chimici classici e quantistici. L’utilizzo dell'intelligenza artificiale ha lo scopo di fornire un metodo innovativo per esplorare la relazione struttura-attività nella scoperta di potenziali farmaci, con un focus particolare sull'affinità e la selettività di legame con i G4. I risultatati ottenuti, non solo aprono nuove strade per lo sviluppo di terapie mirate basate sul “G-quadruplex targeting”, ma evidenzia anche il ruolo sempre più centrale di tecniche basate sull’intelligenza artificiale nella scienza molecolare.La tesi presentata è organizzata in tre sezioni: I) Introduzione, II) Risultati e III) Conclusioni. Ogni sezione è divisa in capitoli. In particolare, nella sezione “Risultati”, i tre capitoli si allineano con le tre fasi descritte sopra. Il primo capitolo tratta principalmente la sintesi di nuovi complessi metallici con leganti di tipo Salfen e la loro interazione con G4 umani. Il secondo capitolo, invece, si concentra sui G4 virali, utilizzando una combinazione di tecniche sperimentali e teoriche per esplorarne la struttura e le modalità di interazione con i complessi sintetizzati. Infine, il terzo capitolo consolida tutte le informazioni raccolte nelle fasi precedenti, sia dal punto di vista progettuale che temporale, convergendo nel primo modello di machine learning “open source" per predire l’attività di composti organici e inorganici verso strutture G4.
G-Quadruplex, Machine learning, Salphen metal complexes, Sars-CoV-2
(2025). DNA/RNA G-Quadruplexes and SARS-CoV-2: An Innovative Target for Metal Complexes with Salphen Ligands.
File in questo prodotto:
File Dimensione Formato  
Tesi_DottoratoDAnna.pdf

Solo gestori archvio

Dimensione 17.47 MB
Formato Adobe PDF
17.47 MB Adobe PDF   Visualizza/Apri   Richiedi una copia

I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10447/673629
Citazioni
  • ???jsp.display-item.citation.pmc??? ND
  • Scopus ND
  • ???jsp.display-item.citation.isi??? ND
social impact