Éditeurs de base de cytosine améliorés générés à partir de variantes de TadA
MaisonMaison > Blog > Éditeurs de base de cytosine améliorés générés à partir de variantes de TadA

Éditeurs de base de cytosine améliorés générés à partir de variantes de TadA

Sep 25, 2023

Nature Biotechnology volume 41, pages 686–697 (2023)Citer cet article

12 000 accès

4 Citations

50 Altmétrique

Détails des métriques

Les éditeurs de bases de cytosine (CBE) permettent des mutations de transition génomiques programmables C·G-à-T·A et comprennent généralement une enzyme CRISPR-Cas modifiée, une cytidine désaminase naturelle et un inhibiteur de la réparation de l'uracile. Des études antérieures ont montré que les CBE utilisant des cytidine désaminases naturelles peuvent provoquer une désamination non guidée de la cytosine à l'échelle du génome. Bien que des CBE améliorés qui réduisent les cibles non ciblées stochastiques à l'échelle du génome aient été signalés par la suite, ces éditeurs peuvent souffrir de performances sous-optimales sur la cible. Ici, nous rapportons la génération et la caractérisation de CBE qui utilisent des variantes modifiées de TadA (CBE-T) qui permettent une C·G à T·A élevée sur la cible à travers un ensemble de séquences diverses de locus génomiques, démontrent une activité robuste dans les cellules primaires et ne provoquent aucune élévation détectable de la mutation à l'échelle du génome. En outre, nous rapportons des éditeurs de bases de cytosine et d'adénine (CABE) catalysant à la fois l'édition A-à-I et C-à-U (CABE-T). Avec les ABE, les CBE-T et les CABE-T permettent l'installation programmable de toutes les mutations de transition à l'aide de variantes TadA développées en laboratoire avec des propriétés améliorées par rapport aux CBE précédemment signalés.

Les éditeurs de bases de cytosine (CBE) sont des enzymes d'édition de gènes capables d'introduire de manière programmée des changements de paires de bases C·G à T·A dans l'ADN génomique des cellules vivantes. Cette conversion chimique est obtenue par désamination hydrolytique à médiation enzymatique de la cytosine en uracile, qui est interprétée comme de la thymine par les ADN polymérases1. À ce jour, les CBE sont généralement composés de quatre composants distincts : une cytidine désaminase naturelle (telle que APOBEC, AID ou CDA)2, une forme altérée de Cas9 capable de couper le brin d'ADN non modifié par la base, une ou plusieurs unités d'un peptide inhibiteur de l'uracile glycosylase (UGI) et d'une séquence de localisation nucléaire (NLS)1,2,3. Ces composants sont généralement fusionnés de manière covalente mais peuvent également être assemblés de manière non covalente4. Les CBE ont été largement exploités pour la réversion génique et l'ingénierie cellulaire et ont le potentiel de fournir des avantages thérapeutiques aux patients vivant avec des maladies génétiques débilitantes ou des malignités5.

Bien qu'une efficacité élevée de l'édition de l'ADN sur la cible puisse être obtenue avec les outils d'édition de base CBE actuels2, ils peuvent également provoquer une édition hors cible indépendante de l'ARN guide (ARNg) à l'échelle du génome6,7. Il a été rapporté que les éditeurs CBE de nouvelle génération tels que YE1 (réf. 8), BE4-PpAPOBEC9 et autres10 atténuent les résultats hors cible indépendants de l'ARNg, mais ces éditeurs utilisent des variantes naturelles ou légèrement modifiées de la désaminase APOBEC et peuvent souffrir d'une diminution de la -performances d'édition ciblées2,9. De plus, dans certains contextes spécifiques à la séquence, les CBE basés sur APOBEC peuvent conduire à une édition proximale adjacente à la séquence génomique ciblée en raison de la capacité inefficace, mais mesurable, d'APOBEC à accepter l'ADN double brin (dsDNA) comme substrat11.

Les éditeurs de bases d'adénine (ABE) sont des enzymes d'édition de gènes qui installent de manière programmable des mutations ponctuelles A·T à G·C sur des locus ciblés via une désaminase TadA développée en laboratoire qui convertit chimiquement l'adénine en inosine12. L'inosine s'apparie avec la cytosine dans le site actif des ADN polymérases, ce qui entraîne une mutation de l'inosine en guanine après la réplication de l'ADN. Notamment, les ABE provoquent peu ou pas de cibles hors cibles indépendantes de l'ARNg et modifient l'ADN génomique (ADNg) dans une fenêtre plus précise (positions ~ 3–8, PAM 21–23), ce qui peut entraîner moins de cibles hors cibles dépendantes du guide comme ainsi que moins de modifications indirectes, par rapport aux CBE6,13. De plus, il n'a pas été signalé que les ABE agissent sur l'ADNdb.

Pour conférer les attributs favorables des ABE à un CBE, nous avons envisagé de transformer TadA en une enzyme capable de désamination robuste de la cytidine et avons ensuite généré une classe améliorée de CBE qui utilise TadA au lieu d'une cytidine désaminase naturelle. De manière encourageante, des enquêtes antérieures ont démontré la malléabilité des ABE vis-à-vis de l'édition C à T faible mais détectable grâce à l'inclusion de l'UGI14. En effet, grâce à une conception guidée par la structure, un variant ABE a été signalé, ABE-P48R-UGI, qui a permis une activité cytosine améliorée, par rapport à ABE7.10, mais avec une spécificité de séquence TC élevée15. Bien que ces progrès aient représenté un progrès vers nos objectifs, nous avons reconnu qu'une ingénierie et une évolution plus poussées de TadA seraient nécessaires pour atteindre des efficacités d'édition C·G-to-T·A thérapeutiquement pertinentes avec une pureté élevée du produit et sans restrictions de séquence de substrat.

En commençant par ABE8.20-m13 comme modèle pour la génération de bibliothèques, nous avons mené deux cycles d'évolution dirigée pour générer des variantes d'éditeur de base avec des efficacités d'édition C·G à T·A améliorées et la rétention de l'édition d'adénine. Nous nous référons à ces éditeurs de bases de cytosine et d'adénine (CABE) utilisant TadA sous le nom de "CABE-T", et nous avons développé et caractérisé ces éditeurs pour les efficacités d'édition C·G-to-T·A et A·T-to-G·C dans les cellules de mammifères. Avec les CABE-T en main, nous avons déterminé les structures cristallines des variantes de TadA désaminase associées à ces éditeurs et effectué une mutagenèse guidée par la structure pour créer des CBE-T, une classe distincte de CBE qui utilisent des désaminases TadA modifiées pour un C·G à T· élevé. Une conversion en ADNg sans niveaux appréciables d'édition A·T en G·C. Par rapport à BE4, nos CBE-T ont démontré des efficacités d'édition sur cible comparables, avaient une fenêtre d'édition plus précise, une édition hors cible dépendante du guide réduite et n'ont montré aucune édition hors cible détectable indépendante du génome gRNA. En outre, les CBE-T ont démontré une compatibilité avec les enzymes Cas orthogonales, permettant leur application potentielle sur un plus large éventail de sites cibles. Enfin, nos CBE-T étaient très actifs dans les types de cellules primaires telles que les cellules T et les hépatocytes, validant ainsi leur potentiel en tant qu'outil d'édition de gènes attrayant pour des applications thérapeutiques.

Pour modifier la tolérance du substrat nucléobasique de l'ABE, nous avons pensé que nous pouvions exercer une pression sélective sur l'ABE pour augmenter sa capacité d'édition de base C·G-to-T·A faible, mais détectable13,14, par évolution dirigée et inclusion d'UGI (pour inhiber l'uracile réparation par UNG2). Tout d'abord, nous avons généré une bibliothèque ABE randomisée chimiquement dans la région TadA de l'éditeur (ABE8.20-m13 utilisé comme modèle) ou randomisée via PCR sujette aux erreurs (ABE8.19-m13 utilisé comme modèle). La bibliothèque résultante d'environ 10 millions de membres contenait en moyenne trois substitutions d'acides aminés par membre. Escherichia coli a été co-transformé avec la bibliothèque ABE, l'ARNg et un plasmide de sélection et a ensuite été mis au défi avec des doses létales d'antibiotiques qui ont été sélectionnés pour les membres de la bibliothèque ABE qui ont effectué des modifications C·G à T·A dans une résistance aux antibiotiques correspondante, restaurant le gène fonction (Fig. 1a–d et séquence supplémentaire 1). L'analyse de la séquence Sanger des membres survivants de la bibliothèque (Fig. 1e et Fig. 1 supplémentaire) a révélé que la majorité des clones sélectionnés par un antibiotique contenaient des substitutions d'acides aminés aux positions 27 et 49 de TadA. Étant donné que 19 des 20 variants contiennent au moins une substitution dans l'une ou l'autre position, nous avons émis l'hypothèse que des substitutions à ces positions (E27H et I49K) situées près de la poche de liaison au substrat induiraient des changements conformationnels rendant TadA capable de se lier et de désaminer la nucléobase de la cytosine, qui est notamment plus petit que l'adénine.

a, Aperçu schématique du flux de travail d'évolution dirigée pour identifier les variantes de TadA capables de désamination C-à-U. b, Représentation schématique des plasmides d'expression et de sélection utilisés dans les campagnes d'évolution dirigée. Gauche : plasmide d'expression de l'éditeur de base codant pour un membre de la bibliothèque et sgRNA, droite : plasmide de sélection codant pour un gène de résistance aux antibiotiques non fonctionnel. La réversion au niveau des sites ciblés restaure la fonction des gènes. c, Vue d'ensemble du développement de l'éditeur CBE-T par l'évolution dirigée et l'ingénierie des protéines. d, Représentation schématique des architectures d'éditeur de base sélectionnées. ABE12 contient une désaminase TadA* développée en laboratoire, nCas9 (D10A) et une étiquette de localisation nucléaire (bpNLS). Le double éditeur (par exemple, SPACE16) est composé d'une désaminase TadA* évoluée, nCas9 (D10A), de la cytidine désaminase rAPOBEC1 ainsi que de deux unités d'UGI et d'une étiquette bpNLS. Les CBE (par exemple, BE4 (réf. 3)) sont composés d'une cytidine désaminase naturelle (par exemple, rAPOBEC1), de nCas9 D10A, de deux unités d'UGI et d'une étiquette bpNLS. Les CABE-T, rapportés ici, sont composés d'une variante TadA capable d'éditer A-to-G et C-to-T (TADAC), nCas9 (D10A), deux unités d'UGI et une étiquette bpNLS. Les CBE-T, rapportés ici, sont composés d'une variante TadA capable d'éditer C-to-T (TADC), nCas9 (D10A), deux unités d'UGI et une étiquette bpNLS. e, Substitutions incorporées dans TadA dans des éditeurs CABE-T sélectionnés du cycle d'évolution dirigée 1 (CABE-T1) et du cycle 2 (CABE-T2). Les substitutions incorporées dans TadA * 8.20 liées à TadA de type sauvage (WT) sont surlignées en gris, et celles identifiées dans les cycles d'évolution dirigée 1 et 2 sont surlignées en violet et orange, respectivement. Les valeurs de la dernière colonne représentent le nombre de substitutions ajoutées à chaque variante par rapport à WT TadA. f, Conversion maximale de C · G en T · A et A · T en G · C dans des cellules HEK293T transfectées avec des plasmides d'expression humaine codant pour les éditeurs ou contrôles CABE-T1 et CABE-T2. Les valeurs et les barres d'erreur reflètent la moyenne et l'écart-type de n = 3 (sites 1 à 4) ou 4 (sites 5 et 6) répétitions biologiques indépendantes réalisées à des jours différents.

Données source

Parmi les membres survivants de la bibliothèque, 20 variantes ont été caractérisées dans des cellules de mammifères pour les résultats de l'édition de base et de nombreuses variantes identifiées à partir du premier cycle d'évolution ont démontré des niveaux appréciables d'édition de C·G à T·A (par exemple, CABE-T1.2, moy 32,1 % ; CABE-T1.17, moyenne de 34,9 % sur 22 sites génomiques), avec différents degrés d'édition A·T à G·C conservés (Fig. 1f et Fig. 2–4 supplémentaires). Sur le plan architectural, ces éditeurs de base sont composés d'une variante TadA fusionnée de manière covalente à l'extrémité N-terminale d'une nickase Cas9 (nCas9, D10A) suivie de deux unités UGI C-terminales et d'une étiquette de localisation nucléaire (Fig. 1d). En conséquence, nous appelons ces éditeurs doubles A·T à G·C et C·G à T·A CABE-T1 (Fig. 1c). Les CABE-T1 ont provoqué une augmentation moyenne de l'édition de C · G à T · A > 25 fois par rapport à ABE8.20-m sur les sites génomiques testés (Fig. 1f et Fig. 2–4 supplémentaires).

Pour augmenter encore l'efficacité d'édition globale de CABE-T1, nous avons créé une bibliothèque CABE-T d'environ 10 millions de membres sur la séquence d'arrière-plan de CABE-T1.2, un CABE-T1 qui a démontré une robustesse C·G à T·A édition dans des cellules de mammifères (Fig. 1f). Nous avons demandé aux membres de la bibliothèque CABE-T1.2 de créer deux réversions C·G à T·A, en plus de deux modifications A·T à G·C pour une plus grande rigueur dans la sélection, pour survivre à l'exposition aux antibiotiques à des concentrations plus élevées que dans la cycle précédent d'évolution dirigée (Fig. 1b et séquence supplémentaire 2). Les membres survivants de la bibliothèque, appelés variants CABE-T2, ont été séquencés et évalués pour l'efficacité de l'édition des bases et le biais du substrat de la nucléobase dans les cellules de mammifères (Fig. 1e, f et Fig. 5 supplémentaires). Dans l'ensemble, les expériences de transfection de mammifères ont révélé une amélioration de nos CABE-T2 par rapport aux CABE-T1. Par exemple, les variantes représentatives CABE-T2.6, CABE-T2.9 et CABE-T2.19 ont pu atteindre des taux d'édition maximaux moyens de C·G à T·A de 53,0 %, 53,6 % et 49,4 % sur 22 sites génomiques , respectivement, tout en maintenant divers niveaux d'édition A·T à G·C (Fig. 1f et Fig. 2, 3 et 6 supplémentaires).

Bien que les CABE aient déjà été signalés dans la littérature, ces outils ont nécessité l'inclusion des désaminases TadA * 7.10 et rAPOBEC1 pour permettre l'édition de bases d'adénine et de cytosine à partir d'un seul éditeur complet16,17,18,19. La création de CABE-T qui utilisent une variante de TadA qui agit à la fois sur les adénines et les cytosines d'ADN (TADAC) a entraîné la génération d'un éditeur de base plus compact (~ 700 pb plus petit) avec des résultats d'édition à double base supérieurs par rapport aux CABE précédemment décrits. Par exemple, CABE-T2.6 a démontré environ 1,6 fois plus de C·G maximal à T·A et environ 2,6 fois plus de A·T maximal à G·C par rapport à SPACE16, A&C-BEmax17 et TargetACEmax18 (Fig. 1f et Figures supplémentaires 2 et 3).

Pour éclairer la façon dont les substitutions d'acides aminés identifiées à partir de l'évolution dirigée affectent la tolérance au substrat de TADAC, nous avons déterminé les structures cristallines de TadA * 8.20 à partir d'ABE8.20-m13, le modèle utilisé pour faire évoluer CABE-T1 et les variantes TADAC-1 de CABE-T1 rapportées ici . À l'aide d'informations structurelles, nous avons cherché à optimiser l'efficacité de l'édition C·G-to-T·A et la spécificité du substrat grâce à la conception de bibliothèques guidées par la structure.

Après le premier cycle d'évolution dirigée, nous avons caractérisé structurellement trois désaminases correspondant à CABE-T1 (TADAC-1.17, TADAC-1.14 et TADAC-1.19) qui ont généré des niveaux appréciables d'édition de bases CG à T·A. Bien que les structures globales de ces variantes soient similaires à celles de TadA * 8.20 (Fig. 2a), les analyses structurelles ont révélé des changements structurels locaux pouvant expliquer la tolérance au substrat élargie observée par les variantes CABE-T1.

a, Superpositions entre les monomères des variants TadA*8.20 et TADAC-1 (RMSD entre 0,4 Å et 0,9 Å pour l'ensemble des atomes Cα). Les structures TADAC-1.17 (protéine—bleu, ssDNA—orange) et TadA*8.20 (protéine—vert, ssDNA—jaune) sont similaires (RMSD de 0,4 Å pour tous les atomes Cα), montrant que les substitutions (sphères cyan) ni modifier la structure de la protéine ni le mode de liaison à l'ADNss, mais peut avoir un impact sur la catalyse en raison de la substitution du site actif S82T. La structure TADAC-1.14 (jaune) a une conformation différente pour la boucle entre β4 et β5 (magenta) que TadA * 8.20 en raison de la substitution G112H (sphère magenta). La structure TADAC-1.19 (rose) a une boucle étendue entre α1 et β1 (orange) avec une conformation différente de TadA*8.20 en raison de la substitution E27G (sphère orange). C représente l'extrémité C-terminale. b, Surface des cavités du site actif des variants TadA*8.20 et TADAC-1. TADAC-1.17 (deuxième panneau) ne montre aucune différence par rapport à TadA*8.20 (premier panneau). La boucle TADAC-1.14 entre β4 et β5 (troisième panneau) modifie la forme de la cavité du site actif, provoquant un conflit stérique A109 avec dT (8) de TadA * 8.20-ssDNA. La boucle TADAC-1.19 entre α1 et β1 (quatrième panneau) modifie la forme de la cavité du site actif, provoquant un conflit stérique du résidu R26 avec dC (10) de TadA * 8.20-ssDNA. c, site actif TADAC-1.17 avec l'analogue à l'état de transition adénine 2-désoxy-8-azanebularine (d8Az; jaune) coordonné à l'ion zinc (sphère grise). T82 est à 4 Â (ligne pointillée cyan) du résidu catalytique E59. Les lignes pointillées noires indiquent les liaisons hydrogène. d, superposition entre les monomères TADAC-1.14 sans substrat (jaune clair et foncé) et le monomère TadA * 8.20 lié à l'ADNss (protéine - vert, ADNss - jaune) montrant deux conformations différentes pour la boucle TADAC-1.14 entre β4 et β5 (rose et magenta) par rapport à TadA*8.20. Cette boucle contient la substitution G112H, et ses nouvelles conformations feraient des conflits stériques avec dT(8). K49 est proche du squelette ssDNA (~ 4, 5 Å du squelette dC (10)) et peut contribuer à stabiliser le complexe protéine-ADN. e, Superposition entre TADAC-1.19 sans substrat (rose) et les monomères TadA*8.20 liés à l'ADNsb montrant que la substitution E27G place E25 dans TADAC-1.19 (orange) à une position similaire à E27 dans TadA*8.20 (vert) et induit un nouvelle conformation pour la boucle TADAC-1.19 entre α1 et β1 (orange). Les lignes pointillées indiquent les liaisons hydrogène.

Les structures cristallines de TadA * 8.20 et TADAC-1.17 ont été déterminées dans un complexe avec un substrat d'ADNss contenant l'analogue d'état de transition adénine 2-désoxy-8-azanebularine (d8Az) (Fig. 2, données étendues Figs. 1 et 2 et Figs supplémentaires 7–10). Ces deux structures sont très similaires et les quatre substitutions TADAC-1.17 (T17A, A48G, S82T et A142E) dérivées de l'évolution ne modifient pas radicalement la tolérance au substrat en modifiant la structure de la protéine ou le mode de liaison à l'ADNsb (Fig. 2a, b). Ces résultats sont en corrélation avec les réversions relativement faibles de CG à TA de TADAC-1.17 au site génomique 5 par rapport aux autres variantes de CABE-T1 (Fig. 4 supplémentaire). Nous émettons l'hypothèse que la chaîne latérale T82 près du résidu catalytique E59 (~ 4 Å) dans le site actif peut jouer un rôle dans l'augmentation de la désamination de la cytosine en modulant le transfert de protons vers ou depuis E59 (Fig. 2c). De plus, la liaison hydrogène entre E142 et R153 peut moduler la liaison de l'ADNss en stabilisant l'hélice α6, comme en témoignent les interactions entre F156 et dT (8) dans la structure TADAC-1.17 (Extended Data Fig. 2d).

Notamment, la structure cristalline de TADAC-1.14 contenant quatre substitutions (S2H, I49K, Y76I et G112H) révèle une différence structurelle dans la boucle entre les brins β4 et β5 (R107 à V130) sur le côté droit de la cavité du site actif (Fig. 2a, d, données étendues Fig. 3 et Fig. 11 supplémentaire). Cette boucle contient une substitution G112H qui modifie considérablement sa flexibilité et sa conformation par rapport à TadA * 8.20 en introduisant un résidu volumineux chargé positivement (Extended Data Fig. 3d). Ces changements structurels peuvent remodeler la cavité du site actif TADAC-1.14 pour accueillir à la fois les adénines et les cytosines (Fig. 2b et Extended Data Fig. 3f). En effet, une comparaison avec la structure de TadA * 8.20 lié au substrat d'ADNss montre que TADAC-1.14 peut engager l'ADNss différemment des variants de TadA avec une spécificité stricte pour l'adénine (Fig. 2b et Extended Data Fig. 3d). Nous émettons l'hypothèse que le résidu K49 dans TADAC-1.14 peut contribuer à la stabilisation des interactions protéine-ADN nécessaires à la liaison des substrats d'ADNsb contenant de la cytosine en raison de son repositionnement près de la nucléobase dC (10) (~ 4, 5 Å) (Fig. 2d et Données étendues Fig. .3e).

En plus des perturbations sur le côté droit de la cavité du site actif TADAC-1.14, l'évaluation de la structure TADAC-1.19 révèle que d'autres substitutions (E27G et I49N) de notre évolution ont provoqué des changements structurels majeurs sur le côté gauche de la cavité du site actif (Fig. 2a, b, données étendues Fig. 4 et Fig. 12 supplémentaire). Ces changements structurels sont probablement causés par la substitution E27G, qui entraîne la perte de liaisons hydrogène essentielles entre E27 et A48, I49 et G50. En raison de ces pertes de liaisons hydrogène, un changement de conformation s'est produit qui a réorienté le résidu E25 de TADAC-1.19 vers une position similaire qui était auparavant occupée par le résidu E27 dans TadA * 8.20 (Fig. 2e et Extended Data Fig. 4e). Le déplacement de E25 raccourcit l'hélice α1, modifie la longueur et la conformation de la boucle entre α1 et β1 (D24 à P29) contenant la substitution E27G et déplie les hélices α5 et α6 (Fig. 2a, e et Extended Data Fig. 4), remodelant la cavité du site actif TADAC-T1.19 et impactant potentiellement la liaison de la nucléobase cible au sein du site actif (Fig. 2b).

Informés par les structures cristallines décrites ici (Fig. 2), nous avons émis l'hypothèse que les changements structurels induits par des substitutions dans l'une des trois régions distinctes de TadA * 8.20 (E27G, S82T et G112H) étaient suffisants pour modifier la tolérance du substrat envers une cytosine (Fig. 3b). Ainsi, nous avons émis l'hypothèse que la combinaison des substitutions d'acides aminés des trois régions donnerait une amélioration synergique dans l'amélioration de l'édition de CG à TA. Pour tester cette hypothèse, huit sites dans la désaminase de CABE-T1 ont été sélectionnés pour la construction de la bibliothèque, y compris les substitutions aux positions 27, 49, 82, 112 et 142 discutées ci-dessus, plus deux sites sélectionnés de manière rationnelle sur ou à proximité du site actif de TadA* 8.20 (Fig. 3a, b) pour générer la première bibliothèque combinatoire contenant 199 variants (CABE-T3). Chaque membre de la bibliothèque avait 2 à 10 substitutions d'acides aminés (~ 5,3 en moyenne) dans la désaminase de CABE-T3, et la plupart des membres de la bibliothèque codaient au moins une substitution d'acide aminé dans ces trois régions (Fig. 3b, c et Figs supplémentaires 13 et 14). Nous avons identifié plusieurs variantes CABE-T3, notamment CABE-T3.1 et CABE-T3.155, qui démontrent une double activité d'édition de base C·G-to-T·A et A·T-to-G·C à des niveaux comparables à ou supérieur à ceux de CABE-T1 ou CABE-T2 (Fig. 3d et Fig. 2, 3 et 15 supplémentaires). Notamment, en criblant les membres de la bibliothèque directement dans les cellules de mammifères pour une activité d'édition de base relative, nous avons pu identifier des éditeurs avec une large gamme de rapports d'édition C·G à T·A et A·T à G·C, y compris plusieurs variantes (pour exemple, CABE-T3.55, T3.153 et T3.154) capables d'une édition robuste de C · G à T · A avec une édition minimale de A · T à G · C (Fig. 15 supplémentaire).

a, flux de travail de conception de bibliothèque combinatoire guidé par la structure. Pour plus de clarté, un seul monomère TadA * 8.20 (vert) avec ssDNA (jaune) est représenté. Les 23 sites de substitution identifiés lors du premier cycle d'évolution sont représentés par des sphères violettes dans le premier panneau. Sur la base des structures des variants de TADAC-1 (Fig. 2), 10 sites ont été sélectionnés, 8 de TADAC-1 (violet) plus 2 sélectionnés rationnellement (cyan), dans la boucle entre α1 et β1, hélice α2, site actif , la boucle entre les hélices β4 et β5 et α5, pour générer les variants TADAC-3 (deuxième panneau). Les sites de substitution dans TADAC-2 du deuxième cycle d'évolution sont représentés par des sphères violettes (mêmes sites identifiés dans TADAC-1) et orange (nouveaux sites) dans la structure TadA * 8.20 (troisième panneau). Pour générer les variantes TADC-1, huit substitutions du deuxième cycle d'évolution ont été ajoutées à TACAC-3.154 (quatrième panel). b, Autre vue de la structure TadA*8.20 (vert) montrant les sites de substitution sélectionnés pour générer TADAC-3 (sphères violettes et cyan). Les cercles en pointillés mettent en évidence les trois régions que nous avons supposées être critiques pour modifier la tolérance au substrat. c, Substitutions incorporées dans des TadA sélectionnés à partir du tour 1 de dépistage guidé par la structure (éditeurs CABE-T3 ; désaminases TADAC-3) et du tour 2 (éditeurs CBE-T1 ; désaminases TADC-1). Les substitutions incorporées dans TadA*8.20 par rapport à WT TadA sont surlignées en gris, et celles identifiées dans les campagnes d'évolution dirigée 1 et 2 sont surlignées en violet et orange, respectivement. Les valeurs de la dernière colonne représentent le nombre de substitutions ajoutées à chaque variante par rapport à WT TadA. d, Conversion maximale de C · G en T · A et A · T en G · C au niveau de locus génomiques ciblés dans des cellules HEK293T transfectées avec des plasmides d'expression humaine codant pour les éditeurs ou contrôles de bases CABE-T3 et CBE-T1. Les valeurs et les barres d'erreur reflètent la moyenne et l'écart-type de n = 3 (sites 1 à 4) ou 4 (sites 5 et 6) répétitions biologiques indépendantes réalisées à des jours différents.

Données source

Parallèlement, pour augmenter encore l'efficacité globale de l'édition C·G vers T·A et optimiser la spécificité du substrat vis-à-vis de la cytosine, nous avons pris CABE-T3.154, un éditeur de base montrant une forte préférence pour l'édition C·G vers T·A (Supplémentaire Figs. 14 et 15) et en couches combinatoires huit substitutions supplémentaires sélectionnées parmi les désaminases de CABE-T2 (Fig. 3 et Fig. 5 et 6 supplémentaires). Ces substitutions sont situées à proximité de la poche de liaison à l'ADN de la désaminase et leur inclusion dans les CABE-T2 a entraîné une augmentation globale de l'efficacité d'édition par rapport aux CABE-T1. Nous avons généré une bibliothèque de 56 membres (Fig. 16 supplémentaire), les avons criblés dans des cellules de mammifères via la transfection de plasmide et avons constaté que les 56 variantes obtenaient une édition substantielle de C · G à T · A (69, 2% en moyenne sur toutes les variantes) mais ne provoquaient que niveaux faibles à indétectables d'édition A·T à G·C (1,8 % en moyenne pour toutes les variantes sur tous les sites testés ; Fig. 3d et Fig. 17 et 18 supplémentaires). Par conséquent, nous désignons ces CBE contenant des TadA agissant sur les ADN cytosines (TADC) comme des CBE-T (Fig. 1d).

Après avoir observé l'activité robuste de nos CBE-T dans Hek293T, nous étions curieux d'évaluer comment les résultats de l'édition de la base de cytosine d'un sous-ensemble représentatif de nos 56 CBE-T par rapport à l'éditeur ABE-P48R-UGI15 précédemment publié sur six sites génomiques étant donné le degré élevé de substitution d'acides aminés par variant qui était nécessaire pour accéder à nos éditeurs (Fig. 1e et Fig. 16 supplémentaire). En effet, nous avons constaté que nos CBE-T surpassaient largement l'ABE-P48R-UGI en termes d'efficacité d'édition de C · G à T · A, de pureté relative du produit d'édition de base cytosine à adénine et de tolérance au substrat (Fig. 19 supplémentaire). Par rapport à ABE-P48R-UGI, les CBE-T n'étaient pas limités aux motifs TC, une limitation de l'éditeur ABE-P48R-UGI, et par conséquent, nous envisageons que les CBE-T rapportés ici soient plus universellement applicables (Fig supplémentaire 19) .

Pour déterminer si les TADC présents dans nos CBE-T étaient compatibles avec les enzymes Cas orthogonales, nous avons examiné l'activité d'édition de base d'un sous-ensemble représentatif de nos CBE-T, en remplaçant la nickase Cas9 de Streptococcus pyogenes D10A par la nickase Cas9 de Staphylococcus aureus (SaCas9, PAM : NGGRRT), montré précédemment pour avoir une compatibilité avec les éditeurs ABE dans les cellules de mammifères13,20. En effet, nous avons observé que les TADC sont des enzymes modulaires et sont compatibles avec SaCas9, mais ne suscitent que des efficacités d'édition modestes de C · G à T · A, similaires aux variantes BE4-SaCas9, sur les six sites génomiques testés (Fig. 20 supplémentaire).

Pour caractériser plus profondément les CABE-T et les CBE-T, nous avons synthétisé chimiquement des ARNg et des ARNm transcrits in vitro (IVT) codant pour un sous-ensemble représentatif d'éditeurs CABE-T et CBE-T et les avons transfectés dans des cellules HEK293T à des doses saturantes et sous-saturantes de ARNm codant pour l'éditeur (Fig. 4a, b). Pour les CABE-T2 et T3 testés, nous avons observé une augmentation moyenne de 1,53 fois et 1,03 fois de l'édition maximale de C·G à T·A et une amélioration moyenne de 2,18 fois et 1,67 fois de A·T à G ·C édition par rapport à SPACE et A&C-BEmax, respectivement (Fig. 21 supplémentaire). Sur tous les sites testés, nous n'avons observé aucune différence significative dans les résultats d'édition maximaux pour nos CBE-T caractérisés par rapport à BE4 (P = 0,30, test Wilcoxon-Mann-Whitney U bilatéral) et une différenciation remarquable des résultats d'édition par rapport à l'éditeur parent ABE8.20. Sur tous les sites testés, nos CBE-T ont entraîné une augmentation moyenne de 262 fois de l'édition C·G à T·A et une diminution concordante de 13 fois de l'édition A·T à G·C par rapport à ABE8.20 sur l'ensemble de l'édition. fenêtre (Fig. 4a–c et Fig. 2 et 3 supplémentaires).

a,b, Conversion maximale de C·G en T·A et A·T en G·C dans les cellules HEK293T transfectées avec l'ARNm codant pour les variants CBE-T principaux, plus les témoins, sur huit loci génomiques ciblés via des ARNg synthétiques à saturation (500 ng ARNm) (a) et conditions de sous-saturation (62,5 ng d'ARNm construit + 437,5 ng d'ARNm porteur non traduit) (b). c, Pourcentage de variation des taux d'édition de C·G à T·A (à gauche) et A·T à G·C (à droite) entre les variantes CBE-T1 et ABE8.20 à chaque position du site cible (PAM = positions 21–23) sur huit sites génomiques testés (sites 1 à 8 ; tableau supplémentaire 3). d, Conversion médiane de CG à T·A à chaque position de fenêtre cible comme spécifié sur l'axe des x, avec la numérotation des positions définie comme PAM désignée par les positions 21–23. Les valeurs des cartes de couleur ont été déterminées à partir de transfections d'ARNm dans des conditions de saturation. Les valeurs et l'erreur reflètent la moyenne et l'écart-type de n = 4 (conditions de saturation) ou 3 (conditions de sous-saturation) répétitions biologiques indépendantes réalisées à des jours différents.

Données source

Pour confirmer que nos CABE-T et CBE-T ont procédé par un mécanisme de désamination C-to-U, nous avons utilisé un test de désamination in vitro pour évaluer un sous-ensemble d'éditeurs en tant que complexes de ribonucléoprotéines (RNP) programmés par ARNg agissant sur l'ADNdb. substrat. Dans cet essai, les CABE-T et les CBE-T ont entraîné une désamination moyenne du substrat C-to-U d'environ 30 % après 24 h sur le site cible, contre environ 58 % pour BE4, sans A-to détectable. -I désamination pour les CBE-T évalués (Extended Data Fig. 5a). En plus de la désamination du substrat C vers U, les CABE-T ont également produit jusqu'à 35 % de désamination A vers I sur la cible. Au total, ces données fournissent un support biochimique orthogonal pour l'activité de désamination C-à-U de nos CABE et CBE utilisant des variantes de TadA. Dans une expérience distincte, la constante de vitesse de désamination apparente C à U (kapp, également appelée vitesse) de CBE-T1.14 RNP sur un substrat d'ADNdb a été mesurée à 0,014 ± 0,006 min−1, beaucoup plus lente que la vitesse de désamination A à I pour ABE8.20 RNP sur dsDNA (0, 17 ± 0, 06 min -1; données étendues Fig. 5b), tandis que leur taux de coupure pour le brin non cible est resté presque identique (données étendues Fig. 5b et données supplémentaires Fig. 22 et 23).

Malgré un taux de désamination plus lent in vitro, les CBE-T et BE4 ont produit une désamination totale comparable des sites cibles lors de transfections cellulaires menées sur 5 jours (Fig. 4a, b). Nous avons émis l'hypothèse que, avec suffisamment de temps, l'édition totale de C · G à T · A ou la désamination C à U par CBE-T atteindrait des niveaux comparables au BE4 cinétiquement plus rapide. En accord avec cette observation, l'extension du temps de désamination à 24 h in vitro a conduit à une désamination totale comparable de C à U par CBE-T et BE4 (données étendues Fig. 5a).

Nous avons ensuite évalué comment la dose d'ARNm délivrée affecte les résultats de l'édition des bases de cytosine en effectuant des transfections de cellules de mammifères à des niveaux de sous-saturation d'ARNm (Fig. 24 supplémentaire). Dans ces conditions, les CBE-T ont conservé une efficacité d'édition maximale de 55 % à 70 % par rapport aux conditions de saturation et ont obtenu des performances similaires ou meilleures par rapport aux CBE basés sur APOBEC sur une base par site. Les éditeurs représentatifs de CBE-T CBE-T1.14, CBE-T1.46 et CBE-T1.52 ont atteint des taux moyens maximaux de C·G à T·A de 66 % sur huit sites génomiques, contre une moyenne de 59 % de C·G à T · A atteint par BE4, et une moyenne de ~ 35% C · G à T · A atteint par YE1 (Fig. 4b et Supplémentaire Fig. 25). Nous constatons également que les CBE-T provoquent des niveaux similaires de formation d'indel et de modifications C- à non-T (Fig. 26 supplémentaire et données étendues Fig. 6a). La pureté du produit et les résultats indel comparables par rapport aux CBE utilisant des cytidine désaminases sont probablement dus aux mécanismes de réparation génomique de la lésion de l'uracile, qui ne dépendent pas de la façon dont la lésion a été créée.

Comme les ABE, nous montrons que les CABE-T et les CBE-T ont une fenêtre d'édition plus étroite par rapport à BE4, avec des modifications de base limitées approximativement aux positions 3 à 8 dans le protospacer (Fig. 4c et Supplémentaire Fig. 27). De plus, nous observons que les CBE-T, par rapport aux CBE basés sur APOBEC, génèrent moins de mutations de spectateur car il existe en moyenne moins de C dans la fenêtre ciblable rétrécie de l'éditeur (Fig. 4d et Fig. 27 supplémentaire). Pour les applications thérapeutiques, nous notons que cette augmentation de la précision de l'édition de base est une caractéristique attrayante lors de l'examen des cibles de la maladie. De même, alors que BE4 a été caractérisé pour agir sur l'ADNdb à proximité du protospacer en raison des tolérances faibles mais détectables d'APOBEC pour l'ADNdb en tant que substrat, nous n'observons pas cette activité d'édition d'ADNdb avec nos CBE-T (Extended Data Fig. 6b).

Pour caractériser l'édition hors cible de l'ADN gRNA-dépendante des CBE-T et CABE-T, nous avons effectué des transfections d'ARNm dans des cellules avec plusieurs ARNg pour lesquels le profil hors cible de l'ARNg a été précédemment caractérisé avec Cas9 et les éditeurs de base1,12,13 ,21. Nous constatons que les CBE-T et les CABE-T ont des fréquences d'édition de bases hors cible dépendantes de l'ARNg plus faibles sur tous les sites examinés par rapport à BE4 et BE4-PpAPOBEC, avec des diminutions de 3,06 fois et 3,53 fois du maximum C·G à T· Un montage, respectivement, et des niveaux similaires par rapport à celui des éditeurs hors cible atténués YE1 et BE4-PpAPOBEC-H122A (Extended Data Fig. 7 et Supplementary Figs. 28 et 29).

Pour évaluer le rapport entre l'édition de base indépendante du guide causée par les CABE-T et les CBE-T par rapport à BE4 (pour l'édition C à T) ou ABE8.20 (pour l'édition A à G), nous avons effectué un séquençage du génome entier (WGS) de cellules expansées traitées avec de l'ARNm codant pour un éditeur de base et quantifié le taux de mutation relatif de C·G à T·A ou A·T à G·C comme décrit précédemment13 (Fig. 30 supplémentaire). Nous avons constaté que les CABE-T et les CBE-T ne provoquaient aucune élévation significative des SNV C·G à T·A à l'échelle du génome par rapport aux échantillons non traités, un schéma qui a également été signalé pour YE1 et BE4-ppAPOBEC-H122A (tous P > 0,05 ; test U unilatéral de Mann-Whitney). En revanche, BE4 a provoqué un enrichissement moyen de 3,8 fois pour les modifications C·G à T·A par rapport au contrôle (P = 7,770e−05 ; test Mann−Whitney U unilatéral) et BE4-PpAPOBEC a causé 1,5 fois la moyenne pli d'enrichissement de C·G en T·A (P = 0,00147 ; test U unilatéral de Mann−Whitney) (Fig. 5a)6,13. Les CABE-T et les CBE-T n'ont pas non plus provoqué d'élévation significative des SNV génomiques A · T à G · C (tous P> 0, 05; test Mann − Whitney U unilatéral) (Fig. 5b) et désamination stochastique à l'échelle du génome était impossible à distinguer des cellules non traitées.

a, Odds ratio plot pour les mutations C à T par rapport à tous les autres types de mutations dans les cellules éditées avec CABE-T3.155, CABE-T2.19, CBE-T1.14, CBE-T1.46 et CBE-T1.52, BE4, YE1, BE4-PpAPO et BE4-PpAPO-H122A par rapport aux cellules à expansion clonale non traitées, avec des barres noires représentant l'odds-ratio médian pour ce groupe de traitement (P = 0,8359, 0,7473, 0,9476, 0,8089, 0,9751, 7,770 × 10− 5, 0,9859, 0,00148 et 0,7473, respectivement ; test U de Mann-Whitney unilatéral). Toutes les n = 8 populations de cellules expansées unicellulaires biologiquement indépendantes sont présentées pour chaque condition. b, Odds ratio plot pour les mutations A à G par rapport à tous les autres types de mutations dans les cellules éditées avec CABE-T33.155, CABE-T2.19, CBE-T1.14, CBE-T1.46 et CBE-T1.52 et ABE8.20 par rapport aux cellules expansées par clonage non traitées, avec des barres noires représentant le rapport de cotes médian pour ce groupe de traitement (P = 0,1641, 0,4796, 0,5204, 0,8607, 0,5204 et 0,2527, respectivement ; test Mann-Whitney U unilatéral). Toutes les n = 8 populations de cellules expansées unicellulaires biologiquement indépendantes sont présentées pour chaque condition. c, Cinétique in vitro de la désamination A-to-I ou C-to-U du même substrat présenté comme ssDNA à BE4, ABE8.20 et CBE-T1.14 en l'absence d'ARNg. Les constantes de vitesse apparente de pseudo-premier ordre (kapp) obtenues par ajustement à un seul ajustement exponentiel sont rapportées (moyenne ± sd, n = 3 répétitions indépendantes). Voir les données de source de gel.

Données source

Pour éclairer les différences cinétiques dans la désamination de l'ADNss, nous avons mesuré les constantes de vitesse de désamination apparente de pseudo-premier ordre (kapp) des éditeurs de base dépourvus d'ARN guide sur le substrat d'ADNss in vitro. Nous avons mesuré que le taux de désamination C en U par BE4 était de 0,78 ± 0,02 min−1, ~ 11 fois plus élevé que le taux de désamination A en I provoqué par ABE8.20 (kapp = 0,071 ± 0,005 min− 1) pour le même substrat d'ADNsb (Fig. 5c et Fig. 22 supplémentaire). Cette différence de taux de désamination de l'ADNss confirme en outre les observations précédentes et les observations rapportées ici, selon lesquelles les CBE à base d'APOBEC peuvent désaminer de manière stochastique les régions simple brin du génome. Nous avons constaté que CBE-T1.14 catalysait la désamination C à U avec un kapp de 0,060 ± 0,006 min−1, un taux indiscernable de celui mesuré pour la désamination A à I par ABE8.20 (Fig. 5c et Fig. 22) sur le même substrat ssDNA. Notamment, le résidu catalytique reste inchangé entre ABE8.20 et CBE-Ts (Figs. 2c, 3a et Extended Data Figs. 1d, 2, 3c).

Les CBE-T ont un potentiel substantiel d'utilisation thérapeutique dans la réversion et le silençage génique en raison de leurs propriétés améliorées par rapport aux CBE utilisant des cytidine désaminases naturelles. Pour évaluer le potentiel d'édition des CBE-T dans les cellules primaires, nous avons d'abord évalué la capacité des CBE-T à faire taire l'expression de PCSK9, une cible pertinente pour le traitement thérapeutique de l'hypercholestérolémie22, dans un système de coculture d'hépatocytes humains primaires à longue durée de vie23. Le knock-down ou le knock-out du gène PCSK9 entraîne une baisse des taux de cholestérol des lipoprotéines de basse densité (LDL) dans le sang et réduit par la suite le risque de maladie cardiaque24,25. En effet, des résultats prometteurs avec le ciblage du site d'épissage de PCSK9 ont été obtenus avec ABE8.8 in vivo26. De même, nous avons constaté que la transfection de l'ARNm de CBE-T1.46 avec un guide synthétique ciblant le gène PCSK9 dans les hépatocytes humains primaires atteignait des efficacités d'édition de base C · G à T · A comparables ou supérieures à BE4 sur deux sites cibles PCSK9 qui introduisent le codon stop Q555X ou perturber l'épissage du pré-ARNm au niveau de l'exon 4 (épissage E4; Fig. 6a). L'évaluation des niveaux de protéine PCSK9 via ELISA montre l'inactivation de PCSK9 par CBE-T1.46 à des niveaux comparables ou supérieurs à BE4 sur les deux sites cibles testés (Fig. 6b). De manière concordante, des augmentations du récepteur LDL total (LDLR) ont été observées pour les échantillons traités au CBE-T1.46 sur les deux sites (P <0,05, <0,01), démontrant le potentiel du CBE-T à générer un effet phénotypique thérapeutiquement pertinent (Fig. 6c).

a, Résultats de l'édition de gènes d'hépatocytes humains primaires transfectés avec des ARNm codant pour CBE-T1.46 et BE4 sur trois sites du gène PCSK9 (à gauche, P = 0,2882 (NS) ; à droite, P = 0,0017 (double astérisque)). Modification positionnelle dans le protospacer indiqué. b, Évaluation du changement relatif de la sécrétion de PCSK9 entre le jour 9 (point de temps de collecte) et le jour 0 (point de temps de transfection) par ELISA. Le site PCSK9 ciblé est indiqué sur l'axe des x. Les valeurs P sont les suivantes : Q555X versus non traité, P = 0,001001 (double astérisque) ; Épissage E4 versus non traité, P = 0,001295 (double astérisque). c, Changement relatif du LDL-R présent dans le surnageant entre le jour 9 et le jour 0 évalué par ELISA. Les valeurs P sont les suivantes : Q555X versus non traité, P = 0,001116 (double astérisque), épissure E4 versus non traité, P = 0,009481 (double astérisque). d, Efficacité de l'édition de gènes à partir de criblages d'ARNsg dans des lymphocytes T humains primaires à l'aide de CBE-T. L'étiquette de l'axe X indique le gène ciblé et la base cible dans le sgRNA. e,f, pourcentage de conversion de CG en TA (e) et de perte de protéines de surface (f) obtenus par chaque éditeur de base ou contrôle dans des lymphocytes T humains primaires édités en multiplex. Les données primaires sur les hépatocytes ont été générées à partir de n = 3 (échantillons « aucun »/non traités) ou 4 (échantillons BE4 et CBE-T1.46) réplicats biologiques indépendants. Les données sur les lymphocytes T ont été générées à partir de n = 2 donneurs indépendants. Le cas échéant, la signification statistique a été calculée via des tests t bilatéraux non appariés : NS, P ≥ 0,05 ; *P < 0,05 ; **P < 0,01.

Données source

Nous avons ensuite évalué l'application des CBE-T à l'ingénierie des lymphocytes T thérapeutiques. Les thérapies cellulaires T autologues dérivées de cellules T exprimant TCRαβ sont efficaces dans le traitement de certains cancers, bien que la fabrication de ces thérapies cellulaires par patient puisse entraîner des produits incohérents, un coût élevé des marchandises et des retards importants dans le traitement des patients. L'édition de gènes peut être utilisée pour créer des thérapies cellulaires T universellement compatibles, générées à partir de donneurs uniques pour le traitement de nombreux patients27. Les thérapies à cellules T universellement compatibles nécessitent un silençage multigénique pour éliminer l'expression du récepteur des cellules T afin de réduire le potentiel de maladie du greffon contre l'hôte (GvHD) et des stratégies d'édition pour réduire ou éliminer le rejet par l'hôte des cellules T allogéniques28. Pour déterminer si les CBE-T pouvaient être utilisés pour l'édition des lymphocytes T, nous avons électroporé des cellules T avec de l'ARNm codant pour les CBE-T et des ARNg ciblant les gènes codant pour les composants du récepteur des lymphocytes T, B2M ou CIITA et avons constaté que les CBE-T produisaient des résultats comparables ou uniquement efficacités d'édition légèrement inférieures à celles des contrôles BE4 (Fig. 6d). L'édition CBE-T multiplexée a démontré des efficacités d'édition comparables à celles de l'édition en simple plex, ce qui a entraîné des niveaux correspondants de suppression de protéines (Fig. 6e, f et Fig. 31 supplémentaires), démontrant le potentiel de la plate-forme CBE-T pour thérapeutique ingénierie cellulaire.

Nous décrivons ici le développement de deux familles d'éditeurs de bases, les CABE-T et les CBE-T, qui utilisent des variantes de TadA pour catalyser la désamination des cytosines avec rétention (CABE-T) ou perte (CBE-T) de la désamination de l'adénine.

Au cours de dix cycles d'évolution dirigée et de cycles supplémentaires de conception guidée par la structure, TadA a mûri pour inclure plus de 29 substitutions dans nos CBE-T les plus sophistiqués (Fig. 3c). Grâce à la cristallographie aux rayons X, nous montrons comment l'accumulation de substitutions a un impact sur la forme de la cavité du site actif et peut contribuer à l'hébergement de la cytosine en tant que substrat et au déplacement ultérieur de la spécificité vers la désamination C-à-U. Les structures développées ici éclairent comment les substitutions d'acides aminés dans TadA influencent les résultats d'édition de gènes observés dans les cellules.

Les CABE-T et CBE-T rapportés ici sont des éditeurs de base de précision avec des résultats hors cible d'ADN indépendants du guide très atténués, moins de modifications de spectateurs et moins d'ADN hors cible dépendant du guide par rapport aux CBE précédemment rapportés en raison de la différence de cinétique de désamination de l'ADNsb par le variant TadA utilisé dans nos constructions CBE-T. Les CBE-T et CABE-T basés sur TadA conservent une activité d'édition élevée sur la cible, permettant des efficacités d'édition de gènes élevées à la fois dans les applications simples et multiplexées.

Enfin, nous montrons que nos CBE-T sont actifs dans des types de cellules thérapeutiquement pertinents, y compris les hépatocytes primaires et les lymphocytes T primaires, avec des résultats d'édition similaires ou supérieurs à ce qui peut être obtenu avec BE4. Nous démontrons la capacité des CBE-T à éditer des sites cibles dans le locus PCSK9 pour réduire les niveaux de protéine PCSK9 sécrétée, ainsi qu'à atteindre des niveaux élevés d'édition multiplexée sur des cibles de cellules T pertinentes pour la génération de cellules CAR-T allogéniques.

En résumé, le développement de TadA pour une utilisation dans l'édition de base de cytosine hautement efficace représente une avancée significative dans le développement des CBE en tant qu'outils thérapeutiques. Avec les ABE, les CABE-T et les CBE-T permettent l'installation programmable de toutes les mutations de transition de l'ADN dans les cellules vivantes, séparément ou simultanément, grâce à l'utilisation de désaminases TadA développées en laboratoire et hautement conçues et étendent par conséquent les applications thérapeutiques potentielles de la base de cytosine édition.

Toutes les méthodes de biologie moléculaire et les étapes de clonage ont été effectuées comme décrit précédemment13, y compris l'utilisation de l'enzyme USER (New England Biolabs, NEB, M5505L), Phusion U DNA Polymerase Green Multiplex PCR Master Mix (Thermo Fisher Scientific, F564L), Q5 Hot Start High -Fidelity 2X Master Mix (NEB, M0494L), cellules compétentes Mach T1 (Thermo Fisher Scientific, C8681201) et kits ZymoPURE II Plasmid Midiprep (Zymo Research Corporation, D4201) conformément aux protocoles des fabricants. Les séquences d'acides aminés pour les éditeurs de base mis en évidence dans cette étude peuvent être trouvées dans les séquences supplémentaires 3–31. Les séquences d'ARNsg utilisées pour cibler les sites génomiques se trouvent dans le tableau supplémentaire 3. Les CABE-T et CBE-T représentatifs utilisés dans cette étude ont été déposés sur Addgene.

Des bibliothèques synthétiques pour les cycles d'évolution dirigés un et deux ont été obtenues auprès de Ranomics avec les spécifications suivantes : bibliothèque TadA*8.20 du premier cycle d'évolution - chaque position d'acide aminé de la séquence TadA*8.20 (de ABE8.20) doit être représentée par les 20 acides aminés substitutions à une fréquence de 1 à 3 substitutions par membre de la bibliothèque (~ 10 millions de membres). Cette bibliothèque excluait toutes les séquences stop et n'utilisait qu'un seul codon par acide aminé. Cette bibliothèque synthétique a été combinée avec une bibliothèque randomisée générée avec une PCR sujette aux erreurs en utilisant TadA * 8.19 (réf. 13) comme modèle, comme indiqué précédemment dans la réf. 12. Évolution autour de deux bibliothèques synthétiques - chaque position d'acide aminé de la séquence TADAC1.02 doit être représentée par les 20 substitutions d'acides aminés via à une fréquence de 2 à 3 substitutions par membre de la bibliothèque (~ 10 millions de membres). Ces bibliothèques ont été clonées dans un plasmide d'expression bactérien contenant du Cas9 mort (dCas9 D10A et H840A) ainsi que des ARNg ciblant le gène de résistance au chloramphénicol par clonage USER.

L'évolution dirigée de la bibliothèque TadA8.19 et TadA8.20 (tour d'évolution dirigée) et de la bibliothèque TADAC1.02 (tour d'évolution dirigée 2) a été réalisée comme décrit précédemment dans la réf. 13 avec les modifications suivantes : les bibliothèques de diverses variantes de TadA* désaminase qui sont incluses dans un plasmide bactérien contenant l'architecture de l'éditeur TadA*-dCas9-UGI ont été mises au défi d'annuler les modifications du gène de résistance au chloramphénicol pour survivre au traitement avec des doses létales d'antibiotiques. Dans le premier cycle d'évolution dirigée, la bibliothèque d'évolution était une combinaison d'une bibliothèque ABE8.19m TadA* sujette aux erreurs et d'une bibliothèque synthétique ABE8.20m TadA* où chaque position d'acide aminé est représentée par les 20 substitutions à une fréquence de 1 –3 substitutions par membre de la bibliothèque. Pour surmonter le défi antibiotique, 2 réversions C-to-T (réversion proline et réversion His du site actif) ont été nécessaires. Dans le deuxième cycle d'évolution, une bibliothèque synthétique de CABE-T1.2 a été utilisée, qui a été générée avec les spécifications de la bibliothèque ABE8.20 TadA * mais avec 2 à 3 substitutions par membre de la bibliothèque. Pour surmonter le défi antibiotique, les mêmes 2 réversions C-à-T plus 2 réversions du codon A-à-G STOP étaient nécessaires.

Les cellules HEK293T (ATCC, CRL-3216) ont été cultivées dans du DMEM + GlutaMAX (Gibco, 10569) additionné de 10 % (vol/vol) de sérum bovin fœtal (Gibco, 10437) à 37 °C et 5 % de CO2 conformément aux protocoles standard de l'ATCC et comme décrit précédemment.13

Pour toutes les transfections, les cellules HEK293T ont été ensemencées à une densité de 3, 0 × 105 cellules par puits dans des plaques à 48 puits revêtues de poly-d-lysine BioCoat (Corning, 356509) 16 à 22 h avant la transfection. Les transfections plasmidiques ont été réalisées à l'aide de Lipofectamine 2000 (Invitrogen, 11668-019) comme décrit précédemment.13 Les transfections avec l'ARNm ont été réalisées à l'aide de Lipofectamine MessengerMAX conformément aux protocoles du fabricant, avec les spécificités suivantes : conditions) d'ARNm codant pour l'éditeur ou le contrôle et 100 ng d'ARNg synthétique ont été combinés dans un volume total de 12,5 μl de milieu réduit en sérum OptiMEM (Gibco, 31985). Un mélange MessengerMAX de 12,5 μl 1: 12, 5 (Lipo: OptiMEM) a ensuite été ajouté à la solution d'ARNm / ARNg, et tout le contenu a été laissé au repos à température ambiante pendant 15 min. Pour les transfections d'ARNm dans des conditions de sous-saturation, 437,5 ng d'ARNm porteur ont également été ajoutés pour maintenir des quantités équivalentes de matériel transfecté. L'ensemble du mélange de 25 μl a ensuite été utilisé pour traiter les cellules HEK293T préensemencées. Les séquences d'ARNsg utilisées dans cette étude sont spécifiées dans le tableau supplémentaire 3. Les ARNg synthétiques pour les transfections d'ARNm ont des modifications d'extrémité 5'/3' comme décrit précédemment.13

Après 4 jours d'incubation, l'ADNg des cellules HEK293T a été récolté à partir des cellules en utilisant 100 μl de tampon d'extraction d'ADN Quick Extract (Lucigen, QE09050) conformément aux protocoles du fabricant. Pour les lymphocytes T allogéniques, 50 μl de tampon d'extraction d'ADN Quick Extract ont été utilisés sur 1 × 105 cellules 5 à 6 jours après les transfections. Des échantillons d'ADN génomique provenant d'échantillons de cellules de mammifères ont été amplifiés avec des amorces pour l'amplification d'ADN génomique spécifique au site contenant des séquences adaptatrices compatibles avec le système TruSeq HT d'Illumina (séquence de lecture d'adaptateur 1, AGATCGGAAGAGCACACGTCTGAACTCCAGTCA ; lecture d'adaptateur 2, séquence AGATCGGAAGAGCGTCGTTGTAGGGAAAGAGGTGT). Les séquences de ces amorces sont répertoriées dans le tableau supplémentaire 4. Plus précisément, 2 μl d'ADNg ont été ajoutés à un mélange de réaction PCR contenant Phusion U Green Multiplex Master Mix (Thermo Fisher Scientific, F564L) et 0, 5 μM de chaque amorce directe et inverse. Ces amplicons ont ensuite été codés à barres à l'aide du Q5 Hot Start High-Fidelity 2X Master Mix, où 2 μl d'amplicon du premier cycle de PCR ont été ajoutés au master mix contenant 0,5 μM de chaque combinaison unique d'amorce de code à barres avant et inverse. Les conditions de thermocyclage sont les suivantes : 95 °C × 2 min de dénaturation initiale ; 95 °C × 15 s de cycle de dénaturation ; 62 °C × 20 s de recuit ; 72 ° C × 20 s d'extension, avec des répétitions de cycle de 30 pour la génération initiale d'amplicon et 10 pour le codage à barres. Les amplicons à code-barres ont été purifiés, la taille sélectionnée par électrophorèse sur gel et le gel extrait à l'aide du kit d'extraction de gel Qiaquick (Qiagen, 28706 × 4), et les concentrations d'ADN résultantes ont été évaluées avec un spectrophotomètre NanoDrop 1000 (Thermo Fisher Scientific).

Toutes les données NGS d'amplicon ciblées ont été analysées à l'aide des méthodes décrites précédemment, y compris l'utilisation des outils/logiciels suivants : trimmomatic (v0.39), bowtie2 (v2.35), samtools (v1.9) et bam-readcounts (v0.8 ).13

Les fichiers FASTQ ont été alignés sur le génome humain (Gencode GRCh38v31 primary assembly) à l'aide de BWA mem2 (bwa-mem2-2.2.1). Les alignements ont été triés par coordonnées, fusionnés si nécessaire, et les doublons ont été marqués à l'aide de Picard (v2.21.7) sur les paramètres par défaut. Le recalibrage du score de qualité de base a ensuite été effectué à l'aide de GATK (v4.1.4.1) pour créer un fichier BAM à entrer dans LoFreq (v2.1.5) pour l'appel de variantes. L'échantillon en vrac 1 a été utilisé comme échantillon normal et chaque cellule expansée par clonage a été analysée comme un échantillon de tumeur séparé pour identifier les mutations somatiques spécifiques à chaque cellule. LoFreq a été exécuté avec l'indicateur '–min-cov 10' pour exiger un minimum de dix fois la couverture sur le site de la variante et les variantes somatiques ont été analysées à partir du fichier de sortie somatic_final_minus-dbsnp.snvs, pour supprimer les variantes courantes qui étaient probablement des faux positifs.

Pour les parcelles de rapport de cotes, une seule cellule représentative des cellules expansées par clonage non traitées est nécessaire comme point de référence pour comparer avec les cellules traitées et non traitées pour les désaminations C-to-T et A-to-G. Cette cellule a été sélectionnée en ordonnant les cellules non traitées par proportion de mutations A à G et proportion de mutations C à T et en sélectionnant la cellule la plus proche de la médiane pour les deux paramètres. N1 était en position 5/8 pour les mutations C à T et en position 3/8 pour les mutations A à G, ce qui en fait le meilleur candidat pour la cellule de référence dans les traitements CABE-T et CBE-T.

La protéine TadA * 8.20 a été clonée dans un vecteur pET51b + avec des étiquettes His et SUMO à l'extrémité N-terminale et exprimée dans des cellules E. coli BL21 Star (DE3) (NEB, C2527I) dans du milieu LB. Les cultures cellulaires ont été cultivées à 37 ° C avec agitation à 240 tr / min et l'expression des protéines a été induite par 0, 5 mM d'IPTG lorsque la DO600 a atteint 0, 6. La culture cellulaire a été incubée sous agitation à 18°C ​​pendant une nuit. Les cellules récoltées ont été lysées par un homogénéisateur haute pression dans un tampon de lyse (25 mM Bis-Tris, 500 mM NaCl, 1 mM TCEP, 10 % (vol/vol) glycérol, pH 6,0 et 1 mM PMSF), et le lysat cellulaire a été clarifié par ultracentrifugation. Les lysats clarifiés ont été chargés sur une résine d'agarose Ni-NTA par liaison par lots pendant 1 h à 4 ° C. La résine a été lavée avec un tampon de lyse avec 20 mM d'imidazole sur une colonne à écoulement par gravité suivi d'une élution avec le tampon de lyse additionné d'imidazole 50/100/250 mM. L'échantillon élué a été incubé avec Ulp1 tout en étant dialysé dans 25 mM de Bis-Tris, 300 mM de NaCl, 1 mM de TCEP, 10 % (vol/vol) de glycérol et pH 6,0 pendant une nuit. L'échantillon dialysé a été chargé sur une résine Ni-NTA pour éliminer la protéine non clivée et Ulp1. L'écoulement de Ni-NTA inverse a été chargé sur une colonne HP d'héparine de 5 ml (Cytiva) et élué à l'aide d'un gradient de NaCl de 0 à 2 M. Les fractions contenant la protéine TadA * 8.20 ont été purifiées davantage par chromatographie d'exclusion stérique sur Superdex75 10/300 dans du Bis-Tris 25 mM, du NaCl 300 mM, du TCEP 1 mM, du glycérol à 10 % (vol/vol), pH 7,0. La protéine TADAC-1.14 a été exprimée avec l'étiquette His N-terminale dans le vecteur pET51b + et purifiée comme décrit ci-dessus, sauf que les étapes de clivage de l'étiquette Ulp1 et de Ni-NTA inverse ont été omises. TADAC-1.17 et TADAC-1.19 ont été clonés dans le vecteur pD881 (ATUM) avec His-tag N-terminal et SUMO tag et exprimés dans des cellules E. coli BL21 (NEB). L'expression des protéines a été induite par du rhamnose à 0, 2% (wt / vol) à une DO600 de 0, 6, suivie d'une incubation à 37 ° C pendant 4 h. La purification a été effectuée comme décrit ci-dessus. Ces variants de désaminase ont été utilisés pour des études de cristallographie aux rayons X. Toutes les protéines de l'éditeur de bases CBE-T utilisées pour les études biochimiques ont été exprimées et purifiées comme décrit ci-dessus avec de légères modifications.

La condition de cristallisation de TadA * 8.20 avec ssDNA contenant l'analogue d'adénine 2-désoxy-8-azanebularine (d8Az), 5′-G(1)C(2)T(3)C(4)G(5)G(6 )C(7)T(8)d8Az(9)C(10)G(11) G(12)A(13)-3′, a été identifié et optimisé à l'aide d'un robot Mosquito (SPT LabTech) à 20 °C. Les gouttes ont été préparées en mélangeant 1 μl de protéine plus une solution d'ADNss (0,15 mM TadA * 8,20 dans 25 mM Bis-Tris, 300 mM NaCl, 1 mM TCEP, 10 % (vol/vol) glycérol, pH 7 et 0,22 mM ssDNA avec d8Az ) et 1 μl de solution réservoir (27–29 % (vol/vol) PEG 3 350, acétate d'ammonium 0,22–0,26 M, Tris 0,1 M pH 8,5), et équilibré contre 70 μl de solution réservoir. Les cristaux ont été transférés dans une solution cryoprotectrice (15 % (vol/vol) glycérol, 29 % (vol/vol) PEG 3 350, acétate d'ammonium 0,26 M, Tris 0,1 M pH 8,5) et refroidis par flash dans de l'azote liquide.

La condition de cristallisation de TADAC-1.17 avec ssDNA contenant l'analogue d'adénine 2-désoxy-8-azanebularine (d8Az), 5′-G(1)C(2)T(3)C(4)G(5)G(6 )C(7)T(8)d8Az(9)C(10)G(11) G(12)A(13)-3′, a été identifié et optimisé à l'aide d'un robot Mosquito (SPT LabTech) à 20 °C. Les gouttes ont été préparées en mélangeant 1 μl de protéine plus une solution d'ADNsb (TADAC-1.17 0,15 mM dans Bis-Tris 25 mM, NaCl 300 mM, TCEP 1 mM, 10 % (vol/vol) glycérol, pH 7 et ADNss 0,22 mM avec d8Az ) et 1 μl de solution réservoir (4–8 % (vol/vol) PEG 3 350, 8–10 % Tacsimate pH 6) et équilibré par rapport à 200 μl de solution réservoir. Les cristaux ont été transférés dans une solution cryoprotectrice (12 % (vol/vol) PEG 3 350, 10 % (vol/vol) Tacsimate pH 6, 25 % (vol/vol) glycérol) et refroidis par flash dans de l'azote liquide.

La condition de cristallisation de TADAC-1.14 sans ssDNA (TADAC-1.14-holo) a été identifiée et optimisée à l'aide d'un robot Mosquito (SPT LabTech) à 20 ° C. Les gouttes ont été préparées en mélangeant 1 μl de solution protéique (0,18 mM TADAC-1.14 dans 25 mM Bis-Tris, 450 mM NaCl, 1 mM TCEP, 10 % (vol/vol) glycérol, pH 7) et 1 μl de solution réservoir ( 1,8–2,0 M sulfate d'ammonium, 0,1 M HEPES pH 7,5) et équilibré contre 200 μl de solution réservoir. Les cristaux ont été transférés dans une solution cryoprotectrice (sulfate d'ammonium 1,8 M, HEPES 0,1 M pH 7,5, glycérol à 20 % (vol/vol)) et refroidis instantanément dans de l'azote liquide.

La condition de cristallisation de TADAC-1.19 sans ssDNA (TADAC-1.19-holo) a été identifiée et optimisée à l'aide d'un robot Mosquito (SPT LabTech) à 20 ° C. Les gouttes ont été préparées en mélangeant 1 μl de solution protéique (0,3 mM TADAC-1.19 dans 25 mM Bis-Tris, 300 mM NaCl, 1 mM TCEP, 10 % (vol/vol) glycérol, pH 7) et 1 μl de solution réservoir ( 6–12 % (vol/vol) PEG 3 350, 0,3–0,5 M citrate d'ammonium tribasique pH 7,0) et équilibré contre 200 μl de solution réservoir. Les cristaux ont été transférés dans une solution cryoprotectrice (16 % (vol/vol) PEG 3 350, 0,6 M citrate d'ammonium tribasique pH 7,0, 20 % (vol/vol) glycérol) et refroidis instantanément dans de l'azote liquide.

Les collectes de données ont été effectuées sur la ligne de lumière Frontier Microfocusing Macromolecular Crystallography (FMX) de la National Synchrotron Light Source II ou la ligne de lumière ID30B de l'European Synchrotron Radiation Facility, ou la ligne de lumière BL13-XALOC de l'ALBA Synchrotron ou la ligne de lumière P13 de l'EMBL Hamburg à l'anneau de stockage PETRA III (DESY). Les données de diffraction ont été traitées à l'aide de XDS29 et mises à l'échelle à l'aide d'AIMLESS30. Les structures cristallines de TadA * 8.20, TADAC-1.17, TADAC-1.14 et TADAC-1.19 sans ou avec ssDNA ont été déterminées par des techniques de remplacement moléculaire mises en œuvre dans Phaser31. Pour la structure TadA*8.20, les coordonnées de la structure E. coli TadA (Protein Data Bank (PDB) code : 1Z3A)32 ont été utilisées pour obtenir les phases initiales. Pour les structures TADAC-1.17, TADAC-1.14 et TADAC-1.19, les coordonnées du TadA*8.20 (cette étude) ont été utilisées pour obtenir les phases initiales. Après le remplacement moléculaire, un recuit simulé a été effectué dans phenix.refine33 pour éliminer le biais du modèle. Les modèles ont été affinés par des cycles itératifs de construction de modèles et l'ajout de molécules d'eau à l'aide de Coot34. Le raffinement des structures dans phenix.refine a utilisé des contraintes de symétrie non cristallographiques, un raffinement de position et de facteur B et TLS (translation, libration et vis) (sauf pour TADAC-1.17 et TADAC-1.14). Les cristaux de TadA * 8.20 et TADAC-1.17 sont maclés de manière méroédrique avec des fractions de macles de 0, 375 et 0, 246 par analyses de Britton (phenix.xtriage), respectivement, et la loi de macles -h, -k, l a été utilisée pour le raffinement. La collecte de données et les statistiques de raffinement sont résumées dans le tableau supplémentaire 2. Les résidus et nucléotides visualisés dans les structures, de 167 résidus et 13 nucléotides, sont répertoriés dans le tableau supplémentaire 5. Les figures ont été créées avec le logiciel PyMol (Schrodinger, 2010. Le PyMOL Molecular système graphique, version 2.4.1.).

Le sgRNA (mG*mA*mA*CACAAAGCAUAGACUGCGUUUUAGAGCUAGAAAAUAGC

AAGUUAAAAUAAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCU*mU*mU*mU ; modifications : m, 2′-O-méthyl et *, liaison phosphorothioate) a été synthétisé chez Agilent Technologies et Integrated DNA Technologies (IDT). L'ADN du substrat a été synthétisé à IDT : un brin d'ADN subissant une désamination (TTCGGTGGCTCCGTCCGTGAACACAAAGCATAGACTGCCGGCGTTTTGGTTGCTCTTCG) a été marqué avec le fluorophore 5' ATTO-647 et un brin d'ADN complémentaire subissant une entaille par D10A-Nickase (CGAAGAGCAACCAAAACGCCGGCAGTCTATGCTTTGTGTTCACGGACGGAGCCACCGAA) a été marqué avec Fluorophore 5′ 6-FAM. Pour la désamination indépendante de l'ARN guide, l'ADN simple brin marqué ATTO-647 a été utilisé tel quel. Pour la désamination dépendante de l'ARN guide, le substrat d'ADNdb a été préparé en annelant les deux brins, avec un double excès du brin subissant une coupure (1: 2 nmol). L'ADN duplexé a été purifié par Native-PAGE à 7,5 % (29:1, acrylamide:bisacrylamide; Sigma). La bande d'acrylamide contenant l'ADNdb a été excisée, broyée et mise en rotation pendant une nuit dans un tampon d'écrasement et de trempage (NaCl 400 mM et EDTA 25 mM) pour éluer l'ADNdb. L'ADNdb élué a été précipité à –20 °C pendant 2 h après avoir ajouté 1 volume de 2-propanol à 100 %, suivi d'une centrifugation à 20 000 g pendant 30 min à 4 °C. Le culot d'ADN a été lavé avec 1 volume d'éthanol à 70 % vol/vol et centrifugé à 20 000 g pendant 30 min à 4 °C. Le culot a été séché à l'air à température ambiante pendant 30 minutes et remis en suspension dans de l'eau.

Des complexes RNP ont été formés en mélangeant le sgRNA et la protéine de l'éditeur de base appropriée dans un rapport molaire de 1,5: 1 dans un «tampon d'assemblage et de réaction RNP» (20 mM HEPES-KOH pH 7,4, 100 mM KCl, 5 mM MgCl2, 5% vol / vol glycérol, TCEP 2 mM) et incuber à température ambiante pendant 20 min.

Pour la cinétique de renouvellement unique de la désamination d'ADNdb dépendante de l'ARN guide in vitro, à une concentration finale de 1 µM de RNP, une concentration finale de substrat d'ADNdb de 10 nM (préparé à 100 nM dans un assemblage RNP et un tampon de réaction) a été ajoutée pour initier la désamination. La réaction a été incubée à 37 °C et des aliquotes de 5 ul ont été prélevées aux intervalles de temps indiqués. Les réactions ont été trempées dans un tampon de trempe de 50 µl (Tris-Cl 50 mM, pH 8,5, NaCl 400 mM, EDTA 25 mM, SDS 0,1 %, 1 µl de protéinase K thermolabile (New England Biolabs, NEB P8111S) et 1 µl de 15 mg ml-1 coprécipitant Glycoblue (Thermo Fisher Scientific, A9515)) pendant 15 min à 37 °C. La protéinase K thermolabile a été inactivée à 75°C pendant 15 min.

Les points de temps de réaction désactivés ont ensuite été précipités avec du 2-propanol comme décrit ci-dessus. Pour détecter l'adénine désaminée (inosine) catalysée par les ABE, les points de temps précipités ont été traités avec l'endonucléase V comme décrit précédemment dans les réf. 20,35. Pour détecter la cytidine désaminée (désoxy-uridine) catalysée par les CBE, les points de temps précipités ont été traités avec USER II (NEB, M5508L) conformément aux directives du fabricant. Les échantillons ont été mélangés avec un volume égal de tampon de charge de gel de formamide (95 % de formamide, 25 mM d'EDTA, 0,025 % de SDS et 0,025 % de bleu de bromophénol), chauffés à 98 °C pendant 5 min et résolus en dénaturant 7,5 % d'urée-PAGE (19 :1, acrylamide:bisacrylamide ; National Diagnostics). La réaction a été surveillée en scannant le gel séquentiellement avec FAM suivi des paramètres Alexa-647 à l'aide du système d'imagerie ChemiDoc (Bio-Rad). Les intensités de l'ADN non clivé et clivé ont été quantifiées à l'aide d'ImageJ 1,53 K. Les données ont été ajustées à une seule décroissance exponentielle dans Prism 9 (GraphPad Prism, v9.4.0) pour calculer les taux de désamination apparents (kapp). L'entaille de l'ADN du substrat par D10A-Nickase de l'éditeur de base, constante dans tous les éditeurs de base testés, a été détectée avec le fluorophore 6-FAM et utilisée comme contrôle pour garantir des protéines recombinantes uniformément actives.

Pour la cinétique de renouvellement unique de la désamination d'ADNsb indépendante de l'ARN guide in vitro, la réaction a été mise en place comme décrit ci-dessus mais avec les modifications suivantes : l'éditeur de base n'a pas été programmé avec de l'ARNsg et a été incubé avec le brin d'ADNsb marqué ATTO-647.

Pour le test de désamination in vitro en point final pour comparer la désamination par ABE 8.20, BE4, CABE-T2.17, CABE-T3.155, CBE-T1.14 et CBE-T1.52, la réaction de désamination a été configurée avec 1- µM BE RNP et substrat d'ADNdb 10 nM comme décrit ci-dessus. Au lieu de points de temps, la réaction entière a été stoppée après 24 h et précipitée comme décrit ci-dessus. La réaction précipitée a été remise en suspension dans de l'eau et divisée en quatre parties égales : non traitée, traitée avec l'endonucléase V comme décrit, traitée avec USER II comme décrit et traitée avec l'alkyl adénine glycosylase humaine (hAAG ; NEB 0313S) suivie de l'AP endonucléase 1 (APE1 ; NEB M0282L) selon les instructions du fabricant. La combinaison de hAAG et APE1 a été utilisée en raison de notre observation expérimentale selon laquelle G:U (produit de la désamination de la cytosine) est un substrat pour EndoV, ce qui a été confirmé par NEB (https://www.neb.com/tools-and-resources /selection-charts/dna-repair-enzymes-on-damaged-and-non-standard-bases). EndoV, par conséquent, n'a pas pu être utilisé lors de la comparaison des ABE, des CABE et des CBE pour les activités de désamination relatives A à I et C à U. hAAG est plus spécifique et n'a produit qu'un produit de clivage détectable pour la désamination de A à I mais pas pour la désamination de C à U dans les mêmes conditions expérimentales et a donc été utilisé pour de telles comparaisons. Suite à ces traitements, les échantillons ont été résolus sur Urea-PAGE et les données ont été quantifiées comme décrit ci-dessus.

Les ARNm utilisés dans cette étude ont été produits par transcription in vitro de plasmides d'expression codant pour nos éditeurs et contrôles, conformément aux protocoles précédemment décrits dans la réf. 13.

Les cellules HEK293T ont été transfectées via Lipofectamine MessengerMAX (Thermo Fisher Scientific, LMRNA001) avec un contrôle (Cas9, SPACE, etc.) ou un ARNm codant pour un éditeur avec un ARNg synthétique (commande spéciale d'Axolabs) ciblant une région de la β-2-microglobuline (B2M ). La séquence de ce guide synthétique est la suivante (syntaxe propre à Axolabs) : ascsusCACGCUGGAUAGCCUCCGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGGUGCusususU

La perturbation du B2M lors d'un ciblage réussi par ABE, CBE ou Cas9 sur ce site a été validée en interne. Trois jours après la transfection, les cellules ont été dissociées avec TrypLE Express, lavées avec un tampon de coloration cellulaire (Biolegend, 420201) par centrifugation et remises en suspension dans un tampon de coloration cellulaire contenant 1:100 d'anticorps B2M antihumain conjugué à PE (Biolegend, 316306). Après 30 minutes d'incubation sur de la glace dans l'obscurité, les cellules ont été lavées trois fois avec un tampon de coloration cellulaire par centrifugation et filtrées dans des tubes FACS standard de 5 ml.

Les cellules individuelles classées comme négatives à la PE ont été triées dans des plaques à 96 puits contenant du DMEM + 20 % de FBS + 100 unités par ml de pénicilline/streptomycine (Thermo Fisher Scientific, 15140122). Pour le contrôle non traité, les cellules individuelles ont été triées par vivant uniquement. Des stratégies de déclenchement représentatives sont fournies dans la Fig. 30 supplémentaire. Après 12 jours de culture, l'ADNg a été récolté à partir de cellules à l'aide du kit Agencourt DNAdvanced (Beckman-Coulter, A48705) conformément aux protocoles du fabricant. La confirmation de la réussite de l'édition de chaque clone a été obtenue grâce au séquençage ciblé de l'amplicon B2M englobant le site cible. La séquence d'ADNg confirmée a ensuite été soumise à Novogene pour la préparation de la bibliothèque et le WGS.

Des cellules T humaines ont été isolées à partir de produits de leucaphérèse (Leukopaks, HemaCare) par sélection positive à l'aide de microbilles CD4 et CD8 (Miltenyi, 130045101 et 130045201). Les cellules T ont été congelées à raison de 25 à 50 × 106 cellules par ml de Cryostor CS10 (Stemcell Technologies, 1001061). Pour les expériences d'édition, les lymphocytes T ont été décongelés dans un bain-marie à 37 °C, puis laissés au repos pendant la nuit dans un milieu d'expansion cellulaire ImmunoCult-XF contenant (Stemcell Technologies, 10981) 5 % de CTS Immune Cell SR, Glutamax, 10 mM HEPES, 1 % pénicilline/streptomycine (Thermo Fisher Scientific, 15140122). Le lendemain, les lymphocytes T ont été activés en utilisant 25 μl d'ImmunoCult Human CD3/CD28/CD2 T Cell Activator (Stemcell Technologies, 10970) par ml de cellules à raison de 1 × 106 cellules par ml plus 300 UI ml−1 d'IL-2 ( Cell Genix, 1420050). De l'IL-2 fraîche a été ajoutée aux cellules T tous les 2 à 3 jours. Les lymphocytes T ont été cultivés à 37°C et 5% de CO2.

Les lymphocytes T ont été transfectés 72 h après l'activation. Les cellules ont été remises en suspension dans la solution de nucléofacteurs de cellules primaires P3 contenant le supplément 1 (Lonza, V4SP-3960). 1 × 106 cellules T ont été éditées avec 1 μg d'ARNg synthétique (IDT) et 2 μg d'ARNm de l'éditeur dans un volume total de 20 μl à l'aide du kit Nucleocuvette P3 à 96 puits (Lonza, V4SP-3960). Les trois sgARN utilisés sont les suivants : B2M Exon 2 (B2M Ex.2), pmSTOP C6, CD247 pomSTOP C7 et PD-1 Ex.1 SA C7 sont spécifiés dans le tableau supplémentaire 3. Les cellules T ont été électroporées avec le système 4D-Nucleofector (Lonza, AAF-1003B et AAF-1003S) en utilisant le programme DH-102. Toutes les expériences ont été réalisées avec deux donneurs de lymphocytes T indépendants. Pour l'analyse NGS, 1 × 105 cellules T par condition à chaque instant ont été culottées, le surnageant a été retiré et les culots ont été remis en suspension dans 50 ml de tampon d'extraction d'ADN QuickExtract (Lucigen, QE09050) et transférés sur une plaque PCR pour le séquençage d'amplicon ciblé.

L'inactivation des protéines a été évaluée par cytométrie en flux 5 à 6 jours après l'édition. Les cellules T ont été colorées avec des anticorps conjugués à un fluorophore pour TCRα / β (Biolegend, 306718), β2M (Biolegend, 316304) et PD-1 (Biolegend, 367422) via une dilution 1:33 dans du PBS standard. Pour l'analyse de PD-1 par cytométrie en flux, les lymphocytes T ont été traités avec Cell Activation Cocktail (sans brefeldine A) (Biolegend) pendant une nuit avant la coloration. Les événements ont été collectés à l'aide d'un analyseur MACSQuant 16 (Miltenyi). Les données ont été analysées à l'aide du logiciel FlowJo (v10.8.1)

Des hépatocytes humains primaires congelés cryogéniquement (BioIVT) ont été décongelés et étalés à une densité de 3,5 × 105 cellules par puits sur des plaques à 24 puits BioCoat Collagen I (Corning, 354408) et maintenus dans du milieu CP additionné de mélange d'antibiotiques Torpedo (BioIVT) conformément avec les protocoles fournis par BioIVT. Une fois les monocultures PHH établies pendant la nuit, la génération de cultures PHH à longue durée de vie impliquait la coculture supplémentaire de fibroblastes murins 3T3-J2 (Kerafast, EF3003) à 2, 0 × 104 cellules par puits aux monocultures PHH établies. Les cocultures de PHH ont été maintenues avec des changements de milieu toutes les 48 h pendant toute la durée de l'étude.

Les cocultures de PHH ont été transfectées 48 h après la génération de la coculture avec des fibroblastes murins 3T3-J2. Les transfections avec l'ARNm ont été réalisées à l'aide de Lipofectamine MessengerMax (Thermo Fisher Scientific, LMRNA003) conformément aux protocoles des fabricants, avec les spécificités optimisées suivantes : 1 µg (pour les conditions de saturation) d'ARNm codant pour l'éditeur et 333 ng d'ARNg synthétique (Synthego) ont été combinés dans 30 µl de milieu réduit en sérum OptiMEM (Gibco, 31985). Un mélange de 30 µl 1:15 (Lipofectamine:OptiMEM) a été ajouté à la solution d'ARNm/ARNg avec le mélange final résultant laissé au repos à température ambiante pendant 15 min. La totalité de la solution de 60 µl a été utilisée pour traiter un puits d'hépatocytes humains primaires co-cultivés. Chaque condition d'étude a été exécutée en triple et les quantités de transfection utilisées ont été augmentées en conséquence. A 9 jours post-transfection, les cocultures PHH ont été lysées avec une solution de Tris-HCl 10 mM pH8.0 (Thermo Fisher Scientific, 15568025), 0.05% SDS (Thermo Fisher Scientific, 15553027) et 500 µg protéinase K (Thermo Fisher Scientific, EO0491) à un total de 200 µl par puits. Une fois lysé, le lysat a été traité à 85 ° C pendant 15 min pour inactiver la protéinase K. Les séquences d'ARNsg utilisées dans cette étude sont spécifiées dans le tableau supplémentaire 3.

La quantification de l'inactivation de la protéine PCSK9 a été évaluée à l'aide d'un kit ELISA Human PCSK9 SimpleStep (Abcam, ab209884) en mesurant la concentration de PCSK9 sécrétée dans le surnageant collecté toutes les 48 h. Le surnageant a été dilué dix fois en utilisant un tampon de test et le protocole de test a été exécuté conformément au protocole du fabricant. La quantification du LDL-R a été évaluée à l'aide d'un kit ELISA Human LDL-R SimpleStep (Abcam, ab209884) en mesurant la protéine LDL-R sécrétée dans le surnageant collecté toutes les 48 h. Les deux kits ELISA SimpleStep utilisent un anticorps de capture marqué par une étiquette d'affinité et un anticorps détecteur conjugué rapporteur. L'anticorps de capture et l'anticorps détecteur se lient aux analytes de l'échantillon, qui sont ensuite immobilisés sur un anticorps anti-étiquette recouvrant le puits de dosage. Les deux dosages ELISA colorimétriques sont lus à une absorbance de 450 nm.

De plus amples informations sur la conception de la recherche sont disponibles dans le résumé des rapports sur le portefeuille Nature lié à cet article.

Les données de séquençage de nouvelle génération sous-jacentes à toutes les expériences sont déposées dans le NCBI Sequence Read Archive (SRA) dans le cadre du projet de soumission PRJNA869750. Les coordonnées atomiques et les facteurs de structure ont été déposés dans l'APB sous les entrées : 8E2P, 8E2Q, 8E2R et 8E2S. Les données sources sont disponibles pour les Fig. 1, 3–6, Données étendues Fig. 5–7 et Figs supplémentaires 2–4, 6, 15, 17–21, 22–29 (y compris les fichiers source d'image de gel). Les données sources sont fournies avec ce document.

Tous les outils logiciels utilisés pour l'analyse des données sont accessibles au public et ont été utilisés de la manière décrite précédemment dans la réf. 13.

Komor, AC, Kim, YB, Packer, MS, Zuris, JA & Liu, DR Édition programmable d'une base cible dans l'ADN génomique sans clivage d'ADN double brin. Nature 533, 420–424 (2016).

Article CAS PubMed PubMed Central Google Scholar

Anzalone, AV, Koblan, LW & Liu, DR Édition du génome avec les nucléases CRISPR-Cas, les éditeurs de base, les transposases et les éditeurs principaux. Nat. Biotechnol. 38, 824–844 (2020).

Article CAS PubMed Google Scholar

Komor, AC et al. L'inhibition améliorée de la réparation par excision des bases et la protéine du bactériophage Mu Gam produisent des éditeurs de bases C:G-to-T:A avec une efficacité et une pureté de produit supérieures. Sci. Adv. 3, eaao4774 (2017).

Article PubMed PubMed Central Google Scholar

Collantes, JC et al. Développement et caractérisation d'un système d'édition de base modulaire CRISPR et aptamère d'ARN. CRISPR J. 4, 58–68 (2021).

Article CAS PubMed PubMed Central Google Scholar

Rees, HA, Minella, AC, Burnett, CA, Komor, AC & Gaudelli, NM Thérapies d'édition du génome dérivées de CRISPR : progrès du banc au chevet. Mol. Là. 29, 3125–3139 (2021).

Article CAS PubMed PubMed Central Google Scholar

Jin, S. et al. Les éditeurs de bases de cytosine, mais pas d'adénine, induisent des mutations hors cible à l'échelle du génome chez le riz. Sciences 364, 292-295 (2019).

Article CAS PubMed Google Scholar

Zuo, E. et al. L'éditeur de bases de cytosine génère d'importants variants mononucléotidiques hors cible dans les embryons de souris. Sciences 364, 289-292 (2019).

Article CAS PubMed PubMed Central Google Scholar

Doman, JL, Raguram, A., Newby, GA & Liu, DR Évaluation et minimisation de l'édition d'ADN hors cible indépendante de Cas9 par des éditeurs de base de cytosine. Nat. Biotechnol. 38, 620–628 (2020).

Article CAS PubMed PubMed Central Google Scholar

Yu, Y. et al. Éditeurs de base de cytosine avec des événements hors cible minimisés d'ADN et d'ARN non guidés et une activité élevée sur la cible. Nat. Commun. 11, 2052 (2020).

Article CAS PubMed PubMed Central Google Scholar

Zuo, E. et al. Un éditeur de base de cytosine conçu de manière rationnelle conserve une activité élevée sur la cible tout en réduisant les effets hors cible de l'ADN et de l'ARN. Nat. Méthodes 17, 600–604 (2020).

Article CAS PubMed Google Scholar

Yang, L. et al. Ingénierie et optimisation des fusions de désaminase pour l'édition du génome. Nat. Commun. 7, 13330 (2016).

Article CAS PubMed PubMed Central Google Scholar

Gaudelli, NM et al. Édition de base programmable de A*T à G*C dans l'ADN génomique sans clivage de l'ADN. Nature 551, 464–471 (2017).

Article CAS PubMed PubMed Central Google Scholar

Gaudelli, NM et al. Évolution dirigée des éditeurs de base d'adénine avec une activité accrue et une application thérapeutique. Nat. Biotechnol. 38, 892–900 (2020).

Article CAS PubMed Google Scholar

Kim, HS, Jeong, YK, Hur, JK, Kim, JS & Bae, S. Les éditeurs de bases Adenine catalysent les conversions de cytosine dans les cellules humaines. Nat. Biotechnol. 37, 1145-1148 (2019).

Article CAS PubMed Google Scholar

Jeong, YK et al. L'ingénierie de l'éditeur de base d'adénine réduit l'édition des cytosines témoins. Nat. Biotechnol. 39, 1426-1433 (2021).

Article CAS PubMed Google Scholar

Grunewald, J. et al. Un éditeur de base CRISPR à double désaminase permet l'édition simultanée d'adénine et de cytosine. Nat. Biotechnol. 38, 861–864 (2020).

Article PubMed PubMed Central Google Scholar

Zhang, X. et al. L'éditeur de base double catalyse à la fois les conversions de base de cytosine et d'adénine dans les cellules humaines. Nat. Biotechnol. 38, 856–860 (2020).

Article CAS PubMed Google Scholar

Sakata, RC et al. Éditeurs de base pour l'introduction simultanée de mutations C-à-T et A-à-G. Nat. Biotechnol. 38, 865–869 (2020).

Article CAS PubMed Google Scholar

Li, C. et al. Mutagenèse ciblée et aléatoire de gènes végétaux avec des éditeurs de bases doubles cytosine et adénine. Nat. Biotechnol. 38, 875–882 (2020).

Article CAS PubMed Google Scholar

Richter, MF et al. Évolution assistée par phage d'un éditeur de base d'adénine avec une compatibilité et une activité de domaine Cas améliorées. Nat. Biotechnol. 38, 883–891 (2020).

Article CAS PubMed PubMed Central Google Scholar

Tsai, SQ et al. GUIDE-seq permet le profilage à l'échelle du génome du clivage hors cible par les nucléases CRISPR-Cas. Nat. Biotechnol. 33, 187-197 (2015).

Article CAS PubMed Google Scholar

Chaudhary, R., Garg, J., Shah, N. & Sumner, A. Inhibiteurs de PCSK9 : une nouvelle ère de traitement hypolipidémiant. Monde J. Cardiol. 9, 76–91 (2017).

Article PubMed PubMed Central Google Scholar

Bhatia, SN, Balis, UJ, Yarmush, ML & Toner, M. Effet des interactions cellule-cellule dans la préservation du phénotype cellulaire : coculture d'hépatocytes et de cellules non parenchymateuses. FASEB J. 13, 1883–1900 (1999).

Article CAS PubMed Google Scholar

Cohen, JC, Boerwinkle, E., Mosley, TH Jr. & Hobbs, HH Variations de séquence dans PCSK9, faible LDL et protection contre les maladies coronariennes. N. Engl. J. Med. 354, 1264-1272 (2006).

Article CAS PubMed Google Scholar

Rao, AS et al. Une étude d'association à grande échelle à l'échelle du phénome des variantes de PCSK9 démontre une protection contre l'AVC ischémique. Circ. Génome. Précis. Méd. 11, e002162 (2018).

Article CAS PubMed PubMed Central Google Scholar

Musunuru, K. et al. L'édition de base CRISPR in vivo de PCSK9 réduit durablement le cholestérol chez les primates. Nature 593, 429–434 (2021).

Article CAS PubMed Google Scholar

Benjamin, R. et al. Cellules T réceptrices antigéniques chimériques anti-CD19 allogéniques modifiées sur le génome et dérivées de donneurs dans la leucémie aiguë lymphoblastique à cellules B pédiatrique et adulte : résultats de deux études de phase 1. Lancette 396, 1885–1894 (2020).

Article CAS PubMed Google Scholar

Liu, X. et al. Édition de gènes multiplex médiée par CRISPR-Cas9 dans les cellules CAR-T. Cell Res. 27, 154–157 (2017).

Article PubMed Google Scholar

Kabsch, W. XDS. Acta Crystallogr. D. Biol. Cristallologue. 66, 125-132 (2010).

Article CAS PubMed PubMed Central Google Scholar

Evans, PR & Murshudov, GN Quelle est la qualité de mes données et quelle est la résolution ? Acta Crystallogr. D. Biol. Cristallologue. 69, 1204-1214 (2013).

Article CAS PubMed PubMed Central Google Scholar

McCoy, AJ et al. Logiciel de cristallographie Phaser. J. Appl. Cristallologue. 40, 658–674 (2007).

Article CAS PubMed PubMed Central Google Scholar

Kim, J. et al. Caractérisation structurale et cinétique d'Escherichia coli TadA, l'ARNt désaminase spécifique à l'oscillation. Biochimie 45, 6407–6416 (2006).

Article CAS PubMed Google Scholar

Adams, PD et al. PHENIX : un système complet basé sur Python pour la solution de structure macromoléculaire. Acta Crystallogr. D. Biol. Cristallologue. 66, 213-221 (2010).

Article CAS PubMed PubMed Central Google Scholar

Emsley, P., Lohkamp, ​​B., Scott, WG & Cowtan, K. Caractéristiques et développement de Foulque. Acta Crystallogr. D. Biol. Cristallologue. 66, 486–501 (2010).

Article CAS PubMed PubMed Central Google Scholar

Lapinaïte, A. et al. Capture d'ADN par un éditeur de base d'adénine guidé par CRISPR-Cas9. Sciences 369, 566–571 (2020).

Article CAS PubMed PubMed Central Google Scholar

Télécharger les références

Nous reconnaissons et remercions M. Humes et B. Gantzer (Beam Tx) pour leur soutien à l'automatisation. Nous remercions J. Decker et David Born (Beam Tx) pour le NGS et le support informatique. Nous reconnaissons et remercions R. Manoukian et L. Hardy (Beam Tx) pour leur expertise FACS et pour le tri des cellules utilisées dans les expériences WGS. Nous remercions A. Arvind (Beam Tx) pour son aide à la cristallisation des protéines.

Ces auteurs ont contribué à parts égales : Dieter K. Lam, Patricia R. Feliciano.

Beam Therapeutics, Cambridge, Massachusetts, États-Unis

Dieter K. Lam, Patricia R. Feliciano, Amena Arif, Tangis Bohnuud, Thomas P. Fernandez, Jason M. Gehrke, Phil Grayson, Kin D. Lee, Manuel A. Ortega, Courtney Sawyer, Noah D. Schwaegerle, Leila Peraro, Lauren Young, Seung-Joo Lee, Giuseppe Ciaramella et Nicole M. Gaudelli

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

DKL, PRF, AA et MAO ont mené des expériences d'évolution dirigée, structurelles, biochimiques et d'édition de gènes et ont rédigé le manuscrit. CS, NS et KDL ont mené des expériences. TPF, JMG et LP ont mené des expériences sur les cellules primaires, analysé les données et rédigé le manuscrit. TB, PG et LY ont analysé les données de séquençage et effectué des analyses statistiques. S.-JL a dirigé des travaux de biologie structurale, de biochimie et d'ingénierie des protéines et a rédigé le manuscrit. GC a édité le manuscrit. NMG a conçu et dirigé la recherche et rédigé le manuscrit.

Correspondance à Nicole M. Gaudelli.

Tous les auteurs étaient des employés de Beam Therapeutics au moment de la réalisation des travaux et sont actionnaires de la société. Beam Therapeutics a déposé des demandes de brevet sur ce travail.

Nature Biotechnology remercie Sangsu Bae et les autres examinateurs anonymes pour leur contribution à l'examen par les pairs de ce travail.

Note de l'éditeur Springer Nature reste neutre en ce qui concerne les revendications juridictionnelles dans les cartes publiées et les affiliations institutionnelles.

a, le panneau supérieur représente la désamination hydrolytique de l'adénosine catalysée par TadA. Le panneau inférieur montre l'hydratation de l'analogue de l'adénine, la 2'-désoxy-8-azanebularine (d8Az), formant l'analogue à l'état de transition qui est piégé dans le site actif en se coordonnant avec le zinc. b, La structure globale de l'homodimère fonctionnel TadA*8.20 (chaîne A en vert foncé ; chaîne B en vert clair) lié à l'ADNsb (jaune). c, La structure globale du monomère TadA*8.20. Le monomère (vert clair) contient cinq brins β (β1 à β5) et six hélices α (α1 à α6) qui se replient en un seul domaine avec une feuille β centrale à cinq brins entourée d'hélices α. L'ion zinc est représenté par une sphère grise. d, site actif TadA * 8.20 avec analogue d'état de transition ssDNA-d8Az lié. L'ion zinc catalytique (gris) est coordonné à un résidu histidine (H57), deux résidus cystéine (C87 et C90) et l'analogue de l'état de transition d8Az (jaune). Les liaisons hydrogène sont représentées par des lignes pointillées grises. e, La surface du dimère TadA * 8.20 (vert foncé et vert clair) lié à l'ADNss (jaune), montrant que l'ADNss est lié dans la cavité profonde du site actif située à l'interface du dimère protéique et interagit avec les résidus des deux monomères, y compris les substitutions I76Y, L84F, D108N, R152P, E155V et I156F par rapport au TadA de type sauvage. Les substitutions à la surface de la protéine sont indiquées en orange (W23R, H36L, R51L, I76Y et A106V), au C-terminal en rose (S146C, D147R, R152P, Q154R, E155V, I156F et K157N) et au site actif dans le cyan (P48A, V82S, L84F et D108N). f, Interactions entre l'ADNsb (jaune) et les résidus du site actif TadA*8.20. Les résidus des chaînes A et B sont représentés respectivement en vert foncé et vert clair. La surface de la protéine, le C-terminal et les substitutions du site actif sont représentés respectivement en orange (chaîne A), rose (chaîne B) et cyan (chaîne B). L'ion zinc est représenté dans une sphère grise. Les liaisons hydrogène sont représentées par des lignes pointillées noires. Une vue stéréo est illustrée à la Fig. 7 supplémentaire.

Données source

a, La structure globale de l'homodimère fonctionnel TADAC-1.17 (chaîne A en bleu foncé ; chaîne B en bleu ardoise) avec ADNss (jaune) lié. Les substitutions (T17A, A48G, S82T et A142E) par rapport à TadA*8.20 sont représentées dans des sphères cyan. b, La structure globale du monomère TADAC-1.17 (bleu ardoise) dans un complexe avec ssDNA (jaune). Le monomère contient cinq brins β (β1 à β5) et six hélices α (α1 à α6) qui se replient en un seul domaine avec une feuille β centrale à cinq brins entourée d'hélices α. C et 5′ représentent respectivement l'extrémité C-terminale et l'extrémité 5′ de l'ADNsb. c, site actif TADAC-1.17 avec analogue d'état de transition ssDNA-d8Az lié. L'ion zinc catalytique (sphère grise) coordonne H57, C87, C90 et l'analogue d'état de transition d8Az (jaune). La chaîne latérale T82 (cyan) est proche de la chaîne latérale catalytique E59 (3,9 Å ; ligne pointillée cyan) et peut jouer un rôle dans la désamination en donnant/acceptant un proton vers/depuis E59. Le résidu A17 (cyan) est en hélice α1 à la surface de la protéine. Le résidu G48 (cyan) est en hélice α2 au niveau de la poche de liaison au substrat. Les liaisons H entre l'analogue de l'état de transition d8Az et les résidus protéiques sont représentées par des lignes pointillées grises. d, La chaîne latérale du E142, située dans l'hélice α5, se lie en H (ligne pointillée grise) à la chaîne latérale R153, située dans l'hélice α6, et aide à stabiliser l'hélice α6 C-terminale pour positionner le côté F156 chaîne pour interagir (lignes pointillées cyan) avec la base pyrimidine de dT(8).

a, La structure globale de l'homodimère fonctionnel TADAC-1.14 (chaîne A en jaune foncé ; chaîne B en jaune clair). Les substitutions (I49K, Y76I et G112H) par rapport à TadA*8.20 sont représentées dans des sphères magenta. Le résidu H2 est désordonné et non visualisé dans la structure. L'ion zinc est représenté par une sphère grise. La ligne pointillée représente la boucle partiellement désordonnée (A109 à A114) entre β4 et β5 (R107 à V130). b, La structure globale du monomère TADAC-1.14. La superposition entre les chaînes A (jaune foncé) et B (jaune clair) montre deux conformations différentes pour la boucle entre β4 et β5 (R107 à V130). c, site actif TADAC-1.14 avec de l'eau (sphère rouge) liée à l'ion zinc (sphère grise). Les résidus H57, C87 et C90 se coordonnent avec l'ion zinc. La molécule d'eau (sphère rouge) se lie en H (lignes pointillées grises) au résidu catalytique E59. Dans la première étape de la réaction TadA, cette eau est ajoutée au substrat pour former une espèce à l'état de transition (Extended Data Fig. 1a). d – f, Comparaisons structurelles entre les structures TADAC-1.14 sans substrat (jaune foncé) et TadA * 8.20 lié à l'ADNsb (vert foncé et jaune). La boucle TADAC-1.14 entre β4 et β5, qui contient la substitution G112H (magenta), a une conformation différente de TadA*8.20 et peut avoir un impact sur la liaison ssDNA (jaune) en créant des conflits stériques entre le résidu A109 et la base dT(8) (1,8-Å), qui est adjacente à la base cible d8Az(9) (d). La substitution Y76I (magenta) peut ne pas affecter la liaison à l'ADNsb en conservant les interactions (lignes pointillées noires) avec la base dG(12) (e). La substitution I49K positionne la chaîne latérale K49 à proximité du squelette dC(10) (~4,5-Å ; lignes pointillées noires) et peut contribuer à stabiliser le complexe protéine-ADN (e). La surface de TADAC-1.14 (jaune foncé et clair) montre que la nouvelle conformation de la boucle entre β4 et β5 modifie la forme de la cavité du site actif par rapport à TadA*8.20 (vert foncé et clair) (f).

a, Structure globale de l'homodimère fonctionnel TADAC-1.19 (rose foncé et rose clair). Les substitutions E27G et I49N par rapport à TadA*8.20 sont représentées dans des sphères oranges. L'ion zinc est représenté par une sphère grise. b, structure globale du monomère TADAC-1.19. C représente l'extrémité C-terminale. c, site actif TADAC-1.19 avec de l'eau (sphère rouge) liée à l'ion zinc. H57, C87 et C90 se coordonnent avec l'ion zinc. La molécule d'eau se lie (lignes pointillées) au résidu catalytique E59. d–h, Comparaisons structurelles entre les structures TADAC-1.19 et TadA*8.20. ( d ) Superposition entre les monomères TADAC-1.19 (rose) sans substrat et les monomères TadA * 8.20 (vert, jaune) liés à l'ADNsb, montrant une similitude structurelle élevée (RMSD d'environ 0, 9-Å pour tous les atomes Cα). Les principales différences structurelles concernent l'hélice α1, la boucle entre α1 et β1, et les hélices α5 et α6 C-terminales. (e) TadA * 8.20 a une liaison H de la chaîne latérale E27 (lignes pointillées noires) aux chaînes principales de A48, I49 et G50, et la substitution E27G supprime ces interactions. Pour compenser ces contacts critiques, TADAC1.19 place E25 à une position similaire à celle précédemment occupée par E27 dans TadA * 8.20 pour créer les mêmes liaisons H (lignes pointillées orange) avec A48, I49 et G50. Le déplacement E25 raccourcit l'hélice α1 et la boucle entre α1 et β1 (orange), contenant la substitution E27G, est étendue et s'adapte à une conformation différente par rapport à TadA * 8.20 (d, f et g). Il en résulte un dépliement partiel de l'hélice α5 pour éviter un conflit stérique avec cette conformation de boucle et un dépliage complet de l'hélice α6 (d et g). Ces changements structurels modifient la forme de la cavité du site actif TADAC-T1.19 (h), affectant la liaison au substrat dans le site actif (Fig. 2b). R26 présent dans la boucle TADAC-T1.19 (orange) établirait des contacts étroits (lignes pointillées cyan) avec dC(10), adjacent à la base cible d8Az(9) et dG(11) de TadA*8.20-ssDNA ( g). La substitution I49N positionne la chaîne latérale N49 loin du squelette de l'ADNss (~ 9-Å de dG (11); lignes pointillées cyan) (f), suggérant qu'un résidu avec une chaîne latérale chargée positivement plus longue comme la lysine créerait des contacts supplémentaires avec le ssDNA, comme observé dans la structure TADAC-T1.14 (Extended Data Fig. 3e).

a, test de désamination in vitro sur 24 heures pour détecter la désamination relative de A à I (hAAG + APE1) et de C à U (USERII) par BE4, ABE8.20, CABE-T et CBE-T programmé avec le même guide et agissant sur le même substrat dsDNA. Endonucléase V, Endo V; l'alkyl adénine ADN glycosylase humaine, hAAG; Apurinique/apyrimidinique Endonucléase 1, APE1. Les barres d'erreur représentent l'écart type par rapport à la moyenne (tracée) de trois répétitions indépendantes. Les données ont été normalisées à l'échantillon non traité. Endo V détecte à la fois la désamination A vers I et C vers U. b, à gauche, taux de rotation unique de la désamination A à I ou C à U du même substrat d'ADNdb par BE RNP. À droite, taux de rotation unique de l'entaille par BE RNP dans la même expérience que celle illustrée à gauche. Les constantes de vitesse kapp de pseudo-premier ordre obtenues par ajustement à une seule exponentielle sont rapportées (moyenne ± sd, n = 3 répétitions indépendantes).

Données source

a, Distribution du produit des lectures de séquençage cartographiées telles que modifiées pour les CBE-T de base et BE4, dans lesquelles la cytosine cible spécifiée (surlignée en rouge) est mutée. Les valeurs ont été déterminées à partir de la transfection de HEK293T avec de l'ARNm dans des conditions de saturation. Les valeurs et les barres d'erreur reflètent la moyenne et l'écart-type à n = 3 répétitions biologiques indépendantes réalisées à des jours différents. b, Carte couleur des conversions maximales de C · G en T · A à l'extérieur et à 5 'de la fenêtre cible du protospacer. Les positions du site cible où > 0,8 % d'édition C-to-T a été détectée pour n'importe quel éditeur sont incluses. Les valeurs ont été déterminées à partir de la transfection de HEK293T avec des éditeurs codant pour l'ARNm ou des témoins dans des conditions de saturation, avec n = 4 répétitions biologiques indépendantes réalisées à des jours différents.

Données source

Carte couleur du % de conversion maximale de C·G en T·A sur la cible sur les sites génomiques et du % de conversion maximale de C·G en T·A sur leurs sites hors cible correspondants dans les cellules HEK293T transfectées avec l'éditeur codant l'ARNm (ou le contrôle) plus sgRNA synthétique dans des conditions saturantes. Les valeurs médianes ont été dérivées de n = 3 répétitions biologiques indépendantes réalisées à des jours différents.

Données source

Fig. supplémentaires. 1–31, tableaux supplémentaires 1–5, séquences supplémentaires 1–31 et références supplémentaires.

Données de source statistiques pour les figures supplémentaires. 2–4, 6, 15, 17–21 et 24–29.

Données source d'image de gel pour la Fig. 22 supplémentaire.

Données source d'image de gel pour la Fig. 23 supplémentaire.

Données source statistiques, avec des onglets Excel étiquetés avec le numéro de figure ou de sous-figure.

Gels non recadrés de toutes les données à base de gel présentées (y compris celles des figures supplémentaires 22 et 23, qui sont invariablement liées aux figures principales et aux figures étendues en question).

Fichier de structures ChemDraw de Extended Data Fig. 1

Libre accès Cet article est sous licence Creative Commons Attribution 4.0 International License, qui permet l'utilisation, le partage, l'adaptation, la distribution et la reproduction sur n'importe quel support ou format, tant que vous donnez le crédit approprié à l'auteur ou aux auteurs originaux et à la source, fournissez un lien vers la licence Creative Commons et indiquez si des modifications ont été apportées. Les images ou tout autre matériel tiers dans cet article sont inclus dans la licence Creative Commons de l'article, sauf indication contraire dans une ligne de crédit au matériel. Si le matériel n'est pas inclus dans la licence Creative Commons de l'article et que votre utilisation prévue n'est pas autorisée par la réglementation légale ou dépasse l'utilisation autorisée, vous devrez obtenir l'autorisation directement du détenteur des droits d'auteur. Pour voir une copie de cette licence, visitez http://creativecommons.org/licenses/by/4.0/.

Réimpressions et autorisations

Lam, DK, Feliciano, PR, Arif, A. et al. Éditeurs de base de cytosine améliorés générés à partir de variantes de TadA. Nat Biotechnol 41, 686–697 (2023). https://doi.org/10.1038/s41587-022-01611-9

Télécharger la citation

Reçu : 16 août 2022

Accepté : 09 novembre 2022

Publié: 09 janvier 2023

Date d'émission : Mai 2023

DOI : https://doi.org/10.1038/s41587-022-01611-9

Toute personne avec qui vous partagez le lien suivant pourra lire ce contenu :

Désolé, aucun lien partageable n'est actuellement disponible pour cet article.

Fourni par l'initiative de partage de contenu Springer Nature SharedIt

Biotechnologie de la nature (2023)