La structure des protéines
 9782759822430

Citation preview

“TITLE” — 2018/9/17 — 19:51 — page 1 — #1

La structure des protéines

Jeannine Yon-Kahn Guy Hervé Jean-Luc Popot

“copy” — 2019/1/24 — 13:45 — page 1 — #1

Remerciements Les auteurs remercient bien vivement David Perahia, Florence Lederer et Liliane Mouawad pour avoir lu attentivement cet ouvrage et pour leurs suggestions constructives, ainsi qu’Annie Rousselet et Fabrice Giusti pour leur aide compétente pour la préparation de certaines figures et le Professeur Jean Bornarel pour ses encouragements à le publier. Les auteurs souhaitent également remercier Sophie Hosotte pour le soin et la compétence avec lesquels elle a assuré l’ordonnancement et la présentation de cet ouvrage.

Illustrations de couverture : Composition graphique à partir d’une structure obtenue en cryo-microscopie électronique du complexe cyanobactérien KaiCBA. Le complexe comporte six copies de la protéine KaiC (en bleu et vert), six de KaiB (en rose et violet) et douze de KaiA (en jaune et orange). En présence d’ATP, il oscille spontanément entre états assemblés et désassemblés avec une période d’environ 24 h, déterminant le cycle circadien de la bactérie. D’après Snijder et al., Science 355: 1181-1184, 2017; reproduit avec la permission de AAAS, copyright (2019).

Imprimé en France ISBN : 978-2-7598-2242-3 ISBN : 978-2-7598-2243-0 Tous droits de traduction, d’adaptation et de reproduction par tous procédés, réservés pour tous pays. La loi du 11 mars 1957 n’autorisant, aux termes des alinéas 2 et 3 de l’article 41, d’une part, que les « copies ou reproductions strictement réservées à l’usage privé du copiste et non destinées à une utilisation collective », et d’autre part, que les analyses et les courtes citations dans un but d’exemple et d’illustration, « toute représentation intégrale, ou partielle, faite sans le consentement de l’auteur ou de ses ayants droit ou ayants cause est illicite » (alinéa 1er de l’article 40). Cette représentation ou reproduction, par quelque procédé que ce soit, constituerait donc une contrefaçon sanctionnée par les articles 425 et suivants du code pénal. © EDP Sciences 2019

“TOC” — 2019/1/24 — 20:31 — page iii — #1

Table des matières Introduction Chapitre 1 • Les acides aminés, motifs élémentaires 1.1 Identification 1.1.1 Asymétrie structurale 1.2 Propriétés optiques

1 3 3 6 7

1.2.1 Absorption de la lumière

7

1.2.2 Fluorescence

8

1.2.3 Propriétés rotatoires

9

1.3 Propriétés ioniques

10

1.4 Modifications chimiques du groupe aminé

11

1.4.1 Réactions d’addition sur une double liaison

15

1.4.2 Attaque par un réactif électrophile

16

1.5 Modifications chimiques du groupe carboxyle

16

1.6 Modifications chimiques des chaînes latérales

17

1.6.1 Groupes α-aminés et β-carboxyliques

17

1.6.2 Histidine

18

1.6.3 Sérine et thréonine

20

1.6.4 Tyrosine

20

1.6.5 Cytéine

22

1.6.6 Méthionine

26

iii

“TOC” — 2019/1/24 — 20:31 — page iv — #2

La structure des protéines

1.6.7 Arginine

26

1.6.8 Tryptophane

26

1.7 Techniques de séparation des acides aminés 1.7.1 Électrophorèse

27

1.7.2 Chromatographie

27

Chapitre 2 • La structure primaire des protéines

31

2.1 Définition

31

2.2 Détermination de la structure primaire des protéines

32

2.2.1 Avancées historiques

32

2.2.2 Principes des méthodes de détermination des séquences protéiques

35

2.2.3 Spectrométrie de masse

35

2.3 Composition globale des protéines en acides aminés

36

2.4 Étude des alignements de séquences : taxonomie des protéines

37

2.5 Synthèse peptidique

37

Chapitre 3 • La structure secondaire

41

3.1 Définition

41

3.2 Conformations du squelette peptidique

43

3.2.1 Hélices

45

3.2.2 Déformation des hélices α

47

3.2.3 Structures β

47

3.2.4 Retournement de la chaîne : les virages

48

3.2.5 Autres structures régulières

49

3.2.6 Caractéristiques des structures non régulières

50

3.2.7 Méthodes d’étude des structures secondaires

50

3.3 Transformation des hélices α en structures β Chapitre 4 • La structure supersecondaire

iv

27

52 55

4.1 Définition

55

4.2 Association d’hélices α

55

4.3 Association de brins β

56

4.4 Interactions entre hélices α et segments β

58

“TOC” — 2019/1/24 — 20:31 — page v — #3

Table des matières

4.5 Interactions entre hélices α ou brins β et segments dépourvus de structure régulière

62

4.6 Principaux motifs structuraux présents dans les protéines

62

Chapitre 5 • La structure tertiaire

67

5.1 Définition

67

5.2 Caractéristiques de la structure protéique

68

5.2.1 Absence de nœud dans la chaîne polypeptidique

68

5.2.2 Compacité des protéines globulaires

68

5.2.3 Les résidus hydrophobes ont tendance à se rassembler à l’intérieur de la protéine

68

5.2.4 Domaines structuraux

69

5.2.5 Protéines intrinsèquement non structurées

73

5.3 Classification des protéines basée sur la structure

73

5.4 Métalloprotéines

74

5.5 Méthodes de détermination des structures protéiques

75

5.5.1 Cristallographie aux rayons X

76

5.5.2 Résonance magnétique nucléaire

77

5.5.3 Microscopie électronique

77

Chapitre 6 • La structure quaternaire

79

6.1 Définition

79

6.2 Mode d’association des sous-unités

79

6.3 Protéines oligomériques possédant des sous-unités différentes

84

6.4 Assemblage de protéines

85

6.5 Méthodes d’étude des structures quaternaires

87

Chapitre 7 • Structure des protéines membranaires

89

7.1 Localisation et fonction des protéines membranaires

89

7.2 Environnement membranaire

93

7.2.1 Composition et organisation 7.3 Expression, extraction, purification et manipulation des protéines membranaires en solution aqueuse

93 98

7.3.1 Expression

98

7.3.2 Extraction

100

v

“TOC” — 2019/1/24 — 20:31 — page vi — #4

La structure des protéines

7.3.3 Instabilité des protéines membranaires en solution détergente et alternative aux détergents 7.4 Étude structurale des protéines membranaires

102 107

7.4.1 Microscopie électronique

107

7.4.2 Radiocristallographie

109

7.4.3 Résonance magnétique nucléaire

110

7.4.4 Autres approches fournissant des informations structurales

111

7.5 Structure des protéines membranaires 7.5.1 Mode d’association avec la membrane. Structure quaternaire. Supercomplexes

112 113

7.5.2 Structure secondaire et tertiaire des régions transmembranaires120 7.5.2 Interactions stabilisantes. Cofacteurs. Lipides Chapitre 8 • Énergétique conformationnelle 8.1 Interactions intramoléculaires résultant de facteurs intrinsèques à la protéine

122 129 130

8.1.1 Interactions non covalentes

130

8.1.2 Interactions covalentes : les ponts disulfure

134

8.2 Interactions intramoléculaires influencées par le solvant

135

8.2.1 Liaisons hydrogène

135

8.2.2 Interactions électrostatiques

139

8.3 Interactions intramoléculaires déterminées par le solvant

140

8.3.1 Structure de l’eau liquide

140

8.3.2 Interactions hydrophobes

141

8.3.3 Rôle des interactions hydrophobes dans la stabilisation de la structure protéique

142

8.3.4 Surface accessible

143

8.4 Interactions entre le solvant et les molécules protéiques

144

8.5 Énergie conformationnelle totale d’une protéine

147

Chapitre 9 • Formation de la structure tridimensionnelle : le repliement des protéines 149 9.1 Le postulat d’Anfinsen et le paradoxe de Levinthal

151

9.2 Chemins de repliement

151

9.2.1 Modèles de repliement

151

9.2.2 Détection et caractérisation des intermédiaires de repliement 153

vi

“TOC” — 2019/1/24 — 20:31 — page vii — #5

Table des matières

9.2.3 La nouvelle vision du repliement : le paysage énergétique et l’entonnoir de repliement

154

9.3 Repliement des protéines dans l’environnement cellulaire

156

9.4 Repliements incorrects, agrégation et conséquences pathologiques

158

9.5 Repliement des protéines membranaires, in vivo et in vitro

163

9.5.1 Synthèse in vivo

164

9.5.2 Repliement in vitro des protéines membranaires

168

Chapitre 10 • Prédictions conformationnelles

173

10.1 Introduction

173

10.2 Problèmes rencontrés dans les calculs conformationnels

174

10.2.1 Le problème des multiminima

174

10.2.2 Le grand nombre d’interactions

174

10.2.3 L’effet de solvant

175

10.3 Prédictions de structures secondaires

175

10.4 Prédictions de la structure tertiaire

178

Chapitre 11 • Dynamique structurale

183

11.1 Différents types de mouvements dans les protéines

184

11.2 Preuves expérimentales des mouvements dans les protéines

184

11.3 Approches théoriques : la dynamique moléculaire

186

11.4 Autres méthodes

189

Index

195

Crédits photographiques

199

vii

“Introduction” — 2018/12/1 — 7:08 — page 1 — #1

Introduction Les protéines, molécules fonctionnelles, participent à toutes les activités biologiques. Elles assurent une grande variété de fonctions. La plupart d’entre elles possèdent une propriété élémentaire qui est la reconnaissance spécifique et la fixation de ligands. Parmi les protéines, les enzymes qui exercent une activité catalytique sont impliqués dans toutes les nombreuses étapes du métabolisme. Certaines protéines sont impliquées dans des mécanismes de transport ou la transduction de signaux. Ainsi l’hémoglobine a pour fonction la fixation et le transport de l’oxygène. Des protéines qui possèdent une fonction mécanique sont responsables de la contraction musculaire et de la motilité cellulaire. Des mécanismes aussi divers que ceux qui participent aux phénomènes de l’immunité ou de la vision mettent aussi en jeu des protéines. La diversité des fonctions assurées par les protéines n’a d’égale que l’étonnante complexité de leur construction. Les acides aminés constituent le motif élémentaire de toutes les protéines. Associés par des liaisons peptidiques, leur agencement dans la chaîne polypeptidique détermine la structure et la spécificité fonctionnelle de l’édifice. L’émergence de la connaissance des protéines remonte au XIXe siècle avec les premières identifications des acides aminés. Au cours du temps, les progrès dans l’identification et la purification des protéines, puis la détermination de la séquence grâce aux développements des méthodes chimiques, enfin la résolution de leur structure tridimensionnelle que permit l’introduction de méthodes physiques puissantes comme la cristallographie aux rayons X, la cryo-microscopie électronique et la résonance magnétique nucléaire ont conduit à une connaissance précise de ces molécules essentielles des organismes vivants. Les connaissances structurales résultent de la convergence d’un ensemble de méthodes relevant de la biologie, de la chimie et de la physique et plus récemment de l’informatique (Kessler & Ben-Tal, 2018). La Protein Data Bank comporte plus de 120 000 structures de protéines à haute résolution.

1

“Introduction” — 2018/12/1 — 7:08 — page 2 — #2

La structure des protéines

L’architecture des molécules protéiques se présente selon un ordre hiérarchique et montre plusieurs niveaux d’organisation. La structure primaire représente l’enchaînement séquentiel des acides aminés qui forment la chaîne polypeptidique. La structure secondaire désigne les éléments de structure régulière ou périodique. La structure supersecondaire résulte de l’interaction entre segments de structure secondaire. La structure tertiaire correspond à la conformation spatiale relativement compacte de la molécule et les protéines de grande taille peuvent comporter des domaines structuraux. La structure quaternaire est formée par l’association non covalente de plusieurs sous-unités identiques ou non. Ces structures ne sont pas figées. Elles sont animées de mouvements d’amplitude et de constantes de temps variées. Ces différents niveaux d’organisation seront abordés successivement. En plus de ces connaissances fondamentales, le présent ouvrage introduit certains aspects nouveaux. C’est d’abord le cas du chapitre 1 dans lequel les réactions chimiques impliquant les chaînes latérales des acides aminés, si utiles aux chimistes des protéines et aux enzymologistes, font l’objet d’une présentation détaillée, car jusqu’ici cette information était dispersée dans la littérature, et de ce fait, difficilement accessible. Par ailleurs, les progrès considérables de ces dernières années en ce qui concerne la spécificité structurale et fonctionnelle des protéines membranaires justifient qu’un long chapitre leur soit consacré. La résolution de leur structure a nécessité le développement d’un mode de pensée et de technologies spécifiques. Du point de vue méthodologique, le développement de la RMN du solide et le développement de nouveaux logiciels pour l’exploration de la dynamique moléculaire sont également pris en compte. Enfin, lorsqu’il y a lieu, le développement historique de l’établissement de certains concepts fondamentaux est présenté. Dans cet ouvrage, la structure des protéines est présentée dans sa dimension spatiotemporelle. La seule dimension spatiale risquait de faire apparaître les molécules protéiques comme des objets rigides. La dimension temporelle intervient dans les événements qui conduisent à la formation de la structure protéique et à la dynamique interne des molécules qui permet l’expression de leurs propriétés fonctionnelles.

Bibliographie Kessler, A. & Ben-Tal, N. (2018) Introduction to Proteins: Structure, Function and Motion. Chapman and Hall/CRC.

2

“Introduction” — 2018/12/1 — 7:08 — page 2 — #2

La structure des protéines

L’architecture des molécules protéiques se présente selon un ordre hiérarchique et montre plusieurs niveaux d’organisation. La structure primaire représente l’enchaînement séquentiel des acides aminés qui forment la chaîne polypeptidique. La structure secondaire désigne les éléments de structure régulière ou périodique. La structure supersecondaire résulte de l’interaction entre segments de structure secondaire. La structure tertiaire correspond à la conformation spatiale relativement compacte de la molécule et les protéines de grande taille peuvent comporter des domaines structuraux. La structure quaternaire est formée par l’association non covalente de plusieurs sous-unités identiques ou non. Ces structures ne sont pas figées. Elles sont animées de mouvements d’amplitude et de constantes de temps variées. Ces différents niveaux d’organisation seront abordés successivement. En plus de ces connaissances fondamentales, le présent ouvrage introduit certains aspects nouveaux. C’est d’abord le cas du chapitre 1 dans lequel les réactions chimiques impliquant les chaînes latérales des acides aminés, si utiles aux chimistes des protéines et aux enzymologistes, font l’objet d’une présentation détaillée, car jusqu’ici cette information était dispersée dans la littérature, et de ce fait, difficilement accessible. Par ailleurs, les progrès considérables de ces dernières années en ce qui concerne la spécificité structurale et fonctionnelle des protéines membranaires justifient qu’un long chapitre leur soit consacré. La résolution de leur structure a nécessité le développement d’un mode de pensée et de technologies spécifiques. Du point de vue méthodologique, le développement de la RMN du solide et le développement de nouveaux logiciels pour l’exploration de la dynamique moléculaire sont également pris en compte. Enfin, lorsqu’il y a lieu, le développement historique de l’établissement de certains concepts fondamentaux est présenté. Dans cet ouvrage, la structure des protéines est présentée dans sa dimension spatiotemporelle. La seule dimension spatiale risquait de faire apparaître les molécules protéiques comme des objets rigides. La dimension temporelle intervient dans les événements qui conduisent à la formation de la structure protéique et à la dynamique interne des molécules qui permet l’expression de leurs propriétés fonctionnelles.

Bibliographie Kessler, A. & Ben-Tal, N. (2018) Introduction to Proteins: Structure, Function and Motion. Chapman and Hall/CRC.

2

“Chap1” — 2018/12/4 — 18:34 — page 3 — #1

1 Les acides aminés, motifs élémentaires 1.1

Identification

Les protéines sont constituées d’un enchaînement d’acides aminés qui diffèrent par leur chaîne latérale. Les acides aminés ont pour formule générale : O H2N

CH

C

OH

R

Ils comportent un groupe aminé NH2 et un groupe carboxylique COOH ainsi qu’une chaîne latérale R qui spécifie les différents acides aminés. L’atome de carbone central, le Cα , est lié aux groupes aminé et carboxyle. La proline fait exception, c’est un acide aminé dans lequel le groupement aminé est engagé dans une liaison covalente avec la chaîne latérale. Sa formule est la suivante : O C

OH

HN

3

“Chap1” — 2018/12/4 — 18:34 — page 4 — #2

La structure des protéines

Il existe vingt-deux acides aminés naturels qui sont codés par les triplets des nucléotides des gènes. Dans les premiers temps de la biologie moléculaire, seuls les vingt premiers acides aminés étaient connus. Deux autres acides aminés plus rares, la sélénocystéine et la pyrrolysine, ont été identifiés par la suite. Ainsi que le montre la figure 1.1, un alphabet à quatre lettres, les bases qui constituent les acides nucléiques, spécifient les vingt-deux acides aminés naturels.

Figure 1.1 Le code génétique. Dans l’ARN messager, les quatre bases (A adénine, G guanine, U uracile et C cytosine) spécifient les codons triplets. INIT et TERM indiquent les codons d’initiation et de terminaison, respectivement ; O et U sont la pyrrolysine et la sélénocystéine respectivement.

Les différents acides aminés furent découverts entre 1805 et 1920. L’asparagine fut isolée en 1805 par Robiquet et Vauquelin à partir de jus d’asperges ; la leucine par Proust en 1818, et la glycine par Braconnet en 1820 à partir d’un hydrolysat de déchets animaux. En 1846, Liebig obtint la tyrosine. La glutamine fut isolée en 1866 à partir de gluten de blé, l’arginine et l’histidine en 1886. La lysine fut obtenue par Drechsel en 1899 à partir de la caséine. La proline et l’hydroxyproline furent identifiées par E. Fischer en 1901, l’isoleucine par Erlich en 1904. La méthionine fut isolée en 1921. La phénylalanine et le tryptophane furent ensuite identifiés. En 1986, la sélénocystéine codée par le codon de terminaison UGA a été découverte. Seules quelques protéines ont une sélénocystéine dans leur séquence. La pyrrolysine, 22e acide aminé, fut identifiée en 2002 au site actif d’une méthyl transférase d’une archée ; elle est codée par un autre codon de terminaison UAG. Les structures des acides aminés sont présentées sur la figure 1.2. Le tableau 1.1 ci-après donne la liste des acides aminés naturels avec leurs codes à trois lettres et à une lettre.

4

“Chap1” — 2018/12/4 — 18:34 — page 5 — #3

1. Les acides aminés, motifs élémentaires

glycine

sérine

- thréonine

cystéine

tyrosine asparagine glutamine chaînes latérales polaires non chargées

aspartate glutamate lysine arginine histidine chaînes latérales chargées négativement chaînes latérales chargées positivement

alanine

proline

valine

leucine

isoleucine

méthionine phénylalanine chaînes latérales hydrophobes

sélenocystéine

tryptophane

pyrrolysine

Figure 1.2 Les acides aminés naturels.

5

“Chap1” — 2018/12/4 — 18:34 — page 6 — #4

La structure des protéines

Tableau 1.1

Liste des acides aminés avec leurs codes.

Acide aminé Code à trois Code à une lettres lettre Alanine Arginine Asparagine Aspartate Cystéine Glutamate Glutamine Glycine Histidine Isoleucine Leucine

1.1.1

Ala Arg Asn Asp Cys Glu Gln Gly His Ile Leu

A R N D C E Q G H I L

Acide aminé

Code à trois Code à une lettres lettre

Lysine Méthionine Phénylalanine Proline Pyrrolysine Sérine Sélénocystéine Thréonine Tryptophane Tyrosine Valine

Lys Met Phe Pro Pyl Ser Sec Thr Trp Tyr Val

K M F P O S U T W Y V

Asymétrie structurale

Comme la plupart des molécules biologiques, les acides aminés sont asymétriques. À l’exception de la glycine qui porte deux atomes d’hydrogène sur le carbone α (R=H), les acides aminés naturels existent sous la configuration L. Les deux énanthiomères L et D sont représentés sur la figure 1.4. O H 2N

CH H

Figure 1.3 Structure de la glycine.

Figure 1.4 Configuration des acides aminés.

6

C

OH

“Chap1” — 2018/12/4 — 18:34 — page 7 — #5

1. Les acides aminés, motifs élémentaires

Il existe une règle simple pour reconnaître la configuration des acides aminés. Dans la configuration L, les trois groupes R, N et C apparaissent dans le sens des aiguilles d’une montre, et dans le sens opposé dans la configuration D. Ces deux conformations peuvent être distinguées par leurs propriétés rotatoires.

1.2 1.2.1

Propriétés optiques Absorption de la lumière

Les acides aminés absorbent les rayons infrarouges par les groupes carboxyles et aminés et par les chaînes latérales. L’absorption du groupe carboxyle est à 5,9 μ ; elle est déplacée à 6,3 μ pour l’ion carboxylate. L’eau absorbant dans la zone des longueurs d’ondes utilisées, les mesures s’effectuent à l’état solide qui est la forme zwitterionique des acides aminés. Les fréquences caractéristiques se situent pour le groupe NH3 + à 3 200 cm−1 ; dans la région entre 1 700 et 1 300 cm−1 , on trouve les fréquences correspondant à l’élongation symétrique et asymétrique du groupe COO− , à la déformation du groupe NH3 + et du Cα H, et dans la région située entre 1 300 et 650 cm−1 , l’élongation de la liaison C-N et de la liaison C-C, ainsi que la déformation du COO− . Les acides aminés absorbent la lumière dans l’ultraviolet lointain (λ < 190 nm). Ceux qui possèdent une chaîne latérale aromatique absorbent dans le proche ultraviolet entre 200 et 300 nm. C’est le cas du tryptophane, de la tyrosine et de la phénylalanine. La tyrosine à pH 7 présente un maximum d’absorption à 275 nm, le tryptophane à 280 nm et la phénylalanine à 257 nm. La figure 1.5 montre le spectre d’absorption de ces acides aminés aromatiques à molarité égale. Le tableau 1.2 indique leur coefficient molaire d’absorbance à la longueur d’onde maximum. L’absorption de la lumière est une méthode simple et rapide pour déterminer la concentration d’un composé chromophore. L’absorption d’une lumière monochromatique dans un milieu homogène isotrope est proportionnelle à la longueur du trajet lumineux dans la solution et à la concentration du composé absorbant : I = Io e−klc Soit encore : 2,3 log10 Io /I = kcl Io étant l’intensité de la lumière incidente, I celle de la lumière sortante, c la concentration du composé absorbant, l la longueur du trajet optique. La longueur unitaire l est de 1 cm et ε = k/2,3 définit le coefficient d’extinction molaire de la substance. L’absorbance de la solution est donc : Aλ = –log10 I/Io = εc

7

“Chap1” — 2018/12/4 — 18:34 — page 8 — #6

La structure des protéines

ε(extinction) Try

4000

2000 Tyr

Phe

0 260

λ(nanomètre) 280

320

Figure 1.5 Spectre d’absorption des acides aminés aromatiques.

Tableau 1.2

1.2.2

Coefficient molaire d’absorbance des acides aminés aromatiques à λmax . Acide aminé pH 7, 0 25 ◦ C

λmax

ε/M−1 cm−1

Tryptophane Tyrosine Phénylalanine

280 274 257

5 600 1 400 200

Fluorescence

La fluorescence est une émission lumineuse provoquée par l’excitation d’une molécule par absorption d’un photon. L’énergie absorbée porte les électrons dans l’état excité ; cette énergie est restituée sous forme lumineuse lorsque les électrons retournent à leur état fondamental. Dans la plupart des cas, une partie seulement de l’énergie est restituée sous forme lumineuse. La fréquence ν = E/h (E étant l’énergie et h la

8

“Chap1” — 2018/12/4 — 18:34 — page 9 — #7

1. Les acides aminés, motifs élémentaires

constante de Planck) sera donc plus faible que celle de la lumière d’excitation et la longueur d’onde d’émission supérieure. Parmi les acides aminés, seul le tryptophane et la tyrosine présentent une fluorescence appréciable.

1.2.3

Propriétés rotatoires

Les acides aminés ont un pouvoir rotatoire. Les composés asymétriques dévient la lumière polarisée ; ils provoquent une rotation de son plan de polarisation. Le composé est lévogyre si la rotation est vers la gauche, dextrogyre si elle est vers la droite. L’angle de rotation du plan de polarisation représente le pouvoir rotatoire. Celui-ci dépend de la longueur d’onde de la lumière, de la température et de la concentration de la substance en solution. La loi de Biot définit le pouvoir rotatoire : α = [α]λT l c α est le pouvoir rotatoire ou angle de rotation du plan de polarisation exprimé en degrés. l est l’épaisseur de la solution traversée exprimée en dm. c est la concentration de la substance dissoute exprimée en g · cm−3 . [α]λT est le pouvoir rotatoire spécifique exprimé en dm−1 g−1 cm3 . Il dépend de la longueur d’onde qui est généralement celle de la raie D du sodium (λ = 589,3 nm) ; T, la température, les valeurs de [α]λT étant généralement données à 20 ◦ C. La variation de α avec la longueur d’onde définit la dispersion optique rotatoire. Cette dispersion présente des anomalies au niveau des chromophores lorsque ceux-ci sont engagés dans une structure asymétrique. Ces anomalies se traduisent par une inversion du pouvoir rotatoire appelée effet Cotton. La figure 1.6 montre l’allure des effets Cotton, positif et négatif. [α]

[α]

λ0

λ

(a) Effet Cotton positif

λ0

λ

(b) Effet Cotton négatif

Figure 1.6 Effets Cotton positif et négatif.

9

“Chap1” — 2018/12/4 — 18:34 — page 10 — #8

La structure des protéines

On peut rendre compte du dichroïsme circulaire par l’existence de deux coefficients d’extinction différents pour les ondes polarisées circulairement droite et gauche. ε = εG – εD Δε

λ0

Δε λ0

λ

λ

Δc (b) Effet Cotton négatif

(a) Effet Cotton positif

Figure 1.7 Différence des coefficients d’extinction droite et gauche dans le cas des effets Cotton positif et négatif.

Le dichroïsme circulaire est mesuré à des longueurs d’onde proches des bandes d’absorption des molécules. En pratique, on mesure l’ellipticité :  = K(εG – εD ) La mesure de l’ellipticité dans l’ultraviolet lointain dans la zone d’absorption de la liaison peptidique est une méthode expérimentale importante car elle donne des informations sur la structure secondaire des protéines.

1.3

Propriétés ioniques

Les acides aminés ont une structure bi-ionique faisant intervenir les deux groupes COOH et NH2 susceptibles de gagner ou de perdre un proton. -COOH -N+H+3

-COO– + H+ -NH2 + H+

À l’état solide ainsi qu’en solution neutre, les acides aminés présentent deux groupes chargés ; ils sont dipolaires (zwitterion) :

Leur état d’ionisation varie avec le pH. Le pK des groupes carboxyliques est environ de 3-4, celui du groupe aminé est de l’ordre de 10. Le point isoélectrique qui correspond

10

“Chap1” — 2018/12/4 — 18:34 — page 11 — #9

1. Les acides aminés, motifs élémentaires

à la neutralité globale de la molécule est égal à la demi-somme des pK. La présence d’une chaîne latérale (radical R) possédant un groupe ionisable participe à la valeur du point isoélectrique. Le tableau 1.3 ci-après donne les valeurs du pK et du point isoélectrique des acides aminés. Dans une protéine, l’environnement peut modifier considérablement le pK et la réactivité de ces groupes. Par suite de leur caractère amphotère, les acides aminés sont solubles dans les solvants polaires de constante diélectrique élevée tels que l’eau et ne sont que très peu ou pas solubles dans les solvants apolaires de faible constante diélectrique. La dissolution d’un acide aminé entraîne une augmentation de la constante diélectrique du solvant.

Tableau 1.3

1.4

Valeur du pK et du point isoélectrique des acides aminés.

Acide aminé

pK du groupe COOH

pK du groupe NH3+

pK des chaînes latérales

Glycine Alanine Valine Leucine Isoleucine Sérine Thréonine Méthionine Cystéine Proline Phénylalanine Tyrosine Tryptophane Acide aspartique Acide glutamique Lysine Arginine Histidine Asparagine Glutamine

2,4 2,4 2,3 2,3 2,3 2,2 2,1 2,2 1,9 2,0 2,6 2,2 2,4

9,8 9,9 9,7 9,7 9,7 9,4 9,1 9,3 10,3 10,6 9,2 9,1 9,4

2,0

10

3,9

2,8

2,1 2,2 1,8 1,8 2,0 2,2

10 9,2 9,0 9,2 8,8 9,1

4,3 10,8 12,5 6,0

3,2 9,6 11,2 7,6

8,3 10,9

Point isoélectrique 6,06 6,1 6,0 6,03 6,04 5,7 5,6 5,7 5,1 6,3 5,9 5,6 5,9

Modifications chimiques du groupe aminé

Le groupe aminé possède un pouvoir nucléophile en raison du doublet disponible : -NH2 qui lui confère sa réactivité. Il participe ainsi à divers types de réactions à condition qu’il ne soit pas protoné. L’acylation est l’attaque d’un carbone trigonal sp2 par un groupe nucléophile, le doublet de l’azote du groupe aminé conduisant à la formation d’une liaison du type R -CO-NH-R. Pour cette réaction, on utilise généralement des anhydrides d’acides :

11

“Chap1” — 2018/12/4 — 18:34 — page 12 — #10

La structure des protéines

O ║

O

R′-C

║ O + R-NH2

O

R′-C-N-R + R′-C

R′-C ║ O

O-

H

Suivant la nature du radical R , il est possible d’introduire une charge positive (en utilisant un N-carboxyanhydride d’acide α-aminé), d’introduire une charge négative (en utilisant les anhydrides succinique, maléique, 2-méthylmaléique, tétrafluorosuccinique), ou encore de neutraliser la charge (en utilisant l’anhydride acétique). Le groupement aminé peut être régénéré dans différentes conditions suivant la stabilité de la liaison formée. La modification par l’anhydride maléique est facilement inversée en milieu acide où l’hydrolyse de la liaison maléylamide est catalysée de manière intramoléculaire par le groupe carboxyle non ionisé. La citraconylation est également inversée en milieu acide. L’acylation par l’anhydride tétrafluorosuccinique donne un dérivé stable en milieu acide, mais facilement décomposé à pH 9,5. La carbamylation par le cyanate est une réaction assez sélective en milieu alcalin : R-NH2 + -N=CO

R-NH-C=NH │ OH

R-NH-C-NH2 ║ O

D’une manière générale, la carbamylation s’effectue avec un réactif de la forme R-N=C=O. La réaction se fait autour de pH 8. Cette réaction est à la base d’une méthode de détermination quantitative des acides aminés N-terminaux des protéines (Stark & Smith, 1963). Certains esters, thioesters ou imidoesters sont très réactifs vis-à-vis des groupes aminés. Les imidoesters sont facilement attaqués par les agents nucléophiles et réagissent sélectivement avec les groupes aminés des protéines entre pH 8,5 et 9,5 pour former des amidines. L’amidination conduit au blocage complet des groupes aminés si l’on utilise des concentrations relativement fortes de réactifs. La réaction est la suivante : NH R-C

NH + R′NH2

OEt

R-C

+ CH3OH NHR′

Cette réaction se produit également avec le groupe ε-aminé des résidus de lysine qui, une fois bloqué, peut être régénéré par incubation du dérivé en présence

12

“Chap1” — 2018/12/4 — 18:34 — page 13 — #11

1. Les acides aminés, motifs élémentaires

d’ammoniaque ou d’hydrazine. Les imidoesters à plus longue chaîne et qui possèdent deux groupements réactifs tels que le diméthyl suberimidate ou l’adipimidate sont utilisés comme agents réticulants en se fixant de manière covalente à deux groupements aminés situés à une distance convenable l’un de l’autre. Ceci a permis de mettre en évidence l’interaction entre deux protéines, de déterminer le nombre de sous-unités de protéines oligomériques ou de stabiliser une conformation particulière d’une protéine. La sulfonylation est obtenue par action des halogénures d’acide sulfonique aliphatiques ou aromatiques sur les groupes aminés des protéines. Le réactif le plus utilisé est le chlorure de l’acide S-diméthylamino-naphtalène-1-sulfonique ou chlorure de dansyle. La dansylation des groupes aminés donne des dérivés fluorescents. Pour cette raison, cette réaction est utilisée pour introduire un marqueur fluorescent extrinsèque dans une protéine pour des études conformationnelles. CH3 NH

+

NH2-CH-COOH

CH3 SO2Cl

R

CH3 NH CH3 SO2-NH-CH-COOH R

L’alkylation et l’arylation sont des réactions qui donnent naissance à des composés du type : -NH-C-R ou -NH-Ar Elles sont réalisées par action des halogénures d’aryle dont le plus classique est le dinitrofluorobenzène (DNFB) introduit par Sanger en 1945. L’ordre de réactivité du groupe partant est : F > Cl∼Br > SO3 H Le DNFB forme des dérivés dinitrophényl avec les groupes α- et ε-aminés. La réaction requiert que le groupe nucléophile ne soit pas protoné ; à pH 8,5 et pour

13

“Chap1” — 2018/12/4 — 18:34 — page 14 — #12

La structure des protéines

des pH inférieurs, les groupes ε-aminés réagissent plus lentement que les groupes α-aminés. Dans la ribonucléase cependant, la dinitrophényl-lysine 41 est formée préférentiellement par suite de la grande réactivité particulière de ce groupe due à son environnement dans la protéine. Les dérivés dinitrophényles sont stables en conditions alcalines et facilement dosables par spectrophotométrie, le composé formé avec une amine absorbant dans le visible avec un maximum à 365 nm. O

-NO2 O2N-

-F

+ H2N

CH

C

-NO2

OH

-NH-CH-COO

O2N-

-

R

R Le DNFB réagit aussi avec quelques chaînes latérales d’acides aminés, en particulier le groupe SH des cystéines, le groupe phénolique des tyrosines et le groupe imidazole des histidines. Le 2,4,6, trinitrobenzène sulfonate (TNBS) réagit avec les groupes aminés et est utilisé comme réactif dans un dosage colorimétrique. Les spectres d’absorption de la TNP lysine et des TNP amino-acides présentent un maximum vers 345 nm avec un épaulement à 420 nm. 2

NO

NO

2

O 2

O N-

-3

- SO

+ H2N - CH - C - OH

2

O N-

- NH - CH - COO

R

NO2

NO2

-

R

Le TNBS réagit peu avec l’azote de l’imidazole ou les groupements hydroxyle de la tyrosine, de la sérine et de la thréonine ; il ne réagit pas avec l’arginine. Il forme avec les groupes SH des dérivés labiles. Il existe d’autres réactifs des groupes aminés utilisés essentiellement pour la détection spectroscopique de ces résidus ; ils donnent naissance à des dérivés colorés comme avec la ninhydrine ou des dérivés fluorescents comme avec la fluorescamine (2-méthoxy-2,4-diphényl-3H-furanone, MDPF) qui permettent une détection hautement sensible par fluorimétrie. La réaction avec la ninhydrine est un processus complexe qui comporte la suite de réactions représentées sur la figure 1.8. Les aldéhydes aliphatiques et les cétones réagissent rapidement et d’une manière réversible avec les groupes aminés des protéines. Les produits formés, qui sont des bases de Schiff, peuvent être réduits pour donner des groupes alkylamines stables. En conditions légèrement alcalines, les groupes autres que les groupes aminés ne forment pas de dérivés stables. La formaldéhyde réagit avec la lysine en présence de borohydrure de sodium pour donner la diméthyl-lysine. Si l’on utilise le borohydrure tritié, on introduit ainsi un marquage radioactif qui permet d’identifier la lysine

14

“Chap1” — 2018/12/4 — 18:34 — page 15 — #13

1. Les acides aminés, motifs élémentaires

Figure 1.8 Réaction avec la ninhydrine.

Figure 1.9 Réaction avec la fluorescamine.

impliquée. Le groupe aminé réagit avec les sucres par leur groupe carbonyle formant des glycosamines. Les glycosamines subissent ensuite un réarrangement d’Amadori pour former des cétoamines, c’est la réaction de Maillard.

1.4.1

Réactions d’addition sur une double liaison

L’addition nucléophile à l’acrylonitrile a été utilisée pour alkyler les groupes SH. Ces derniers réagissent dans des conditions légèrement alcalines. À pH plus élevé, pH 9,5, la réaction avec les groupes aminés devient significative. À pH 9,2 tous les

15

“Chap1” — 2018/12/4 — 18:34 — page 16 — #14

La structure des protéines

résidus de lysine de la ribonucléase sont marqués par le réactif. La réaction est la suivante : R-NH2 + CH2 = CH-CN →R-NH-CH2 -CH2 -CN

1.4.2

Attaque par un réactif électrophile

Les sels d’aryl azonium réagissent avec les groupes aminés. La réaction procède rapidement pour former un composé non coloré. Dans des conditions faiblement alcalines, la réaction des groupes aminés peut devenir plus rapide que celle de la tyrosine ou de l’histidine. Ces deux derniers acides aminés forment des composés colorés. Les sels de diazonium ont été très utilisés pour le marquage des anticorps.

1.5

Modifications chimiques du groupe carboxyle

L’ion carboxylate stabilisé par résonance est peu réactif. La forme réactive est le carboxyle protoné COOH. Les réactions principales des groupes carboxyliques sont, d’une part l’estérification catalysée par un acide, d’autre part le couplage avec un composé nucléophile après activation par une carbodiimide soluble dans l’eau. Les groupes carboxyles en général peuvent être estérifiés par un alcool dans l’acide chlorhydrique dilué : R-COOH + R -OH → R-COOR + H2 O L’estérification peut être effectuée par des dérivés diazo-acides ou diazo-alcanes. Le diazométhane est un composé hautement réactif et a été utilisé pour estérifier les acides carboxyliques. Il est parfois employé pour estérifier les groupes carboxyliques des protéines, mais les réactions sont souvent incomplètes et d’autres groupes peuvent être également modifiés. Les esters des diazo-acétates sont plus stables. La modification des groupes SH constitue l’une des réactions parasites. L’estérification des groupes carboxyliques peut être réalisée par l’intermédiaire d’un anhydride mixte : R-COOH + R CO-Cl →R-CO-O-CO-R + HCl R-CO-O-CO-R +R -OH → R-CO-O-R + R -COOH L’estérification peut être inversée en milieu alcalin. Cependant, la réaction la plus utilisée pour le marquage des résidus carboxyliques est le couplage avec des composés nucléophiles, l’ester ou l’amide d’un acide aminé, ou encore une amine comme le groupe ε-aminé des lysines, par l’intermédiaire d’une carbodiimide soluble. En présence de celle-ci, un groupe carboxylique en milieu aqueux donne un dérivé O-acylisourée :

16

“Chap1” — 2018/12/4 — 18:34 — page 17 — #15

1. Les acides aminés, motifs élémentaires

O R-C OH

R′ | N ║ + C ║ N |

R′ │ O NH ║ │ R -C-O-C ║ NH+ │

R′′

R′′

qui avec la glycine éthyl ester donne une liaison amine :

+ :NH2-CH2-COO-C2H5

O ║ R-C-NH-CH2-COO-C2H5 +

R′ │ NH │ C=O │ NH │ R′′

1.6

Modifications chimiques des chaînes latérales

Les groupements constitutifs des chaînes latérales des acides aminés participent également à de nombreuses réactions chimiques. Ces propriétés sont utilisées pour identifier les acides aminés qui sont spécifiquement impliqués dans la structure et l’activité biologique des protéines.

1.6.1

Groupes ε aminé et β carboxylique

Les propriétés des chaînes latérales chargées, le groupe ε aminé de la lysine et les groupes β-COOH des acides aspartique et glutamique diffèrent peu de celles que présentent ces mêmes groupements localisés en position principale. Toutefois les groupes ε aminés réagissent plus lentement que les groupes α aminés du fait de leur pK plus élevé. Le groupe guanidinium de l’arginine possède un pK élevé. Étant stabilisé par résonance, il présente une faible réactivité. Aux pH élevés, entre pH 12 et pH 14, il réagit avec l’aldéhyde nitromalonique pour former un dérivé nitropyridine.

17

“Chap1” — 2018/12/4 — 18:34 — page 18 — #16

La structure des protéines

Le phénylglyoxal réagit rapidement à des pH moins extrêmes (pH 8). Parmi les autres réactifs de l’arginine, on peut citer la butanedione et le 1,2 cyclohexane dione.

1.6.2

Histidine

Le noyau imidazole de l’histidine a la propriété de fixer ou de donner un proton dans les conditions physiologiques, son pK est de 6,5.

O CH

H2N

C

O OH

CH

H2N

CH2

C

OH

CH2

N

+HN NH

NH

Figure 1.10 Équilibre entre les deux formes de l’histidine.

Il peut ainsi intervenir pour catalyser les réactions de transfert de protons ; son rôle dans le mécanisme d’action des enzymes est lié à cette propriété. L’imidazole de l’histidine est un excellent nucléophile. Il participe à des réactions d’acylation, d’arylation et d’alkylation. L’anhydride éthoxyformique ou diéthylpyrocarbonate réagit avec l’imidazole pour former un dérivé qui présente une absorption caractéristique entre 230 et 240 nm.

O

C-O-CH2-CH3 O

N O

O C-O-CH2-CH3

+ N

N-C-O-CH2-CH3 NH

L’arylation par le dinitrofluorobenzène (FDNB) produit un dérivé instable en milieu acide.

18

“Chap1” — 2018/12/4 — 18:34 — page 19 — #17

1. Les acides aminés, motifs élémentaires

DNP

NO2 O2N-

+

-F

N

N N

NH

L’alkylation par l’iodoacétate ou le bromoacétate conduit à la formation de dérivés substitués en position N1 ou N3 de l’imidazole et même de composés bisubstitués. Avec l’iodoacétate, on obtient ainsi soit la 1-carboxyméthyl histidine, soit la 3-carboxyméthyl histidine, soit encore la 1,3-dicarboxyméthyl histidine. CH2COOH N

ICH2COOH

N

N

+

+ NH

N

N CH2COOH

L’histidine est susceptible de subir une attaque par un réactif électrophile. Le diazotétrazole réagit avec l’histidine pour former un dérivé bis-azo coloré qui absorbe avec un maximum à 680 nm, ce qui permet de procéder à un dosage spectrophotométrique. De même l’acide sulfanylique diazoté ou réactif de Pauly conduit à la formation d’un composé coloré avec l’histidine, ce qui en permet la détection.

N

N

N

+

N

C-N=N N H

+

N

-N=N

N

N

NH

H N

N H N

N

N N

N=NN H

Figure 1.11 Réaction de l’histidine avec le diazotétrazole.

L’iodation de l’histidine conduit à la formation de dérivés mono et diiodohistidine. Le noyau imidazole de l’histidine est détruit par photooxydation en présence de composés photosensibilisateurs comme le bleu de méthylène ou le rose Bengale.

19

“Chap1” — 2018/12/4 — 18:34 — page 20 — #18

La structure des protéines

1.6.3

Sérine et thréonine

Les groupes hydroxyle de la sérine et de la thréonine sont des groupes alcool normalement très peu réactifs du fait de leur pK très élevé. La sérine peut devenir très réactive dans un environnement particulier, tel celui du centre actif des protéases à sérine. Pour la modifier, on utilise des pseudo-substrats ou des marqueurs d’affinité. Lorsqu’elle est réactive, la sérine peut être acylée ou phosphorylée. La O-phosphosérine est naturellement présente dans certains enzymes. Parfois, elle se forme au site actif dans une étape intermédiaire de la réaction. La O-phosphothréonine se rencontre aussi, quoique beaucoup plus rarement. Phosphorylations et déphosphorylations jouent des rôles importants dans la signalisation et dans la régulation de l’activité de certains enzymes (glycogène phosphorylase par exemple).

1.6.4

Tyrosine

La tyrosine présente un spectre d’absorption caractéristique avec un maximum à 275 nm. Le groupe phénolique possède un oxygène avec un fort pouvoir nucléophile. Il participe aux mêmes types de réactions que les groupes aminés, c’est-à-dire à des réactions d’acylation, d’arylation et d’alkylation, mais dans des conditions différentes. Parmi les réactions d’acylation, la modification des tyrosines par l’anhydride acétique est réversible ; l’ester ainsi formé est instable en milieu alcalin. C’est ce qui permet d’éviter cette réaction parasite pour le marquage sélectif des groupes aminés aux pH élevés. L’acétyl-imidazole réagit sur les tyrosines en donnant un ester instable en milieu alcalin. H3C-CO H3C-CO

O

+ HO

CH3-CO-O-

Figure 1.12 Réaction de la tyrosine avec l’anhydride acétique.

Parmi les réactions d’arylation, le fluorure cyanurique (CNF), qui présente une très grande réactivité mais possède une faible sélectivité, est peu utilisé. Il forme avec la tyrosine un ester qui est stable en milieu alcalin et dont le spectre d’absorption est déplacé vers le bleu par rapport à celui de la tyrosine.

20

“Chap1” — 2018/12/4 — 18:34 — page 21 — #19

1. Les acides aminés, motifs élémentaires

Le fluorodinitrobenzène (FDNB) réagit avec la tyrosine pour donner un composé O-dinitrophényl tyrosine. F N

F N

+ HO F

N

N

N

-ON

F

F

Figure 1.13 Réaction de la tyrosine avec le fluorure cyanurique.

NO2

O2N-

-F

NO2

+ HO

O2N-

-O-

L’alkylation par le diméthylsulfate, SO4 (CH3 )2 conduit à la formation de O-méthyl tyrosine. La tyrosine réagit avec des agents électrophiles. La nitration par le tétranitrométhane (TNM) est l’une des réactions les plus sélectives de la tyrosine. À pH 7-8 et en limitant le temps de réaction, la nitration s’effectue en ortho du groupe OH. On n’observe pas de formation de 3,5 dinitrotyrosine. L’ion O-nitrophénolate est stable à l’hydrolyse acide. Il présente un maximum d’absorption à 428 nm, ce qui permet de suivre la réaction par spectrophotométrie. O2 N C(NO2)4 + HO

HO-

Le spectre d’absorption de la 3-nitrotyrosine est très sensible à la polarité du solvant. Il existe des réactions parasites avec le TNM comme la formation de pontages intermoléculaires, l’oxydation de la cystéine, de la méthionine, la modification du tryptophane et de l’histidine. L’électrophorèse sur gel de polyacrylamide en présence de dodécyl sulfate de sodium permet rapidement de déterminer si des pontages intermoléculaires se sont produits. Malgré ces inconvénients, l’emploi du tétranitrométhane a connu de nombreux succès pour le marquage sélectif des tyrosines qui se produit plus rapidement que celui des autres résidus. L’iodation par l’iode ou le chlorure iodique est également une réaction très utilisée. Le marquage se produit en ortho du groupe phénolique conduisant à des dérivés mono ou diiodés (3-iodo ou 3,5-diiodotyrosine). Les groupes sulfhydriles très réactifs sont parfois affectés formant des iodures de sulfényl. En dehors de ces réactions de substitution, des réactions oxydatives impliquant les résidus méthionyl, cystéinyl, tryptophanyl peuvent également se produire. Cependant elles sont

21

“Chap1” — 2018/12/4 — 18:34 — page 22 — #20

La structure des protéines

prédominantes en milieu acide alors que les réactions de substitution sont prédominantes en milieu alcalin. L’iodation peut être réalisée par une réaction enzymatique spécifique des tyrosines dans laquelle l’action de l’iodure de sodium est catalysée par la lactoperoxydase. L’iodation des tyrosines est très utilisée pour marquer les protéines à l’iode 125 I, en particulier pour les essais radioimmunologiques ou pour les études de récepteurs. Les sels d’aryl diazonium réagissent avec la tyrosine pour former des dérivés dont la coloration est utilisée dans la détection de cet acide aminé. Le diazonium-1Htétrazole (DHT) réagit avec la tyrosine et aussi avec l’histidine formant des azodérivés correspondants qui absorbent à 550 nm et 480 nm, respectivement. Le dosage spectrophotométrique simultané des deux dérivés est donc possible sans ambiguïté. La vitesse de la réaction augmente avec le pH. Par suite de son instabilité, le diazonium1H-tétrazole est potentiellement explosif et doit être manipulé avec précaution. Les concentrations supérieures à 0,2 M sont considérées comme dangereuses.

N

N

N +

N

N2+

HO

N H

1.6.5

H O

N -N=N-

N N H

Cystéine

Les groupes thiols des cystéines sont très réactifs sous leur forme S− . Un grand nombre de composés sont donc susceptibles de réagir avec ces groupes. Du fait que les groupes thiols sont aisément modifiables et que certaines des réactions auxquelles ils participent sont réversibles, leur rôle au site actif de certains enzymes a été décelé très tôt. Les groupes thiols participent à des réactions d’acylation et d’arylation. Ils réagissent rapidement avec les anhydrides d’acides pour donner des dérivés instables en milieu alcalin. La réaction des thiols avec les composés aromatiques tels que le chlorodinitrobenzène ou le bromo-nitro-imidazole se fait plus rapidement que les réactions d’acylation, même en conditions plus acides. Les groupes thiols sont susceptibles de subir des réactions d’alkylation. La carboxyméthylation par les halogénures d’acide constitue une modification très classique des thiols qui sont beaucoup plus réactifs que les autres résidus susceptibles de réagir avec ces composés. La réaction avec l’iodoacétate donne naissance à la carboxyméthyl cystéine chargée négativement, selon la réaction : RS− + I-CH2 -COO− → R-S-CH2 -COO− + I−

22

“Chap1” — 2018/12/4 — 18:34 — page 23 — #21

1. Les acides aminés, motifs élémentaires

Ainsi que mentionné précédemment, l’iodoacétate réagit aussi avec l’histidine pour former des dérivés substitués en position N1 ou N3 du noyau imidazole. L’iodoacétamide est aussi très utilisée ; sa réaction avec les thiols conduit au dérivé carboxamido méthyl cystéine non chargé. Les mêmes réactions peuvent s’effectuer avec les dérivés bromés correspondants. La N-éthylènimine convertit les résidus de cystéine en S(2-aminoéthyl) cystéine. La réaction s’effectue dans des conditions légèrement alcalines.

Aucun autre groupe ne réagit à ces pH ; en milieu acide, la méthionine est lentement modifiée pour donner l’ion S(2-aminoéthyl) méthionine sulfonium. Cette modification est intéressante en ce sens que la S(2-aminoéthyl) cystéine ressemble à la lysine (avec un S à la place d’un CH2 ), ce qui introduit dans une protéine un nouveau site de coupure par la trypsine. L’alkylation par le bromure de triméthyléthyl ammonium convertit la cystéine en un dérivé fortement basique, la 4-thialamine, selon la réaction : CH2SH

CH3

HOOC-CH-NH2 + CH3-N+-CH2-CH2-Br

CH3 CH3-S-CH2-CH2-N+-CH3 + HBr CH3

CH3

Ce composé triméthylaminoéthylé est très stable et résiste à l’hydrolyse acide, ce qui permet les analyses conduisant à l’identification des cystéines qui ont réagi. Les groupes thiols participent à des réactions d’addition avec un certain nombre de réactifs. La cyanoéthylation par l’acrylonitrile est rapide et sélective à pH 8 ; la réaction avec les groupes aminés se produisant à des pH plus élevés. La réaction s’effectue comme suit : -S– + CH2 = CHCN

-S-CH2-CH2-CN

Le réactif le plus couramment utilisé est la N-éthyl maléimide (NEM) qui donne la S-éthyl succinimido cystéine soluble dans l’eau et stable. La NEM réagit rapidement avec la cystéine à pH neutre. La réaction peut être suivie par la diminution d’absorbance à 305 nm. En effet, la NEM absorbe à cette longueur d’onde (εM = 620)

23

“Chap1” — 2018/12/4 — 18:34 — page 24 — #22

La structure des protéines

alors que la S-éthylsuccinimido-cystéine n’absorbe plus. La NEM est un réactif très sélectif des thiols qui conduit à un marquage irréversible.

HC

O C

O

N-C2H5 + HC

H2N

C O

CH

C

O C

-S- CH OH

N-C2H5 H2C

CH2

C O

SH

La réaction des thiols avec les organomercuriels conduit à la formation de mercaptides. L’un des réactifs les plus courants est le p-chloromercuribenzoate (PCMB). La réaction peut être aisément suivie par spectrophotométrie. À pH 4,6, le PCMB absorbe avec un maximum à 234 nm et un coefficient d’extinction ε = 1,74 104 M−1 cm−1 . À 255 nm et au même pH, la valeur de εM entre les résidus PMB-cystéinyl et le PCMB est de l’ordre de 6 000 à 8 000 M−1 cm−1 suivant le solvant utilisé. O

C1-Hg

- COOH

+ H2N

CH

C

OH

-COOH

-S-Hg

CH2 SH

Les dérivés mercuri-nitrophénols présentent l’avantage d’absorber dans la région visible du spectre. Ils ont été fréquemment utilisés comme sonde de l’environnement des sulfhydriles dans les protéines ainsi que dans la préparation de dérivés mercuriels pour l’analyse des protéines par diffraction des rayons X. Une des réactions les plus classiques des thiols résulte de leur facilité d’échange avec les groupes disulfures pour donner des disulfures mixtes ; ces réactions sont réversibles. L’un des réactifs les plus utilisés introduit par Ellman (1959) est le 5,5 dithiobis (2-nitrobenzoate) ou DTNB ou encore dans la nomenclature officielle NbS2. La réaction donne naissance à un disulfure mixte avec apparition de l’ion thionitrobenzoate que l’on peut suivre par variation de l’absorbance à 412 nm. Lors de ces marquages, on doit tenir compte d’une légère hydrolyse spontanée du réactif. R-S-SO2N-

-S-S-

-NO 2

+

-NO2 COO -

-OOC

COO -

-S-

-NO2 COO -

24

“Chap1” — 2018/12/4 — 18:34 — page 25 — #23

1. Les acides aminés, motifs élémentaires

L’ion thionitrobenzoate (TNB− ) absorbe à 412 nm (ε = 1,36 · 104 M−1 cm−1 à pH 8), le disulfure mixte enzyme-thionitrobenzoate absorbant à 310 nm avec un coefficient d’extinction moyen de 2,6 · 103 M−1 cm−1 alors que le DTNB présente un pic à 323 nm (ε = 1,66 · 104 M−1 cm−1 ). Cependant, dans les protéines, la présence d’autres thiols à proximité du disulfure mixte peut entraîner l’apparition d’un deuxième ion TNB− avec formation d’un pont disulfure interne entraînant une erreur dans le titrage. S P-S-S-

-NO2

SH

-NO2 + H+

-

P

S-

S COO

-

COO-

La cyanylation des SH peut être effectuée par réaction avec le 2-nitro5-thiocyanobenzoate (NTCB) introduit par Degani et al. en 1970. On obtient la thiocyanoalanine. La substitution qui est très spécifique conduit à un dérivé sans encombrement stérique, ce qui n’est pas le cas pour d’autres réactifs des thiols. Le réactif est obtenu par traitement du DTNB par le bromure de cyanogène à pH 8. La réaction avec les thiols est suivie par la variation d’absorbance à 412 nm due à l’ion thionitrobenzoate. Jacobson et al. en 1973 ont proposé une méthode utilisant ce réactif pour obtenir une coupure sélective des liaisons peptidiques au niveau des cystéines. La réaction qui s’effectue à pH 9,0 et à 37◦ est la suivante :

25

“Chap1” — 2018/12/4 — 18:34 — page 26 — #24

La structure des protéines

La coupure ne s’effectue pas à 100 % ; une faible proportion est convertie en un peptide non coupé qui contient la dihydroalanine. Les groupes thiols des cystéines peuvent subir des réactions d’oxydation. L’action d’un agent oxydant comme l’eau oxygénée ou l’acide performique conduit à l’apparition d’acide cystéique, par l’intermédiaire de l’acide sulfénique et sulfinique. Le sulfite de sodium transforme les résidus cystéine en dérivés S-sulfonate (R-S-SO3 − ). Le tétrathionate donne un dérivé S-sulfényle sulfonate selon la réaction réversible : P-SH + S4 O6 = → P-S-S-SO3 − + S2 O3 = + H+ Il peut être utilisé pour protéger les cystéines lors de la modification chimique d’autres résidus.

1.6.6

Méthionine

La méthionine peut subir de nombreuses réactions des autres acides aminés. On peut cependant obtenir des marquages relativement sélectifs en se plaçant en milieu acide. Ainsi l’alkylation par l’iodoacétate et l’iodoacétamide s’effectue assez sélectivement aux bas pH. L’oxydation par l’eau oxygénée se produit aisément en milieu acide ; elle donne naissance à une méthionine sulfoxyde. L’oxydation en milieu acide en présence d’acide performique, ou la photooxydation en présence d’un photosensibilisateur donne des méthionine sulfones. La réaction de la méthionine avec le bromure de cyanogène permet la coupure sélective de la chaîne polypeptidique au niveau du carboxyle de la méthionine qui est transformée en homosérine lactone, laquelle par hydrolyse produit l’homosérine.

1.6.7

Arginine

Le résidu arginyl possède un pK élevé et se trouve stabilisé par résonance ; il diffère des autres groupes basiques des protéines. La modification chimique de ce résidu est donc très difficile. L’acylation et la nitration ne peuvent être effectuées que dans des conditions extrêmes, incompatibles avec la stabilité des protéines. Le seul type de réaction pratiquement utilisé est la condensation avec des composés dicarboxylés qui s’effectue cependant à des pH extrêmes. Parmi les réactifs les plus utilisés, on doit citer la dialdéhyde malonique ou nitromalonique et le phénylglyoxal qui réagit rapidement à pH 8. Le dérivé obtenu, stable en milieu acide, est labile en milieu alcalin.

1.6.8

Tryptophane

La plupart des réactifs utilisables pour modifier les résidus de tryptophane réagissent aussi avec les groupes thiols ; ces derniers doivent donc être préalablement protégés.

26

“Chap1” — 2018/12/4 — 18:34 — page 27 — #25

1. Les acides aminés, motifs élémentaires

L’oxydation du noyau indole est fréquemment utilisée. L’oxydation peut être obtenue par action de l’eau oxygénée, par ozonolyse en milieu performique en présence de résorcinol ; cependant cette dernière réaction modifie aussi les méthionines. La N-bromosuccinimide réagit rapidement avec le tryptophane pour donner un dérivé oxindole qui absorbe à 250 nm ; quoique très utilisée, cette réaction est peu sélective. Certains halogénures de nitrobenzyle sont très réactifs vis-à-vis du tryptophane. Une autre réaction du tryptophane est la formylation par l’acide formique en présence d’HCl ; cette modification est réversible en milieu alcalin. La réactivité des différents acides aminés peut considérablement varier selon l’environnement dans lequel ils se trouvent.

1.7

Techniques de séparation des acides aminés

Il existe plusieurs techniques de séparation des acides aminés, l’électrophorèse, la chromatographie et la spectrométrie de masse.

1.7.1

Électrophorèse

L’électrophorèse fut introduite en 1930 par Arne Tiselius à Uppsala. Cette méthode consiste à séparer les molécules placées dans un champ électrique d’après leur charge. Soumis à un champ électrique, les acides aminés migrent vers l’électrode de polarité opposée, les molécules neutres ne migrant pas. En dehors du point isoélectrique, la charge nette d’un acide aminé n’est jamais nulle. Leur pK et leur point isoélectrique étant différent, la charge varie d’un acide aminé à l’autre. Dans un champ électrique, les acides aminés auront donc une mobilité qui sera fonction du pH et différera d’un acide aminé à l’autre. L’électrophorèse s’effectue généralement sur support solide, soit le papier, et plus couramment le gel de polyacrylamide (PAGE). La révélation des acides aminés est effectuée par coloration à la ninhidrine.

1.7.2

Chromatographie

La chromatographie avait été découverte à la fin du xix e siècle par un botaniste russe, M. Tswett, qui avait ainsi séparé des pigments végétaux. Elle a été redécouverte à Heidelberg en 1931 par E. Lederer qui l’introduisit comme instrument d’analyse. Les méthodes de séparation par chromatographie furent développées d’un point de vue qualitatif et quantitatif par Martin et Synge en Angleterre au début de l’année 1940. Elles connurent ultérieurement une importante évolution due en partie aux recherches effectuées à l’université d’Uppsala. Les principales méthodes utilisées pour la séparation des acides aminés sont la chromatographie de partage et la chromatographie sur échangeur d’ions.

27

“Chap1” — 2018/12/4 — 18:34 — page 28 — #26

La structure des protéines

La chromatographie de partage est une méthode de séparation des molécules résultant d’une migration différentielle dans deux phases liquides non miscibles. Le caractère amphotère des acides aminés leur assure une bonne solubilité dans l’eau et une faible solubilité dans les solvants organiques. Cependant celle-ci augmentera d’autant plus que la chaîne latérale sera plus apolaire. Il y aura partage entre la phase stationnaire et la phase mobile. En pratique c’est généralement la phase aqueuse qui est fixée sur un support solide (papier ou couches minces de silice). La chromatographie de partage peut être utilisée dans deux solvants successifs. La chromatographie sur échangeur d’ions est une chromatographie en phase liquide permettant d’isoler une substance chargée électriquement d’un mélange de molécules. Les groupes chargés des acides aminés forment des liaisons électrostatiques avec les ions de signe contraire. Si l’ion se présente sous forme d’un réseau solide insoluble dans le solvant, il y aura fixation réversible des acides aminés sur ce réseau. Les échangeurs d’ions sont des macromolécules insolubles, des résines portant des groupements ionisables capables d’échanger certains de leurs ions. Il existe des résines échangeuses de cations :

Y- Na+ + C+

Y- C+ + Na+

et des résines échangeuses d’anions :

X+ Cl- + A-

X+ A- + Cl-

La chromatographie sur échangeur d’ions s’effectue à l’aide de colonnes remplies en particulier de polystyrène sulfoné au travers desquelles s’écoule le solvant. Après fixation du mélange d’acides aminés, leur séparation par élution est assurée par élévation progressive de la force ionique, du pH ou des deux. Parmi les composés échangeurs d’ions, les plus utilisés sont la diméthylaminoéthyl (DEAE) cellulose (échangeur d’anions), la carboxyméthyl (CM) cellulose (échangeur de cations), les Sephadex (DEAE et CM), le sulfopropyl Sephadex (échangeur de cations). Vers la fin des années 1950, à la suite des travaux de W. Stein et S. Moore à l’Institut Rockfeller, des analyseurs automatiques ont été mis au point, en particulier pour la détermination de la composition globale en acides aminés des protéines après hydrolyse acide.

28

“Chap1” — 2018/12/4 — 18:34 — page 29 — #27

1. Les acides aminés, motifs élémentaires

Figure 1.14 Analyse chromatographique d’un hydrolysat d’aspartate transcarbamylase par la méthode de Stein et Moore utilisée dans les analyseurs automatiques d’acides aminés (d’après G. Hervé, non publié).

Bibliographie Berg, J.M., Tymoczko, J.L. & Stryer L. (2006) Biochemistry 7th ed. Freeman, San Francisco. Cantor, C.R. & Schimmel, P.R. (1980) Biophysical chemistry. Part II. Techniques for the study of biological structure and function. Freeman, San Francisco. Cohen, L.A. (1968) Group-specific reagents in protein chemistry. Annu. Rev. Biochem. 37: 695-726. Degani et al. (1970) – à compléter Ellman (1959) – à compléter Glazer, A.N. (1970) Specific chemical modifications of proteins. Annu. Rev. Biochem. 39: 101-130. Jacobson, G.R., Schaffer, M.H., Stark, G.R. & Vanaman, T.C. (1973) Specific chemical cleavage in high field at the amino peptide bonds of cysteine and cysteine residues. J. Biol. Chem. 248: 6583-6591. Janin, J. & Delepierre, M. (1994) Biologie structurale. Principes et méthodes biophysiques. Hermann, Paris. Kempe, D. & Stark, G.R. (1975) Pyridoxal-5 -phosphate, a fluorescent probe in the active site of aspartate transcarbamylase. J. Biol. Chem. 250: 6861-6869. Konno, K., Bruckner, H., D’Aniello, A., Fisher, G., Fuji, N. & Homma, H. (2007) D-aminoacides; A new frontier in aminoacids and protein research. Nova Biochemical Books, New-York. Lundblad, R.L. & Noyes, C.M. (1985) Chemical reagents for protein modifications. Vol. I & II. C.R.C. Press, Boca Raton, Florida. Means, G.E. & Feeney, R.E. (1971) Chemical modifications of proteins. Holden Day Inc. San Francisco. Stark, G.R. & Smith, D.G. (1963) The use of cyanate for the determination of NH2-terminal residues in proteins. J. Biol. Chem. 239: 214-226.

29

“Chap1” — 2018/12/4 — 18:34 — page 30 — #28

La structure des protéines

Yon-Kahn, J. & Herve, G. (2005) Enzymologie moléculaire et cellulaire. Vol. I Grenoble Sciences. Yon-Kahn, J. (2006) Histoire de la Science des protéines. Grenoble Sciences.

30

“Chap2” — 2018/12/4 — 18:43 — page 31 — #1

2 La structure primaire des protéines 2.1

Définition

Dans les protéines, les acides aminés sont reliés par des liaisons peptidiques. L’enchaînement des acides aminés qui constituent la chaîne polypeptidique représente la structure primaire également appelée la séquence de la protéine. NH3+ - CH - CO - NH- CH - CO - NH- CHR1

R2

R3

Les acides aminés sont numérotés à partir de l’extrémité amino-terminale vers l’extrémité carboxy-terminale. La figure 2.1 montre la planéité de la liaison peptidique. Les notions de liaison peptidique et de chaîne latérale remontent au début du xx e siècle. Elles furent reconnues par les chimistes organiciens, Hofmeister en 1902 et Fischer en 1906. La séquence des acides aminés est unique pour chaque protéine. Elle est déterminée par le gène qui code pour la protéine.

31

“Chap2” — 2018/12/4 — 18:43 — page 32 — #2

La structure des protéines

Figure 2.1 Structure primaire : ala-cys-asp-gly-ser.

2.2 2.2.1

Détermination de la structure primaire des protéines Avancées historiques

Les premiers résultats significatifs dans la détermination de la structure primaire des protéines remontent aux années 1950. Ils ont été possibles grâce aux développements des méthodes chimiques. Une avancée décisive fut apportée par Sanger à Cambridge qui utilisa un réactif spécifique, le 1-fluoro-2,4-dinitrobenzène, combiné à des hydrolyses partielles pour l’identification étape par étape des acides aminés N-terminaux. Le dérivé avait l’avantage d’être stable lors de l’hydrolyse acide utilisée pour séparer les acides aminés. Sanger et ses collaborateurs utilisèrent cette méthode pour déterminer la séquence des deux chaînes de l’insuline, ce qui demanda dix années de travail intense. La structure primaire de l’insuline qui comporte 51 acides aminés fut publiée en 1953. Elle est présentée sur la figure 2.2.

Figure 2.2 Structure primaire de l’insuline.

32

“Chap2” — 2018/12/4 — 18:43 — page 33 — #3

2. La structure primaire des protéines

En 1950, Edman, à l’université de Lund en Suède, introduisit une méthode utilisant le phénylisothiocyanate (PITC), réactif capable de détacher séquentiellement les acides aminés à partir de l’extrémité N-terminale. Le groupe phénylthioarbamate se fixe sur le groupe α-aminé N-terminal. Le produit formé se cyclise, et cette cyclisation entraîne la rupture entre les deux premiers acides aminés et il y a libération de phénylthiohydantoïne qui contient l’acide aminé N-terminal dont la nature peut être identifiée après hydrolyse acide. L’ensemble des réactions qui constitue la méthode d’Edman est représenté ci-dessous. La réaction est décrite dans le cas d’un peptide. R1

R2

-N-C=S + H2N-CH-CO-NH-CH-

phénylisothiocyanate

peptide

R1

S

R2

-NH--CNH -CH-C-NH-C-

phénylthiocarbamyl peptide

S NH

C

CH-R1

-N C O

phénylthiohydantoïne

Aujourd’hui, on utilise généralement pour le microséquençage manuel des protéines le diméthylaminoazobenzène isothiocyanate (DABITC) qui conduit, sur le même principe que précédemment, à la formation d’un dérivé diméthylaminobenzène thiohydantoïne (DABTH) coloré. L’utilisation de ce réactif permet une très grande sensibilité de détection et rend possible des déterminations de séquence avec moins d’une nanomole de polypeptide. Il existe actuellement des appareils qui effectuent automatiquement le séquençage des protéines.

33

“Chap2” — 2018/12/4 — 18:43 — page 34 — #4

La structure des protéines N C S N

N

CH3 NH CH3

En 1960, grâce aux travaux d’Anfinsen, la séquence de la ribonucléase qui comporte 124 acides aminés et quatre ponts disulfure a été déterminée par Hirs, Stein et Moore. À partir de cette période, de nombreuses équipes de scientifiques dans le monde se consacrèrent à l’analyse des séquences de protéines. Le nombre de séquences connues a augmenté rapidement grâce à l’automatisation des méthodes de séquençage. Ceci conduisit Dayhoff à publier en 1966 la première édition de l’Atlas des séquences protéiques. Aujourd’hui les séquences de nombreuses protéines sont connues, soit à partir de l’analyse de la séquence de la protéine, soit à partir de l’analyse de la séquence du gène qui code pour cette protéine. Les banques de données contiennent aujourd’hui plus de 500 000 séquences de protéines.

Figure 2.3 Structure primaire de la ribonucléase.

34

“Chap2” — 2018/12/4 — 18:43 — page 35 — #5

2. La structure primaire des protéines

2.2.2

Principes des méthodes de détermination des séquences protéiques

Les études de séquence doivent être effectuées sur une protéine purifiée. Lorsque celleci comporte plusieurs chaînes polypeptidiques associées par des ponts disulfure, les chaînes doivent d’abord être séparées. La séparation est effectuée par réduction des ponts disulfure suivie d’une carboxyméthylation. Afin de réduire la taille de la chaîne polypeptidique à séquencer, des méthodes chimiques et enzymatiques permettent de procéder à des coupures spécifiques. La coupure chimique la plus utilisée est la réaction du bromure de cyanogène qui se produit au niveau des méthionines. BrC=N bromure de cyanogène

+ AA1-Met-AA2AA1-HSL + H2N-AA2HSL = homosérine lactone

L’homosérine lactone donne par hydrolyse l’homosérine. Les coupures enzymatiques font appel à des protéases spécifiques. Les fragments résultants sont séparés par chromatographie, puis analysés. Les séquences sont déterminées par la méthode d’Edman. À partir des fragments obtenus, les chevauchements sont recherchés afin d’établir la séquence de la protéine.

2.2.3

Spectrométrie de masse

L’utilisation de la spectrométrie de masse pour l’analyse de molécules et macromolécules telles que peptides et protéines a fait d’importants progrès au cours des dernières années. La technique consiste à ioniser ces molécules sous vide sous l’influence d’un flux électronique qui peut, de plus, provoquer leur fragmentation et l’ionisation des fragments obtenus. Elles sont alors soumises à un champ électrique qui les conduit vers un détecteur très sensible, en fonction du rapport de leur masse et de leur charge (m/z), fournissant des informations sur leur masse et leur structure. La précision est telle que les masses moléculaires sont obtenues à l’unité près. La méthode a connu plusieurs perfectionnements, en particulier par l’utilisation de la méthode MALDI (Matrix-Assisted Laser Desorption-Ionisation). Dans ce cas, les molécules étudiées sont adsorbées sur une matrice organique. Lors de leur désorption du support par un rayonnement laser, l’ionisation de ces composés diminue la fragmentation de la molécule étudiée. Dans les appareils les plus perfectionnés, la technique est encore améliorée par l’introduction d’un analyseur de temps de vol vers le détecteur (TOF = Time Of Flight). Ces progrès technologiques permettent maintenant l’analyse de protéines dont la masse moléculaire peut aller au-delà de 100 000 daltons. Le couplage de la spectrométrie de masse avec l’analyse de mélanges naturels de protéines par

35

“Chap2” — 2018/12/4 — 18:43 — page 36 — #6

La structure des protéines

HPLC (High Performance Liquid Chromatography), électrophorèse bidimensionnelle et protéolyse ménagée, est à la base des progrès rapides de la protéomique. Elle permet également d’obtenir des informations structurales concernant les modifications post-traductionnelles (phosphorylation, acétylation parmi d’autres) et la présence de ponts disulfure. La spectrométrie de masse est aussi utilisée pour la détermination de la séquence des protéines. La protéolyse enzymatique conduit à l’obtention de polypeptides. La fragmentation permet de séparer chaque acide aminé du peptide, la coupure ayant lieu au niveau de la liaison peptidique. Aujourd’hui, et sur la base de l’universalité du code génétique, il est plus fréquent de pratiquer le séquençage du gène codant pour la protéine, qui constitue une méthode plus rapide.

2.3

Composition globale des protéines en acides aminés

Il apparaît que sur l’ensemble des protéines la proportion des différents acides aminés est relativement constante. Certains d’entre eux sont préférentiellement présents. C’est le cas des acides aminés chargés, Asp, Glu, Lys et Arg, en relation avec l’importance des interactions ioniques dans l’établissement de la structure tertiaire. Ceci concerne également les résidus hydrophobes, Val, Leu, Ile qui interviennent dans la constitution des cores hydrophobes. Les acides aminés, Thr, Tyr, Pro, Cys et His, sont moins représentés malgré l’importance des résidus Cys pour l’établissement des ponts disulfures et des résidus His souvent impliqués dans les sites catalytiques des enzymes. Il existe des protéines dans lesquelles, en raison de caractéristiques structurales et fonctionnelles particulières, la fréquence des acides aminés s’écarte de cette moyenne. C’est le cas par exemple du collagène qui contient une forte proportion de résidus proline et glycine. Des écarts importants à la moyenne sont également observés dans le cas de protéines présentes dans les microorganismes adaptés aux conditions environnementales extrêmes. Le cas de l’aspartate transcarbamylase de l’archée hyperthermophile Pyroccocus abyssi est particulièrement intéressant. Cet enzyme contient deux fois plus d’acides aminés chargés positivement et négativement (Asp, Glu, Lys, Arg) que l’enzyme homologue d’Escherichia coli. Ceci aboutit, non seulement à la formation de liaisons ioniques entre sous-unités pour la stabilisation de la structure quaternaire, mais également, fait remarquable, à l’existence d’interactions ioniques à la surface des sous-unités catalytiques de cet enzyme, assurant de plus la stabilisation de la structure tertiaire des monomères.

36

“Chap2” — 2018/12/4 — 18:43 — page 37 — #7

2. La structure primaire des protéines

2.4

Études des alignements de séquences : taxonomie des protéines

La connaissance de la structure primaire de nombreuses protéines donne accès à des informations à partir des alignements de séquences. Ceux-ci permettent de prédire la fonction d’une protéine, sa structure secondaire, et d’établir une phylogénie. Il existe deux types d’alignement et les logiciels correspondants, l’alignement global entre deux séquences sur toute leur longueur (FASTA) et l’alignement local entre une séquence et une partie d’une autre séquence (BLAST). À partir des séquences d’une même protéine issue de différentes espèces, il est possible de construire un arbre phylogénétique. Ces études révèlent l’existence de superfamilles, c’est-à-dire de protéines contenant plus de 30 à 40 % d’identité de séquence. Les arbres phylogénétiques construits à partir des séquences protéiques correspondent assez bien à l’évolution des espèces obtenues à partir de critères morphologiques et paléontologiques.

2.5

Synthèse peptidique

L’étude des protéines et de leurs propriétés a également conduit à effectuer la synthèse in vitro de protéines à partir des acides aminés. Les méthodes de synthèse peptidique commencèrent à progresser vers la fin des années 1940. En 1953, Du Vignaud réussit la synthèse d’hormones peptidiques, l’ocytocine et la vasopressine constituées de 9 acides aminés. Cet aboutissement fut suivi de la synthèse de plusieurs peptides actifs et la synthèse peptidique devint un important domaine de recherche. La synthèse de l’insuline par des équipes chinoises représenta une réussite importante dans l’histoire de la science chinoise. Les travaux de synthèse furent précédés de la mise au point d’une méthode permettant de réassocier les deux chaînes par leurs ponts disulfure. La chaîne B synthétisée fut associée avec succès à la chaîne A naturelle. Ensuite les deux chaînes synthétisées séparément furent associées avec succès en 1965 et le produit se révéla biologiquement actif. Les premières synthèses peptidiques avaient été réalisées par des techniques standards en solution. Une avancée importante fut réalisée par Gutte et Merrifield qui développèrent un procédé de synthèse en phase solide avec automatisation programmée de la séquence des réactions d’addition des acides aminés. Ils aboutirent en 1969 à la synthèse totale de la ribonucléase qui possédait la pleine activité de l’enzyme naturel. La synthèse d’une liaison peptidique est théoriquement obtenue par condensation de deux acides aminés : H2N-CH-COOH + H2N-CH-COOH R1

R2

H2N-CH-CO-NH-CH-COOH + H2O R1

R2

Cependant la réaction est thermodynamiquement en faveur de la réaction inverse qui est l’hydrolyse. Elle ne peut se faire que s’il y a préalablement activation du carboxyle.

37

“Chap2” — 2018/12/4 — 18:43 — page 38 — #8

La structure des protéines

H2N-CH-COOH + AX

H2N-CH-COX + A-OH

R1

R1

H2N-CH-COX + H2N-CH-COOH

H2N-CH-CO-NH-CH-COOH + XH R1

R2

R1

R2

L’activation du carboxyle est généralement réalisée par la formation d’un ester. Les chaînes latérales sont préalablement protégées. Dans la synthèse en phase solide, il y a couplage de l’acide aminé C-terminal à une résine insoluble telle que le chlorométhyl polystyrène.

B-NH-CH-COOH

+ Cl-CH2-

(R)n

B-NH-CH-CO-O-CH2-

+ HCl

(R)n H+

NH2-CH-CO-O-CH2-

+ BH

(R)n

+ B-NH-CH-CO-X (R)n-1

B-NH-CH-CO-NH-CH-CO-O-CH2(R)n-1

(R)n

À la fin de la synthèse, les chaînes latérales préalablement protégées sont débloquées, puis le polypeptide est détaché du support solide.

38

“Chap2” — 2018/12/4 — 18:43 — page 39 — #9

2. La structure primaire des protéines

NH2-CH-CO...-NH-CH-CO-NH-CH-CO-O-CH2R1

(R)n-1

(R)n HBr/CF3COOH

NH2-CH-CO...-NH-CH-CO-NH-CH-CO-O-H R1

(R)n-1

+

Br-CH2-

(R)n

La série des opérations est réalisée dans un appareil automatique. Cette méthode a permis de synthétiser un grand nombre de polypeptides hormonaux, mais également de protéines.

Bibliographie Berg, J, Timoczco, J.L. & Stryer, L. (2012)Biochemistry 7e ed. Freeman. Edman, P. (1950) Method for determination of the aminoacid sequence in peptides. Acta Chem. Scand. 4: 283-293. Gutte, B. & Merrifield, R.B. (1969) Total synthesis of an enzyme with ribonuclease activity. J. Am. Chem. Soc. 91: 501-502. Hirs, C.H., Moore, S. & Stein, W.H. (1960) The sequence of the aminoacid residues in performic acid oxidized ribonuclease. J. Biol. Chem. 235: 633-647. Redfield, R.R., & Anfinsen, C.B. (1956) The structure of ribonuclease. II The preparation, separation and relative alignment of large enzymatically produced fragments J. Biol. Chem. 221: 385. Sanger, F. & Thompson, E.O.P. (1953) The amino acid sequence in the glycyl chain of insulin. Biochem. J. 53: 353-374. Tsou, C.L. (1995) Chemical synthesis of crystalline bovine insulin: a reminiscence. TIBS 20: 289-292. Yon, J. (1969) Structure et dynamique conformationnelle des protéines. Hermann, Paris. Yon-Kahn, J. (2006) Histoire de la science des protéines, Grenoble Sciences.

39

“Chap3” — 2018/12/4 — 18:44 — page 41 — #1

3 La structure secondaire 3.1

Définition

La structure secondaire désigne les éléments de structure régulière ou périodique de la chaîne polypeptidique. La description de la conformation d’une chaîne polypeptidique implique la connaissance des longueurs et des angles de liaison ainsi que des angles de rotation autour des liaisons simples. Les symboles recommandés par la Commission de Nomenclature sont b et τ pour les longueurs et les angles de liaison respectivement. Une des caractéristiques essentielles d’une chaîne polypeptidique est la planéité de la liaison peptidique qui résulte de son caractère partiel de double liaison, par suite de l’existence de deux formes en résonance (figure 3.1a). La figure 3.1b indique les longueurs et les angles de la liaison peptidique. Cela conditionne la conformation que peut adopter une chaîne polypeptidique. Les angles de rotation autour des liaisons simples appelés angles dièdres ou angles de torsion sont désignés par la lettre θ. Dans les polypeptides, ils sont représentés par les lettres ϕ, ψ, ω, et χ. ϕ, et ψ sont les angles de rotation autour de N-Cα et Cα –Ci , respectivement ; ω est l’angle de rotation autour de la liaison peptidique. Les angles de rotation autour des carbones des chaînes latérales sont désignés par χ avec χ1 pour l’angle autour du Cα –Cβ et χ2 pour l’angle autour du Cβ –Cγ . La structure secondaire est déterminée par les valeurs des angles dièdres ϕ et ψ. Puisqu’il y a seulement deux variables par résidu, la conformation locale d’un

41

“Chap3” — 2018/12/4 — 18:44 — page 42 — #2

La structure des protéines

(a)

(b)

Figure 3.1 La liaison peptidique ; en (a) les deux formes en résonance de la liaison peptidique ; en (b) les valeurs des angles et des longueurs de liaison.

résidu i peut être représentée par un point de coordonnées ϕi , ψi dans un diagramme bidimensionnel, le diagramme de Ramachandran représenté sur la figure 3.4. Seule une petite partie de ce diagramme correspond à des conformations locales possibles. Les zones totalement permises sont entourées d’un trait noir. Celles qui sont partiellement permises sont délimitées en pointillés ; elles sont accessibles sous contrainte. La zone I comporte les hélices α droites, la zone II les hélices α gauches, la zone III les structures β. La proline comporte plus de restrictions conformationnelles que les autres acides aminés, car la liaison N-Cα appartient à un cycle à 5 côtés. Il s’ensuit que l’angle ϕ est restreint à une valeur proche de –70◦ , seul ψ reste variable. La liaison peptidique précédant le cycle pyrrolidine peut exister sous deux conformations, cis ou trans, ωi−1 pouvant prendre les valeurs 0◦ ou 180◦ , respectivement. Pour les autres acides aminés, la forme trans de la liaison peptidique est préférentielle.

42

“Chap3” — 2018/12/4 — 18:44 — page 43 — #3

3. La structure secondaire

Figure 3.2 Représentation des angles dièdres du squelette peptidique.

Figure 3.3 Valeur des angles dièdres des résidus d’une chaîne latérale d’une protéine.

3.2

Conformations du squelette polypeptidique

L’existence de structures ordonnées dans les chaînes polypeptidiques a été proposée par William Astbury et son groupe qui étudiaient les protéines fibreuses dans les années 1940. Dès 1935, Linus Pauling s’intéressa à l’étude des protéines. Avec son collègue Robert Corey, il établit les règles qui conditionnent la formation de structures régulières dans les protéines. Ces règles s’énoncent comme suit : 1. La longueur et les angles de liaison ont des valeurs standards. 2. La liaison peptidique est plane avec une préférence pour la configuration trans. 3. Les angles dièdres ϕ (N-Cα ) et ψ (Cα -Ci ) ont des valeurs restreintes à quelques orientations favorables.

43

“Chap3” — 2018/12/4 — 18:44 — page 44 — #4

La structure des protéines

Figure 3.4 Diagramme de Ramachandran montrant les régions permises pour un dipeptide contenant l’alanine. Les zones totalement permises sont entourées d’un trait noir et les zones partiellement permises d’un trait en pointillés. La zone I comporte les hélices α droites, la zone II les hélices α gauches, la zone III les structures β.

Figure 3.5 Liaison peptidique impliquant la proline. À gauche, la liaison peptidique est trans ; à droite, elle est cis.

4. Il se forme un maximum de liaisons hydrogène entre les groupes C=O et H-N. 5. La longueur et la déformation angulaire de la liaison hydrogène varient dans des limites étroites. Pour beaucoup de protéines, les conditions (3) et (4) ne sont plus considérées aujourd’hui comme étant essentielles Il existe principalement deux types de structures régulières dans les protéines, l’hélice α et les structures β. On inclut aussi dans les structures secondaires, les retournements de la chaîne polypeptidique, les virages tels que le virage β (β turn)

44

“Chap3” — 2018/12/4 — 18:44 — page 45 — #5

3. La structure secondaire

Figure 3.6 Linus Pauling (archives du California Institute of Technology).

correspondent à des valeurs précises des angles dièdres. Le terme de virage (turn), qui est la traduction exacte de turn, est plus approprié que celui de coude (elbow) que l’on trouve fréquemment, car il implique une notion directionnelle.

3.2.1

Hélices

Différents types d’hélices ont été décrits par Pauling et Corey. Le tableau suivant donne les caractéristiques des structures régulières dans les protéines et les polypeptides. Ces structures sont définies par les angles dièdres ϕ et ψ, par le nombre de résidus par tour n, par la translation par résidu le long de l’axe h et par r, le nombre d’atomes dans un anneau formé par une liaison hydrogène et le segment de la chaîne principale qui connecte son extrémité. Dans les protéines, parmi les hélices, on trouve essentiellement l’hélice α droite ; sa chiralité est la conséquence du caractère lévogyre des acides aminés. Elle présente des

45

“Chap3” — 2018/12/4 — 18:44 — page 46 — #6

La structure des protéines

Caractéristiques des structures régulières dans les protéines.

Tableau 3.1

ϕ

ψ

n

r

hA

hélice α droite

–58◦

–47◦

3,6

13

1,5

hélice α gauche

+58◦

+47◦

3,6

13

1,5

hélice π

–57,06◦

–69,6◦

4,4

16

1,15

hélice 310

–75,5◦

–4,5◦

3

10

2,00

hélice αII

–93◦

–18◦

3,6

13

chaîne étendue

180◦

180◦

2

3,63

structure β parallèle

–199◦

113◦

2

3,25

structure β antiparallèle

–139◦

135◦

2

3,5

polyproline I (ω = 0◦ )

–83◦

158◦

polyproline II (ω = 180◦ )

–78◦

149◦

Structure

?

1,5

caractéristiques bien définies. Les angles ϕ et ψ ont des valeurs respectives de –58◦ et –47◦ . Elle possède 3,6 acides aminés par tour. Le pas de l’hélice, c’est-à-dire la ? distance entre deux tours adjacents, est de 5,4 A. Quelques segments dans les protéines ont une conformation correspondant à l’hélice 310 souvent observée en fin d’une région hélicoïdale. Cela a été trouvé dans plusieurs protéines dont le lysozyme, la chymotrypsine, l’anhydrase carbonique, la myoglobine et l’hémoglobine.

3.2.2

Déformation des hélices α

Du fait d’interactions avec leur environnement, dont certaines chaînes latérales voisines, les hélices peuvent subir plusieurs types de déformations telles que des courbures ou des coudes induits en particulier par la nature cyclique de la chaîne latérale des résidus de proline. Il a été montré par J. Parello que, dans certains cas, deux molécules d’eau qui sont en interaction, sont fortement liées à la partie externe de ces coudes. Le concept de base pour la détection de ces coudes hydratés repose sur une analyse géométrique des distances entre les atomes d’azote et d’oxygène le long des hélices (Roquet et al., 1992). La conception de programmes informatiques spécifiques par J. Parello et L. Lenocci a permis à ces auteurs d’examiner de ce point de vue la structure cristallographique de plus de 30 000 protéines. Cette remarquable analyse a montré que 3 % des hélices présentent des coudes dont 30 % environ contiennent des résidus de proline. Il est probable que la non-détection de molécules d’eau dans certains cas ne résulte que de la résolution insuffisante de la structure cristallographique. Une étude statistique donne des indications sur la nature des séquences d’acides aminés qui favorisent la formation des coudes hydratés. La localisation de ces coudes dans les protéines étudiées suggère qu’ils jouent un rôle dans le repliement

46

“Chap3” — 2018/12/4 — 18:44 — page 47 — #7

3. La structure secondaire

Figure 3.7 L’hélice α.

et les propriétés fonctionnelles de ces protéines. Comme l’a montré J. Parello, ceci est illustré par le fait que les sous-unités de l’hémoglobine contiennent un coude hydraté présent dans la conformation T mais non dans la conformation R, suggérant que cet élément structural particulier est impliqué dans la transition de structure quaternaire associée à la coopérativité de fixation de l’oxygène à l’hémoglobine.

3.2.3

Structures β

Lorsque la chaîne polypeptidique est complètement étendue, les liaisons hydrogène ne peuvent se former entre les groupes C=O et H-N de la même chaîne. Mais elles peuvent s’établir avec une autre chaîne. Il se forme des feuillets β parallèles ou antiparallèles selon que les chaînes adjacentes sont dirigées dans la même direction ou dans la direction opposée.

47

“Chap3” — 2018/12/4 — 18:44 — page 48 — #8

La structure des protéines

brin β

feuillet β parallèle

feuillet β antiparallèle

Figure 3.8 Structures β.

Des protéines fibreuses comme la kératine β possèdent ce type de structure. Mais de telles structures peuvent aussi s’établir au sein d’une même chaîne polypeptidique dans les protéines globulaires par suite d’un retournement de la chaîne. Suivant le type de connexion, virage en épingle à cheveu (hairpin) (a) ou connexion dite « crossover » (b), il peut se former des structures β antiparallèles ou parallèles. (a)

(b)

Figure 3.9 Retournements de la chaîne.

3.2.4

Retournements de la chaîne : les virages

Les virages de la chaîne polypeptidique peuvent s’effectuer sur une distance de deux résidus, c’est le cas du virage β. Un virage β implique une région de quatre résidus consécutifs de i à i + 3 se repliant sur eux-mêmes de presque 180◦ . Un virage peut être ? défini lorsque la distance entre Cα i et Cα i+3 est inférieure à 7A et lorsque i + 1 ou i + 2 n’est pas impliqué dans une hélice α. En 1968, Venkatachalam fut le premier à décrire différents types de virages possibles, les types I, II et III. Le virage de type II est équivalent à un tour d’hélice3,10 . Les virages de type I et II diffèrent par l’orientation de l’unité peptidique et par plusieurs interactions.

48

“Chap3” — 2018/12/4 — 18:44 — page 49 — #9

3. La structure secondaire

Figure 3.10 Virages β de type I et II.

Tableau 3.2

Caractéristiques des virages β. Type de virage

ϕ2

ψ2

ϕ3

ψ3

I

–60

–30

–90

0

II

–60

+120

+80

0

III

–60

–30

–60

–30

Chaque type de virage est défini par la valeur des angles (ϕ, ψ)2 et (ϕ, ψ)3 . Plusieurs virages β ont des liaisons hydrogène entre Oi et Ni+3 , ce qui requiert une distance ? inférieure à 3,5 A. Les virages de type I , II , et III sont les images miroir des virages de type I, II et III, avec leurs angles de signe opposé. Les virages β connectent généralement deux segments β antiparallèles. Le virage γ connecte aussi deux segments β antiparallèles, mais il requiert seulement trois résidus et est stabilisé par deux liaisons hydrogène. Les courbures de la chaîne polypeptidique contiennent fréquemment les acides aminés Asn, Cys, Asp en première position, Asn, Asp, Gly en deuxième et troisième position, et Trp, Gly, Tyr en quatrième position. La proline est fréquemment présente

49

“Chap3” — 2018/12/4 — 18:44 — page 50 — #10

La structure des protéines

en position 2 dans les virages β de type I et III et la glycine en position 3 dans les virages β de type II.

3.2.5

Autres structures régulières

Il existe d’autres structures régulières que l’on trouve dans les polypeptides, mais pas dans les protéines globulaires. La polyglycine existe sous deux formes, la polyglycine I qui présente une structure étendue et la polyglycine II dans laquelle les chaînes sont empaquetées d’une manière hexagonale formant des liaisons hydrogène entre chaînes ? voisines. Les paramètres sont n = 3, h = 3,1 A. Dans le collagène, trois chaînes en conformation étendue sont enroulées l’une autour de l’autre pour former un super enroulement. Les chaînes sont associées par liaisons hydrogène. Chaque troisième résidu est une glycine, le précédent étant généralement une proline. Dans les structures de type polyproline, le fait que la liaison peptidique puisse exister soit sous forme cis (ω = 0), soit sous forme trans (ω = 180◦ ) conduit respectivement aux structures de type polyproline I et polyproline II. Dans la polyproline I, les angles dièdres ϕ, ψ ont des valeurs respectives de –75◦ et 160◦ ; la structure est une hélice ? gauche avec les paramètres n = 3,3 et h = 2,2 A. Dans la polyproline II, ces valeurs ◦ ◦ sont –75 et 145 . La chaîne forme une hélice gauche rigide avec les paramètres ? n = 3, h = 3,12 A. La conformation de la polyproline II est très semblable à celle du collagène.

3.2.6

Caractéristiques des structures non régulières

Certains acides aminés favorisent les structures régulières dans les protéines. Ainsi, les acides aminés Ala, Leu, Met, Glu, ont tendance à former des hélices α, alors que les acides aminés Gly, Pro ont tendance à rompre les hélices. Les acides aminés Ile, Val, Phe favorisent la formation de brins β. Dans les protéines globulaires, des parties importantes de la chaîne polypeptidique ne sont pas organisées en structures régulières. Cependant, la chaîne polypeptidique a une conformation fixe et bien définie dans ces régions. Il ne s’agit donc pas de structures désordonnées.

3.2.7

Méthodes d’étude des structures secondaires

Diverses méthodes permettent de déterminer la présence des structures secondaires dans les protéines. La diffraction des rayons X par le cristal et la résonance magnétique nucléaire (RMN) utilisées pour résoudre les structures tridimensionnelles des protéines fournissent les informations les plus précises. Cependant il existe d’autres

50

“Chap3” — 2018/12/4 — 18:44 — page 51 — #11

3. La structure secondaire

méthodes comme le dichroïsme circulaire et la spectroscopie infrarouge par transformée de Fourier qui permettent d’identifier les structures secondaires dans les protéines. La méthode de dichroïsme circulaire a été décrite au chapitre 1. Les spectres correspondant aux différents types de structure secondaire sont représentés ci-après. Le spectre de l’hélice α présente un minimum à 220 nm, celui des structures β un maximum à 195 nm.

ellipticité par résidu

4 104 2 104 0 -2 104 -4 104 200

220

240

Longueur d’ onde (nm) Figure 3.11 Dichroïsme circulaire des structures secondaires. En rouge, les hélices α : en bleu, les structures β ; et en vert, les parties non structurées.

Le spectre de dichroïsme circulaire d’une protéine est la résultante de ces trois contributions. Il permet non seulement d’estimer les contributions relatives de ces trois types d’organisation à l’ensemble de la protéine, mais aussi d’apprécier la modification de ces contributions lors des changements conformationnels de cette protéine, tels que ceux provoqués par la fixation de ligands par exemple. La spectroscopie infrarouge par transformée de Fourier (FITR) peut également être utilisée pour déterminer la présence et le contenu de structures secondaires. Deux groupes de vibrations sont considérés correspondant aux spectres amide I et amide II représentés sur la figure 3.12. Le spectre amide I (1 620-1 680 cm−1 ) correspond à la vibration du groupe C=O. Le spectre amide II (1 530-1 550 cm−1 ) correspond à la vibration de déformation du groupe N-H et à la vibration d’élongation de C-N et C-C. Le spectre amide I est relié à la conformation de la protéine, les structures secondaires ayant des bandes caractéristiques bien définies présentées dans le tableau 3.3.

51

“Chap3” — 2018/12/4 — 18:44 — page 52 — #12

La structure des protéines

1640 cm-1 1670 cm-1

amide II

amide I 1700

1650

1600

1550

1500

Figure 3.12 Spectres infrarouges des liaisons amide I et amide II (d’après D. Bertrand et E. Dufour, 2006, La spectroscopie infra rouge et ses applications analytiques. Éd. Lavoisier).

Tableau 3.3

Caractéristiques des bandes FITR des structures secondaires. Feuillets β antiparallèles

1 675-1 695 cm−1

Hélices 310

1 660-1 670 cm−1

Hélice α

1 648-1 660 cm−1

Feuillets β

1 625-1 640 cm−1

Structures non ordonnées

1 640-1 648 cm−1

Agrégats

1 610-1 628 cm−1

La figure 3.13 représente la déconvolution d’un spectre FITR expérimental de protéine.

3.3

Transformation des hélices α en structures β

Dès 1993, il avait été observé qu’un même oligopeptide pouvait exister soit en hélice α, soit en structure β et que le basculement d’une structure dans une autre pouvait être induit par une variation de pH. Dans le facteur d’élongation EF-Tu, la conversion hélice α → structure β se produit lors de l’hydrolyse du GTP en GDP. On pouvait alors se demander quel est le minimum d’acides aminés requis pour spécifier un type de repliement. Pour résoudre cette question, Craemer et Rose ont lancé le « défi de Paracelse » offrant un prix de 1 000 $ au premier groupe qui convertirait une protéine de type β en protéine de type α ou l’inverse. Trois groupes relevèrent le défi et, par remodelage de protéines existantes, construisirent trois nouvelles petites protéines appelées paracelsin-43, crotéin G et Janus. La stratégie a consisté en une approche

52

“Chap3” — 2018/12/4 — 18:44 — page 53 — #13

3. La structure secondaire

Figure 3.13 Déconvolution d’un spectre FITR de protéine. En noir, le spectre expérimental ; en rouge, les hélices α ; en bleu, les structures non ordonnées et en pointillé les structures β (d’après D. Bertrand et E. Dufour, 2006, La spectroscopie infra rouge et ses applications analytiques. Éd. Lavoisier).

(a)

(b)

Figure 3.14 La figure illustre le cas de la crotein G ; en (a) est représentée la protéine parente et en (b) la protéine cible. (d’après S. Dalal et al. (1997). Transmuting α helices and β sheets. Folding & Design, R-71-R77).

53

“Chap3” — 2018/12/4 — 18:44 — page 54 — #14

La structure des protéines

théorique préalable cherchant à définir une séquence compatible avec la structure recherchée au moyen d’un algorithme adapté. Puis la protéine a été synthétisée soit par synthèse chimique en phase solide, soit par recombinaison génétique. La structure de la protéine ainsi obtenue a été déterminée par RMN. La paracelsin-43 présentait une certaine proportion d’hélice alors que la protéine parente était en structure β. Une meilleure conversion était obtenue avec les deux autres protéines. La figure 3.14 illustre le cas de la crotéin G ; en (a) est représentée la protéine parente et en (b) la protéine cible. La transformation d’hélices en structures β peut entraîner la formation d’agrégats. Ceci peut se produire in vivo et est à l’origine de pathologies. Cet aspect sera détaillé dans le chapitre sur le repliement des protéines.

Bibliographie Bertrand, D. & Dufour, E. (2006) La spectroscopie infrarouge et ses applications analytiques. Éd. Tec & Doc. Lavoisier, Paris. Boquet, F., Declercq, J.P., Tinant, B., Rambaud, J., & Parello, J. (1992) Crystal structure of the unique parvalbumin component from muscle of the leopard shark (trakis semi-nasalite). J. Mol. Biol. 223: 705-720. Dalal, S. Balasubramanian, S., & Regan, L. (1997) Transmuting α helices and β sheets. Folding & Design 2: R71. Janin, J & Delepierre, M. (1994) Biologie structurale. Hermann, Paris. Ghelis, C. & Yon, J. (1982) Protein folding. Acad. Press, New-York. Nemethy, G. & Scheraga, H.A. (1965) Theoretical determinations of sterically allowed conformations of a polypeptide chain. Biopolymers 3: 155-184. Pauling, L. & Corey, R.B. (1953) The pleated-sheet configuration of polypeptide chains involving both cis and trans amide groups. Proc. Natl. Acad. Sci. USA 39: 247-256. Ramachandran, G.N., Ramakrishnan, C. & Sasisakharan, V. (1963) Stereochemistry of peptide chain configuration. J. Mol. Biol. 7: 95-99.

54

“Chap4” — 2018/12/4 — 18:47 — page 55 — #1

4 La structure supersecondaire 4.1

Définition

Des segments de structure secondaire peuvent s’associer pour former ce que Rao et Rossmann en 1973 ont désigné par le terme de structure supersecondaire et que Chothia a nommé en 1976 unités de repliement. Le compactage des atomes dans les protéines globulaires résulte des interactions entre segments de structure secondaire ou de structure non périodique (random coil) au sein de la chaîne polypeptidique. Il existe des associations de type hélice α-hélice α, segment β-segment β, segment β-hélice α-segment β et des interactions de type hélice α-coil ou segment β-coil. Ces segments sont reliés entre eux par des boucles plus ou moins longues. La figure 4.1 illustre quelques exemples de ces associations. Les interactions entre segments de structure secondaire obéissent à certaines exigences énergétiques. La structure globale de la protéine doit être compacte et les groupes hydrophobes enfouis à l’intérieur de la molécule afin d’éviter le contact avec le solvant. En conséquence, l’association des structures secondaires dépend des résidus d’acides aminés qui forment leur interface.

4.2

Associations d’hélices α

Afin de déterminer les différentes possibilités d’association de deux hélices, F. Crick en 1963 a utilisé une construction graphique selon un modèle simplifié dans lequel

55

“Chap4” — 2018/12/4 — 18:47 — page 56 — #2

La structure des protéines

αα

ββ

βαβ

Figure 4.1 Associations de structures secondaires.

les parties protubérantes de l’une des hélices étaient insérées dans les sillons de l’autre hélice. Ce modèle nommé « knobs into holes » fut repris en 1977 par Chothia et ses collègues qui en déduisirent trois orientations préférentielles correspondant aux valeurs respectives de l’angle  formé par les axes des hélices de –82◦ , –60◦ et +19◦ . La figure 4.2 illustre le procédé. La première association correspond à des hélices pratiquement orthogonales, la dernière à des hélices quasi parallèles. Après une réévaluation, deux associations préférentielles ont été retenues, celles dont les axes forment un angle de –60◦ ou de + 20◦ , valeurs que l’on retrouve dans les structures protéiques connues. La myoglobine et la myohémérythrine en sont des exemples. Les associations de plus de deux hélices sont plus complexes. En 1988, Murzin et Finkelstein à l’université de Pushino ont proposé un modèle pour rendre compte de l’assemblage des hélices dans les protéines. Ce modèle, appelé modèle des polyèdres quasi sphériques, admet que les hélices ont une forme générale de cylindre et qu’elles s’associent avec une face orientée vers l’intérieur et l’autre vers le solvant. Les polyèdres qui décrivent l’assemblage de trois, quatre, cinq et six hélices sont respectivement l’octaèdre, l’hexadécaèdre, le dodécaèdre et l’icosaèdre, ainsi que l’illustre la figure 4.4. Le deuxième domaine de la thermolysine correspond à l’un des modèles d’hexaèdre.

4.3

Association de brins β

Les associations de brins β dépendent du type de connexion qui les relie. Suivant le type de connexion, en épingle à cheveux ou « cross over », les feuillets seront antiparallèles ou parallèles. Les structures β ainsi formées ont été classifiées par Richardson en 1976 suivant la séparation qui connecte les brins β. Comme nous le verrons plus loin, les motifs topologiques engendrés par ces structures ressemblent à des motifs géométriques que l’on trouve dans les poteries et les tissages grecs ou indiens.

56

“Chap4” — 2018/12/4 — 18:47 — page 57 — #3

4. La structure supersecondaire

b

a

c

d Figure 4.2 Associations d’hélices α (d’après Chothia, C, Levitt, M.A. & Richardson, M.D. (1977) Structure of proteins: packing of a helices and pleated sheets. Proc. Natl. Acad. Sci. USA 74, 4130-4134).

La figure 4.5 montre les différents arrangements des structures β trouvés dans les protéines de structure tridimensionnelle connue. Dans les associations entre segments β, les connexions dextrogyres sont prédominantes. Ainsi que l’ont montré Richardson (1977), Sternberg et Thornton (1977), sur 66 connexions de type crossover, 64 furent trouvées dextrogyres, et seulement deux lévogyres. Dans les protéines globulaires, les feuillets β sont courbés plutôt que

57

“Chap4” — 2018/12/4 — 18:47 — page 58 — #4

La structure des protéines

Figure 4.3 Structure de la Myoglobine (à gauche) et myohémérythrine (à droite) obtenues à partir de la PDB avec le logiciel Swiss PDB viewer.

droits comme dans les protéines fibreuses. Leur torsion vue le long du segment est dextrogyre. La représentation schématique de la carboxypeptidase (figure 4.6) en est une illustration. Une fois formés, les feuillets β peuvent aussi s’associer. Chothia et ses collaborateurs ont défini quelques principes pour ces associations. Ils considèrent deux situations, soit l’association de deux feuillets β indépendants, soit le repliement d’un simple feuillet sur lui-même. L’association de deux feuillets β indépendants dépend de la torsion de chacun d’eux et de leur composition en acides aminés. Deux feuillets β présentant deux torsions différentes T1 et T2 s’associent plus étroitement lorsque l’angle de rotation entre les feuillets est donné par l’expression : c = –2 (|T1 –T2 |) L’association de feuillets β étudiée par Chothia (1976) dans quatre protéines est illustrée par la figure 4.7. Toutes ces protéines contiennent deux feuillets β antiparallèles de torsion différente. Le repliement d’un simple feuillet s’effectue selon une supertorsion dextrogyre.

4.4

Interactions entre hélices α et segments β

Les interactions entre hélices α et brins β, en particulier celles qui engendrent le motif βαβ, sont observées dans de nombreuses protéines parmi lesquelles celles qui ont un

58

“Chap4” — 2018/12/4 — 18:47 — page 59 — #5

4. La structure supersecondaire

a

b

c

Figure 4.4 Assemblages d’hélices dans les protéines (d’après Chothia, 1989) Polyhedra for helical proteins. Nature 337 (6204) 204-206 .

site de reconnaissance pour les nucléotides. Le motif βαβ a été reconnu en 1973 par Rao et Rossmann d’où le nom de pli Rossmann (Rossmann fold). Ces auteurs ont montré l’occurrence du double motif βαβαβ dans plusieurs déshydrogénases ayant pour coenzyme le NAD+ . Dans ce type de structure deux segments β parallèles sont connectés par une hélice α.Le repliement est préférentiellement dextrogyre. L’axe de l’hélice est parallèle aux brins β. Dans les protéines qui contiennent le motif βαβ, il existe essentiellement deux types d’arrangements, linéaire et fermé. Dans le premier type, les brins β sont approximativement linéaires alors qu’ils sont circulaires dans le second type. Dans les déshydrogénases et les kinases, l’arrangement est linéaire. Il est circulaire dans les protéines comme la triose phosphate isomérase (TIM) qui composte le motif (αβ)8 connu sous le nom de TIM barrel.

59

“Chap4” — 2018/12/4 — 18:47 — page 60 — #6

La structure des protéines

Figure 4.5 Topologies de structures β dans les protéines (d’après Richardson J.S., 1977, β-sheet topology and the relatedness of proteins. Nature 265, 498). Les abréviations sont les suivantes : LDH : lactate déshydrogénase ; STI : inhibiteur de trypsine du soja ; Lys : lysozyme ; PTI : inhibiteur de trypsine du pancréas ; LADH : alcool déshydrogénase du foie ; Bchl : protéine bactériochlorophylle ; S.nuc. : nucléase du staphylocoque ; RNase : ribonucléase ; Therm. : thermolysine ; Rhod : rhodanèse ; Adenyl K : anénylate kinase ; Cyt.:b5 : cytochrome b5 ; hexo.K : hexokinase ; PGK : phosphoglycérate kinase ; Chym : chymotrypsine ; Con. A : concanavaline A ; PGM : phosphoglycérate mutase ; Imm.C : domaine constant de l’immunoglobuline ; SOD : superoxyde dismutase ; TIM : triose phosphate isomérase ; GPDH : glycéraldéhyde-3-phosphate déshydrogénase ; Carb.Anh. : anhydrase carbonique.

60

“Chap4” — 2018/12/4 — 18:47 — page 61 — #7

4. La structure supersecondaire

Figure 4.6 Structure de la carboxypeptidase.

(a)

(I)

(II)

(b)

(III)

(IV)

Figure 4.7 Association de deux feuillets β indépendants. En (a) les deux feuillets avec la même torsion se placent face à face. En (b) les feuillets ont des torsions différentes. La figure montre l’association des feuillets dans quatre protéines. (i) : fragments d’immunoglobuline ; (ii) : préalbumine ; (iii) : superoxyde dismutase ; (iv) : concanavaline A (d’après Chothia C., 1773, J. Mol.Bio. 75, 293-302).

61

“Chap4” — 2018/12/4 — 18:47 — page 62 — #8

La structure des protéines

triose phosphate isomérase

inhibiteur de la pepsine

Figure 4.8 Association d’hélices α et de structures β (structures construites à partir de la PDB avec le logiciel Swiss PDB viewer).

4.5

Interactions entre hélices α ou brins β et segments dépourvus de structure régulière

Les hélices α et les brins β peuvent être connectés par des segments de la chaîne polypeptidique qui ne présentent pas de structure régulière. Les boucles qui relient ces segments varient entre 5 et 24 résidus.

4.6

Principaux motifs structuraux présents dans les protéines

La topologie des structures β fait apparaître des motifs structuraux tels que l’épingle à cheveux (hairpin) engendrant le méandre β, le motif grec, et un arrangement dénommé le jelleyroll par analogie avec une pâtisserie danoise. Ces motifs sont représentés sur la figure 4.9.

Figure 4.9 Motifs structuraux.

62

“Chap4” — 2018/12/4 — 18:47 — page 63 — #9

4. La structure supersecondaire

Figure 4.10 Structures construites à partir de la PDB avec le logiciel Swiss PDB viewer.

63

“Chap4” — 2018/12/4 — 18:47 — page 64 — #10

La structure des protéines

Figure 4.10 Suite.

Il existe dans les protéines une grande variété de motifs structuraux créés par l’association d’hélices, de brins β et des deux types de structures. Certains rappellent des formes familières, d’où leur dénomination. La figure 4.10 est une représentation schématique des principaux motifs structuraux rencontrés dans les protéines.

64

“Chap4” — 2018/12/4 — 18:47 — page 65 — #11

4. La structure supersecondaire

Bibliographie Chothia, C. (1976) The nature of the accessible and buried surfaces in proteins. J. Mol. Biol. 105: 1-104. Chothia, C. (1989) Polyhedra for helical proteins. Nature 337(6204): 204-206. Chothia, C., Levitt, M. & Richardson, M.D. (1977) Structure of proteins: packing of α helices and pleated sheets. Proc. Natl. Acad. Sci. USA 74: 4130-4134. Ghelis, C. & Yon, J. (1982) Protein folding. Acad. Press, New-York. Murzin, A.G., & Finkelstein, A.V. (1988) General architecture of the α helical globules. J. Mol. Biol. 294: 749-769. Rao, S.T. & Rossmann, M.G. (1973) Comparison of super-secondary structures in proteins. J. Mol. Biol. 76: 241-256. Richardson, J.S., (1977) β-sheet topology and the relatedness of proteins. Nature 265: 498. Sternberg, M.J.E. & Thornton, J.M. (1977) On the conformation of proteins: the handedness of the connection between parallel β sheets. J. Mol. Biol. 110: 269-283. Sternberg, M.J.E. & Thornton, J.M. (1977) On the conformation of proteins. An analysis of β-pleated sheets. J. Mol. Biol. 110: 285-286.

65

“Chap5” — 2018/12/4 — 18:59 — page 67 — #1

5 La structure tertiaire 5.1

Définition

Le terme de structure tertiaire désigne la conformation tridimensionnelle globale de la protéine. La conformation de la chaîne polypeptidique est entièrement décrite par les angles dièdres φ et ψ. Pour une description complète de la structure tertiaire, la valeur des angles dièdres χ qui décrit la conformation des chaînes latérales doit aussi être connue. Les cristallographes décrivent généralement la structure globale d’une protéine par les coordonnées atomiques. On connaît aujourd’hui un grand nombre de structures protéiques à résolution atomique, obtenues soit par diffraction des rayons X, soit par résonance magnétique nucléaire. Ces structures sont consignées dans la Protein Data Bank qui en 2018 comporte plus de 140 000 structures. Les principales règles qui gouvernent l’établissement de la structure tridimensionnelle des protéines ont été déduites de l’examen de nombreuses structures. Les principales caractéristiques sont les suivantes. (1) La chaîne polypeptidique ne forme pas de nœud. (2) La structure protéique est compacte ; cette compacité empêche le solvant aqueux de pénétrer à l’intérieur des molécules. (3) Les résidus hydrophobes ont tendance à être enfouis à l’intérieur de la molécule, les résidus hydrophiles étant préférentiellement à la surface en contact avec le solvant. (4) On note la présence de molécules d’eau à la surface de la molécule en interaction avec les groupes polaires. (5) Enfin les molécules de grande taille comportent généralement plusieurs domaines structuraux.

67

“Chap5” — 2018/12/4 — 18:59 — page 68 — #2

La structure des protéines

5.2 5.2.1

Caractéristiques de la structure protéique Absence de nœud dans la chaîne polypeptidique

Pour engendrer la structure tridimensionnelle, la chaîne polypeptidique se replie sans former de nœud. Cependant quelques portions de la chaîne situées, soit à l’extrémité N-terminale, soit à l’extrémité C-terminale, peuvent se retrouver repliées dans une boucle.

5.2.2

Compacité des protéines globulaires

L’examen des structures tridimensionnelles de protéines montre que les atomes sont bien tassés à l’intérieur des molécules. L’empilement des atomes dans les protéines fut évalué quantitativement par Richards. La densité d’occupation représente le volume de van der Waals standard d’un atome ou d’un groupe d’atomes divisé par le volume réellement occupé dans l’espace. Pour les sphères étroitement serrées, la densité d’occupation est de 0,74, alors qu’elle est de 0,91 pour un cylindre de longueur infinie. Pour les cristaux de molécules organiques, ce nombre varie de 0,70 à 0,78. La densité d’occupation moyenne calculée par Richards pour le lysozyme et la ribonucléase est de l’ordre de 0,75. Certaines parties de la molécule ont une plus faible densité d’occupation ; elles présentent des défauts d’empilement des atomes qui permettent le mouvement. Les régions de grande densité qui ne sont pas compressibles peuvent transmettre les mouvements sur de grandes distances. Par contre on note la présence de cavités au sein d’une molécule. Environ 40 % de ces cavités possèdent une taille égale ou ? supérieure à 40 A 3 , ce qui permet la présence de molécules d’eau dont le volume ? ? est de 30 A 3 ; 60 % d’entre elles ont un volume moyen de 21 A 3 et sont vides ou contiennent des molécules de gaz. Ainsi, dans la myoglobine, une cavité peut accommoder un atome de xénon. Dans d’autres protéines, une ou plusieurs cavités peuvent enserrer une molécule d’eau.

5.2.3

Les résidus hydrophobes ont tendance à se rassembler à l’intérieur de la protéine

Les résidus hydrophobes ont tendance à s’enfouir à l’intérieur des molécules protéiques afin d’éviter le solvant, alors que les résidus hydrophiles se trouvent préférentiellement à la surface des molécules. Les molécules d’eau liées aux protéines sont en interaction avec les résidus polaires localisés à leur surface. Elles forment généralement des liaisons hydrogène avec ces

68

“Chap5” — 2018/12/4 — 18:59 — page 69 — #3

5. La structure tertiaire

Figure 5.1 Le lysozyme. En rouge, les résidus polaires ; en bleu, les résidus hydrophobes.

groupes ; certaines forment de simples liaisons hydrogène avec un seul groupe polaire, d’autres s’associent à deux groupes ou plus de la protéine. Quelques protéines contiennent aussi des molécules d’eau internes qui se trouvent localisées dans des cavités ou entre les domaines structuraux. Certaines sont des molécules d’eau isolées ; ainsi dans l’acylenzyme que forment les protéases à sérine avec leur substrat, une molécule d’eau fortement liée au centre actif est impliquée dans la catalyse, elle intervient dans l’étape de désacylation. Cependant il existe aussi des amas de plusieurs molécules d’eau associées par liaison hydrogène. Ainsi, à l’intérieur de la chymotrypsine et de l’élastase, par exemple, on note deux amas de trois molécules d’eau. Les molécules d’eau interviennent aux différents niveaux de la structure des protéines, leurs éléments de structure secondaire et tertiaire et les interfaces entre domaines et/ou sous-unités. Notons ici l’existence des coudes hydratés décrits au chapitre 3.

5.2.4

Domaines structuraux

Les protéines de grande taille sont souvent constituées de plusieurs domaines structuraux. Le terme de domaine structural désigne des régions globulaires et compactes assemblées de manière covalente au sein d’une même protéine. Le concept de domaine fut introduit par Edelman en 1970 pour décrire la structure des immunoglobulines. En fait, les domaines structuraux d’une molécule d’IgG avaient déjà été séparés en 1959 par Porter par protéolyse limitée. L’existence de domaines fut confirmée plus tard lorsque la structure tridimensionnelle des immunoglobulines fut résolue. La molécule d’immunoglobuline IgG est constituée de 12 domaines structuraux, 8 dans les deux chaînes lourdes et 4 dans les deux chaînes légères. Dans les chaînes légères, l’un des domaines est formé par une région variable, l’autre par une région constante. Dans la chaîne lourde, l’un des domaines représente aussi une région variable, les trois autres une région constante.

69

“Chap5” — 2018/12/4 — 18:59 — page 70 — #4

La structure des protéines

L’existence de domaines comme motifs structuraux est une caractéristique généralement rencontrée dans les protéines de taille supérieure à 20 000. La taille d’un domaine varie entre 40 et 150 acides aminés. Wetlaufer en 1973 a souligné l’existence de domaines dans les protéines et a introduit la distinction entre les domaines continus formés par des segments adjacents dans la chaîne polypeptidique et les domaines discontinus constitués de segments non adjacents de la chaîne polypeptidique. (a)

(b)

Figure 5.2 Représentation schématique de la structure des immunoglobulines montrant les domaines constants C et les domaines variables V ; les domaines marqués H et L correspondent aux chaînes lourdes et légères, respectivement.

Les domaines constituent des unités structurales, des unités de repliement, des unités génétiques et souvent des unités fonctionnelles. Unités structurales, elles représentent des parties compactes au sein des molécules protéiques. Unités de repliement, les domaines au sein de la molécule peuvent se replier indépendamment. Unités génétiques, les domaines continus résultent d’une fusion de gènes, les domaines

70

“Chap5” — 2018/12/4 — 18:59 — page 71 — #5

5. La structure tertiaire

discontinus d’une insertion de gènes. Unités fonctionnelles, certaines protéines comportent un domaine catalytique et un domaine de fixation du coenzyme ou d’effecteurs allostériques comme dans l’aspartate transcarbamylase d’E. coli. Les protéases à sérine, trypsine, chymotrypsine, élastase, sont organisées en deux domaines continus. Le site catalytique de ces enzymes comporte des résidus situés dans les deux domaines, His57 et Asp102 dans le domaine N-terminal et Ser195 dans le domaine C-terminal. Le site de fixation des substrats est situé dans le domaine C-terminal.

Figure 5.3 Structure de la chymotrypsine.

Dans les déshydrogénases qui sont des protéines oligomériques, chaque sous-unité est repliée en deux domaines structuraux, le domaine de fixation du NAD+ qui comporte deux plis Rossmann et le domaine catalytique. La topologie du domaine de fixation du NAD+ est bien conservée dans les différentes déshydrogénases. L’arrangement des domaines peut faire apparaître une symétrie ou une pseudosymétrie. Ainsi dans la molécule de chymotrypsine qui est représentée plus haut, chaque domaine est constitué d’un tonneau β formé par 6 brins β antiparallèles. Les domaines sont appariés autour d’un axe de symétrie d’ordre 2. Ce type de symétrie apparaît dans l’organisation de plusieurs protéines dont la protéase B et la superoxyde dismutase. Plusieurs méthodes ont été proposées pour déterminer la présence des domaines au sein d’une molécule protéique. Ooi et Nishikawa en 1974 ont utilisé une méthode basée sur la carte des distances interatomiques. Elle permet aussi de mettre en évidence des similitudes structurales entre protéines ainsi qu’il est illustré sur la figure 5.5. Rose en 1979 a développé un algorithme qui requiert seulement la connaissance des coordonnées atomiques. Wodak et Janin ont également développé une méthode

71

“Chap5” — 2018/12/4 — 18:59 — page 72 — #6

La structure des protéines

Figure 5.4 Structure de l’alcool déshydrogénase.

Figure 5.5 Diagramme de Ooi et Nishikawa comparatif pour l’élastase et la chymotrypsine. Les parties noires correspondent à des séparations de moins ? de 15 A entre les atomes ; les parties grisées à des sépérations supérieures ? à 30 A. Les domaines correspondant aux régions de haute densité sont représentés par des surfaces noires (d’après Sawyer et al., 1978, J. Mol. Bio. 118, 137-208).

72

“Chap5” — 2018/12/4 — 18:59 — page 73 — #7

5. La structure tertiaire

pour la reconnaissance des domaines dans les protéines. Le développement de la protéomique a permis d’identifier de nombreux domaines supplémentaires et de détecter la présence d’un certain nombre d’entre eux dans plusieurs protéines homologues ou non, ce qui confirme leur identité fonctionnelle et leur aptitude à être spécifiquement transférés d’un génome à un autre.

5.2.5

Protéines intrinsèquement non structurées

Il existe un certain nombre de protéines qui ne possèdent que peu de structures régulières, ce qui leur confère une grande plasticité. Ces protéines possèdent des séquences qui comportent au moins trente résidus non structurants. Elles se structurent en présence de leur ligand spécifique. En fait, à l’état libre, elles oscillent entre deux conformations, la forme structurée étant minoritaire parce que peu stable. Elles sont stabilisées lors de la fixation de leur ligand. La plupart des protéines impliquées dans les voies de signalisation sont des protéines intrinsèquement non structurées qui comportent un grand nombre de sites d’association permettant l’assemblage de complexes protéiques qui assurent la transduction du signal. L’ensemble des protéines intrinsèquement non ordonnées est contenu dans une base de données Disprot. Ces protéines interviennent dans divers processus biochimiques. Ceci est illustré par la démonstration récente par Boothby et al. que ces protéines jouent un rôle essentiel dans l’adaptation des tardigrades aux conditions environnementales de déshydratation extrême. En quasi-absence de molécules d’eau, ces protéines se vitrifient en formant des structures solides amorphes et non cristallines qui assurent la protection de ces organismes jusqu’à leur réhydratation.

5.3

Classification des protéines basée sur la structure

En 1976, Levitt et Chothia introduisirent une classification des protéines basée sur leur topologie, et en particulier sur l’organisation de leur structure supersecondaire. Ils distinguèrent les protéines toutes α qui ne contiennent que des hélices α, les protéines toutes β qui ne contiennent que des segments β, les protéines α/β qui possèdent une alternance d’hélices α et de brins β. Avec un dernier mode d’organisation, les protéines α + β, possèdent les deux types de structure, mais dans des domaines distincts. Sur ces bases, Chothia a introduit en 1995 la classification SCOP pour Structure Classification Of Proteins. En 1997, Thornton et ses collaborateurs ont proposé une autre classification dénommée CATH pour Classification, Topology, Architecture, Homology. Elle ne prend pas en compte les protéines du type α + β ; en revanche, elle introduit la classe des protéines qui contiennent peu de structures secondaires. Il existe en effet des protéines qui à l’état libre sont peu structurées, mais dont la

73

“Chap5” — 2018/12/4 — 18:59 — page 74 — #8

La structure des protéines

structure est formée lorsqu’elles ont fixé leur ligand spécifique, ainsi qu’il est décrit dans la section 5.2.5.

5.4

Métalloprotéines

De nombreuses protéines, dont des enzymes, contiennent des cations métalliques qui leur sont associés de manière spécifique. Parmi les principaux cations présents dans les métalloprotéines figurent Zn, Fe, Cu, Co, Mg et Mn. Dans certains cas, le cation métallique joue un rôle structural ; dans d’autres cas, il intervient dans le mécanisme catalytique. Dans l’aspartate transcarbamylase de E. coli, enzyme constitué de l’association de sous-unités catalytiques et de sous-unités régulatrices, un atome de zinc est chélaté par les groupes SH de quatre résidus de cystéine localisés dans le domaine N-terminal de la chaîne régulatrice. Sa présence est absolument indispensable à la structuration de ce domaine pour son interaction avec la chaîne catalytique. Un atome de Zn est nécessaire à la dimérisation de l’aldolase et de la phosphatase alcaline. Des atomes de Zn interviennent également dans la structuration des domaines protéiques en « doigt de zinc » qui sont impliqués dans l’interaction de certaines protéines avec les acides nucléiques. Dans certains enzymes, l’ion métallique est localisé au niveau du site actif et intervient dans la catalyse. C’est le cas du Zn dans des protéases telles que les aminopeptidases et la carboxypeptidase. L’activité de certains enzymes nécessite au niveau de leur site catalytique la présence d’un groupement prosthétique (coenzyme) tel que le pyridoxal phosphate, la thiamine pyrophosphate, le nicotinamide adénine dinucléotide (NAD), la flavine mononucléotide (FMN) ou la flavine adénine dinucléotide (FAD). Plusieurs de ces enzymes possèdent, en plus du coenzyme, un ion métallique fixé au site actif de la protéine. Il intervient dans la catalyse en interaction avec le coenzyme. Ainsi, dans la succinate déshydrogénase, un atome de Fe est associé à la flavine ; dans la dyhydroorotate déshydrogénase, l’atome de Fe est associé au NAD ; et dans l’alcool déshydrogénase, un atome de Zn est associé au NAD. Dans l’hémoglobine, l’ion fer (Fe++ ) est coordonné au macro cycle d’une protoporphyrine constituée d’un noyau tétrapyrolique et à un atome d’azote d’une histidine de la protéine ; le sixième ligand étant une molécule d’eau ou une molécule d’oxygène. Les ions métalliques jouent un rôle important dans les enzymes qui catalysent les réactions redox qui sont au cœur de la bioénergétique. Certains enzymes impliqués dans des réactions d’oxydo-réduction et dans les chaînes de transfert d’électrons possèdent des « centres fer-soufre » constitués d’un nombre égal d’atomes de fer et de soufre associés en une structure régulière en interaction avec un nombre égal de résidus de cystéine. Le nombre d’atomes de fer, de soufre et de résidus de cystéine peut varier de deux à huit selon les protéines. Les centres fer-soufre peuvent fixer et transférer un électron. La figure 5.7 montre la structure du centre fer-soufre de protéines de la cyanobactérie Cromatium.

74

“Chap5” — 2018/12/4 — 18:59 — page 75 — #9

5. La structure tertiaire

Figure 5.6 Structure de l’hème du cytochrome C.

Figure 5.7 Structure d’un centre fer-soufre.

5.5

Méthodes de détermination des structures protéiques

La détermination de la structure tridimensionnelle des protéines nécessite des méthodes hautement résolutives et une instrumentation adaptée. Deux types de méthodologies ont été développés, la radiocristallographie aux rayons X et la résonance magnétique nucléaire. Le principe de ces méthodes est détaillé dans le livre de J. Janin et M. Delepierre, Biologie structurale. L’aboutissement de ces études relève d’une longue histoire.

75

“Chap5” — 2018/12/4 — 18:59 — page 76 — #10

La structure des protéines

5.5.1

Cristallographie aux rayons X

La découverte par M. von Laue, P. Knipping et W. Friedrich de la diffraction des rayons X remonte à 1912. La théorie précise en fut établie l’année suivante en Angleterre par William Bragg et son fils Lawrence qui furent les fondateurs de la cristallographie anglaise et obtinrent le prix Nobel en 1915. La diffraction des rayons X par les cristaux est essentiellement un phénomène d’interférence entre les rayons diffractés par les électrons de tous les atomes de la molécule. L’intensité diffractée est reliée à la distribution des atomes dans le cristal. W. Bragg a entrevu la possibilité d’établir des cartes de densité électronique à partir de la mesure des intensités. La méthode de diffraction des rayons X fut appliquée initialement à des molécules simples telles que NaCl, KCl, KBr. En ce qui concerne les protéines, les premières études furent effectuées sur des protéines fibreuses qui possèdent une régularité structurale. À ces études, il faut associer le nom de Astbury qui fut un pionnier dans le domaine des protéines fibreuses.

Figure 5.8 Max Perutz lors de sa nomination de Docteur Honoris Causa à l’université de Paris-Sud en 1993 (photo J. Yon-Kahn).

Les protéines globulaires n’ayant pas le degré de régularité des protéines fibreuses, la résolution de leur structure présentait de sérieuses difficultés. Pour y parvenir,

76

“Chap5” — 2018/12/4 — 18:59 — page 77 — #11

5. La structure tertiaire

il fallait résoudre le problème des phases qui constitue la difficulté majeure de la radiocristallographie. Après un long cheminement, le problème fut résolu par Max Perutz qui utilisa l’introduction de métaux lourds tels que le mercure par remplacement isomorphe. C’est ainsi que fut résolue en 1958 la structure de la myoglobine par Kendrew et en 1960 de l’hémoglobine par Perutz. Ce remarquable aboutissement fut couronné par l’attribution du prix Nobel de chimie à Perutz et Kendrew en 1962. Il est à l’origine des nombreux développements qui ont marqué la biologie moderne. Les progrès techniques liés au développement de l’instrumentation et de l’augmentation de la puissance des ordinateurs ainsi que l’utilisation du rayonnement synchrotron ont favorisé une progression rapide dans la détermination des structures protéiques.

5.5.2

Résonance magnétique nucléaire

L’étude des structures de protéines par spectroscopie de RMN s’est développée plus tardivement. À partir de 1980, l’introduction d’appareils de RMN à haut champ offrait une nouvelle technologie pour la détermination des structures de protéines, non plus dans le cristal, mais en solution. Deux approches différentes ont été utilisées, la RMN homonucléaire et la RMN hétéronucléaire, selon que l’on observe les seuls protons ou les noyaux carbone et/ou azote. La RMN homonucléaire comporte certaines limitations dont un mauvais transfert d’aimantation entre protons pour les protéines de taille supérieure à 100 acides aminés, conséquence de la relaxation. Ces difficultés ont été réduites par l’utilisation de noyaux différents. La détermination des structures par RMN hétéronucléaire peut s’effectuer sur des échantillons doublement marqués par les atomes 15 N et 13 C. Les expériences de RMN permettent l’observation de couplages scalaires et dipolaires entre spins. L’observation du transfert d’aimantation par couplage dipolaire produit les effets Overhauser (NOE) entre ? noyaux situés à moins de 5 A l’un de l’autre permettant l’estimation des distances entre les noyaux observés.

5.5.3

Microscopie électronique

La microscopie électronique a fait de très importants progrès au cours des dernières années, au point que la détermination de structures à une résolution permettant la construction directe de modèles atomiques par analyse d’images de particules isolées est d’utilisation courante.

77

“Chap5” — 2018/12/4 — 18:59 — page 78 — #12

La structure des protéines

Bibliographie Boothby, T.C., Tapia, H., Brozens, A.H., Piezklewiez, S., Smith, A., Giovannini, I, & Gary, L. (2017) Tardigrades use intrinsically disorder proteins in survive dessication. Mol. Cell. 65: 975-984. Chothia, C. (1989) Polyhedra for helical proteins. Nature 337: 204-205. Edelman G.M., (1970) Covalent structure of a human γG-immunoglobulin: functional implications. Biochemistry 9: 3197-3204. Ghelis, C. & Yon, J. (1982) Protein folding. Acad. Press, New-York. Janin, J & Delepierre, M. (1994) Biologie structurale. Hermann, Paris. Kendrew, J., Bodo, D., Dintzis, H.M., Parish, R.G., & Wyckoff, W. (1960) A three-dimensional structure of the myoglobin molecule obtained by X-ray analysis. Nature 181: 662-666. Lee, B., & Richards, F. (1971) The interpretation of protein structure, estimation of static accessibility. J. Mol. Biol. 55: 379-400. Levitt, M. & Chothia, C. (1976) Structural patterns in globular proteins. Nature 261: 552558. Murzin, A.L., Brenner, S.E., Hubbard, T., & Chothia, C. (1997) A structural classification of proteins: data base for the investigation of sequences and structures. J. Mol. Biol. 247: 536-540. Ooi, T. & Nishikawa, K. (1973) In: Conformation of Biological Molecules and Polymers, edited by D.B. Bergman et B. Pullmann, Acad. Press, New-York. Orengo, C.A., Michic, A.D., Jones, S., Jones, D.J. Swindale, D.B., & Thornton, J.C. (1997) CATH: a hierarchic classification of protein domain structures. Structure 5: 1093-1108. Perutz, M., Rossmann, M.G., Cullis, A.F., & Muirhead, M. (1961) Structure of ? haemoglobin. A three dimensional Fourier synthesis at 5.5 A resolution obtained by X-ray analysis. Nature 185: 416. Richards, F.M. (1974) The interpretation of protein structures: partial volume, gropup volume contributions and packing density. J. Mol. Biol. 82: 1-14. Rose G.D. (1979) Hierarchic organization of domains in globular proteins. J. Mol. Biol. 134: 447-470. Wetlaufer, D.B. (1973) Nucleation, rapid folding and globular interaction regions in proteins. Proc. Natl. Acad. Sci. USA 70: 691-701.

78

“Chap6” — 2018/12/4 — 19:02 — page 79 — #1

6 La structure quaternaire 6.1

Définition

Les protéines oligomériques sont constituées de plusieurs sous-unités associées entre elles par des interactions non covalentes. Les sous-unités peuvent être identiques ou différentes. Elles sont généralement reliées par des opérations de symétrie. Elles comportent un petit nombre de sous-unités. Monod et ses collègues ont proposé de les désigner par le terme d’oligomère pour les distinguer des polymères qui résultent de l’association d’un grand nombre de sous-unités. Lorsque la protéine oligomérique est formée de sous-unités identiques, celles-ci sont désignées par le terme de protomère, le terme de monomère se référant aux protéines formées d’une seule unité. Ainsi dans l’hémoglobine (tétramère α2 β2 ), α et β sont des sous-unités et (αβ) représente le protomère.

6.2

Mode d’association des sous-unités

La formation des structures oligomériques met en jeu divers modes d’association. La géométrie des protéines oligomériques est déterminée par les contacts entre sousunités. L’association est dite isologue lorsqu’elle s’effectue entre aires de contact identiques. Elle est hétérologue si elle implique des aires de contact différentes (Monod et al., 1965). La figure 6.1 illustre les différents modes d’association.

79

“Chap6” — 2018/12/4 — 19:02 — page 80 — #2

La structure des protéines

Les associations hétérologues peuvent donner naissance à une structure ouverte (en II sur la figure) et engendrer des structures hélicoïdales. Si le pas de l’hélice est nul, une structure fermée à symétrie cyclique se forme. Cette situation est illustrée dans le cas du tétramère (en III sur la figure).

Figure 6.1 Associations entre protomères.

Dans la symétrie cyclique, il y a correspondance entre les protomères par rotation autour d’un axe situé au centre de la molécule. Ce type de symétrie est désigné par Cn . Les protéines qui possèdent un nombre impair de protomères ont obligatoirement une symétrie cyclique. À titre d’exemple, la purine nucléoside phosphorylase est une protéine trimérique présentant une symétrie cyclique. La protéine GroEL qui est un chaperon moléculaire est formée de deux cylindres associés par leur base. Chacun des deux comporte sept sous-unités organisées selon une symétrie cyclique. La symétrie dièdre correspond à des protéines oligomériques qui possèdent n/2 axes de symétrie d’ordre 2 orthogonaux. La symétrie est désignée par Dn=2 . Par exemple, un tétramère présentant une symétrie dièdre est désigné par la symétrie D2 . Ces arrangements donnent naissance à des formes géométriques classiques ainsi que le montrent les figures 6.3 et 6.4. La phosphofructokinase qui est une protéine tétramérique est organisée selon une symétrie dièdre.

80

“Chap6” — 2018/12/4 — 19:02 — page 81 — #3

6. La structure quaternaire

Figure 6.2 Formes géométriques des oligomères.

Les structures oligomériques le plus fréquemment rencontrées sont les dimères et les tétramères. Dans une étude relativement ancienne (Raibaud, 1977), sur 500 protéines, l’auteur notait 300 dimères et 150 tétramères. Les oligomères d’ordre supérieur sont beaucoup moins nombreux. La stabilité de l’organisation géométrique des oligomères dépend de leur énergie d’association, c’est-à-dire du nombre de contacts et de la force des interactions. Dans la géométrie cyclique, tous les contacts inter-protomères sont identiques ; ils sont différents dans la géométrie dièdre. Lors de l’association des protomères, une partie de leur surface est enfouie. Généralement, l’interface consiste en une grande proportion de contacts non polaires. Cependant on observe parfois quelques contacts polaires résultant de l’établissement de ponts salins entre protomères.

81

“Chap6” — 2018/12/4 — 19:02 — page 82 — #4

La structure des protéines

Tableau 6.1

Différents types de géométrie dans les protéines oligomériques.

Nombre de protomères

Notation Schonflies

Notation internationale

Type d’interaction

2

C2

2

isologue linéaire

3

C3

3

hétérologue identique

triangle

hétérologue identique

carré

4

C4

4

4

D2

222

deux isologues différents carré

4

D2

222

trois isologues différents tétraèdre

5

C5

5

hétérologue identique

pentagone

6

C6

6

hétérologue identique

hexagone

6

D3

32

deux isologues différents hexagone

6

D3

32

isologue et hétérologue

6

D3

32

isologue et hétérologue

octaèdre

7

C7

7

hétérologue identique

heptagone

8

D4

422

deux isologues différents octogone

8

D4

422

isologue et hétérologue

octogone

8

D4

422

isologue hétérologue

cube

Figure 6.3 La purine nucléoside phosphorylase (1n3i).

82

Géométrie

prisme trigonal

“Chap6” — 2018/12/4 — 19:02 — page 83 — #5

6. La structure quaternaire

Figure 6.4 La protéine GroEL (1 svt).

Figure 6.5 La phosphofructokinase.

83

“Chap6” — 2018/12/4 — 19:02 — page 84 — #6

La structure des protéines

6.3

Protéines oligomériques possédant des sous-unités différentes

Certaines protéines oligomériques sont constituées de sous-unités différentes. C’est le cas, en particulier, de protéines et d’enzymes impliqués dans des processus de régulation métabolique présentant des propriétés de fixation coopérative de ligands ou substrats. C’est aussi le cas de l’hémoglobine dont les sous-unités α et β contiennent les hèmes qui assurent la fixation coopérative de l’oxygène. L’aspartate transcarbamylase d’E. coli, premier enzyme spécifique de la voie de biosynthèse des nucléotides pyrimidiques, c’est-à-dire qui catalyse la carbamylation du groupement aminé de l’aspartate par le carbamylphosphate, est un exemple particulièrement intéressant. Du point de vue structural, cet enzyme est constitué par l’association de deux trimères de chaînes catalytiques et de tris dimères de chaînes régulatrices qui portent les sites de fixation des effecteurs allostériques.

Figure 6.6 Structure schématique de l’aspartate transcarbamylase de E. coli, C : chaînes catalytiques ; R : chaînes régulatrices ; Asp : domaine de fixation de l’aspartate d’une chaîne catalytique ; carbP : domaine de fixation du carbamylphoshate d’une chaîne catalytique. Triangles noirs : position des sites catalytiques à l’interface entre deux chaînes catalytiques appartenant au même trimère. Points noirs : position des sites régulateurs (adapté de Krause, K.L. Volz, K.W. & Lipscomb, W. N. 1985, The 2,5 A structure of aspartate carbamoyltransferase complexes with the substrate analogue N(phosphonacetyl-L-aspartate. J. Mol. Bio.193, 527-553).

84

“Chap6” — 2018/12/4 — 19:02 — page 85 — #7

6. La structure quaternaire

Cet enzyme présente le phénomène de coopérativité entre les sites catalytiques pour la fixation du substrat aspartate. Sa régulation allostérique consiste en l’activation des sites catalytiques par l’effecteur ATP et leur inhibition synergique par les effecteurs CTP et UTP dont la fixation aux sites régulateurs manifeste des effets coopératifs et anticoopératifs. La ribonucléotide réductase d’E. coli est constituée d’un dimère de sous-unités catalytiques et d’un dimère de sous-unités régulatrices. Cet enzyme reconnaît cinq substrats, les quatre ribunucléiques et l’ITP ; son activité est régulée par une série de désoxynucléotides. Un aspect fascinant de cette régulation consiste dans le fait que ces effecteurs agissent de manière spécifique à l’égard des différents substrats.

6.4

Assemblages de protéines

Il existe aussi des assemblages multimoléculaires qui résultent de l’association de plusieurs protéines. Leur structure s’établit selon des symétries plus complexes que dans les protéines oligomériques, comme les symétries cubiques. C’est le cas par exemple des systèmes multienzymatiques. La pyruvate déshydrogénase est un des plus gros complexes multienzymatiques dont la fonction est de catalyser la décarboxylation oxydative du pyruvate pour produire l’acétyl coenzyme A, reliant la voie glycolytique au cycle tricarboxylique et à la biosynthèse des acides gras. La réaction globale est la suivante : CH3 COCOO− + CoASH + NAD+ → CH3 COSCoA + NADH + CO2 Le système comporte de multiples copies de trois enzymes distincts, la pyruvate décarboxylase, la dihydrolipoyl déshydrogénase et la dihydrolipoyl acyl transférase qui catalysent des réactions consécutives. Dans les bactéries Gram-négatives comme E. coli, le complexe comporte un cœur de 24 copies de la dihydrolipoyl acyl transférase présentant une symétrie octaédrique, 24 copies de la dihydrolipoacyl transférase et 12 copies de la dihydrolipoyl déshydrogénase. Chez les bactéries Gram-positives et les organismes eukaryotes, le complexe comporte 60 copies de la dihydrolipoyl acyl tranférase organisées selon une symétrie icosaédrique. Ces complexes multienzymatiques ont des masses moléculaires allant jusqu’à 10 millions de daltons. L’érythrocruorine des annélides est un autre exemple de complexe de grande taille. Les érythrocruorines sont des protéines respiratoires de masses moléculaires de l’ordre de 3,6 millions de daltons. La structure du complexe de la protéine du ver de terre, Lumbricus terrestris, a été résolue par microscopie électronique et diffraction des rayons X. Ce complexe est formé de l’assemblage de 144 sous-unités d’hémoglobine et de 36 sous-unités d’assemblage. Les protéines d’assemblage sont organisées en un complexe central avec une symétrie D6 sur lequel se fixent 12 dodécamères d’hémoglobine pour former la protéine.

85

“Chap6” — 2018/12/4 — 19:02 — page 86 — #8

La structure des protéines

Figure 6.7 Structure de la pyruvate déshydrogénase. En bleu, la pyruvate décarboxylase ; en vert, la dihydrolipoamide acétyl transférase ; en orangé : la dihydrolipoamide déshydrogénase (d’après H. R. Horton, L. A. Moran, R. R. Ochs, J. D. Rawn & K. G. Scrimgeour, Biochime (1994) de Boeck Bruxelles.

Figure 6.8 L’érythrocruorine (d’après W. E. Royer, H. Sharma, J. E. Knapp, & B. Bhyravbhatla, 2006, Lumbricus erythrocruorin at 3,5 Å resolution : architecture of a megadalton respiratory complex. Structure 14, 1167-1177).

86

“Chap6” — 2018/12/4 — 19:02 — page 87 — #9

6. La structure quaternaire

6.5

Méthodes d’étude des structures quaternaires

La méthode de choix pour l’étude des structures quaternaires est la diffraction des rayons X. Pour les complexes multimoléculaires, beaucoup de données ont été obtenues au moyen de la microscopie électronique jointe à la radiocristallographie. Ces méthodes permettent d’obtenir des données d’une grande précision. Cependant dans une première approche, il est possible de déterminer le nombre de sous-unités formant une protéine oligomérique par des procédés plus rapides. Ces méthodes consistent à déterminer la masse moléculaire de la protéine entière, puis après traitement par un agent dissociant celle de la sous-unité. La chromatographie par filtration sur gel représente l’une des méthodes les plus utilisées. Chaque molécule est caractérisée par un pic d’absorbance et un volume d’élution Ve . Le volume d’exclusion étant V0 , la masse moléculaire est donnée par la relation : Ve /V0 = f(log de la masse moléculaire) La droite étalon est obtenue à partir de volumes d’élution de protéines standards. Elle permet de déterminer la masse moléculaire de la protéine étudiée. L’électrophorèse sur gel de polyacrylamide (PAGE) représente une autre méthode rapide d’évaluation des masses moléculaires. La détermination de la masse moléculaire de la protéine entière est effectuée en l’absence d’agent dissociant, celle de la sous-unité en présence de SDS (sodium dodécyl sulfate). Toutefois, il ne faut pas oublier qu’en conditions non dénaturantes, la séparation des protéines dépend non seulement de leur masse, mais également de leur forme. Aussi cette méthode ne fournit qu’un résultat approximatif. L’ultracentrifugation et la spectrométrie de masse sont également utilisées pour déterminer la masse moléculaire d’une protéine oligomérique et de ses sous-unités.

Bibliographie Klotz, I.M., Darnall, D.W. & Langerman, N.R. (1975) In: The Proteins, 3rd ed. Acad. Press, New York, 293-411. Krause, K.L., Volz, K.W. & Lipscomb, W.N. (1985) The 2.5 A◦ structure of aspartate carbamoyltransferase complexed with the bisubstrate analogue N-(phosphonacetyl)-L-aspartate. J. Mol.Biol. 193, 527-553. Monod, J., Wyman, J. & Changeux, J.P. (1965) On the nature of allosteric transitions: a plausible model. J. Mol. Biol. 12: 88-118. Raibaud, O. (1977) Thèse d’État, Univ. Paris 7. Yon-Kahn, J. & Herve, G. (2005) Enzymologie moléculaire et cellulaire. Grenoble Sciences.

87

“Chap7” — 2018/12/6 — 17:25 — page 89 — #1

7 Structure des protéines membranaires Un grand nombre de protéines sont associées aux membranes cellulaires. Beaucoup d’entre elles les traversent. Les protéines membranaires jouent des rôles physiologiques essentiels, notamment dans la production, la gestion, la transformation et l’utilisation de l’énergie cellulaire, la communication cellulaire, l’influx et l’efflux de solutés, l’association des cellules en tissus. Si les protéines qui sont associées de façon superficielle à la membrane (protéines dites extrinsèques ou périphériques) ne posent pas de problèmes structuraux très originaux par rapport aux protéines solubles, celles qui sont en contact avec le cœur hydrophobe des membranes (protéines intrinsèques ou intégrales) sont soumises à des contraintes très particulières qui affectent leur structure et leur biosynthèse. Leur production, leur purification et leur étude structurale posent de ce fait des problèmes très originaux, dont la résolution a nécessité le développement d’un mode de pensée et d’un ensemble de technologies eux-mêmes très spécifiques.

7.1

Localisation et fonctions des protéines membranaires

Les membranes biologiques séparent le cytosol du milieu extérieur, le compartimentent et, dans le cas des bactéries dites Gram-négatives, entourent la cellule d’une

89

“Chap7” — 2018/12/6 — 17:25 — page 90 — #2

La structure des protéines

membrane externe qui protège la membrane plasmique du milieu extérieur et définit un espace intermédiaire qui joue le rôle de sas, le périplasme (figure 7.1). Parmi leurs nombreuses fonctions figure le maintien de la différence de composition et de potentiel électrique et redox entre compartiments. Les lipides qui assurent le rôle de barrière sont largement imperméables aux solutés polaires, molécules hydrophiles et ions. Le transfert actif ou passif de ces solutés est assuré par des protéines insérées dans la membrane, les protéines membranaires, qui remplissent également de très nombreuses autres fonctions. Un panorama rapide des différents types de fonctions et de localisations de ces protéines est schématisé sur la figure 7.1 qui représente une cellule composite imaginaire présentant des caractères de cellule bactérienne, animale et végétale.

Figure 7.1 Schéma d’une cellule imaginaire comportant des éléments d’une cellule animale, végétale et bactérienne, illustrant la localisation et la fonction de diverses protéines membranaires. Les numéros renvoient aux commentaires donnés dans le texte.

La diffusion facilitée de molécules et d’ions qui descendent passivement leur gradient électrochimique est représentée ici par une porine (1) intégrée à la membrane externe bactérienne, qui contrôle la diffusion de petites molécules et des ions entre le milieu extérieur et le périplasme. Cette mise en communication contrôlée de deux compartiments aqueux à travers une ou deux membranes est également illustrée par les connexines des gap junctions (jonctions communicantes ou lacunaires 12), qui

90

“Chap7” — 2018/12/6 — 17:25 — page 91 — #3

7. Structure des protéines membranaires

mettent en communication les cytosols de cellules voisines au sein de tissus animaux comme le cristallin de l’œil ou le foie ; les pores aqueux qu’elles ouvrent se ferment si la concentration de calcium de l’un des deux cytosols ainsi mis en communication augmente anormalement, indice d’une situation pathologique. La diffusion passive contrôlée joue un rôle très important dans la communication cellulaire. Cette fonction est illustrée par : a) le récepteur nicotinique de l’acétylcholine (nAChR ; 7) ; situé notamment dans la membrane post-synaptique de la jonction neuromusculaire, ce récepteur reconnaît le médiateur (ACh) sécrété par la terminaison présynaptique et, en réponse, ouvre transitoirement un canal sélectif pour les cations ; l’entrée d’ions sodium dans le cytosol, qui en est la principale conséquence, dépolarise la membrane post-synaptique, excitant la cellule ; et b) un canal sélectif pour le sodium régulé par le voltage (8) : activé, par exemple, par la dépolarisation locale provoquée par le récepteur de l’acétylcholine, il génère un potentiel d’action qui se propage de proche en proche, en excitant les canaux sodiques voisins tout le long d’un nerf ou d’une fibre musculaire. La formation de pores transmembranaires régulés chimiquement (nAChR), électriquement (canal sodique) ou mécaniquement (canaux mécanosensibles) constitue l’une des fonctions les plus répandues des protéines membranaires et participe à d’innombrables fonctions physiologiques. Beaucoup de gradients sont créés par des ATPases membranaires, comme les gradients d’ions Na+ et K+ par l’ATPase sodium-potassium de la membrane plasmique (2). Lors de la contraction musculaire, une ATPase similaire (non représentée) prélève dans le cytosol les ions Ca2+ qui y sont entrés lors de l’excitation de la fibre musculaire et les stocke dans le lumen du réticulum sarcoplasmique, provoquant la relaxation de l’actomyosine. Un gradient peut être utilisé (et, ce faisant, dissipé) pour créer un autre gradient, soit par échange, soit par co-transport (« transport secondaire »). Ainsi, la perméase bactérienne spécifique du lactose (3) utilise l’énergie libre libérée par l’entrée de protons dans la cellule pour co-importer le lactose, ce dernier contre son gradient de concentration. L’échangeur d’anions de l’érythrocyte (« Bande 3 » ; 4) échange le chlore contre le bicarbonate, permettant le transport hors de l’organisme du CO2 produit par la respiration. La signalisation est un des rôles essentiels remplis par les protéines membranaires. Beaucoup d’entre elles ont pour fonction de détecter des signaux extracellulaires et de déclencher la réponse cellulaire appropriée Une très riche famille de ces protéines, celle des récepteurs couplés aux protéines G (GPCRs ; 6), transmet l’information de l’extérieur à l’intérieur de la cellule par un autre mécanisme que celui exploité par le nAChR : au lieu d’une perméabilisation membranaire, une transconformation du récepteur, provoquée par la fixation d’un ligand extracellulaire (ou par l’isomérisation du rétinal sous l’effet de la lumière dans le cas de la rhodopsine), est propagée de l’extérieur vers l’intérieur et détectée par des protéines cytosoliques (protéines G, arrestine, kinases) qui déclenchent et contrôlent une cascade de réactions induisant et arrêtant la réponse physiologique. Le fonctionnement des GPCRs met en jeu des équilibres subtils entre de multiples conformations. D’autres récepteurs (non

91

“Chap7” — 2018/12/6 — 17:25 — page 92 — #4

La structure des protéines

représentés), également très nombreux, utilisent une autre forme de transduction conformationnelle ; ils répondent à la fixation de leurs ligands en s’oligomérisant, ou en modifiant la conformation d’un oligomère préexistant, modification qui, détectée dans le cytosol, entraîne typiquement l’autophosphorylation ou la méthylation de leurs domaines intracellulaires. Des éléments nutritifs, ou des facteurs de croissance, peuvent être importés dans la cellule par des récepteurs de surface qui, lorsqu’ils ont fixé leur ligand, sont internalisés. C’est le cas du récepteur qui reconnaît la lipoprotéine de basse densité, un transporteur de lipides (LDL ; 9). Le complexe récepteur/LDL est dirigé vers des endosomes. Une pompe à protons membranaire (non représentée) acidifie le compartiment interne (lumen) de l’endosome. La chute de pH provoque la séparation de la LDL et du récepteur. La LDL est métabolisée, tandis que le récepteur est recyclé à la surface de la cellule. Ce mécanisme est détourné par certains virus, comme le virus de la grippe. Les particules virales sont enveloppées d’une membrane (arrachée à la membrane plasmique de la cellule qui a produit le virus) dans laquelle sont insérées diverses protéines membranaires virales, dont l’hémagglutinine (10). Lorsque la particule virale est internalisée, la chute de pH qui se produit dans l’endosome déclenche un changement de conformation de l’hémagglutinine, laquelle provoque la fusion de la membrane endosomiale et de la membrane virale, libérant dans le cytosol l’acide nucléique du virus. Certaines protéines membranaires sont impliquées dans l’association de membranes ou de cellules, ou dans l’association de la membrane plasmique avec le cytosquelette ou la matrice extracellulaire. C’est le cas de deux des protéines membranaires déjà citées plus haut : les connexines qui constituent les gap junctions (12), outre leur fonction de pores, associent mécaniquement entre elles les cellules du foie ou du cristallin. L’échangeur d’anions de l’érythrocyte (4) comporte deux domaines, un domaine transmembranaire, responsable de l’échange des anions, et un domaine cytosolique, qui associe la membrane au cytosquelette. Chez les bactéries Gram-négatives il existe des systèmes de transfert d’énergie mécanique (non représentés) entre des protéines de la membrane interne, qui ont accès à l’ATP cytosolique, et des protéines de membrane externe, qui n’y ont pas accès mais utilisent l’énergie mécanique qui leur est ainsi transférée pour importer, contre leur gradient de concentration, des solutés, le fer par exemple, prélevés dans le milieu extérieur. Ces exemples sont loin de couvrir toute la variété des fonctions remplies par les protéines membranaires, mais ils donnent une idée de ce que leurs structures doivent leur permettre d’accomplir : former des pores et réguler leur spécificité et leur ouverture, reconnaître, fixer et transporter des solutés, dont certains sont de petite taille (ions) et d’autres de très grande taille (protéines), transférer de l’information, associer mécaniquement les membranes à leur environnement, etc.

92

“Chap7” — 2018/12/6 — 17:25 — page 93 — #5

7. Structure des protéines membranaires

7.2 7.2.1

Environnement membranaire Composition et organisation

L’analyse biochimique des membranes biologiques montre qu’elles sont principalement composées de lipides et de protéines. Les principaux lipides membranaires sont les phospholipides, les glycolipides et les stérols (figure 7.2). Les phospholipides, qui comprennent les phosphoglycérides et les dérivés de la sphingosine, notamment la sphingomyéline, sont les lipides les plus abondants dans les cellules animales, où ils sont organisés en bicouche (voir ci-dessous). La combinatoire des têtes polaires, qui peuvent ou non porter une charge nette, et des queues hydrophobes, dont il existe une grande variété de longueurs et de degré d’insaturation, fait qu’il existe des centaines d’espèces de phospholipides avec toutefois, pour une membrane donnée, la prédominance d’une certaine longueur moyenne de queue et un pourcentage relativement défini de chaque type de tête. Les stérols, cholestérol dans les cellules animales, principalement dans la membrane plasmique, ergostérol chez les levures et les champignons, phytostérols chez les plantes, ne s’organisent pas par eux-mêmes en bicouche, mais ils s’y dissolvent et modulent leur épaisseur, leur fluidité et leur perméabilité. Les glycolipides sont impliqués dans de nombreux mécanismes de reconnaissance (groupes sanguins par exemple). Les lipopolysacharides (LPS) sont le constituant principal du feuillet externe de la membrane externe des bactéries Gram-négatives. Jusqu’à la fin des années soixante, l’arrangement des lipides et des protéines membranaires faisait l’objet d’un débat. Dans les années 1970, s’est imposé le modèle dit en mosaïque fluide proposé par Singer et Nicolson (figure 7.3). Comme il sera indiqué plus bas, ce modèle a évolué en fonction des observations effectuées depuis plus de quarante ans, notamment en ce qui concerne la densité beaucoup plus élevée des protéines et leur liberté de diffusion plus faible, mais dans ses grandes lignes il reste à la base de la conception actuelle des membranes biologiques. Il propose que les lipides soient organisés en bicouche, chaque monocouche exposant à l’environnement aqueux les têtes polaires des lipides, tandis que les queues hydrophobes s’apposent les unes aux autres au milieu de la bicouche, évitant ainsi le contact avec l’eau (figure 7.4). Cette organisation, qui est une réponse à l’effet hydrophobe (Tanford, 1980), est spontanée et peut être reproduite in vitro en dispersant dans l’eau un extrait de lipides membranaires, en l’absence totale de protéines. Au sein d’une membrane biologique, les lipides ne sont pas distribués de façon aléatoire. D’une part, les deux monocouches ont des compositions différentes. Ainsi, dans une membrane plasmique de cellule animale, la monocouche externe est enrichie en phosphatidylcholine, sphingomyéline et glycolipides, tandis que la monocouche interne est enrichie en phosphatidyléthanolamine et contient des phospholipides négativement chargés, phosphatidylsérine notamment. À la différence de l’organisation en bicouche, cette asymétrie n’est pas spontanée ; elle est créée et maintenue activement par la cellule au prix d’une dépense énergétique. Par ailleurs, les membranes des différents compartiments d’une cellule eucaryote ont des compositions et des épaisseurs différentes. Enfin, au sein d’une même membrane plasmique, existent des

93

“Chap7” — 2018/12/6 — 17:25 — page 94 — #6

La structure des protéines

PC Sph PE

PS PA

Chol

Ergo

PI

PG

CL

LPS Glu

Gan

Figure 7.2 Quelques lipides polaires fréquemment rencontrés dans les membranes biologiques. Stérols : Chol : cholestérol ; Ergo : ergostérol. Glycolipides : Gan : ganglioside ; Glu : glucolipide ; LPS : lipopolysacharide. Phospholipides : CL : cardiolipine ; PA : acide phosphatidique ; PE : phosphatidyléthanolamine ; PI : phosphatidylinositol ; PG : phosphatidylglycérol ; PS : phosphatidylsérine ; Sph : sphingomyéline.

régions de compositions distinctes résultant d’une ségrégation latérale des protéines et des lipides. Les protéines, soit s’adsorbent à la surface de la bicouche, soit sont liées de façon covalente à un lipide tout en restant elles-mêmes extramembranaires, soit pénètrent l’une des monocouches, soit traversent totalement la bicouche (figure 7.5). Elles peuvent flotter librement au sein de la bicouche lipidique, comme proposé dans le modèle initial, être directement ou indirectement ancrées à l’extérieur de la bicouche, sur la matrice extracellulaire ou sur le cytosquelette, et/ou s’associer latéralement en complexes et supercomplexes. Les surfaces protéiques exposées à l’environnement

94

“Chap7” — 2018/12/6 — 17:25 — page 95 — #7

7. Structure des protéines membranaires

Figure 7.3 Modèle en mosaïque fluide des membranes biologiques (Singer et Nicolson, 1972).

Figure 7.4 Modèle d’une bicouche lipidique hydratée obtenue par une simulation de dynamique moléculaire. En vert, les chaînes hydrophobes. En rouge orangé, les têtes polaires. En bleu et blanc, l’eau (d’après Jakobsson, 1997).

95

“Chap7” — 2018/12/6 — 17:25 — page 96 — #8

La structure des protéines

Tableau 7.1

Quelques propriétés comparées des environnements cytosolique et membranaire importantes pour le repliement, l’association et la stabilité des protéines. a Pour les propriétés qui varient selon la profondeur d’insertion dans la membrane, la valeur donnée correspond au centre de la bicouche. b Noter toutefois que le cytosol est extrêmement encombré (cf.(Goodsell, 1991)). c Dans la plupart des membranes, mais non dans toutes. d Estimations d’après les données compilées par D.S. Goodsell pour le cytosol et la membrane plasmique d’Escherichia coli (Goodsell, 1991) ; les calculs pour le cytosol sont basés sur les estimations données par Goodsell pour la taille moyenne d’une protéine soluble et un rapport en masse ARN/protéine = 1:2,5 (Alberts et al., 2015) ; les calculs pour la membrane plasmique font l’hypothèse que la protéine membranaire moyenne (souvent un oligomère) comporte ∼12 hélices α transmembranaires et que la moitié de son volume est transmembranaire ; les estimations publiées varient de 17 à 50 %. e Le seuil de percolation pour la diffusion à courte distance de petites molécules dans le plan membranaire est d’environ 50 %. f Dans le solvant pur. g Pour une protéine de taille moyenne (∼50 kDa) dans l’eau ou les lipides purs ; dans le cytosol et les membranes biologiques, Dt varie selon la distance considérée. La table est extraite de (Popot & Engelman, 2000), où l’on trouvera des références plus complètes aux publications originales.

Propriété Homogénéité du solvant Entités chimiques en contact

Cytosol

Membrane plasmiquea

Oui

Non

HOH, ions, –SH –CH3 , –CH2 , =CH– ∼Ouib

Non

Gradient de pH

Non

Ouic

Champ électrique (V · m−1 )

∼0

∼2.106

Gradient de pression

Non

Oui

Isotropie

c

Gradient de constante diélectrique

Non

Oui

Gradient de potentiel rédox

Non

Ouic

Degré d’occupation du volume ou de la surface par les protéines (protéine/solvant ; %)d

∼17

∼ 35e

∼50

∼30−35

Séparation entre les protéines : Distance (Å)

∼15−20

∼4

∼ 10−11

∼10−7

0,001

0,1

3

∼2

∼ 10−10

∼ 10−11

∼250

∼50

80

∼2

Rompre une liaison hydrogène de la chaîne principale

∼0

+4-6

Déprotoner une chaîne latérale de glutamate (pH 7)

-4

>30

Molécules de solvant interstitielles (eau ou lipides) Temps d échange entre molécules de solvant(s)f Viscosité à 20 ◦ C (η ; N·s·m−2 ) Dimensions Diffusion translationnelleg : Dt (m2 · s−1 )g Distance moyenne explorée en 1 μs (x  ; Å) Constante diélectrique (ε) G ◦ (kcal · mol−1 ) pour :

Ouvrir un pont salin Exposer 1 Å 2 de surface hydrophobe Exposer une chaîne latérale de leucine au solvant Associer deux protéines de 50 kDa (T S à 20 ◦ C)

96

C=O…HN< peut se faire dans l’eau à énergie libre à peu près constante, l’eau solvatant les groupes >CO2− et –NH3+ ainsi libérés ; au cœur de la bicouche, cette même ouverture se traduit par un G estimé à 4-6 kCal/mole. À température ambiante, cela introduit un facteur de l’ordre de 103 -104 dans la constante d’équilibre entre les deux états, en faveur de celui où la liaison est formée. Cet effet joue un rôle essentiel dans la structuration des régions protéiques transmembranaires. Inversement, et contrairement à ce qu’il en est dans l’eau, le cœur de la phase lipidique n’est pas significativement perturbé par l’exposition d’une chaîne latérale hydrophobe d’acide aminé, leucine par exemple, alors que cette exposition coûte environ 2,8 kcal/mole dans l’eau, soit un facteur ∼100 dans une constante d’équilibre (tableau 7.1). Ce n’est donc pas dans l’effet hydrophobe qu’il faut chercher le principe organisateur des régions protéiques intramembranaires. Les domaines extramembranaires de ces protéines en revanche, sont exposés à l’eau, et les mêmes règles d’organisation qu’aux protéines solubles s’y appliquent. Comme on le verra plus loin, ce n’est donc pas l’effet hydrophobe qui gouverne l’assemblage des segments protéiques transmembranaires. La surface des protéines membranaires est adaptée à l’environnement auquel cellesci sont exposées, les régions qui font face aux chaînes lipidiques étant essentiellement couvertes de chaînes latérales d’acides aminés hydrophobes. Ceci explique que l’insertion de ces protéines dans la membrane soit thermodynamiquement favorable, ainsi que le fait qu’elles ne soient pas solubles dans l’eau en l’absence d’agents tensioactifs, ce qui complique considérablement leur étude expérimentale. Les lipides sont des molécules complexes, qui peuvent établir des interactions spécifiques avec telle ou telle région de la surface protéique transmembranaire. Ces interactions jouent un rôle important dans la stabilisation des protéines membranaires, ainsi que, le cas échéant, dans la régulation de leur activité. De ce point de vue, les lipides doivent être considérés non comme un solvant amorphe, mais comme des cofacteurs.

7.3

7.3.1

Expression, extraction, purification et manipulation des protéines membranaires en solution aqueuse Expression

Les premières études de protéines membranaires ont porté sur des protéines dont l’abondance naturelle était suffisante, notamment celles qui sont impliquées dans la respiration ou la photosynthèse, le transport en masse de solutés, la perméabilisation des membranes, toutes fonctions pour lesquelles l’existence d’un grand nombre de

98

“Chap7” — 2018/12/6 — 17:25 — page 99 — #11

7. Structure des protéines membranaires

Figure 7.6 Version modernisée du modèle en mosaïque fluide des membranes biologiques (d’après Nicolson, 2014).

copies par cellule peut être nécessaire. Toutefois, ce cas est assez rare. En effet, beaucoup de protéines membranaires ont des fonctions de signalisation qui n’en requièrent que des quantités minimes par cellule, insuffisantes pour une étude biochimique et structurale. La production à grande échelle de ces protéines est une entreprise difficile qui fait appel aux approches suivantes : • Surexprimer la protéine in vivo en la dirigeant vers un compartiment membranaire où elle pourra se replier. C’est encore à ce jour l’approche la plus fréquemment utilisée, mais son optimisation est difficile car la surexpression des protéines membranaires tend à être toxique pour la cellule qui la produit, ce qui limite les rendements. • Surexprimer la protéine in vivo, mais en la dirigeant vers le cytosol où elle précipite sous la forme de corps d’inclusion, insolubles et non toxiques, faciles à purifier en grande quantité. Toutefois, la protéine n’y est pas correctement repliée. Il faut la dissoudre dans un dénaturant, typiquement l’urée pour les protéines en tonneau β et le dodécylsulfate de sodium pour les protéines en faisceau d’hélices α, puis l’amener à adopter une structure fonctionnelle, ce qui est souvent possible (voir chapitre 9, § 9.5.2), mais n’est pas un exercice simple. • Exprimer la protéinein vitro par synthèse acellulaire, ce qui évite tout problème de toxicité et facilite considérablement les marquages. Toutefois, l’obtention d’une

99

“Chap7” — 2018/12/6 — 17:25 — page 100 — #12

La structure des protéines

protéine majoritairement fonctionnelle, présente là aussi des difficultés. L’étape de surexpression reste donc souvent une étape de blocage pour l’étude structurale d’une protéine membranaire.

7.3.2

Extraction

Les protéines extrinsèques, qui ne sont associées qu’avec la surface de la membrane, sans en pénétrer le cœur hydrophobe ni être ancrées sur un lipide, peuvent généralement être détachées par des traitements qui perturbent les interactions de type électrostatique ou hydrophobe (exposition à des extrêmes de pH ou de salinité ou à des agents chaotropes). Les protéines intégrales (appelées également intrinsèques) exposent aux lipides, ainsi qu’aux autres protéines qui les entourent, une surface transmembranaire qui est extrêmement hydrophobe. Ces protéines ne peuvent être ni extraites ni maintenues solubles en phase aqueuse sans protéger ces surfaces hydrophobes du contact de l’eau, faute de quoi l’effet hydrophobe les fait s’agréger. Le plus souvent, la protéine précipite ; parfois, elle forme de petits agrégats solubles, mais généralement inutilisables pour une étude structurale. L’approche presque universellement utilisée de nos jours pour contourner ce problème est le recours à des détergents (figure 7.7). Les détergents sont des tensioactifs, c’est-à-dire des molécules qui, possédant à la fois des groupes hydrophobes et des groupes hydrophiles, tendent à partitionner à l’interface air/eau, où leur(s) région(s) polaire(s) peu(ven)t rester en contact avec l’eau, tandis que leur(s) région(s) apolaire(s) s’en échappe(nt). Ce faisant, elles déplacent de l’interface des molécules d’eau, dont l’exposition à l’air est énergétiquement défavorable. Ceci rend énergétiquement moins coûteuse l’extension de cette surface, autrement dit abaisse la tension superficielle. Presque toutes les molécules biologiques, et notamment les lipides et les protéines, sont des tensioactifs. Les détergents sont une classe particulière de tensioactifs, qui ont la propriété de solubiliser les graisses (tous les détergents sont des tensioactifs, mais tous les tensioactifs ne sont pas des détergents). Quelques structures chimiques de détergents usuels sont illustrées sur la figure 7.7. La plupart des détergents utilisés en biochimie de nos jours sont des molécules de synthèse développées pour l’industrie ou pour la recherche, mais il existe des détergents naturels, comme les sels biliaires (cholate, désoxycholate et leurs dérivés) ou la digitonine, qui ont été très utilisés aux premiers temps de l’étude biologique des membranes et le sont encore parfois aujourd’hui, notamment la digitonine en raison de son caractère peu dénaturant. Certains détergents spécialement développés pour la biochimie, comme l’octylglucoside (OG) ou le dodécylmaltoside (DDM), sont d’utilisation courante. Le désir d’améliorer le nécessaire compromis entre capacité solubilisante et innocuité (toujours relative) vis-à-vis des protéines solubilisées conduit au développement constant de nouvelles molécules, le LMNG (2,2-didécylpropane-1,3-bis-β-D-maltopyranoside) (Chae et al., 2010) étant l’une des plus

100

“Chap7” — 2018/12/6 — 17:25 — page 101 — #13

7. Structure des protéines membranaires

CmEn

Chol DOC Dg

CHAPS(O) TX-100 LDAO

OG

Tween 20

β-DDM OTG

α-DDM DHPC

Z3-14

DPC LMNG SDS

Figure 7.7 Structure chimique de quelques détergents usuels ; CHAPS : 3-[(3cholamidopropyl)diméthylammonio]-1-propanesulfonate ; CHAPSO : 3-[(3-cholamidopropyl)-diméthylamino-1-propane sulfonate] 3-[(3cholamidopropyl)-diméthylamino]-2-hydroxy-1-propane sulfonate: Cm Ep : alkylpolyéthylène (ex. C8 E4 , C12 E8 ) ; Chol. : cholate de sodium ; (α- ou β-)DDM : n-dodécyl-α (ou β)-D-maltopyranoside ; Dg : digitonine ; DHPC : dihexanoyl- ou diheptanoylphosphatidylcholine (diC6 – et diC7 -PC) ; DOC : déoxycholate de sodium ; DPC : dodécylphosphocholine = fos-choline 12 ; LDAO : lauryldiméthylaminooxyde ; LMNG : 2,2-didécylpropane1,3-bis-β-D-maltopyranoside : OG :n-octyl-β-D-glucopyranoside ; OTG : n-octyl-β-D-thioglucopyranoside ; SDS : dodécylsulfate de sodium ; TX-100 : Triton X-100 ; Z-14-3 : Zwittergent.

intéressantes qui soient récemment apparues et dont l’utilisation se soit répandue, notamment pour l’étude des GPCRs. La structure générale de la plupart des détergents rappelle celle des lipides membranaires : une extrémité hydrophobe, une extrémité hydrophile. Exposés à l’eau, les groupes hydrophobes des détergents, comme ceux des lipides, tendent à se rassembler sous l’influence de l’effet hydrophobe. Il existe toutefois deux différences importantes avec les lipides. D’une part, la plupart des détergents ne possèdent qu’une chaîne

101

“Chap7” — 2018/12/6 — 17:25 — page 102 — #14

La structure des protéines

hydrophobe, et non deux, et celle-ci est généralement courte, ce qui rend la molécule beaucoup plus hydrosoluble. D’autre part, la tête polaire est plus encombrante que la queue hydrophobe. Ces caractéristiques gouvernent le comportement des détergents en solution aqueuse. D’une part, en raison de leur forme générale conique, leur association ne génère pas une interface plane avec l’eau, mais une surface convexe qui se referme sur elle-même : au lieu d’une monocouche virtuellement infinie, on obtient des objets clos, sphériques, lenticulaires ou allongés, appelés micelles. Au sein d’une micelle, le cœur contient les chaînes hydrophobes, tandis que la surface est composée des têtes polaires. D’autre part, l’existence d’une chaîne unique de relativement petite taille fait que le G négatif résultant de leur association est plus faible que pour les deux longues chaînes caractéristiques de la plupart des lipides. Ils ne s’agrègent donc qu’à des concentrations relativement élevées, le plus souvent comprises entre 0,1 et 10 mM, contre quelques nM pour les lipides (Tanford, 1980). La concentration à laquelle un détergent commence à former des micelles est appelée « concentration micellaire critique » (CMC). C’est elle qui détermine si une solution d’un détergent donné est solubilisante ou non, car la présence de micelles est indispensable à la solubilisation. En effet, au-dessous de la CMC, un détergent va se distribuer, en fonction de son coefficient de partage, entre monomères dispersés dans la phase aqueuse et molécules insérées dans la membrane que l’on cherche à solubiliser, ce qui peut affecter les propriétés de cette dernière, mais non la dissoudre (figure 7.8 haut). Au dessus de la CMC, en revanche, lipides et protéines membranaires peuvent s’associer aux micelles dont la région hydrophobe va se substituer à l’environnement membranaire. Les lipides se dispersent au sein des micelles, formant des micelles mixtes, tandis qu’une ceinture de détergent mêlé de lipides recouvre les surfaces protéiques qui, in situ, étaient en contact avec le cœur hydrophobe de la membrane (figure 7.8, centre) (voir par exemple Le Maire et al., 2000). Ce que le biochimiste va manipuler en solution n’est donc pas une protéine membranaire isolée, mais un complexe entre celle-ci et une ceinture de détergent, complexe qui n’est stable qu’aussi longtemps que la concentration de détergent libre est supérieure à la CMC. Si l’on dilue la solution au-dessous de la CMC, les protéines s’agrègent, libérant du détergent monomérique. Toute étude structurale doit tenir compte de cette nécessité que, quel que soit le système étudié, la surface transmembranaire des protéines ne doit pas être librement exposée à l’eau.

7.3.3

Instabilité des protéines membranaires en solution détergente et alternatives aux détergents

Les biochimistes se sont rapidement aperçus, à leurs dépens, que la majorité des protéines membranaires sont instables en solution détergente, ce qui est un problème grave et récurrent pour l’expérimentateur. Cette constatation a suscité de très nombreuses tentatives pour substituer aux détergents usuels des molécules moins

102

“Chap7” — 2018/12/6 — 17:25 — page 103 — #15

7. Structure des protéines membranaires

Distribution du détergent entre la phase aqueuse et les lipides membranaires

Perméabiisation de la membrane et formation de micelles mixtes détergent / lipides

Solubilisation sélective

Fragmentation de la membrane

Solubilisation plus ou moins complète

Délipidation, inactivation

Figure 7.8 Effets de l’addition de concentrations croissantes de détergent (en vert) sur une membrane biologique (d’après Popot, 2018).

103

“Chap7” — 2018/12/6 — 17:25 — page 104 — #16

La structure des protéines

agressives. Il est permis de penser qu’il existe une certaine antinomie entre le caractère dissociant des détergents, nécessaire pour permettre la solubilisation, et le respect des interactions que les protéines membranaires établissent in situ avec leur environnement naturel, fixation de lipides en particulier (voir plus loin), mais aussi interactions entre éléments transmembranaires au sein d’une même protéine ou entre sous-unités au sein d’un oligomère. Cette considération a conduit au développement de divers types de tensioactifs originaux qui, le plus souvent sans être par eux-mêmes capables de solubiliser les membranes, peuvent maintenir les protéines membranaires hydrosolubles après qu’elles aient été extraites par un détergent. C’est, dans une certaine mesure, le cas de la digitonine (figure 7.7), tensioactif naturel dont la détergence est très faible. Cette démarche peut être illustrée par quatre types de systèmes, les tensioactifs fluorés, les lipopeptides, les amphipols et les nanodisques. Les interactions de Van der Waals entre chaînes hydrocarbonées et chaînes fluorocarbonées sont peu favorables, de sorte que ces deux types de composés, par exemple le décane et le fluorodécane, sont peu miscibles (pour une revue générale, voir Popot, 2018). On s’attend à ce qu’une chaîne fluorocarbonée, qui par ailleurs est plus grosse et plus rigide qu’une chaîne hydrocarbonée, ne déplace pas facilement de la surface protéique une chaîne lipidique et ne s’insère pas facilement entre les surfaces, essentiellement hydrocarbonées, des segments protéiques transmembranaires. De fait, les tensioactifs fluorés ne sont pas, ou seulement très faiblement, détergents. On observe que transférer une protéine membranaire d’un détergent vers un tensioactif à queue hydrophobe fluorée la stabilise (Popot, 2010, 2018). Les tensioactifs fluorés ont notamment été utilisés pour insérer des protéines membranaires dans des membranes (que la plupart d’entre eux ne solubilisent pas), accepter des protéines membranaires synthétisées in vitro, ou étudier des complexes protéine membranaire/protéine soluble par diffusion des neutrons. Les lipopeptides sont composés d’un peptide conçu pour s’organiser, en solution aqueuse, sous la forme d’une hélice α dont une face est fortement hydrophobe et l’autre fortement hydrophile (hélice latéralement amphipathique). À chaque extrémité du peptide est greffée une chaîne lipidique qui tend à se rabattre sur la face hydrophobe de l’hélice. Si l’on mélange ces « lipopeptides » à une protéine membranaire en solution détergente et si l’on élimine le détergent, les lipopeptides se collent à la surface hydrophobe de la protéine, la maintenant soluble. Les complexes ainsi obtenus sont suffisamment petits pour être étudiés par RMN en solution. L’usage des lipopeptides et des agents tensioactifs fluorés a été validé expérimentalement, mais leur utilisation est encore ponctuelle. Les deux alternatives aux détergents actuellement les plus fréquemment utilisées sont les amphipols et les nanodisques. Les amphipols sont des polymères synthétiques de taille moyenne (typiquement de 5 à 15 kDa), dont la séquence comporte des groupes hydrophobes, habituellement de petites chaînes alkyles, et des groupes hydrophiles. Ces derniers peuvent être porteurs d’une charge nette, zwitterioniques, ou non chargés (sucres) (figure 7.9). Comme pour les lipopeptides et les tensioactifs fluorés, les amphipols ne sont pas, ou très rarement, utilisés pour extraire les protéines des membranes, mais pour les

104

“Chap7” — 2018/12/6 — 17:25 — page 105 — #17

7. Structure des protéines membranaires

a

b

c

d

d

Figure 7.9 Structure chimique de quelques polymères amphiphiles utilisés pour la manipulation des protéines membranaires en solution aqueuse (amphipols). a) amphipol dérivé du polyacrylate (A8-35) ; b) amphipol à tête polaire phosphorylcholine (PC-APol) ; c) amphipol non ionique à tête polaire glucosylée (NAPol) ; d) amphipol sulfonaté (SAPol) (d’après Zoonens et Popot, 2014).

prendre en charge après qu’elles aient été extraites par un détergent. Le transfert s’effectue en ajoutant l’amphipol à la protéine membranaire en solution détergente avant d’éliminer le détergent. Comme les détergents, les amphipols s’adsorbent sur la surface hydrophobe des protéines membranaires (figure 7.10 et plus loin figures 7.13 et 7.21), formant un complexe hydrosoluble. En règle générale, les protéines membranaires transférées en amphipols sont plus stables que si elles sont conservées en solution détergente. Ceci est dû à plusieurs causes : a) les amphipols sont moins dissociants que les détergents ; b) leur concentration d’agrégation critique (équivalent de la CMC) étant très basse, il est possible de travailler en présence de très faibles concentrations d’amphipols libres, ce qui limite le risque de délipidation ; et c) les amphipols tendent à amortir les fluctuations conformationnelles des protéines auxquelles ils se fixent, ce qui diminue la probabilité de dénaturation. Si la solution détergente de départ comporte aussi des lipides, un assemblage ternaire protéine membranaire/lipide/amphipols est obtenu, stabilisant encore davantage la protéine. L’usage des amphipols a été validé pour la manipulation de très nombreuses protéines membranaires (actuellement ∼ 70) de toutes tailles et de tous types de structure, et pour de multiples applications (Zoonens &

105

“Chap7” — 2018/12/6 — 17:25 — page 106 — #18

La structure des protéines

Figure 7.10 Organisation d’un complexe protéine membranaire/amphipol modélisé en dynamique moléculaire à gros grains. En vert, la protéine (OmpX). En bleu, les groupes carboxylates de l’amphipol (A8-35) ; en rouge, les chaînes octyles ; en gris, les groupes isopropyles. À gauche, vue extérieure depuis un point proche de l’axe du tonneau β : à droite, vue latérale en coupe. Noter la façon dont les chaînes octyles s’adsorbent sur la surface transmembranaire (hydrophobe) de la protéine (d’après Perlmutter et al., 2014).

Popot, 2014, Popot, 2018). La figure 7.10 illustre la structure obtenue en dynamique moléculaire à gros grains d’une petite protéine membranaire en tonneau β (OmpX) complexée avec l’amphipol A8-35, figure 7.9). Les copolymères du styrène et de l’acide maléique constituent une classe particulière d’amphipols, capables d’extraire directement les protéines membranaires des membranes, en même temps qu’un nombre plus ou moins importants de lipides. Les nanodisques sont des assemblages lipoprotéiques dans lesquels, contrairement aux lipopeptides, les deux composants ne sont pas associés de façon covalente (Denisov & Sligar, 2016). Les protéines impliquées, appelées « scaffold proteins », sont dérivées de l’apolipoprotéine A1 qui stabilise, dans la circulation sanguine, les particules lipoprotéiques de haute densité (HDL). Elles forment des hélices latéralement amphipathiques qui s’adsorbent sur la tranche de très petits fragments discoïdaux de bicouche lipidique. L’assemblage se forme spontanément si lipides et protéines sont mélangés en solution détergente dans la proportion voulue et le détergent éliminé. Si le mélange de départ comporte aussi une protéine membranaire, celle-ci peut s’intégrer dans le disque lipidique (figure 7.11). La beauté du système tient en deux points principaux. D’une part, la protéine membranaire, tout en étant maintenue hydrosoluble, est exposée à un environnement très proche de l’environnement membranaire. D’autre part, la taille des scaffold proteins détermine celle du nanodisque. Il est ainsi possible de piéger des monomères de protéines membranaires en les empêchant de dimériser, ce qui s’est avéré être très précieux pour diverses études fonctionnelles, par exemple pour examiner si les GPCRs fonctionnent ou non sous

106

“Chap7” — 2018/12/6 — 17:25 — page 107 — #19

7. Structure des protéines membranaires

Figure 7.11 Modèle d’un complexe protéine membranaire/nanodisque. En bleu, les deux scaffold proteins ; en gris semi-transparent, le fragment de bicouche lipidique ; en jaune, la protéine membranaire (ici la bactériorhodopsine) (d’après Nath et al., 2007).

forme de monomères, ce qui est très difficile à étudier dans d’autres systèmes expérimentaux.

7.4

Étude structurale des protéines membranaires

Une fois maintenues solubles par un tensioactif, les protéines membranaires peuvent, à condition que leur stabilité soit suffisante, être purifiées et étudiées en solution aqueuse par la plupart des techniques applicables aux protéines solubles. Toutefois, leur étude structurale pose de nombreux problèmes spécifiques. Les trois approches expérimentales permettant d’établir dans sa totalité une structure tridimensionnelle à une résolution suffisante pour la construction d’un modèle atomique sont la microscopie électronique, la cristallographie X et la RMN en solution.

7.4.1

Microscopie électronique

Historiquement, c’est la microscopie électronique qui a fourni les premières informations structurales, à moyenne résolution, sur l’organisation tridimensionnelle des protéines membranaires. Il existe deux grandes approches, techniquement très différentes, basées respectivement sur l’étude de cristaux bidimensionnels et sur celle de particules uniques. Certaines protéines, lorsque leur concentration dans le plan membranaire devient très élevée, tendent à s’associer latéralement en cristaux bidimensionnels plus ou moins ordonnés. C’est notamment le cas de la bactériorhodopsine dans la membrane

107

“Chap7” — 2018/12/6 — 17:25 — page 108 — #20

La structure des protéines

Figure 7.12 Arrangement cristallin et reconstruction de la structure 3D de la bactériorhodopsine obtenus par l’étude cristallographique d’images en cryo-microscopie électronique de cristaux bidimensionnels non colorés. À gauche, arrangement hexagonal dans le plan membranaire des trimères de bactériorhodopsine (d’après Henderson & Unwin, 1975). À droite, reconstruction de la structure tridimensionnelle d’un monomère. Le rectangle est parallèle au plan de la membrane. La résolution est d’environ 0,7 nm dans le plan membranaire, mais de seulement ∼1,4 nm dans la direction perpendiculaire, ce qui explique l’allure fuselée des sept hélices α qui forment la région transmembranaire et l’absence dans la carte de densité électronique des boucles extramembranaires qui les connectent (d’après Henderson & Unwin, 1975).

plasmique de l’archébactérie Halobacterium salinarium (figure 7.12). La plupart du temps, toutefois, les cristaux sont obtenus in vitro, en mélangeant en solution détergente la protéine purifiée et une quantité soigneusement ajustée de lipides et en éliminant le détergent. L’étude de ces cristaux en coloration négative est relativement aisée, mais la résolution obtenue ne dépasse pas 1,5-2 nm, en raison du colorant, et seule la forme générale de la protéine peut être visualisée, non sa structure interne. Seule la cryo-microscopie électronique, pour laquelle les cristaux sont immobilisés dans un film de glace amorphe maintenu à la température de l’azote ou de l’hélium liquide, combinée à l’inclinaison de l’échantillon sous différents angles, fournit des cartes tridimensionnelles de densité électronique permettant la construction de modèles atomiques. La seconde approche, méthodologiquement très différente, consiste à collecter et ordonner des milliers d’images en projection de particules uniques obtenues sous différents angles, à partir desquelles une structure tridimensionnelle est reconstruite

108

“Chap7” — 2019/1/11 — 11:11 — page 109 — #21

7. Structure des protéines membranaires

b

a

Figure 7.13 Vues latérale (à gauche) et en projection sur le plan de la membrane (à droite) du canal ionique TRPV1 piégé en amphipols. La carte de densité électronique qui a servi à la construction du modèle atomique de la protéine a été obtenue à 0,34 nm de résolution par alignement et analyse tomographique d’images de particules uniques collectées par cryo-microscopie électronique. Une ceinture d’amphipols entoure la région transmembranaire (d’après Liao et al., 2014).

par tomographie. Longtemps limitée à l’obtention de cartes à relativement basse résolution, cette approche, grâce à des progrès techniques comme la détection directe des électrons, la modification génétique des protéines cibles, et l’utilisation de tensioactifs stabilisants, permet désormais d’obtenir directement des modèles atomiques sans passer par les cristaux bidimensionnels ou la radiocristallographie. La figure 7.13 montre la structure du canal ionique TRPV1 piégé en amphipols, obtenue par cette approche.

7.4.2

Radiocristallographie

L’utilisation de la diffraction des rayons X pour déterminer la structure des protéines membranaires ne diffère pas, dans son principe, de sa mise en œuvre pour l’étude des protéines solubles, mais en pratique elle est beaucoup plus difficile. Cela tient en grande partie au fait que les cristaux de ces protéines sont plus difficiles à obtenir et généralement plus petits, plus fragiles et moins bien ordonnés. De nombreux progrès techniques ont toutefois rendu moins aléatoire la cristallisation des protéines membranaires. En particulier : • Des modifications génétiques de la protéine, destinées à la stabiliser et à la rigidifier, ou à augmenter les surfaces polaires disponibles pour la formation de contacts cristallins (élimination de boucles extramembranaires et/ou des extrémités N- et C-terminales, sélection de protéines plus résistantes aux détergents, insertion de

109

“Chap7” — 2019/1/11 — 11:11 — page 110 — #22

La structure des protéines

domaines solubles dans les boucles extramembranaires). Si la protéine est glycosylée, ce qui est fréquent chez les protéines d’origine eucaryote, on améliorera son homogénéité biochimique en supprimant génétiquement les sites de glycosylation ou en exprimant cette protéine dans une bactérie, où la glycosylation n’a pas lieu. • La cristallisation en mésophases lipidiques, telles que les phases dites cubiques. Il s’agit de phases tridimensionnelles où les lipides, typiquement la monooléine, s’organisent en bicouches qui se referment en tubes creux, lesquels se connectent les uns aux autres pour former un réseau tridimensionnel. Les protéines membranaires introduites dans ces phases diffusent dans la paroi des tubes et, localement, s’assemblent en inclusions sous forme de cristaux formés d’un empilement de cristaux bidimensionnels. • La microcristallographie . L’étude des très petits cristaux (typiquement de fines aiguilles de dimensions latérales micrométriques) a fait de considérables progrès grâce à l’utilisation de faisceaux de rayons X très fins (de un à quelques microns) et à la mise au point de matériels et de logiciels pour repérer les microcristaux, les aligner dans le faisceau, collecter les données, trier celles-ci pour limiter les effets de la radiolyse, et reconstituer un diagramme de diffraction complet à partir des données très fragmentaires recueillies sur chaque cristal. • Actuellement en plein développement, la diffraction des faisceaux de rayons X produits par des lasers à électrons libres (X-FEL) ouvre une nouvelle ère dans l’histoire de la cristallographie, d’une part en permettant l’utilisation de cristaux toujours plus petits, d’autre part en effectuant la collecte de données dans des temps tellement brefs (fentosecondes) que l’échantillon n’a pas le temps de subir de radiolyse (ce qui peut paraître paradoxal, étant donné qu’il est vaporisé ; toutefois la collecte est plus rapide que la radiolyse). • La diffraction des neutrons a permis de visualiser l’organisation du détergent autour des molécules de protéines membranaires, fournissant la première évidence directe de leur adsorption spécifique sur la région transmembranaire de la protéine.

7.4.3

Résonance magnétique nucléaire

Comme pour la radiocristallographie, l’utilisation de la RMN pour l’étude structurale des protéines membranaires ne diffère pas fondamentalement de celle des protéines solubles, mais la nature des échantillons la rend plus difficile. RMN en solution et RMN dite des solides peuvent toutes deux être mises en œuvre, la nature des complexes utilisables variant selon le technique utilisée. En règle générale, seule la RMN en solution permet actuellement d’établir des structures dans leur intégralité ou presque, et ceci uniquement pour de petites protéines, la limite de masse actuelle étant de l’ordre de 30-40 kDa. Cependant, les récents développements de la RMN

110

“Chap7” — 2019/1/11 — 11:11 — page 111 — #23

7. Structure des protéines membranaires

à l’état solide laissent entrevoir de nouvelles possibilités (utilisation de nanodisques, polarisation nucléaire dynamique…). Par rapport aux protéines solubles, les difficultés additionnelles sont de deux ordres. D’une part, la quantité importante de détergent fixé à la protéine se traduit par un temps de corrélation rotationnelle plus long, ce qui élargit les raies. D’autre part, la stabilité de l’échantillon devient un gros problème, les conditions auxquelles la protéine est exposée étant rudes : concentration de détergent élevée (pour empêcher l’agrégation), température relativement élevée (pour améliorer la résolution), et longues durées d’expérience. Là aussi, l’utilisation de tensioactifs non détergents (amphipols, nanodisques…) offre des perspectives intéressantes, car ils donnent accès à l’étude de protéines plus fragiles et permettent des études de plus longue durée et/ou à plus haute température. Le revers de la médaille est qu’ils accroissent la taille des complexes et ralentissent leur réorientation, ce qui, à une température donnée, diminue la résolution. La RMN des solides s’applique bien à des protéines incluses dans une membrane, mais il faut limiter le nombre de signaux pour pouvoir les séparer les uns des autres, donc utiliser des marquages sélectifs, et faire tourner l’échantillon à l’angle magique pour homogénéiser l’environnement électromagnétique des noyaux.

7.4.4

Autres approches fournissant des informations structurales

D’autres méthodes telles que la microscopie à force atomique, la spectrométrie de masse et la dynamique moléculaire permettent d’apporter d’autres types d’informations, plus partielles, mais parfois très précieuses. La microscopie à force atomique permet l’exploration des surfaces. Le principe est de balayer celle-ci avec une pointe très fine (de dimensions atomiques) et d’enregistrer la déviation de la pointe due au relief de la surface. La résolution peut atteindre 10 nm dans le plan et approcher 0,1 nm perpendiculairement à celui-ci. C’est une technique qui se prête remarquablement bien à l’étude de la topographie de la surface d’échantillons membranaires naturels ou reconstitués. Contrairement à la microscopie électronique, elle peut se pratiquer dans une phase aqueuse liquide, à la température ambiante, dans des conditions où les protéines étudiées sont fonctionnelles. Par ailleurs, contrairement à la cryo-microscopie électronique qui, à haute résolution, ne donne accès qu’à des images moyennées, chaque molécule protéique peut être visualisée individuellement. On peut ainsi, par exemple, examiner la distribution des formes ouvertes et fermées d’une porine dans un échantillon non cristallin, ou, en balayant plusieurs fois la même portion de la surface, voir s’ouvrir et se fermer des molécules individuelles. La microscopie à force atomique ne donne pas accès à l’intérieur des protéines. Une technique apparentée, la spectrométrie de force sur molécule unique donne des informations sur les forces qui structurent les protéines membranaires et qui les

111

“Chap7” — 2018/12/6 — 17:25 — page 112 — #24

La structure des protéines

associent à leur environnement membranaire et à leurs ligands. L’approche consiste à accrocher à l’extrémité de la pointe de l’instrument une portion d’une molécule, le plus souvent l’extrémité N- ou C-terminale d’une protéine. L’accrochage se fait généralement spontanément, en tapotant la surface de la membrane avec la pointe de la sonde jusqu’à ce qu’une protéine s’y fixe. À l’aide d’un dispositif piézoélectrique, on éloigne ensuite progressivement la pointe de la surface, tout en enregistrant la force qui s’y oppose. Il est ainsi possible de suivre l’extraction progressive des différents segments transmembranaires de la protéine et de mesurer les différences causées par une mutation ou par la fixation d’un ligand. La spectrométrie de masse est classiquement utilisée pour déterminer la masse des molécules étudiées. Dans le cas des protéines membranaires, elle peut aussi être utilisée pour examiner les lipides associés à ces protéines, l’état d’oligomérisation ou de repliement de celles-ci, la fixation de ligands. Le choix du détergent est critique pour obtenir des spectres de masse de bonne qualité. Là aussi, les tensioactifs non détergents apportent une amélioration, car ils préservent mieux que les détergents l’état des protéines lors de l’étape critique de transfert depuis la matrice ou la solution aqueuse jusqu’au vide de l’instrument. La dynamique moléculaire est une approche théorique informatisée (cf. chapitre 11) qui complémente de façon très efficace les approches expérimentales, en aidant à l’interprétation des résultats et en permettant l’exploration de conditions inaccessibles expérimentalement. Elle peut être utilisée pour comparer la conformation et la dynamique de protéines membranaires dans différents environnements, étudier le comportement des tensioactifs (figure 7.10), la fixation de ligands et ses conséquences, ou les transitions possibles entre différents états conformationnels. Les techniques de spectroscopie optique (absorption dans l’UV, le visible et l’infrarouge, dichroïsme circulaire, fluorescence), et la résonance paramagnétique électronique (RPE) s’utilisent essentiellement dans les mêmes conditions que pour les protéines solubles. La RPE a été abondamment utilisée pour examiner les mouvements moléculaires que subit, au cours de son cycle fonctionnel, une protéine insérée dans une membrane, et par exemple essayer de distinguer entre différents modèles du mécanisme d’ouverture et de fermeture de pores transmembranaires, le principe étant d’attacher deux groupes paramagnétiques en deux points connus de la séquence de la protéine et de mesurer par RPE la distance qui les sépare dans les différents états conformationnels.

7.5

Structure des protéines membranaires

Par rapport aux protéines solubles, la détermination de la structure des protéines membranaires a été tardive et lente. La première structure à basse résolution, celle de la bactériorhodopsine a été obtenue en 1975 (figure 7.12), la première carte permettant la construction d’un modèle atomique, celle d’un centre réactionnel photosynthétique bactérien, en 1985 (Deisenhofer et al., 1985). Initialement, les

112

“Chap7” — 2018/12/6 — 17:25 — page 113 — #25

7. Structure des protéines membranaires

Figure 7.14 Nombre cumulé de structures de protéines membranaires déterminées depuis la première structure cristallographique (1985). Données régulièrement mises à jour par S.H. White et collaborateurs sur le site http//blanco.biomol.uc.edu.mpstruc.

acquisitions de nouvelles structures ont été très lentes : on n’en connaissait encore qu’une dizaine en 1995, une centaine en 2005. Il y en a à présent près de 600 (figure 7.14), sur un total de quelque 120 000 structures de protéines présentes dans la Protein Data Bank. Ces protéines présentent une grande variété d’organisations.

7.5.1

Modes d’association avec la membrane. Structures quaternaires. Supercomplexes

Les protéines membranaires peuvent exister sous forme de monomères, d’oligomères, voire de super-complexes associant plusieurs oligomères. Un protomère peut être a) extramembranaire, et associé à une ou des sous-unités elles-mêmes transmembranaires, b) associé à un seul feuillet lipidique (protéines monotopiques), ou c) transmembranaire (figure 7.5). La prostaglandine H2 synthétase-1 est la première protéine monotopique dont l’étude cristallographique ait permis, en 1994, d’établir un modèle atomique. L’association avec la membrane est due à des motifs amphiphiles, des hélices α latéralement amphipathiques dont une face pénètre probablement la monocouche externe de la membrane du réticulum endoplasmique. Le reste de la protéine est extérieur à la membrane (figure 7.15). La structure ayant été résolue en présence de détergent, la membrane n’est pas présente dans la carte de densité électronique et cet arrangement reste conjectural, mais la structure laisse peu de place au doute. Ce type d’organisation

113

“Chap7” — 2018/12/6 — 17:25 — page 114 — #26

La structure des protéines

Figure 7.15 Structure cristallographique du dimère de la prostaglandine H2 synthétase1. Les régions extramembranaires sont représentées en bleu. Les hélices amphipathiques colorées en bronze sont présumées s’insérer dans la monocouche externe (cytosolique) de la membrane du réticulum endoplasmique (1PRH) (d’après Picot et al. 1994).

semble rare, mais il a été retrouvé chez quelques autres protéines. Dans le cas de la prostaglandine synthétase, il semble y avoir un rapport direct avec la fonction de cet enzyme, qui est de prélever dans la membrane un substrat fortement hydrophobe, l’acide arachidonique, et d’en réaliser l’oxydation en prostaglandine H2 . La perturbation de la membrane créée par la protéine et la proximité des sites actifs suggèrent que ce mode d’ancrage favorise l’extraction du substrat dissout dans la bicouche. La quasi-totalité des protéines membranaires de structure connue comportent au moins une sous-unité ou une région transmembranaire. Celle-ci peut traverser la membrane par un segment unique, qui est toujours une hélice α (protéines bitopiques, figure 7.5). C’est le cas de protéines comme la glycophorine A, l’hémaglutinine, la neuraminidase, des cytochromes de type P450 , de nombreux facteurs de croissance. Le segment transmembranaire peut être, pour autant qu’on le sache, une simple ancre hydrophobe, l’activité de la protéine se déroulant entièrement à l’extérieur de la membrane. Il peut aussi permettre l’association de la protéine avec d’autres sous-unités, soit identiques, soit différentes. Dans le cas des facteurs de croissance, l’hélice transmembranaire joue un rôle dans la régulation de l’activité, en contrôlant le transfert d’information entre le milieu aqueux extérieur et le cytosol. Ceci peut passer, soit par la modulation d’un équilibre monomère ↔ dimère, soit par la réorganisation d’un dimère préexistant, l’une ou l’autre déclenchée par la fixation du ligand. La mise en contact de domaines intracellulaires, à la suite de cette réorganisation, déclenche souvent une autophosphorylation ou une méthylation, qui est le signal qui amorce la réponse cellulaire. Le (ou les) domaine(s) extracellulaire(s) des protéines bitopiques peut (peuvent) être très étendu(s) (plus de 2 000 résidus chez certains récepteurs), ou presque inexistant(s). Ce dernier cas se rencontre fréquemment dans certaines sous-unités

114

“Chap7” — 2018/12/6 — 17:25 — page 115 — #27

7. Structure des protéines membranaires

Figure 7.16 Le complexe collecteur de lumière LH2 de la bactérie photosynthétique Rhodopseudomonas acidophilia. Le complexe comporte neuf copies de deux types de sous-unités, chacune comprenant une seule hélice α transmembranaire (en blanc), arrangées en deux couronnes entre lesquelles sont fixées des molécules de bactériochlorophylle (en vert et en rouge) et de caroténoïdes (en jaune). À gauche, vue en projection sur le plan de la membrane ; à droite, vue latérale (d’après McDermott et al., 1995).

de complexes impliqués dans la respiration ou la photosynthèse, par exemple dans les deux sous-unités du cytochrome b 559 ou dans les protéines collectrices de lumière des bactéries pourpres (figure 7.16). Ceci s’explique assez simplement, la fonction de ces sous-unités étant de fixer et d’organiser des cofacteurs hydrophobes comme les hèmes, les chlorophylles ou les caroténoïdes, qui résident le plus souvent à l’intérieur de la membrane. Dans d’autres cas, le rôle de ces petits peptides transmembranaires est plus mystérieux. Il est possible, par exemple, qu’ils se substituent aux lipides pour stabiliser l’oligomère, protègent certains sites sensibles, ou régulent leur accès. De petites protéines bitopiques de ce genre, presque dépourvues de régions extramembranaires, se rencontrent également dans les membranes virales ainsi que dans le réticulum sarcoplasmique (phospholambane). Ces segments transmembranaires uniques sont toujours des hélices α. Ce dernier point s’explique facilement : une hélice α peut satisfaire avec elle-même toutes les liaisons hydrogène qui peuvent se former entre les groupes >N-H et O=C< de la chaîne principale, ce qui n’est pas le cas d’un brin β. L’autre grande classe de protéines intégrales est celle des protéines polytopiques, c’està-dire celles dont la chaîne polypeptidique traverse au moins deux fois la membrane (figure 7.5). À nouveau, ces protéines peuvent fonctionner comme monomères ou comme oligomères. Dans la première catégorie, on rencontre beaucoup de transporteurs, de récepteurs, de pores régulés ou non. Ces protéines peuvent être essentiellement transmembranaires, ou comporter des domaines extramembranaires étendus, éventuellement de part et d’autre de la membrane. Parmi les exemples du premier cas, figurent la bactériorhodopsine, dont ∼75 % de la masse est située dans la membrane (figure 7.17), et beaucoup de porines de la membrane externe des bactéries Gram-négatives, dont les régions extramembranaires sont souvent réduites au

115

“Chap7” — 2018/12/6 — 17:25 — page 116 — #28

La structure des protéines

minimum dans le périplasme, tandis que des boucles plus ou moins longues se développent dans le milieu extérieur et jouent souvent un rôle clé dans la reconnaissance et le transport des substrats, ainsi que dans l’oligomérisation (figure 7.18). Inversement, les régions extramembranaires peuvent être très étendues.

C-terminus

B

Cytosol

C

A

D G

Cœur hydrophobe de la membrane

F

E ret

Milieu extérieur N-terminus

Figure 7.17 Organisation transmembranaire de la bactériorhodopsine. Les sept hélices α transmembranaires sont notées de A à G, selon leur position dans la séquence. Le rétinal (ret) est inséré entre les hélices et associé de façon covalente (par une base de Schiff) à un résidu lysyl de l’hélice G (d’après Henderson et al., 1990).

Les protéines polytopiques peuvent s’associer à des protéines bitopiques et extramembranaires. Par exemple, le cytochrome b6 f chloroplastique est un superdimère dont chaque monomère comporte huit sous-unités, dont deux sous-unités polytopiques, deux sous-unités bitopiques dotées de domaines enzymatiques extramembranaires assez étendus, et quatre petites sous-unités bitopiques essentiellement transmembranaires (figure 7.19). Le cytochrome bc1 mitochondrial, dont la fonction et la composition sont similaires, comporte en plus des sous-unités extrinsèques. Certaines protéines membranaires sont d’une très grande taille et d’une extrême complexité, comme le Complexe I mitochondrial (NADH ubiquinone oxydoréductase), dont la version bovine ne comporte pas moins de 44 sous-unités, tant intrinsèques qu’extrinsèques, pour une masse totale d’environ 1 MDa (figure 7.20). Il n’est pas rare qu’une protéine dont la forme fonctionnelle est un oligomère dans une membrane ou un organisme soit une protéine unique comprenant de multiples régions dans une autre. C’est le cas, par exemple, des canaux ioniques impliqués dans

116

“Chap7” — 2018/12/6 — 17:25 — page 117 — #29

7. Structure des protéines membranaires

Milieu extérieur

Cœur hydrophobe de la membrane

Périplasme

Figure 7.18 Organisation du transporteur de fer Fep A (d’après Buchanan et al. 1999).

subIV

cytb6 stroma

( lumen

C

N

N

PetG PetL PetM PetN N

C

C

C

C

C

)x2

ci b H

β-car. A

D

B

C

bL

Chla

C

Fe2S2

N

N

N

N

Protéine de Rieske

cytf

Figure 7.19 Composition polypeptidique et topologie transmembranaire du cytochrome b6 f de Chlamydomonas reinhardtii (d’après les données de Pierre et al., 1995, Stroebel et al., 2003).

117

“Chap7” — 2018/12/6 — 17:25 — page 118 — #30

La structure des protéines

Figure 7.20 Structure du complexe I mitochondrial bovin obtenue par analyse d’images de particules uniques en cryo-microscopie à 5 Å de résolution. En haut : vue latérale. En bas : vue en projection sur le plan de la membrane de la région transmembraneire (d’après Vinothkumar et al., 2015).

la propagation de l’influx nerveux : le canal qui assure l’entrée du sodium est formé par une protéine polytopique à quatre régions homologues dont chacune comporte six segments transmembranaires, tandis que celui qui assure la sortie du potassium est un homotétramère, dont chaque protomère est l’homologue de l’une des régions du canal sodique. Un cas fréquent dans les systèmes de transduction d’énergie est la formation de « supercomplexes » qui associent des oligomères de protéines dont chacun, pris indépendamment, est fonctionnel. C’est le cas par exemple du « respirasome »

118

“Chap7” — 2018/12/6 — 17:25 — page 119 — #31

7. Structure des protéines membranaires

(supercomplexe B) mitochondrial, qui associe une copie du Complexe I, un homodimère de cytochrome bc1 , et une copie de la cytochrome c oxydase (figure 7.21). La principale raison d’être de ce supercomplexe est probablement de faciliter le transfert de substrats d’un complexe à l’autre.

10 nm

Amphipols

Figure 7.21 Structure du respirasome mitochondrial, un supercomplexe comportant une copie du Complexe I (en bleu), un dimère de cytochrome bc1 (en rouge) et une copie de cytochrome c oxidase (en vert). En brun, la couche d’amphipols qui couvre la surface transmembranaire. La structure a été déterminée par cryo-microscopie électronique à partir d’images de particules uniques (d’après Althoff et al., 2011).

Un cas d’assemblage supramoléculaire particulièrement étudié est celui des « radeaux » (rafts) formés par l’assemblage dans le plan membranaire de lipides et de protéines qui peuvent transiter d’une région de la cellule à l’autre et, probablement, réguler certaines fonctions cellulaires. Le structuraliste doit donc garder à l’esprit, lorsqu’il étudie une protéine membranaire in vitro que celle-ci a été sortie de son contexte et a pu perdre certaines interactions qui permettent ou modulent son fonctionnement, ou seulement l’une ou l’autre de ses fonctions. Il y a un continuum de la biologie structurale la plus fine à la biologie cellulaire la plus intégrée. On n’oubliera pas non plus que beaucoup de protéines membranaires assument de multiples fonctions. Comme il a déjà été mentionné,

119

“Chap7” — 2018/12/6 — 17:25 — page 120 — #32

La structure des protéines

l’échangeur d’anions de l’érythrocyte, par exemple, comporte, portées par la même chaîne polypeptidique, une région transmembranaire qui assure l’échange d’anions et une région cytosolique qui associe la membrane au cytosquelette (figure 7.1).

7.5.2

Structure secondaire et tertiaire des régions transmembranaires

Ainsi que cela a été mentionné précédemment, les propriétés physiques du cœur hydrophobe d’une bicouche lipidique diffèrent grandement de celles d’une phase aqueuse (tableau 7.1). En particulier, la très basse constante diélectrique rend énergétiquement coûteux tout processus qui entraîne l’exposition aux lipides de groupes porteurs d’une charge nette ou partielle, et renforce considérablement toutes les interactions de nature électrostatique. La conséquence est de favoriser les états conformationnels qui minimisent la polarité des chaînes polypeptidiques. Considérons le cas d’un polypeptide modèle comportant vingt résidus d’alanine, supposé pouvoir s’équilibrer entre un état totalement déplié, où le brin polypeptidique ne forme avec lui-même aucune liaison hydrogène tout en restant exposé soit à l’eau, soit aux lipides (ce dernier état parfaitement imaginaire car énergétiquement hors d’atteinte), et un état entièrement replié en hélice, où toutes les liaisons hydrogène de la chaîne principale sont satisfaites. Dans l’eau, le bilan énergétique du dépliement de l’hélice est à peu près nul, toute liaison hydrogène rompue se reformant avec le solvant. Au sein de la bicouche où aucune solvatation n’est possible, le coût énergétique de l’ouverture d’une liaison H est estimé à 4-6 kCal/mole. Sachant qu’il faut ∼20 résidus pour qu’une hélice α traverse les 3 nm d’épaisseur de la région des chaînes lipidiques, la constante d’équilibre théorique entre les deux états peut être estimée à > 1060 . Autrement dit, dans un milieu totalement hydrophobe, l’état entièrement déplié n’existe pas. Ces considérations avaient été avancées, notamment par S.J. Singer, avant même que la première structure de protéine membranaire ne soit connue. Elles ont été validées par l’observation que la région transmembranaire de la bactériorhodopsine est constituée d’un faisceau de sept hélices (figure 7.17), que le centre réactionnel photosynthétique de Rhodopseudomonas viridis comporte trois sous-unités dont les régions transmembranaires sont assemblées en un faisceau comportant au total onze hélices α (Deisenhofer et al., 1985), et que les porines bactériennes exposent au cœur de la membrane externe la surface d’un tonneau β, feuillet β refermé sur lui-même, donc ne comportant aucun groupe >C=O ou >N–H non apparié (figure 7.18). Ces motifs sont retrouvés dans toutes les protéines membranaires dont la structure a été résolue à ce jour. Les oligomères se constituent par agrégation latérale. L’hélice α est le motif dominant dans les membranes qui délimitent les compartiments intracellulaires des cellules eucaryotes, mais les membranes externes du chloroplaste et de la mitochondrie, organelles qui, au cours de l’évolution, ont dérivé de bactéries endosymbiotiques, contiennent également quelques protéines en tonneau β, comme le canal anionique dépendant du voltage (VDAC).

120

“Chap7” — 2018/12/6 — 17:25 — page 121 — #33

7. Structure des protéines membranaires

GpA

RC

bc1

LHC-II

bR

KcsA

LH2

COX

PSI

MscL

Figure 7.22 Distribution des acides aminés fortement hydrophobes (en bleu) et fortement hydrophiles (en rouge) dans diverses protéines membranaires organisées en faisceau d’hélices α. La structure du centre réactionnel du photosystème I (PSI) n’a pas été colorée, l’identification des résidus n’étant pas encore disponible à l’époque où la figure a été réalisée. La région transmembranaire est reconnaissable à la prédominance d’hélices α régulières et à l’abondance de résidus hydrophobes. Les groupes prosthétiques ne sont pas représentés, ce qui explique l’existence de vides apparents dans certaines structures (d’après Popot et Engelman, 2000).

Les hélices qui sont en contact avec le cœur hydrophobe de la membrane sont, en règle générale, très hydrophobes (figure 7.22), et par là capables d’être stables par elles-mêmes en position transmembranaire en l’absence du reste de la protéine. Ce n’est pas le cas des brins β transmembranaires, lesquels, schématiquement, tendent à comporter un résidu hydrophobe sur deux : dans la protéine repliée, les résidus de l’une des deux séries, par exemple la série impaire, comportent une majorité de chaînes latérales hydrophobes, qui sont exposées à l’extérieur du tonneau, tandis que les chaînes latérales des résidus de la seconde série, la série paire, peuvent être hydrophiles ou hydrophobes et sont tournées vers l’intérieur. Globalement, le brin β est donc beaucoup moins hydrophobe que l’hélice α, ce qui est directement lié au

121

“Chap7” — 2018/12/6 — 17:25 — page 122 — #34

La structure des protéines

mode de synthèse et d’insertion in vivo de chacune de ces deux classes de protéines membranaires (voir chapitre 9, § 9.5.1). Les segments transmembranaires peuvent ne pas être perpendiculaires au plan de la membrane : certaines hélices α ou brins β sont, en fait, extrêmement inclinés par rapport à ce plan. Par ailleurs, une fois une barrière d’hélices α ou de brins β établie, rien n’empêche des segments protéiques situés à l’intérieur du « corral » ainsi formé d’adopter des structures différentes : en effet, ils ne sont pas en contact avec les lipides et peuvent, au contraire, être hydratés par l’eau qui pénètre dans la lumière du tonneau β ou du faisceau d’hélices, ce qui permet la formation de structures non périodiques (cf. la structure de Fep A figure 7.18, dont le lumen du tonneau transmembranaire contient un domaine globulaire). Les boucles et les domaines ainsi formés ont en général une très grande importance fonctionnelle.

7.5.3

Interactions stabilisantes. Cofacteurs. Lipides

Les interactions qui structurent et stabilisent les protéines membranaires sont, intrinsèquement, de même nature que dans le cas des protéines solubles, mais la différence d’environnement fait que leur hiérarchie est très différente. Une hélice α ou un tonneau β exposé à un environnement hydrophobe est considérablement stabilisé, de sorte que, par exemple, une simple hélice transmembranaire peut être considérée en elle-même comme un domaine de repliement, en ce sens qu’elle est intrinsèquement stable, en dehors de toute autre interaction, pourvu que les chaînes latérales des résidus qui la composent soient majoritairement hydrophobes. Sur la base de l’observation des premières structures connues (bactériorhodopsine et centre réactionnel photosynthétique bactérien), d’analyses de séquences, de nombreuses observations biochimiques et de considérations thermodynamiques, il a été proposé que le repliement des protéines membranaires structurées en faisceau d’hélices puisse être considéré comme un processus en deux étapes, au cours duquel les hélices transmembranaires se forment, puis s’associent latéralement (figure 7.23). L’association peut s’accompagner de divers réarrangements, comme des déformations d’hélices, l’insertion de boucles rentrantes, la liaison de groupes prosthétiques, la fixation de lipides, d’autres protéines, etc. Ce modèle est cohérent avec ce que l’on sait du mode d’insertion dans la membrane des protéines repliées en faisceaux d’hélices α lors de leur biosynthèse (voir chapitre 9, § 9.5.1). L’assemblage de deux hélices hydrophobes au sein de la membrane ne peut être stabilisé par l’effet hydrophobe, puisque les surfaces en présence ont déjà été soustraites au contact de l’eau. Leur association ne bénéficie donc pas de la chute d’énergie libre associée à la libération de molécules d’eau, comme cela serait le cas en solution aqueuse. Elle peut résulter d’interactions polaires, qui sont très puissantes en milieu hydrophobe, ou d’interactions de Van der Waals, si les contacts établis entre les surfaces des deux hélices sont plus étroits qu’entre ces surfaces et l’environnement lipidique. Parmi les exemples d’interactions de type polaire figure la façon dont les chaînes latérales d’hélices transmembranaires interagissent avec des boucles ou

122

“Chap7” — 2018/12/6 — 17:25 — page 123 — #35

7. Structure des protéines membranaires

Figure 7.23 Le modèle de repliement en deux étapes postule que les régions transmembranaires organisées en faisceaux d’hélices α se forment par accrétion d’hélices transmembranaires préformées (à gauche), leur assemblage pouvant s’accompagner de divers réarrangements (à droite) (d’après Popot et Engelman, 1990).

hélices rentrantes qui pénètrent au cœur du faisceau d’hélices et les stabilisent. Au sein de l’ATPase calcique du réticulum sarcoplasmique, deux ions calcium fixés par les hélices 4, 5, 6 et 8, stabilisent l’assemblage de dix hélices qui forme la région transmembranaire de cet enzyme. Cette association joue un rôle clé dans la stabilité de la protéine : ainsi, en présence de calcium, l’ATPase calcique résiste raisonnablement bien à certains détergents, comme le C12 E8 . Si l’on élimine le calcium en ajoutant de l’EGTA à la préparation, la dénaturation est quasi instantanée. Un autre exemple bien étudié est celui des récepteurs de facteurs de croissance, protéines bitopiques dont la dimérisation implique des interactions entre leurs hélices transmembranaires. La régulation de celles-ci est très précise : une mutation d’un seul résidu neutre (Ala) en résidu polaire (Glu) dans l’hélice α transmembranaire unique du récepteur FGFR3 des fibroblastes suffit à déplacer l’équilibre monomère ↔ dimère en faveur du dimère, mimant ainsi l’activation physiologique, ce qui est à l’origine de cancers de la vessie. Des molécules d’eau peuvent favoriser ces interactions (voir figure 7.24). Elles jouent souvent un rôle fonctionnel important, notamment dans le transfert des protons. Un cas très particulier d’interaction polaire se rencontre dans certaines porines, où les extrémités N- et C- terminales de la protéine interagissent l’une avec l’autre au sein de la phase membranaire, verrouillant ainsi la fermeture du tonneau. Au sein de la bicouche, l’ouverture de ce pont salin est énergétiquement très coûteuse (tableau 7.1), ce qui assure l’association et l’immobilisation des deux extrémités. L’étude de l’organisation de l’homodimère de la glycophorine A, une protéine de la membrane du globule rouge, fournit un autre exemple de stabilisation, cette foisci par l’adaptation l’une à l’autre de surfaces hélicoïdales. La structure du dimère d’hélices transmembranaires a été obtenue par RMN en solution détergente. Elle montre que les deux hélices sont étroitement encastrées l’une dans l’autre, ce qui

123

“Chap7” — 2019/1/11 — 11:11 — page 124 — #36

La structure des protéines

Figure 7.24 Molécules d’eau (sphères bleu foncé) associées au domaine transmembranaire de la bactériorhodopsine et, pour certaines d’entre elles, impliquées dans le pompage de protons (d’après Popot et Engelman, 2000 ; données originales de Belrhali et al., 1999).

est rendu possible par le motif GxxG qui permet aux deux brins polypeptidiques de s’approcher davantage l’un de l’autre que si les résidus 1 et 4 de ce motif portaient d’autres chaînes latérales. Le motif GxxG a été observé dans de très nombreuses séquences d’hélices transmembranaires. Les protéines membranaires impliquées dans les transferts d’électrons et de protons qui sont au cœur de la bioénergétique comportent de nombreux groupes prosthétiques, dont le potentiel rédox est ajusté par l’environnement protéique et contrôle les transferts d’électrons. D’autres groupes prosthétiques (chlorophylles, caroténoïdes…) captent la lumière ou transfèrent des excitons. Ces groupes sont généralement portés par des hélices transmembranaires et sont le plus souvent en contact avec deux ou plus d’entre elles (cf. figure 7.16). Leur liaison est un facteur de stabilisation, l’expérience montrant que les apoprotéines (bactério-opsine par exemple) sont moins stables que les holoprotéines correspondantes. Les lipides ne doivent pas être considérés comme un solvant amorphe. Ils interagissent souvent de façon spécifique avec les protéines membranaires, se comportant, de fait, comme des cofacteurs stabilisants. Dans les structures cristallographiques, des

124

“Chap7” — 2018/12/6 — 17:25 — page 125 — #37

7. Structure des protéines membranaires

A

B

Figure 7.25 Lipides interagissant avec la bactériorhodopsine (A) et avec le transporteur de fer bactérien PhuA (B) (d’après Popot et Engelman, 2000 ; données originales de Mitsuoka et al., 1999 et Ferguson et al., 1998).

lipides apparaissent dans des positions bien définies, dont on peut distinguer trois types : 1) très fréquemment, des lipides sont fixés à la surface transmembranaire de la protéine, assurant l’interface avec les lipides non immobilisés (figure 7.25) ; 2) dans les protéines oligomériques, des lipides se rencontrent à l’interface entre les domaines transmembranaires des différentes sous-unités ; 3) dans quelques cas, des lipides sont insérés au sein même d’une sous-unité, pris en sandwich entre les hélices α. Ce dernier cas se rencontre, par exemple, dans le centre réactionnel du photosystème I, où le phosphate d’une molécule de phosphatidylglycérol fixe l’ion magnésium d’une molécule de chlorophylle. Dans un cas de ce genre, le lipide joue le rôle d’un véritable groupe prosthétique. Certaines de ces interactions protéine/lipide sont relativement non spécifiques, mais les cas d’interactions spécifiques sont fréquents, par exemple avec le lipopolysaccharide pour certaines porines, la cardiolipine pour de nombreuses protéines mitochondriales ou bactériennes, le cholestérol pour les récepteurs couplés aux protéines G ou pour le récepteur nicotinique de l’acétylcholine. Certains lipides, comme le diacylglycérol ou l’acide lysophosphatidique, servent de seconds messagers qui diffusent dans la membrane et modulent l’activité de protéines cibles.

Bibliographie Alberts, B., Johnson, A., Lewis, J., Morgan, D., Raff, M., Roberts, K., & Walter, P. (2015) Molecular biology of the Cell, Sixth ed., New-York & London, Garland Publishing Inc. Althoff, T., Mills, D.J., Popot, J.-L. & Kühlbrandt, W. (2011) Assembly of electron transport chain components in bovine mitochondrial supercomplex I1 III2 IV1 . EMBO J. 30: 46524664. Belrhali, H., Nollert, P., Royant, A., Menzel, C., Rosenbusch, J. P., Landau, E.M. & PebayPeyroula, E. (1999) Protein, lipid and water organization in bacteriorhodopsin crystals: a molecular view of the purple membrane at 1.9 Å resolution. Structure 7: 909-917.

125

“Chap7” — 2018/12/6 — 17:25 — page 126 — #38

La structure des protéines

Blobel, G. (1980) Intracellular protein topogenesis. Proc. Natl. Acad. Sci. USA 77: 1496-1500. Buchanan, S.K., Smith, B.S., Venkatramani, L., Xia, D., Esser, L., Palnitkar, M., Chakraborty, R., Van Der Helm, D. & Deisenhofer, J. (1999) Crystal structure of the outer membrane active transporter FepA from Escherichia coli. Nat. Struct. Biol. 6: 56-63. Chae, P.S., Rasmussen, S.G.F., Rana, R., Godfryd, K., Chandra, R., Goren, M.A., Kruse, A.C., Nurva, S., Loland, C.J., Pierre, Y., Drew, D., Popot, J.-L., Picot, D., Fox, B.G., Guan, L., Gether, U., Byrne, B., Kobilka, B.K., & Gellman, S.H. (2010) Maltose-neopentyl glycol (MNG) amphiphile for solubilisation, stabilization and crystallization of membrane proteins. Nat. Methods 7: 1003-1008. Deisenhofer, J., Epp, O., Miki, K., Huber, R. & Michel, H. (1985) Structure of the protein subunits in the photosynthetic reaction center of Rhodopseudomonas viridis at 3 Å resolution. Nature 318: 618-624. Denisov, I.G. & Sligar, S.G. (2016) Nanodiscs for structural and functional studies of membrane proteins. Nat. Struct. Mol. Biol. 23: 481-486. Ferguson, A.D., Hofmann, E., Coulton, J.W., Diederichs, K. & Welte, W. (1998) Siderophore-mediated iron transport: crystal structure of FhuA with bound lipopolysaccharide. Science 282: 2215-2220. Goodsell, D.S. (1991) Inside a living cell. Trends Biochem. Sci. 16: 203-206. Henderson, R., Baldwin, J.M., Ceska, T.A., Zemlin, F., Beckmann, E. & Downing, K.H. (1990) Model for the structure of bacteriorhodopsin based on high-resolution electron cryomicroscopy. J. Mol. Biol. 213: 899-929. Henderson, R. & Unwin, P.N.T. (1975) Three-dimensional model of purple membrane obtained by electron microscopy. Nature 257: 28-32. Jakobsson, E. (1997) Computer simulation studies of biological membranes: progress, promise and pitfalls. Trends Biochem. Sci. 22: 339-344. Le Maire, M., Champeil, P. & Møller, J.V. (2000) Interaction of membrane proteins and lipids with solubilizing detergents. Biochim. Biophys. Acta 1508: 86-111. Liao, M., Cao, E., Julius, D. & Cheng, Y. (2014) Single particle electron cryo-microscopy of a mammalian ion channel. Curr. Opin. Struct. Biol. 27: 1-7. McDermott, G., Prince, S.M., Freer, A.A., Hawthornthwaite-Lawless, A.M., Papiz, M.Z., Cogdell, R.J. & Isaacs, N.W. (1995) Crystal structure of an integral membrane lightharvesting complex from photosynthetic bacteria. Nature 374: 517-521. Mitsuoka, K., Hirai, T., Miyazawa, A., Kidera, A., Kimura, Y. & Fujiyoshi, Y. (1999) The structure of bacteriorhodopsin at 3.0 Å resolution based on electron crystallography: implication of the charge distribution. J. Mol. Biol. 286: 861-882. Nath, A., Atkins, W.M. & Sligar, S.G. (2007) Applications of phospholipid bilayer nanodiscs in the study of membranes and membrane proteins. Biochemistry 46: 2059-2069. Nicolson, G.L. (2014) The fluid-mosaic model of membrane structure: still relevant to understanding the structure, function and dynamics of biological membranes after more than 40 years. Biochim. Biophys. Acta 1838: 1451-1466. Perlmutter, J.D., Popot, J.-L. & Sachs, J.N. (2014) Molecular dynamics simulations of a membrane protein/amphipol complex. J. Membr. Biol. 247: 883-895. Peters, R. (1986) Fluorescence microphotolysis to measure nucleocytoplasmic transport and intracellular mobility. Biochim. Biophys. Acta 864: 305-359. Picot, D., Loll, P.J. & Garavito, R.M. (1994) The X-ray crystal structure of the membrane protein prostaglandin H2 synthase-1. Nature 367: 243-249. Pierre, Y., Breyton, C., Kramer, D. & Popot, J.-L. (1995) Purification and characterization of the cytochrome b6 f complex from Chlamydomonas reinhardtii. J. Biol. Chem. 270: 2934229349.

126

“Chap7” — 2018/12/6 — 17:25 — page 127 — #39

7. Structure des protéines membranaires

Popot, J.-L. (2018) Membrane proteins in aqueous solutions. From detergents to amphipols. Springer, New York. Popot, J.-L. & Engelman, D.M. (1990) Membrane protein folding and oligomerization: the two-stage model. Biochemistry 29: 4031-4037. Popot, J.-L. & Engelman, D.M. (2000) Helical membrane protein folding, stability and evolution. Annu. Rev. Biochem. 69: 881-923. Popot, J.-L. & Engelman, D.M. (2016) Membranes do not tell proteins how to fold. Biochemistry 55: 5-18. Reynolds, J.A., Gilbert, D.B., & Tanford, C. (1974) Empirical correlation between hydrophobic free energy and aqueous cavity surface area. Proc. Natl. Acad. Sci. USA 71: 2925-2927. Singer, S.J. & Nicolson, G.L. (1972) The fluid mosaic model of the structure of cell membranes. Science 175: 720-731. Stroebel, D., Choquet, Y., Popot, J.-L. & Picot, D. (2003) An atypical haem in the cytochrome b6 f complex. Nature 426: 413-418. Tanford, C. (1980). The hydrophobic effect: formation of micelles and biological membranes. 2nd ed., John Wiley & Sons, New York. Unwin, P.N.T. & Henderson, R. (1975) Molecular structure determination by electron microscopy of unstained crystalline specimens. J. Mol. Biol. 94: 425-440. Vinothkumar, K.R. (2015). Membrane protein structures without crystals, by single particle electron cryomicroscopy. Curr. Opin. Struct. Biol. 33: 103-114. Warchawski, D.E., Arnold, A.A., Beaugrand, M., Gravet, A., Chartrand, E. & Marcotte, I. (2011) Choosing membrane mimetics for NMR structural studies of transmembrane proteins. Biochem. Biophys. Acta 1808: 1957-1974. Zoonens, M. & Popot, J.-L. (2014) Amphipols for each season. J. Membr. Biol. 247: 759-796.

127

“Chap8” — 2018/12/6 — 15:49 — page 129 — #1

8 Énergétique conformationnelle Il est généralement admis que la structure primaire détermine la conformation de la protéine native dans un environnement donné. Cette assertion est connue sous le nom de postulat d’Anfinsen. Elle a pour corollaire que la structure native est thermodynamiquement la plus stable et correspond à un minimum d’énergie de Gibbs. Cependant le nombre de conformations théoriquement possibles pour une chaîne polypeptidique ayant une séquence définie est très grand. Un calcul rapide indique qu’une séquence de 150 acides aminés peut avoir 1045 conformations possibles en admettant deux conformations par unité peptidique. Il existe de sévères restrictions qui conduisent à réduire ces possibilités à un nombre très limité de conformations. Les facteurs responsables de ces restrictions sont présentés en termes d’énergie d’interaction. La force qui dirige le repliement d’une chaîne polypeptidique implique des interactions spécifiques et très précises puisque la structure tridimensionnelle biologiquement active est soit unique, soit représente un nombre très limité de conformations. À l’exception des protéines qui possèdent des ponts disulfure, les interactions qui stabilisent la structure native des protéines sont des interactions non covalentes. Parmi les différentes contributions à l’énergie conformationnelle, il convient de distinguer les interactions intramoléculaires résultant de facteurs intrinsèques à la protéine, les interactions intramoléculaires influencées par le solvant (effet diélectrique), les interactions induites par la présence du solvant (effet hydrophobe) et les interactions directes entre la protéine et le solvant.

129

“Chap8” — 2018/12/6 — 15:49 — page 130 — #2

La structure des protéines

8.1

Interactions intramoléculaires résultant de facteurs intrinsèques à la protéine

Il s’agit essentiellement d’interactions non covalentes qui ne sont pas influencées par le solvant et des interactions covalentes que sont les ponts disulfure. La conformation de la chaîne polypeptidique est déterminée par les valeurs des angles dièdres (ϕ, ψ) autour des liaisons simples, par la planéité de la liaison peptidique et le fait que les longueurs et les angles de liaison ont des valeurs fixes. Les valeurs des angles dièdres (ϕ, ψ) sont limitées par des facteurs intrinsèques à la protéine. Ces facteurs incluent les effets stériques dus aux contacts de van der Waals entre atomes des chaînes latérales, les barrières de rotation autour des liaisons simples, les interactions non covalentes entre les chaînes latérales et la formation de boucles fermées par des ponts disulfure.

8.1.1

Interactions non covalentes

8.1.1.1

Interactions de van der Waals

Les forces d’attraction entre molécules neutres incluent trois contributions selon la nature de la molécule. Ce sont les interactions entre deux dipôles ou interactions de Keesom, les interactions entre un dipôle et un dipôle induit ou interactions de Debye, les interactions entre deux dipôles induits ou interactions de London. Toutes dépendent de l’inverse de la sixième puissance de la distance intermoléculaire. L’énergie d’attraction peut être représentée par un seul terme : E a = –A/r 6 r est la distance interatomique. A dépend de la polarisabilité de la paire d’atomes en interaction. Lorsque deux atomes s’approchent à une courte distance, une répulsion due au recouvrement des orbitales électroniques augmente rapidement lorsque la distance diminue. L’énergie de répulsion est de la forme : E r = B/r n La relation exacte n’est pas connue ; n a été évalué entre 9 et 15. La constante B peut être évaluée en considérant que le potentiel est minimum lorsque la distance r est égale à la somme des rayons de van der Waals des deux atomes. Parmi les différentes approximations du terme de répulsion, la valeur de 12 a été retenue dans le potentiel de Lennard-Jones. Ainsi la fonction d’énergie connue sous la dénomination de potentiel de Lennard-Jones est donnée par la relation suivante : A + B r 6 r 12 La figure 8.1 indique la variation du potentiel avec la distance dans le cas d’une interaction entre deux atomes de carbone.

E = Ea + Er = −

130

“Chap8” — 2018/12/6 — 15:49 — page 131 — #3

8. Énergétique conformationnelle

Figure 8.1 Variation du potentiel en fonction de la distance entre deux atomes.

L’énergie totale résultant des diverses interactions de van der Waals au sein d’une molécule est donnée par la relation suivante : E =



 −

i,j

Ai,j ri,j6

+

Bi,j



ri,j12

(1)

avec i  = j . La somme est prise sur toutes les paires d’atomes i et j de la molécule. Il existe une autre expression de la fonction potentielle qui est l’approximation de Buckingham ou potentiel 6 exp. E = Ea + Er =

A + Bexp−μr r6

La constante μ peut être évaluée à partir des collisions entre atomes. Le potentiel de Lennard-Jones est le plus couramment utilisé.

8.1.1.2

Approximation de la sphère dure

Dans l’approximation de la sphère dure, les atomes sont considérés comme des sphères rigides. Deux atomes en interaction peuvent s’approcher jusqu’à une distance fixe R0 qui correspond à la somme de leurs rayons de van der Waals. Il peut se produire des contacts avec des valeurs plus faibles dus à des contraintes stériques. La somme des rayons de van der Waals d’une paire d’atomes représente seulement une moyenne. Ramachandran et ses collègues ont proposé deux ensembles de distance entre atomes. Ceux-ci incluent une limite normale qui correspond aux valeurs trouvées dans les

131

“Chap8” — 2018/12/6 — 15:49 — page 132 — #4

La structure des protéines

cristaux et une limite extrême qui comporte des valeurs plus faibles et rend compte de tous les contacts trouvés. Si les distances entre certains atomes sont comprises entre la limite normale et la limite extrême, les conformations sont partiellement permises ; elles sont moins stables que celles qui sont totalement permises. Les conformations qui impliqueraient des contacts à une distance inférieure à la limite extrême sont interdites. Le tableau ci-après donne les deux séries de distances limites pour différentes paires d’atomes d’après une évaluation de Ramachandran et Sasisekharan (1968).

Tableau 8.1

?

Distances limites en Angströms pour différentes distances interatomiques. Type de contact

Limite normale

Limite extrême

H…H H…O H…N H…C O…O O…N O…C N…N N…C C…C C…CH CH…CH

2,0 2,4 2,4 2,4 2,7 2,7 2,8 2,7 2,9 3,0 3,2 3,2

1,9 2,2 2,2 2,2 2,6 2,6 2,7 2,6 2,8 2,9 3,0 3,0

Le diagramme de Ramachandran présenté au chapitre 3 (figure 3.4) indique les régions permises pour un dipeptide contenant l’alanine. Cette carte des régions autorisées est basée sur l’approximation de la sphère dure et ne prend en compte que la rotation autour des liaisons simples, rotation restreinte par les rayons de van der Waals ; elle ne permet pas d’évaluer les stabilités relatives des conformations possibles. Pour cela, il convient d’utiliser la fonction potentielle incluant les interactions attractives et répulsives. En 1965, Néméthy et Schéraga ont établi une fonction potentielle afin de déterminer la stabilité des structures protéiques. Une évaluation quantitative des variations d’énergie conformationnelle est indiquée par des lignes équipotentielles sur le diagramme de Ramachandran. Celui-ci est représenté sur la figure 8.2 ; les lignes d’énergie équipotentielles sont tracées à intervalle de 1 kcal/mol de 0 à 4 kcal · mol. Les régions permises dans l’approximation de la sphère dure sont indiquées par des lignes plus épaisses.

8.1.1.3

Potentiel dû aux barrières de rotation interne ou potentiel de torsion

Les rotations internes autour des liaisons simples ne sont pas complètement libres ; elles sont limitées par des barrières. Les angles de rotation permis sont déterminés par

132

“Chap8” — 2018/12/6 — 15:49 — page 133 — #5

8. Énergétique conformationnelle

Figure 8.2 Lignes équipotentielles du diagramme de Ramachandran (d’après Schéraga H. A., Scott, A., Vanderkoi,G., Leach, S., Gibson K. D., Ooi T., & Nemethy G. (1967) in Conformation of Biopolymers vol. 1, p. 47 Acad. Press, New York). Les lignes d’énergie équipotentielle sont dessinées à intervalle de 1 kcal/mol de 0 à 4 kcal/mol ; les régions permises dans l’approximation de la sphère dure sont indiquées.

des fonctions potentielles périodiques qui résultent en partie des interactions entre orbitales électroniques appartenant aux atomes liés par des liaisons simples, et en partie des répulsions de van der Waals entre les substituants de ces atomes. La forme générale de l’énergie potentielle pour une liaison simple est de la forme : E = 1/2 E1 (1 – cos 3θ) + 1/2 E2 (1 – cos 6θ) E1 et E2 sont les hauteurs des barrières de rotation correspondant à des symétries d’ordre 3 et 6 respectivement. Pour les angles de rotation ϕ et ψ d’une chaîne polypeptidique, Mizushima et Shimanouchi (1961) n’ont tenu compte que des symétries d’ordre 3 ; les barrières de symétrie d’ordre 6 sont généralement négligeables. Dans les protéines, les barrières de rotation autour des liaisons N-Cα et Cα -C ont été estimées par comparaison avec les valeurs obtenues pour des composés modèles. Brandt et Flory (1965) évaluent à 1,5 et 1,0 kcal/mol les barrières respectives pour Eϕ1 et Eψ1 . Les minima se présentent pour ϕ = 0 et ± 120◦ et pour ψ = ± 60◦ et 180◦ . Le potentiel de torsion est relativement faible et joue un rôle mineur dans la conformation d’une chaîne polypeptidique.

133

“Chap8” — 2018/12/6 — 15:49 — page 134 — #6

La structure des protéines

Pour la liaison peptidique C=N qui a un caractère partiel de double liaison, le potentiel de torsion est donné par la relation : Etors = 1/2 Eω (1-cos2ω) La valeur de Eω est proche de 20 kcal/mol. Pour de très faibles variations autour du minimum, la variation d’énergie est : Eω = Eω1 (ω)2

8.1.1.4

Énergies dues à des contraintes dans les longueurs et les angles de liaison

Des contraintes dans la molécule peuvent entraîner des distorsions dans la structure conduisant à un étirement (stretching) des liaisons ou à une courbure (bending) des angles de liaison. L’augmentation d’énergie associée à l’étirement d’une liaison est donnée par la relation : El = 1/2 Kl (l )2 l est la variation de longueur de la liaison et Kl la constante de force. Une expression analogue rend compte de l’énergie de courbure : Eτ = 1/2 Kτ (τ)2 ?

Une variation de 0,1 A dans les longueurs de liaisons produira un accroissement de l’énergie de 5 kcal/mol. Toutefois, il ne se produit pas de déformations supérieures ? à 0,05 A. Généralement, l’étirement des liaisons est un facteur négligeable dans l’énergie conformationnelle.

8.1.2

Interactions covalentes : les ponts disulfure

Certaines protéines possèdent des ponts disulfure qui sont des interactions covalentes qui se forment entre deux résidus de cystéine. Les ponts disulfure existent principalement dans les protéines extracellulaires leur assurant une stabilisation supplémentaire qui leur permet de garder leur structure native malgré les fluctuations de l’environnement. Les ponts disulfure introduisent des boucles fermées dans certaines parties de la chaîne polypeptidique imposant des restrictions dans la structure de la protéine. Ces restrictions résultent des propriétés de la liaison disulfure. Les rotations autour de la liaison S-S qui correspondent à l’angle dièdre χ3 ou χ5 ont un potentiel minimum pour ± 90◦ . L’angle χ5 = +90◦ correspond à la valeur de la torsion droite, tandis que χ3 = –90◦ à la valeur de la torsion gauche. Les deux types de ponts disulfure droit et gauche existent dans les protéines. La barrière rotationnelle est de 12 kcal/mol. Cette barrière rotationnelle relativement élevée est responsable des contraintes imposées à la chaîne polypeptidique par la fermeture

134

“Chap8” — 2018/12/6 — 15:49 — page 135 — #7

8. Énergétique conformationnelle

Figure 8.3 Stéréochimie de la liaison disulfure indiquant la valeur des longueurs et des angles de liaison.

d’une boucle par un pont disulfure. Cependant, les restrictions conformationnelles dues aux interactions non covalentes entre l’ensemble des chaînes latérales sont plus importantes que celles imposées par les ponts disulfure. Ces effets relatifs ont été évalués par Néméthy et Schéraga en 1965 sur un peptide de la ribonucléase compris entre les résidus 65 et 72 : 65 72 Cys-Lys-Asn-Gly-Thr-Asn-Cys

Les estimations ont indiqué que la formation du pont disulfure réduit le nombre de conformations permises de seulement 2 %.

8.2

Interactions intramoléculaires influencées par le solvant

Il s’agit essentiellement des liaisons hydrogène et des interactions électrostatiques.

8.2.1

Liaisons hydrogène

8.2.1.1

Propriétés générales

La liaison hydrogène se forme entre atomes électronégatifs liés par un atome d’hydrogène, celui-ci étant associé par une liaison de covalence à l’un des atomes électronégatifs. Elle est représentée par D-H…A, D et A étant respectivement le donneur et l’accepteur. L’énergie intrinsèque des liaisons hydrogène varie généralement entre –2 et –8 kcal/mol. Elle est intermédiaire entre celle des interactions de

135

“Chap8” — 2018/12/6 — 15:49 — page 136 — #8

La structure des protéines

van der Waals et celle des liaisons covalentes. Elle peut être considérée en première approximation comme une interaction dipôle-dipôle. La force de la liaison hydrogène diminue lorsque la distance H…A augmente. La courbe d’énergie en fonction de la distance est semblable à celle des interactions de van der Waals. La liaison hydrogène peut être considérablement affaiblie dans l’eau, car les groupes D-H et A peuvent former des liaisons hydrogène avec le solvant. Les différentes liaisons hydrogène rencontrées dans les protéines sont présentées sur la figure 8.4.

(a)

(b)

(c)

(d)

(e)

Figure 8.4 Différentes liaisons hydrogène dans les protéines. (a) Liaison hydrogène interamide ; (b) liaison hydrogène entre deux groupes neutres, (c) liaison hydrogène entre une charge et un groupe neutre ; (d) liaison hydrogène entre deux groupes chargés ; (e) liaison hydrogène entre une chaîne latérale et le squelette peptidique.

8.2.1.2

Liaisons hydrogène interamides

La liaison hydrogène la plus fréquente dans les protéines est celle qui existe entre deux groupes peptidiques N-H et O=C. Elle stabilise les structures secondaires, hélices α et structures β. Son énergie varie en fonction de la distance R entre N et O, et de l’angle θ. Elle présente un minimum pour θ = 0◦ . Les variations de l’énergie de la liaison hydrogène en fonction de R sont représentées sur la figure 8.5.

136

“Chap8” — 2018/12/6 — 15:49 — page 137 — #9

8. Énergétique conformationnelle

Figure 8.5 Diagramme énergétique de la liaison hydrogène interamide en fonction de l’angle (d’après Ramachadran, 1973).

L’énergie de la liaison hydrogène peut varier selon sa localisation et son accès aux molécules d’eau. En présence de molécules d’eau, il s’établit une compétition entre les liaisons hydrogène interamides et les liaisons hydrogène de l’eau :

N-H...O=C + H2O...H2O

8.2.1.3

N-H...OH2 + HOH...O=C

Liaisons hydrogène entre chaînes latérales

Ces liaisons hydrogène se forment entre groupes polaires neutres ou chargés. La plupart des groupes polaires sont situés à la surface de la protéine et donc sont accessibles au solvant. Ils sont susceptibles de former des liaisons hydrogène avec les molécules d’eau. La formation d’une liaison hydrogène entre deux chaînes latérales correspond à l’équilibre suivant :

P(DH,A)

P(DH…A)

137

“Chap8” — 2018/12/6 — 15:49 — page 138 — #10

La structure des protéines

Avec la constante d’équilibre KH qui représente la force de la liaison : KH =

P(DH...A) P(DH,A)

(2)

P (DH,A) et P (DH ...A) représentent les espèces dans lesquelles les groupes donneur et accepteur sont libres et liés par liaison hydrogène, respectivement. La fraction de molécules possédant la liaison hydrogène est : x H = P (DH ...A) / (P (DH ...A) + P (DH,A) ) = K H /(1 + K H ) K H est très grand lorsque x H tend vers l’unité et la liaison hydrogène est très forte. Toutefois cette expression est valable dans les conditions de pH où l’état d’ionisation des groupes donneur et accepteur est le plus favorable. En dehors de ces conditions optimales, x H varie en fonction du pH : x H = K H [1 + K H + (K 1 /H + ) + (H + /K 2 )] K 1 et K 2 étant les constantes d’ionisation respectives du groupe donneur et du groupe accepteur. Réciproquement, le pK apparent des groupes donneur et accepteur engagés dans une liaison hydrogène est modifié. La constante d’ionisation observée du groupe donneur est : K obs = (D,A)(H +)/[(DH,A) + (DH…A)] = K 1 (1 + K H ) De même pour le groupe accepteur, la constante d’ionisation observée est : K obs = K 2 (1 + K H )

8.2.1.4

Liaisons hydrogène entre un groupe donneur et un noyau aromatique

Au cours des dernières années, l’importance d’un nouveau type de liaisons hydrogène dans l’établissement de la structure tertiaire des protéines a été abondamment discutée et expérimentalement étudiée, en particulier dans des molécules modèles. Ces interactions appelées liaisons H-π polaires s’établissent entre un atome d’hydrogène appartenant à un groupe donneur et les électrons π d’un noyau aromatique. Les acides aminés, sérine, thréonine, cystéine, histidine, asparagine, glutamine, lysine, et arginine possèdent des groupes qui peuvent se comporter en donneurs comme dans le cas des liaisons hydrogène classiques. Les noyaux accepteurs sont présents dans la phénylalanine, la tyrosine et le tryptophane, mais également dans l’histidine qui est porteuse d’un hétérocycle. De plus, du fait des groupes qu’ils portent, la tyrosine, le tryptophane et l’histidine peuvent aussi se comporter en donneurs. En raison de sa structure planaire, la liaison peptidique peut également se comporter en accepteur. Ces interactions sont caractérisées par une gamme de conformations et d’énergies considérablement plus large que celle des liaisons hydrogène communes. La longueur

138

“Chap8” — 2018/12/6 — 15:49 — page 139 — #11

8. Énergétique conformationnelle

?

de ces liaisons varie de 2,3 à 4 A. L’énergie est maximale lorsque le groupe donneur est perpendiculaire au plan du noyau aromatique. Il est possible maintenant d’observer directement les liaisons hydrogène. Ainsi que l’ont montré Cordier et al. (1999), ceci s’effectue via les couplages scalaires à travers trois liaisons entre protons amides et les carboxyles accepteurs.

8.2.2

Interactions électrostatiques

Les interactions électrostatiques jouent un rôle important dans la stabilité des protéines, car beaucoup d’acides aminés sont chargés à un pH donné. Même au point isoélectrique où la charge nette de la molécule est nulle, il existe un grand nombre d’atomes chargés positivement et négativement. Ces charges interagissent entre elles. Les interactions électrostatiques dépendent du nombre et de la distribution des charges. L’énergie de ces interactions est régie par la loi de Coulomb. L’énergie entre deux charges q1 et q2 situées à une distance r est donnée par la relation : E = q1 q2 /Dr D étant la constante diélectrique du milieu. Les interactions entre charges ponctuelles sont potentiellement plus fortes que les interactions de van der Waals, et diminuent moins rapidement lorsque la distance augmente. En solution aqueuse, l’énergie entre les deux charges est affaiblie, par suite de la valeur de la constante diélectrique du solvant. Ainsi l’énergie entre deux ions ? monovalents situés à 5 A l’un de l’autre dans le vide est – 66,3 kcal/mol ; elle n’est plus que – 0,85 kcal/mol dans l’eau. Les groupes chargés sont situés majoritairement à l’extérieur des molécules de protéines et donc exposés au solvant. Leur contribution à l’énergie de stabilisation est très faible. Par contre certains groupes chargés enfouis à l’intérieur des protéines dans un environnement de faible constante diélectrique peuvent former des ponts salins de forte énergie. Ainsi dans les protéases à sérine telles que la trypsine, la chymotrypsine et l’élastase, un pont salin entre un carboxylate et un groupe α aminé stabilise la conformation fonctionnelle du centre actif. Aux pH extrêmes, la protéine possède un grand nombre de charges de même signe et les répulsions électrostatiques peuvent devenir fortes et entraîner la dénaturation de la protéine. Certains résidus ionisés ont des charges entières, mais il y a aussi des charges partielles sur les atomes qui contribuent à l’énergie d’interaction électrostatique. Pour rendre compte de ces charges partielles, le calcul peut être effectué de deux manières, soit par l’approximation monopôle si les valeurs des charges partielles sont connues, les charges ponctuelles étant localisées au centre des atomes, soit par une évaluation d’interaction dipôle-dipôle. Dans l’approximation dipolaire, l’énergie d’interaction est donnée par la relation : E = – (μ1 μ2 /Dr3 ) cosθ μ1 et μ2 étant les moments des dipôles et θ l’angle qu’ils forment.

139

“Chap8” — 2018/12/6 — 15:49 — page 140 — #12

La structure des protéines

L’approximation monopôle donne une meilleure évaluation de l’énergie d’interaction entre charges partielles. D’autres approches ont été développées pour tenir compte des charges partielles en introduisant des termes de polarisabilité.

8.3

Interactions intramoléculaires déterminées par le solvant

À l’exception des protéines membranaires, l’eau constitue l’environnement naturel des protéines globulaires. Les propriétés particulières de l’eau liquide influencent la structure et la réactivité des protéines. Elles déterminent la formation des interactions hydrophobes entre groupes non chargés. La conformation globale d’une protéine est fortement dépendante du solvant. L’énergétique des interactions hydrophobes est conditionnée par la structure de l’eau liquide.

8.3.1

Structure de l’eau liquide

Les propriétés physiques de l’eau liquide diffèrent pour la plupart de celle des autres liquides. Ces propriétés particulières sont dues au fait qu’une molécule d’eau peut former de fortes liaisons hydrogène avec ses voisines. Chaque molécule d’eau peut contracter quatre liaisons hydrogène, deux comme donneur, et deux comme accepteur. Ainsi la glace a une structure cristalline dans laquelle toutes les molécules d’eau sont associées par quatre liaisons hydrogène. La structure de l’eau liquide n’est pas réellement connue et plusieurs modèles théoriques ont été proposés pour rendre compte de ses propriétés. En première approximation, les modèles peuvent être classés en deux groupes, le modèle continu et le modèle mixte. La figure 8.6 représente en (A) le modèle continu, en (B) le modèle mixte. Dans le modèle continu, toutes les molécules d’eau sont associées par liaisons hydrogène, mais par rapport à celles de la glace, elles présentent des distorsions. Dans le modèle mixte développé par Franck et Wen, des amas de molécules d’eau associées par des liaisons hydrogène, et qui s’échangent avec des molécules d’eau libres, sont rapidement formés et détruits par suite de l’agitation thermique. Ces amas sont fluctuants. Néméthy et Schéraga ont adopté le modèle de Franck et Wen. La taille des amas, leur proportion dans le liquide et les propriétés thermodynamiques du liquide ont été calculées en fonction de la température par un traitement de dynamique statistique.

140

“Chap8” — 2018/12/6 — 15:49 — page 141 — #13

8. Énergétique conformationnelle

(A)

(B)

Figure 8.6 Modèles de structure de l’eau liquide ; A : modèle continu ; B : modèle mixte.

8.3.2

Interactions hydrophobes

Les résidus non polaires ont une très faible solubilité dans l’eau. Au voisinage de ces groupes, le nombre de molécules d’eau unies par liaison hydrogène augmente, accroissant l’ordre dans le liquide et donc diminuant l’entropie. La thermodynamique de solubilisation d’un groupe non polaire dans l’eau est caractérisée par une grande énergie libre positive résultant d’une enthalpie négative contrebalancée par un grand excès d’entropie de solubilisation négative. L’interaction hydrophobe peut être considérée comme l’inverse du processus de solubilisation. Elle est énergétiquement favorable puisqu’elle s’accompagne d’une grande variation d’énergie libre négative (GH  ) due à une importante contribution entropique positive, SH , la contribution enthalpique quoique positive est faible. L’énergie libre d’une interaction hydrophobe est la somme de plusieurs contributions, l’une correspondant au changement de structure de l’eau, l’autre au changement d’état des chaînes latérales : GH  = Gw + G◦ s Si Ys molécules d’eau de la première couche autour des chaînes latérales sont déplacées, la contribution due au déplacement de ces molécules d’eau est : Gw = Ys (G◦ w – Gc w )

141

“Chap8” — 2018/12/6 — 15:49 — page 142 — #14

La structure des protéines

Gc w est l’énergie libre d’une molécule d’eau au voisinage du groupe non polaire et G◦ w est celle d’une molécule d’eau liquide. Le nombre d’interactions d’énergie Erw entre l’eau et les chaînes latérales, Ys , diminue. Les interactions de van der Waals qui en résultent entre deux groupes hydrophobes sont Zr Er , Er étant l’énergie d’interaction de van der Waals pour une paire de groupes non polaires qui entrent en contact, Zr l’étendue du contact. La variation d’énergie libre due au changement d’environnement des chaînes latérales est donc :  G◦ s = –1/2 Erw Ys + Zr Er + Grot Grot correspond à la variation d’énergie libre due aux restrictions conformationnelles résultant de l’interaction entre la paire de chaînes latérales. La variation totale d’énergie libre correspondant à la formation d’interactions hydrophobes est la somme de ces différentes contributions :  GH = Gw + G◦ s = Ys (G◦ w – Gc w ) – 1/2 Erw Ys + Zr Er + Grot Le caractère des interactions hydrophobes est révélé par leur dépendance de la température. Contrairement aux liaisons hydrogène, leur stabilité augmente avec la température. La variation d’énergie libre des interactions hydrophobes varie en fonction de la température selon la relation : GH =a + bT + cT2 les valeurs de a, b, et c variant pour chaque paire de chaînes latérales. L’énergie des interactions hydrophobes est déterminée par le changement d’entropie qui accompagne le changement dans la structure de l’eau.

8.3.3

Rôle des interactions hydrophobes dans la stabilisation de la structure protéique

Dans les protéines globulaires 40 à 50 % des acides aminés ont une chaîne latérale partiellement ou totalement non polaire pouvant participer à des interactions hydrophobes. De plus, les interactions hydrophobes peuvent influencer la stabilité des liaisons hydrogène. Les liaisons hydrogène sont plus fortes en présence de groupes non polaires qui participent à la formation d’interactions hydrophobes. La constante d’équilibre pour la formation d’une liaison hydrogène avec la formation simultanée d’une interaction hydrophobe est : K = Kh (1 + KH ) Kh étant la constante d’équilibre pour la formation d’une liaison hydrogène en l’absence d’interaction hydrophobe, KH la constante d’équilibre pour la formation de l’interaction hydrophobe.

142

“Chap8” — 2018/12/6 — 15:49 — page 143 — #15

8. Énergétique conformationnelle

8.3.4

Surface accessible

À partir des données cristallographiques, différents auteurs ont tenté de rationaliser le problème de l’accessibilité du solvant aux chaînes latérales d’une protéine. La notion de surface accessible a été introduite par Lee et Richards. Ils l’ont définie comme l’étendue des contacts entre les atomes de la surface de la protéine et l’eau. C’est le lieu géométrique du centre d’une molécule d’eau roulant sur la surface de la protéine, comme le montre la représentation schématique de la figure 8.7.

Figure 8.7 Détermination de la surface accessible (d’après Finney, J. L., 1978. Volume occupation ; environment and accessibility in proteins. Environment and molecular area of RNase S. J. Mol. Biol. 118, 415-441).

Pour les chaînes latérales non polaires, Ala, Val, Leu, Phe, Ileu, il existe une relation linéaire entre le caractère hydrophobe et la surface accessible ; la pente de la droite ainsi ? obtenue correspond à 22 cal · A −2 . Pour les résidus des chaînes latérales possédant ? un groupe hydroxyle, la pente de la droite est 26 cal · A −2 (Chothia, 1972). Chothia et Janin ont montré que la perte de surface accessible lors du repliement d’une protéine est proportionnelle à l’énergie due à l’effet hydrophobe et à la puissance 2/3 du poids moléculaire. La surface accessible d’une chaîne polypeptidique dépliée, Ad , est proportionnelle à son poids moléculaire : Ad = 1,44 M La surface accessible de la protéine native, An , est : An = 11,1 M2/3 La surface enfouie lors du repliement de la chaîne polypeptidique est donc : ?

A = Ad – An = M(1,44-11,1 M1/3 )A 2

143

“Chap8” — 2018/12/6 — 15:49 — page 144 — #16

La structure des protéines

La contribution d’énergie hydrophobe par résidu est : GH = γ(Ad – An )/n n étant le nombre de résidus.

Figure 8.8 Accessibilité moyenne par résidu en fonction du nombre de résidus. À droite, variation de l’énergie libre correspondante.

8.3.5

Localisation des résidus hydrophobes et des résidus polaires

Les chaînes latérales hydrophobes ont tendance à être enfouies à l’intérieur des protéines et les résidus polaires ont une préférence à être localisés à l’extérieur restant accessibles au solvant. Toutefois certains groupes non polaires se retrouvent aussi à la surface de la molécule. Il est plus rare de trouver des groupes polaires enfouis à l’intérieur de la molécule (cf. figure 5.1). Dans la majorité des protéines, les groupements N- et C-terminaux sont localisés à la surface de celle-ci, parfois assez proches l’un de l’autre.

8.4

Interactions entre le solvant et les molécules protéiques

L’influence du solvant aqueux sur les interactions électrostatiques et hydrophobes résulte d’effets indirects. Cependant il existe aussi des interactions plus spécifiques entre l’eau et les groupes polaires, ainsi qu’avec les groupes CO et NH du squelette peptidique. Certains effets moins spécifiques contribuent à la formation d’une sphère d’hydratation autour de chaque atome de la protéine. La taille de la sphère détermine le nombre de molécules de solvant qui occupent la sphère d’hydratation.

144

“Chap8” — 2018/12/6 — 15:49 — page 145 — #17

8. Énergétique conformationnelle

Les premières expériences destinées à évaluer l’importance des molécules d’eau dans la structure et l’activité des protéines ont consisté à observer par différentes méthodes (spectroscopie infrarouge, RPE, RMN, tests d’activité) la réhydratation progressive de protéines lyophilisées en suivant les signaux attestant de leur réajustement structural et fonctionnel en particulier dans le cas des enzymes. Au cours de l’addition progressive d’eau, le processus de réhydratation s’accomplit jusqu’à la saturation hydrique de la protéine, après quoi l’addition d’eau n’entraîne plus que la dilution du système. Ces expériences ont été effectuées sur différentes protéines telles que le lysozyme et l’actinidine (protéine du kiwi). Dans le cas du lysozyme, l’hydratation complète correspond à peu près à 300 molécules d’eau par molécule de protéine. L’actinidine, protéine constituée de 218 résidus d’acides aminés, contient 273 molécules d’eau. Environ 90 % de ces molécules sont faiblement fixées, mais certaines le sont avec une affinité comparable à celle d’un enzyme pour son substrat. Les molécules d’eau les plus fortement liées sont celles qui contractent des liaisons hydrogène avec les constituants de la protéine et celles qui interagissent avec les groupements ionisés, en particulier à la surface de la protéine, interaction qui s’accompagne du phénomène d’électrostriction. En ce qui concerne les molécules d’eau internes à la protéine, environ 60 % d’entre elles sont liées au squelette polypeptidique et 40 % aux chaînes latérales des acides aminés. L’interaction d’une molécule d’eau avec la liaison peptidique accentue le caractère polaire de celle-ci en augmentant la polarité du groupement amide. À la surface de la protéine, une molécule d’eau couvre une surface de 7 à 20 Å2 . Il peut en résulter un effet conformationnel. De plus, en 2011, Nucci et ses collaborateurs ont montré dans le cas de l’ubiquitine que la vitesse d’échange de molécules d’eau de surface d’une protéine n’est pas homogène et que la structure de la protéine induit l’existence à sa surface de régions où l’échange des molécules d’eau s’effectue à des vitesses différentes. Le phénomène d’électrostriction consiste dans le fait que lorsqu’une charge positive ou négative est exposée au solvant, les molécules d’eau, du fait de leur polarité, s’associent fortement par interaction électrostatique, autour de cette charge. Cet effet est extrêmement puissant en ce qui concerne la première couche d’eau qui est soumise à une pression microscopique de 32 Kbars. La conséquence de cet effet est que la molécule gramme d’eau de cette première couche occupe un volume de 15 mL au lieu de 18 mL à la pression atmosphérique. Cet effet est déjà considérablement amoindri au niveau de la deuxième couche de molécules d’eau (7,5 Kbars et 15,7 mL). La troisième couche de molécules d’eau n’est pas affectée et peut être considérée comme appartenant à la phase solvant. L’exposition au solvant d’un groupe chargé d’une protéine s’accompagne donc d’une variation de volume, V, de –3 mL/mole d’eau de la première couche. Ce phénomène est responsable d’une bonne partie de l’effet dissociant et dénaturant de la pression hydrostatique vis-à-vis des protéines et ne peut manquer d’être impliqué dans l’adaptation environnementale des organismes qui vivent au fond des océans sous des pressions pouvant dépasser 1 000 bars.

145

“Chap8” — 2018/12/6 — 15:49 — page 146 — #18

La structure des protéines

Figure 8.9 Phénomène d’électrostriction (voir texte).

Les changements conformationnels impliqués dans l’activité biologique des protéines et, en particulier, dans les réactions catalytiques des enzymes, s’accompagnent le plus souvent de variations du nombre de molécules d’eau associées à ces protéines. Cela concerne en particulier les molécules d’eau liées à leur surface, du fait que les changements conformationnels impliqués changent la surface de ces protéines exposée au solvant. Ce changement peut être positif ou négatif. C’est ainsi que lors de la transition T → R de l’aspartate transcarbamylase, la surface de cet enzyme exposé au solvant augmente de 2 000 Å2 , ce qui s’accompagne de la fixation de 200 molécules d’eau supplémentaires. Un résultat similaire a été obtenu dans le cas de l’hémoglobine lors de la fixation de l’oxygène. V. Parsegian et ses collaborateurs ont développé une méthode expérimentale dite de « choc osmotique » qui permet la détermination du nombre de molécules d’eau impliquées dans les changements conformationnels des protéines. La méthode repose sur la considération de deux phases dans la solution de protéine, la phase du solvant (phase aqueuse) et la phase protéique. L’expérience consiste à ajouter des quantités croissantes d’un soluté inerte à la phase aqueuse afin d’augmenter progressivement sa force osmotique. La méthode implique que la taille du soluté utilisé soit suffisamment grande pour qu’il ne pénètre pas dans la maille protéique. Si le changement conformationnel impliqué dans l’activité d’une protéine (un enzyme par exemple) s’accompagne d’un relargage de molécules d’eau, l’augmentation de la force osmotique du solvant va favoriser ce mouvement et la réaction va être accélérée. Si au contraire le changement conformationnel s’accompagne d’une capture de molécules d’eau par la protéine, l’augmentation de la force osmotique du solvant va défavoriser ce mouvement et la réaction va être ralentie. Présenté comme sur la figure 8.10, le résultat d’une telle expérience permet de déterminer en quel sens se fait le mouvement de molécules d’eau et de calculer le nombre de molécules d’eau impliquées. Des molécules d’eau peuvent aussi intervenir dans les processus catalytiques. Dans les protéases à sérine, une molécule d’eau fortement liée au centre actif est impliquée dans la catalyse, dans l’étape de désacylation.

146

“Chap8” — 2018/12/6 — 15:49 — page 147 — #19

8. Énergétique conformationnelle

Figure 8.10 Variation de la constante catalytique d’un enzyme en fonction de la pression osmotique du solvant. Le sens de la droite indique un relargage de molécules d’eau au cours de la catalyse. La pente de la droite est égale au volume d’eau déplacé. Sa division par le volume d’une molécule d’eau (30 ?3 ) donne le nombre de molécules d’eau échangées. (kB est la constante de Boltzmann, T la température absolue, k , la constante de vitesse en présence du soluté et k0 la constate de vitesse en absence de soluté).

8.5

Énergie conformationnelle totale d’une protéine

L’énergie conformationnelle totale est la somme de toutes les contributions qui viennent d’être énumérées. Elle a la forme suivante : E = 1/2

 liaisons

Kl (l )2 + 1/2



Kτ (τ)2 + 1/2



Kϑ (1 − cos θ)

angles

  A q1 q2 B − 6 + + 12 r εr r

Le premier terme se réfère à l’étirement des liaisons, le second à la courbure des angles de liaison. Le troisième terme correspond aux rotations autour des angles dièdres. Le quatrième terme représente l’ensemble des interactions de van der Waals et le dernier terme les interactions électrostatiques. Tous ces termes sont sommés pour toutes les paires d’atomes.

147

“Chap8” — 2018/12/6 — 15:49 — page 148 — #20

La structure des protéines

Bibliographie Chothia, C. (1973) Conformation of β-pleated sheets in proteins. J. Mol. Biol. 75: 295-302. Chothia, C. & Janin, J. (1978) Geometrical principles that determine the three dimensional structure of proteins. 12th FEBS Meeting Dresden 117-126. Chothia, 1972 – à compléter Cordier, F., & Grzesiek, S. (1999) Direct Observation of Hydrogen-Bond in proteins by intraresidue 3h JHC scalar coupling. J. Am. Chem. Soc. 121(7): 1601-1602. Du, Q.S., Wang, Q.Y., Du, L.Q., Chen, D. & Huang, R.B. (2013) Theoretical study on the polar hydrogen-π (Hp-π) interactions between protein side-chains. Chemistry Central Journal 7-92: 1-8. Finney, J.J. (1978) Volume occupation; environment and accessibility in proteins. Environment and molecular area of RNAse S. J. Mol. Biol. 118, 415-441. Ghelis, C. & Yon, J. (1982) Protein Folding. Acad. Press; New-York. Kauzmann, W.J. (1959) Some factors in the interpretation of protein denaturation. Adv. Prot. Chem. 14: 1-53. Lee, B. & Richards, F.M. (1971) The interpretation of protein structures: estimation of static accessibility. J. Mol. Biol. 55: 379-400. Mizushima, S. & Shimanoushi, T. (1961) Adv. Enzym. Relat. Subj. Biochem. 23: 1-27. Nemethy, G. & Sheraga, H. (1962) The structure of water and hydrophobic bonding in proteins. I: A model for the thermodynamic properties of liquid water. J. Chem. Phys. 36: 3382-3400. Parsegian, V.A., Rand, R.P., & Rau, D.C. (1995) Macromolecules and water: probing with osmotic stress. Methods Enzymol. 259: 43-94. Ramachandran, G.N. (1973) Conformation of biological molecules and polymers. Jerusalem Symp. Quant Chem. Biochem. 5: 1-11. Ramachandran, G.N., Ramakrishnan, C. & Sasisekharan, V. (1963) In: Aspect of protein structure. Acad. Press, New-York. Ramachandran et Sasisekharan (1968) – à compléter Sheraga, H.A., Scott, A., Vanderkoi, G., Leach, S., Gibson, K.D., Ooi, T., Nemethy, G. (1967), in Conformation of biopolymers, vol. 1, p.47, Acad. Press, New York.

148

“Chap9” — 2018/12/6 — 16:32 — page 149 — #1

9 Formation de la structure tridimensionnelle : le repliement des protéines Le repliement des protéines est un processus fondamental qui complète l’information contenue dans l’ADN et conduit à la structure tridimensionnelle, condition nécessaire à l’émergence des propriétés fonctionnelles. Il constitue la dernière étape de l’information génétique, selon le schéma : transcription

ADN

repliement

traduction

ARN

chaîne polypeptidique

protéine

En un sens, il représente la première étape du processus de morphogenèse. Comme l’a écrit Jacques Monod, dans Le hasard et la nécessité : « Dans le processus de structuration d’une protéine globulaire, on peut voir à la fois l’image microscopique et la source du développement épigénétique autonome de l’organisme lui-même. » Les mécanismes par lesquels une chaîne polypeptidique atteint sa structure tridimensionnelle ont intrigué les scientifiques depuis le début du xx e siècle. Les premiers travaux qui remontent aux années 1930 et auxquels il faut associer les noms de Wu,

149

“Chap9” — 2018/12/6 — 16:32 — page 150 — #2

La structure des protéines

de Northrop, ont établi que le processus de dénaturation des protéines est un processus réversible. Pour les protéines possédant des ponts disulfure, ceci n’était vérifiable que tant que les ponts disulfure n’avaient pas été rompus. De ces études a émergé le concept que le repliement des protéines est un processus spontané.

Figure 9.1 Le repliement de la ribonucléase.

Dans les années 1950, des contributions thermodynamiques significatives ont souligné le rôle des interactions non covalentes dans la stabilité des protéines. En 1959, Kauzmann soutint que l’effet hydrophobe est la force qui dirige le processus de repliement. À partir de 1960, l’aboutissement de la résolution de la structure tridimensionnelle des protéines par diffraction des rayons X et dès 1980 par spectroscopie RMN a fourni de nouvelles bases pour les études du repliement. Un progrès significatif a été obtenu lorsque Anfinsen a réussi à replier la ribonucléase dont les quatre ponts disulfure avaient été rompus, en un enzyme totalement actif. Il en a conclu que le repliement d’une protéine est entièrement déterminé par sa séquence en acides aminés. À partir de 1970, le développement des études théoriques a apporté de nouveaux points de vue dans le problème du repliement. De ces études a émergé une nouvelle vision du processus. En fonction de l’état des connaissances et de la puissance des techniques, les études et les concepts ont évolué dans différentes directions pour aboutir aujourd’hui à une vision unifiée de ce processus complexe.

150

“Chap9” — 2018/12/6 — 16:32 — page 151 — #3

9. Formation de la structure tridimensionnelle :le repliement des protéines

9.1

Le postulat d’Anfinsen et le paradoxe de Levinthal

Le remarquable succès d’Anfinsen qui parvint à obtenir un enzyme actif à 100 % lors du repliement de la ribonucléase préalablement dénaturée et réduite a marqué le début d’une intense recherche sur le processus de repliement des protéines. À partir de ces résultats, Anfinsen concluait que « toute l’information nécessaire pour aboutir à la conformation native d’une protéine est contenue dans sa séquence en acides aminés ». Le corollaire à cette assertion est que le repliement est sous le contrôle thermodynamique, ce qui signifie que la protéine native est à un minimum d’énergie de Gibbs dans un environnement donné. Elle représente la structure la plus stable dans cet environnement. Ce point de vue fut remis en question par Levinthal à partir de considérations temporelles. Levinthal est parti du fait que le repliement in vitro aussi bien qu’in vivo est un processus rapide qui requiert quelques secondes ou quelques minutes. Ceci est illustré par un calcul rapide. Pour une protéine constituée de 100 acides aminés, en faisant l’hypothèse qu’il n’y a que deux conformations par acide aminé, il existe 1030 conformations possibles. En admettant que le passage d’une conformation à l’autre s’effectue en 10−11 secondes, le temps requis pour une recherche au hasard de la structure native demanderait 1011 années ! Une telle situation connue sous le nom de paradoxe de Levinthal a dominé les discussions pendant plusieurs décades. Différents mécanismes ont été proposés pour résoudre le paradoxe de Levinthal. Levinthal lui-même et plus tard Wetlaufer ont suggéré que le repliement des protéines est sous contrôle cinétique et non pas sous contrôle thermodynamique. Au cours du repliement, la protéine se trouverait piégée dans un minimum énergétique qui n’est pas le minimum global, une barrière de potentiel élevée empêchant la protéine d’atteindre ce dernier. Ainsi les tentatives pour résoudre le paradoxe de Levinthal ont stimulé les études cinétiques. Indépendamment des mécanismes proposés, il apparaît clairement qu’une recherche au hasard de la conformation native d’une protéine parmi l’ensemble des conformations possibles n’est pas une hypothèse réaliste. L’évolution a vraisemblablement trouvé une solution efficace pour résoudre ce problème.

9.2 9.2.1

Chemins de repliement Modèles de repliement

Différents modèles ont été proposés à partir de considérations théoriques, de simulations ou d’observations expérimentales. Le modèle classique de nucléationpropagation qui s’applique aux transitions hélice pelote statistique implique une étape de nucléation suivie d’une propagation rapide, l’étape limitante étant le processus

151

“Chap9” — 2018/12/6 — 16:32 — page 152 — #4

La structure des protéines

de nucléation. Ce modèle a été initialement proposé pour expliquer les résultats cinétiques obtenus lors du repliement de la ribonucléase. Il rendait compte de la coopérativité du processus, mais il fut abandonné à la suite de nouvelles expériences. Plus récemment, un modèle de nucléation-condensation a été proposé par Fersht. Il consiste en la formation de noyaux locaux stabilisés par des interactions à longue distance. Un modèle de repliement hiérarchique et séquentiel fut proposé par plusieurs auteurs et généralement accepté pendant de nombreuses années. Selon ce modèle, la première étape, la nucléation, est suivie par une formation rapide de structures secondaires qui s’associent pour former les structures supersecondaires, puis les domaines, et finalement la protéine native suivant un chemin unique. De même, le modèle de la charpente (framework) implique que les structures secondaires se forment dans les étapes précoces du processus de repliement avant la formation de la structure tertiaire. Ces modèles privilégient le rôle des interactions à courte distance dans le processus de repliement. Un modèle modulaire basé sur l’observation de la structure des protéines a été proposé. Il suggère que les domaines et aussi les sous-domaines se comportent comme des unités de repliement, capables de se replier indépendamment, puis de s’associer pour engendrer la protéine native. Ce modèle implique aussi un chemin de repliement hiérarchique et unique. Le modèle de diffusion-collision fut présenté par Karplus et Weaver en 1976 et réévalué en 1994 à la lumière de nouvelles données expérimentales. Ce modèle suppose que la nucléation se produit simultanément en différentes parties de la chaîne polypeptidique générant des microstructures qui diffusent, s’associent et coalescent pour former des sous-structures ayant une conformation native. Ces microstructures ont un temps de vie contrôlé par la diffusion des segments, de sorte que le repliement d’une chaîne polypeptidique de 100 à 200 acides aminés peut s’effectuer en des temps très courts inférieurs à une seconde. Suivant ce modèle, le repliement s’effectue en plusieurs étapes de diffusion-collision. Le modèle de l’effondrement hydrophobe admet que le premier événement du repliement d’une protéine est un effondrement qui se produit par des interactions à longue distance avant ou en même temps que se forment les structures secondaires. Ce modèle est inspiré par l’effet hydrophobe de Kauzmann. Le modèle de jigsaw puzzle fut introduit en 1985 par Harrison et Durbin à partir de considérations expérimentales. Les auteurs admettent l’existence de multiples chemins de repliement comme dans l’assemblage d’un puzzle. Il existerait de multiples routes pour aboutir à une solution unique. Selon ce modèle, l’identification des intermédiaires de repliement représente une description cinétique plutôt que structurale, chaque intermédiaire consistant en espèces hétérogènes en équilibre rapide. Pendant longtemps, le modèle de jigsaw puzzle a été le sujet de controverses. Une intense activité expérimentale a été déployée pour tenter de choisir entre ces différents modèles.

152

“Chap9” — 2018/12/6 — 16:32 — page 153 — #5

9. Formation de la structure tridimensionnelle :le repliement des protéines

9.2.2

Détection et caractérisation des intermédiaires de repliement

Les transitions de dénaturation-repliement des protéines dans des conditions d’équilibre ont souvent été décrites comme des processus à deux états, ce qui s’applique généralement aux transitions très coopératives. Cependant, même lorsque l’approximation des deux états s’applique au processus global, les études cinétiques ont montré qu’il existe des intermédiaires de repliement. La caractérisation structurale de ces espèces transitoires a fait l’objet de nombreuses approches expérimentales. Elles se sont heurtées à deux difficultés qui sont la coopérativité et la rapidité du processus, certains événements se produisant dans des temps inférieurs à la milliseconde. L’utilisation de méthodes physiques hautement performantes, le développement des méthodes cinétiques ultrarapides avec des constantes de temps de l’ordre de la microseconde et même de la nanoseconde ont permis de caractériser certaines espèces intermédiaires. La formation des structures secondaires a été observée dans les étapes précoces du repliement. Parmi les espèces observées, un intermédiaire transitoire relativement compact ayant un contenu de structures secondaires natives, mais une structure tertiaire fluctuante a été décrite et a donné naissance au concept de globule fondu (molten globule). Plus récemment, un nouvel intermédiaire cinétique apparaissant avant l’étape limitante du dépliement de quatre protéines différentes, la ribonucléase A, la dihydrofolate réductase, la monelline et la villine, a été identifié. Sa caractérisation par RMN, échange hydrogène-deutérium, transfert d’énergie entre molécules fluorescentes (FRET), a montré qu’il a les propriétés du globule fondu, avec la différence qu’il est imperméable à l’eau. Il a été suggéré que ce globule fondu sec (dry molten globule ou DMG) serait aussi un intermédiaire cinétique dans le repliement des protéines. Cependant les structures secondaires observées dans les étapes précoces du repliement ne sont pas toujours des structures natives ; elles doivent se réorganiser pour aboutir à la structure native de la protéine. Il peut aussi exister sur le chemin de repliement des voies latérales conduisant à des formes incorrectement repliées pouvant finalement engendrer des agrégats. À partir de l’ensemble des données, le modèle séquentiel et hiérarchique avec une compétition entre le chemin unique de repliement et une voie latérale pouvant conduire à la formation d’agrégats a été généralement accepté pendant de nombreuses années. Il est résumé par le schéma de la figure 9.2. Ce chemin comporte une compétition cinétique entre le repliement correct et une réaction latérale qui engendre des espèces incorrectement repliées pouvant former des agrégats.

153

“Chap9” — 2018/12/6 — 16:32 — page 154 — #6

La structure des protéines

chaîne polypeptidique

intermédiaires précoces

globule fondu

protéine correctement repliée

X

agrégats

Figure 9.2 Chemin du repliement.

9.2.3

La nouvelle vision du repliement : le paysage énergétique et l’entonnoir de repliement

À partir d’études théoriques, un modèle unifié de repliement des protéines basé sur la surface d’énergie effective a été introduit par Wolynes et ses collègues en 1995. Cette nouvelle vision décrit le processus de repliement en termes de paysage énergétique et d’entonnoir de repliement comme l’indique la figure 9.3. Le modèle décrit le comportement thermodynamique et cinétique d’un ensemble de molécules dépliées

Figure 9.3 L’entonnoir de repliement.

154

“Chap9” — 2018/12/6 — 16:32 — page 155 — #7

9. Formation de la structure tridimensionnelle :le repliement des protéines

jusqu’à l’état natif. Sur la figure, la largeur de l’entonnoir représente l’entropie et la longueur l’énergie. Q est la fraction de contacts natifs pour chaque collection d’états. Ainsi que l’ont écrit Wolynes et ses collègues : « Pour se replier une protéine navigue avec une remarquable aisance à travers un paysage compliqué ». Suivant cette vision, le repliement d’une protéine consiste en une organisation progressive d’un ensemble de structures partiellement repliées qui s’effectue par de multiples routes. Une grande variété de comportements qui dépendent des paramètres thermodynamiques et des conditions environnementales émerge du paysage énergétique. Depuis le sommet jusqu’au bas de l’entonnoir, le nombre de conformations et l’entropie décroissent. Plus la pente est forte, plus rapide est le repliement.

D2 D3 D1

Figure 9.4 Représentations tridimensionnelle d’entonnoirs de repliement (d’après A. Dill & H. S. Chan (1997) From Levinthal to pathways to funnels, Nat. Struct. Biol. 4: 10-9). (Voir texte).

La figure 9.4 est une représentation tridimensionnelle de l’entonnoir de repliement dans deux situations différentes. L’entonnoir de la figure de gauche a des parois lisses ; cette situation correspond à un processus à deux états avec un repliement rapide. À droite, le paysage énergétique ressemble à un entonnoir aux parois rugueuses dont les rugosités correspondent à des pièges énergétiques locaux qui peuvent être transitoires. Dans cette situation, le repliement est plus lent et s’effectue en plusieurs étapes. Lorsque les barrières locales sont suffisamment hautes, les molécules protéiques peuvent rester piégées et finalement s’agréger. Cette nouvelle vision qui est en accord avec de nombreux arguments expérimentaux est maintenant acceptée par l’ensemble de la communauté scientifique.

155

“Chap9” — 2018/12/6 — 16:32 — page 156 — #8

La structure des protéines

9.3

Repliement des protéines dans l’environnement cellulaire

Les principales règles qui gouvernent le repliement des protéines ont été déduites d’études in vitro et in silico. Il était admis que le repliement in vitro représente un bon modèle pour comprendre les mécanismes par lesquels une chaîne polypeptidique naissante acquiert sa structure tridimensionnelle dans le contexte cellulaire. Cependant, l’environnement intracellulaire diffère de celui utilisé dans les études in vitro. L’intérieur des cellules est très concentré en macromolécules. De plus, les chaînes polypeptidiques sont synthétisées de manière vectorielle par les ribosomes. On pouvait se demander si, dans ces conditions, le repliement s’effectue par les mêmes mécanismes que ceux observés in vitro. La question s’est particulièrement posée lors de la découverte en 1987 des chaperons moléculaires. Depuis cette date, une intense activité a été déployée pour l’étude des propriétés structurales et fonctionnelles des chaperons moléculaires et des mécanismes par lesquels ils assistent le repliement des protéines. Il existe plus de vingt familles de chaperons moléculaires. Parmi elles, les protéines de choc thermique (heat chock proteins) Hsp70 (DnaK chez E. coli) et Hsp40 (DnaJ chez E. coli) sont peu ou pas spécifiques des protéines dont elles assistent le repliement. Les chaperons moléculaires interagissent avec les protéines dépliées selon deux mécanismes différents. Les chaperons de petite taille s’associent transitoirement à des régions hydrophobes, des chaînes polypeptidiques naissantes empêchant l’agrégation et le repliement prématuré. L’association et la dissociation de la protéine sont régulées de manière complexe par un mécanisme qui dépend de l’ATP comme le montre le schéma de la figure 9.5 qui représente le cycle de DnaK avec l’intervention de petites protéines. Dans une première étape, DnaJ et la protéine dépliée U s’associent à DnaK, entraînant l’hydrolyse de l’ATP. L’association subséquente de GrpE conduit à l’élimination de l’ADP. Puis l’ATP se fixe sur DnaK, libérant la protéine dépliée qui peut soit se replier spontanément, soit être transférée au système GroEL-GroES. Le mécanisme de structuration demande donc de l’énergie. DnaJ GrpE

U ATP

ATP

ATP

U

ADP

DnaK Pi; DnaJ

ADP

ATP

Vers GroEL

Figure 9.5 Cycle de DnaK au cours du repliement d’une protéine (voir texte).

156

N

“Chap9” — 2018/12/6 — 16:32 — page 157 — #9

9. Formation de la structure tridimensionnelle :le repliement des protéines

Les chaperons de grande taille, comme le complexe GroEL-GroES chez les prokaryotes et l’équivalent TRIC chez les eukaryotes séquestrent la protéine non native dans une cage centrale. Des données structurales précises ont été obtenues sur le complexe. GroEL est formé de deux anneaux heptamériques associés dos à dos et présente une cage centrale pouvant accommoder des protéines de taille allant jusqu’à 70 kDa. La figure 9.6 montre la structure de la protéine chaperon. Cet ensemble est surmonté de la protéine GroES qui est aussi heptamérique. Le mécanisme de repliement assisté par GroEL-GroES est illustré sur la figure 9.7.

Figure 9.6 La protéine GroE : la figure de droite est une vue perpendiculaire à l’axe de la molécule qui montre la cavité centrale.

Figure 9.7 Mécanisme du repliement des protéines assisté par GroEL (d’après Wang J. D., et Weissmann J. S. (1999) Thinking outside the box were insights into the mechanisms of GroEL mediated protein folding. Nature Struct. Biol. 6, 597-600).

157

“Chap9” — 2018/12/6 — 16:32 — page 158 — #10

La structure des protéines

La protéine non native s’associe au domaine apical de l’anneau supérieur inoccupé du complexe asymétrique GroEL-GroES. L’ATP et GroES s’associent au même anneau, ce qui encapsule la protéine. La fixation de GroES induit un important changement de conformation de GroEL. Dans l’anneau inférieur, l’hydrolyse de l’ATP qui est un processus allostérique produit une modification conformationnelle permettant à cet anneau de fixer une protéine non native. Le changement conformationnel favorise la fixation subséquente de l’ATP et de GroES sur l’anneau inférieur et simultanément dissocie le complexe de l’anneau supérieur entraînant l’éjection de GroES et la libération de la protéine. Si celle-ci n’a pas atteint son état natif, elle est soumise à un nouveau cycle. Ainsi les chaperons moléculaires, par leur association temporaire avec les protéines naissantes ont pour rôle d’empêcher leur repliement incorrect et l’agrégation. Ils n’interagissent pas avec les protéines natives. Leur association transitoire avec les protéines non natives s’effectue via des interactions hydrophobes. Ils ne contiennent pas d’informations capables d’orienter la protéine vers une structure différente de celle dictée par sa séquence en acides aminés. En un mot, ils assistent le repliement des protéines sans violation du postulat d’Anfinsen. De plus, ils augmentent le rendement, mais non la vitesse de repliement ; ils n’agissent pas comme des catalyseurs. Lorsque la formation de la structure correcte est favorisée cinétiquement in vivo, l’assistance par des chaperons moléculaires n’est pas nécessaire. Environ 15 % des protéines synthétisées dans la cellule requièrent l’assistance des chaperons moléculaires. Ceux-ci ont un rôle important pour minimiser l’agrégation. La connaissance précise de la structure des ribosomes et les développements technologiques ont permis de suivre le repliement de quelques protéines directement sur le ribosome. In vivo, la synthèse d’une chaîne polypeptidique naissante par le ribosome s’effectue selon un processus vectoriel. Durant son élongation, la chaîne polypeptidique s’étire à travers un tunnel de sortie situé dans la particule ribosomale. ? Ce tunnel a une longueur supérieure à 80 A et une largeur qui varie entre 10 et ? 20 A. Des études par cryomicroscopie électronique et RMN effectuées durant la traduction ont montré que la chaîne polypeptidique naissante peut contracter un grand nombre d’interactions avec le tunnel et adopter des structures partiellement repliées.

9.4

Repliements incorrects, agrégation et conséquences pathologiques

L’agrégation des protéines est un processus qui se produit à partir des intermédiaires précoces du repliement par une compétition cinétique entre le repliement correct et le repliement incorrect. Les agrégats se forment à partir de ces intermédiaires par des interactions intermoléculaires en compétition avec les interactions intramoléculaires. Ils peuvent se constituer dans des conditions particulières ou résulter de mutations

158

“Chap9” — 2018/12/6 — 16:32 — page 159 — #11

9. Formation de la structure tridimensionnelle :le repliement des protéines

dans la protéine. La formation d’agrégats dépend de la concentration de la protéine, du pH, de la force ionique, de la température ou des conditions d’oxydo-réduction de l’environnement. La formation d’agrégats peut se produire lors du repliement de protéines monomériques aussi bien que de protéines oligomériques. L’agrégation intervient lorsque les intermédiaires partiellement repliés sont suffisamment peuplés avec leurs régions hydrophobes exposées. La morphologie des agrégats est soit amorphe comme les corps d’inclusion, soit ordonnée avec formation de fibrilles amyloïdes. Les agrégats amorphes sont observés dans les corps d’inclusion qui apparaissent lorsque des protéines recombinantes sont surexprimées dans des cellules hôtes étrangères ; la forte concentration de ces protéines entraîne leur agrégation. Ce problème demeure critique pour le développement des biotechnologies et les industries pharmaceutiques. Plusieurs procédés ont été développés pour restaurer la protéine native à partir des corps d’inclusion. L’agrégation des protéines lorsqu’elle conduit à la formation de fibrilles amyloïdes joue un rôle clé dans l’origine de plusieurs pathologies telles que les encéphalopathies spongiformes et la maladie d’Alzheimer. La formation de fibrilles est résumée par le schéma de la figure 9.8.

Figure 9.8 Formation de fibrilles amyloïdes.

159

“Chap9” — 2018/12/6 — 16:32 — page 160 — #12

La structure des protéines

Historiquement, le terme d’amyloïde a été introduit pour décrire les dépôts fibrillaires associés à des affections létales connues sous le nom d’amylose, les dépôts ayant l’apparence de l’amidon. Il existe au moins 16 protéines humaines susceptibles de former des fibrilles amyloïdes et d’entraîner de sérieuses pathologies ainsi que le montre le tableau 9.1.

Tableau 9.1

Protéines susceptibles d’entraîner la formation de fibrilles amyloïdes (d’après J.W. Kelly, 1996, Curr. Op. Struct. Biol. 6, 11-17).

Syndrome clinique

Protéine précurseur

Maladie d’Alzheimer Amyloïdose systémique primaire Amyloïdose systémique secondaire Amyloïdose systémique sénile Polyneuropathie familiale amyloïde I Angiopathie amyloïde cérébrale héréditaire Amyloïdose reliée à l’hémodialyse Polyneuropathie familiale amyloïde III Amyloïdose systémique héréditaire finlandaise Diabète de type II Carcinome médullaire de la thyroïde Encéphalopathies spongiformes Amyloïdose atriale Amyloïdose systémique non neuropathique héréditaire Amyloïdose localisée à la zone d’injection Amyloïdose rénale héréditaire Maladie de Parkinson

Protéine Aβ4 ou A β42 Chaîne légère d’immunoglobuline Amyloïde A du sérum Transthyrétine Transthyrétine Cystatine C β2 -microglobuline Apolipoprotéine A1 Gelsoline Polypeptide amyloïde IAPP Calcitonine Prion Facteur ANF Lysozyme Insuline Fibrinogène Synucléine

Bien qu’elles ne présentent aucune homologie de séquence et de structure tridimensionnelle, toutes ces protéines forment des fibrilles amyloïdes consécutivement à la conversion d’hélices α en structures β qui se produit via un intermédiaire partiellement déstabilisé. Les fibrilles amyloïdes sont insolubles et résistantes aux protéases. ? Elles ont généralement de 60 à 100 A de diamètre et sont de longueur variable. Diverses techniques physiques incluant la diffraction des rayons X, la RMN à l’état solide, la cryomicroscopie électronique avec analyse d’image et la microscopie à force atomique ont montré que les fibrilles amyloïdes sont constituées de plusieurs filaments enroulés les uns autour des autres. Cette structure est illustrée par la figure 9.9. Parmi les pathologies engendrées par la formation de dépôts amyloïdes, il existe de sévères maladies neurodégénératives telles que le kuru, la maladie de KreutzfeldJacob, l’insomnie familiale fatale, la tremblante du mouton et l’encéphalopathie bovine spongiforme ou maladie de la vache folle associées à la protéine prion anormale. La maladie d’Alzheimer est aussi caractérisée par la présence de fibres amyloïdes. Cependant il s’agit d’un processus plus complexe qui implique la rupture préalable de la protéine précurseur APP par des protéases, l’α ou la β sécrétase, puis la γ sécrétase,

160

“Chap9” — 2018/12/6 — 16:32 — page 161 — #13

9. Formation de la structure tridimensionnelle :le repliement des protéines

Figure 9.9 Structures amyloïdes formées à partir du domaine SH3 d’une protéine kinase non pathologique (d’après Dobson, 1999 Protein misfolding, evolution and disease. Trends Biochem. Sci. 24, 329-332).

faisant apparaître les polypeptides de 40 (Aβ40) ou 42 (Aβ42) acides aminés qui s’agrègent pour former des structures amyloïdes avec une tendance plus marquée du peptide Aβ42. Toutes les protéines formant des structures amyloïdes sont caractérisées par une répétition de structures β, les segments β étant perpendiculaires à l’axe de la fibre. Le contenu en structures β a été observé par plusieurs méthodes, telles que la spectroscopie infrarouge, le dichroïsme circulaire, la RMN et la microscopie à force atomique. Les maladies à prion résultent de désordres génétiques, infectieux ou sporadiques. Dans les années 1980, elles ont représenté un véritable phénomène de société avec la maladie de la vache folle et son extension aux êtres humains. Ces pathologies mortelles se manifestent par des encéphalopathies spongiformes ; le cerveau des sujets atteints observé en microscopie apparaît comme une éponge avec de multiples trous. La protéine responsable fut découverte en 1982 par Prusiner qui lui donna le nom de prion, à partir de l’anagramme et acronyme INfectious PROtein. Il fut établi qu’il s’agissait d’une protéine seule sans la moindre trace d’acide nucléique. La structure tridimensionnelle de la protéine cellulaire normale (PrPc ) a été résolue par

161

“Chap9” — 2018/12/6 — 16:32 — page 162 — #14

La structure des protéines

RMN pour la protéine recombinante de plusieurs espèces. Les structures globales de ces protéines des différents organismes sont très semblables. La partie C-terminale est repliée en un domaine globulaire bien structuré qui comporte trois segments hélicoïdaux et deux courts segments β.

Figure 9.10 Structure de la PrPc indiquant en rouge la partie N-terminale de la protéine.

La partie N-terminale forme une longue queue flexible, comme le montre la figure 9.10. La fonction physiologique de la protéine normale reste encore mal connue. Il a été suggéré qu’elle pourrait jouer un rôle dans la transmission neuronale chez l’adulte. De nombreuses études ont montré que la protéine normale PrPc est convertie en protéine pathologique PrPsc par une transformation structurale dans laquelle une partie des hélices de la protéine PrPc est convertie en segments β, ainsi qu’il est montré sur la figure 9.11. L’hypothèse retenue admet que la transformation de la protéine cellulaire en PrPsc s’effectue par l’association d’un monomère de la forme PrPsc à une ou deux chaînes de la protéine normale qui seraient partiellement dépliées sous l’effet des fluctuations stochastiques abaissant la barrière d’énergie pour la transformation de PrPc en PrPsc , et ainsi de suite par un processus autocatalytique dans lequel le monomère PrPsc impose sa structure à ses partenaires PrPc . Contrairement à la protéine normale, la forme pathologique est résistante aux protéases. Les résultats de plusieurs études indiquent que la PrPsc agit comme un moule pour transformer la PrPc naissante en PrPsc par suite de leur interaction. Ainsi, la fixation d’un monomère PrPsc à un monomère PrPc induit la transformation de celui-ci en PrPsc . L’hétérodimère serait donc un intermédiaire pour la propagation du prion entraînant le processus infectieux.

162

“Chap9” — 2018/12/6 — 16:32 — page 163 — #15

9. Formation de la structure tridimensionnelle :le repliement des protéines

A

B

PrP

c

sc

PrP

Figure 9.11 Transformation structurale de la PrPc et PrPsc .

De nombreuses études ont été conduites afin de déterminer la nature des acides aminés impliqués dans la barrière d’espèce, c’est-à-dire assurant la non-transmission d’une espèce à l’autre. La plupart des résidus impliqués sont localisés dans le domaine C-terminal. Ainsi l’examen de la structure du domaine C-terminal de la PrPc chez l’homme et chez la vache conforte l’idée que la barrière entre ces deux espèces est petite. Diverses observations ont montré que plusieurs protéines, telles que le lysozyme ou la myoglobine non impliquées dans des maladies amyloïdes, sont capables de former des fibrilles amyloïdes dans certaines conditions. Cette formation se produit à partir d’un dépliement partiel de l’état natif ou d’un repliement partiel de l’état déplié de la protéine.

9.5

Repliement des protéines membranaires, in vivo et in vitro

L’environnement particulier des protéines membranaires (voir chapitre 7) entraîne des différences considérables dans leurs mécanismes de synthèse et de repliement par rapport aux protéines solubles.

163

“Chap9” — 2018/12/6 — 16:32 — page 164 — #16

La structure des protéines

9.5.1

Synthèse in vivo

S’il existe diverses exceptions, notamment en ce qui concerne les protéines membranaires des organelles et certaines protéines virales, les deux cas de figure les plus généraux sont : 1) l’insertion co-traductionnelle ou post-traductionnelle de protéines organisées en faisceaux d’hélices α, effectuée par des complexes transmembranaires dénommés translocons ; et 2) l’insertion post-traductionnelle dans la membrane externe des bactéries Gram-négatives de protéines membranaires repliées en tonneau β.

9.5.1.1

Insertion effectuée par un translocon

Ce mode d’insertion concerne la plupart des protéines présentes dans des membranes qui sont en contact direct avec le cytosol. Dans le cas des cellules eucaryotes, l’insertion de la grande majorité de ces protéines a lieu dans le réticulum endoplasmique, chez les bactéries dans la membrane plasmique (figures 9.12 et 9.13). La même voie est empruntée par les protéines sécrétées, mais celles-ci ne font que traverser la membrane. En général, l’extrémité N-terminale du polypeptide comporte une séquence d’adressage partiellement hydrophobe appelée séquence signal. À son apparition dans le cytosol, cette séquence est reconnue par un complexe composé de protéines et d’ARN, la particule de reconnaissance du signal (signal recognition particle, SRP). L’interaction de cette particule avec la séquence signal et le ribosome

ARNm

SRP

Séquence signal

Cytosol

Sec61/ SecY

Récepteur de SRP

Espace extracellulaire

Figure 9.12 Adressage des protéines sécrétées et des protéines membranaires du réticulum endoplasmique et des compartiments dérivés, notamment la membrane plasmique, par la particule de reconnaissance du signal (SRP) et translocation par le translocon (Sec61/SecY) (d’après Park & Rapoport, 2012).

164

“Chap9” — 2018/12/6 — 16:32 — page 165 — #17

9. Formation de la structure tridimensionnelle :le repliement des protéines

bloque temporairement la synthèse, le temps pour la SRP de reconnaître des récepteurs à la surface du réticulum endoplasmique. La SRP se détache alors de la protéine en cours de synthèse, tandis que le ribosome s’associe à un tunnel transmembranaire, le translocon (système SEC), dans lequel s’engage l’extrémité N-terminale de la protéine (figure 9.12). Le translocon est capable, soit de transférer la chaîne polypeptidique dans le lumen du réticulum (figure 9.12), soit de la délivrer latéralement vers la membrane (figure 9.13).

A

Synthèse par le ribosome Hélice transmembranaire Cytosol Membrane Translocon

B

Cytosol Gorge latérale

Cytosol Gorge latérale Coupure par la peptidase

Figure 9.13 Deux modèles pour l’insertion des protéines membranaires par le translocon. A. Modèle traditionnel : les segments destinés à devenir transmembranaires (en rouge) et ceux qui seront sécrétés (en vert) transitent par le même pore central. Les premiers sont insérés dans la membrane via une issue latérale, les seconds sécrétés dans le lumen du réticulum endoplasmique ou le périplasme bactérien. B. Modèle à deux voies : les segments hydrophobes (séquence signal et futurs segments transmembranaires) empruntent une gorge située à l’interface entre le translocon et la membrane, les segments polaires le canal central. Le schéma (a) s’applique aux protéines membranaires, le schéma (b) aux protéines sécrétées. SPase : signal peptidase (D’après Cymer et al., 2015).

165

“Chap9” — 2018/12/6 — 16:32 — page 166 — #18

La structure des protéines

La sécrétion s’applique : a) aux protéines entièrement sécrétées, qu’elles soient solubles ou, dans le cas des bactéries Gram-négatives, destinées à s’insérer dans la membrane externe ; et b) aux boucles et domaines extracytosoliques des protéines membranaires. Le transfert latéral s’applique aux segments transmembranaires repliés en hélices α, caractéristiques des protéines membranaires du réticulum, de la membrane plasmique et des compartiments qui en dérivent. Les interactions établies par l’extrémité N-terminale avec le translocon et son environnement (les lipides négativement chargés du feuillet cytosolique du réticulum semblent jouer un rôle) déterminent dans quel sens cette extrémité est insérée, i.e. avec le N-terminal exposé, soit au cytosol, soit au lumen du réticulum ou au périplasme. Une peptidase transmembranaire dont le site actif est situé dans le lumen clive la séquence signal si celle-ci est insérée avec son extrémité N-terminale dans le cytosol et présente un site consensus de clivage à son extrémité C-terminale, exposée à l’extérieur. En l’absence de ce site, la séquence signal reste associée au polypeptide, est intégrée dans la membrane du réticulum et constitue la première hélice transmembranaire de la protéine (figure 9.13). La synthèse reprend, le translocon sélectionnant les segments destinés à former des hélices transmembranaires et déterminant leur orientation. Schématiquement, les segments suffisamment longs et suffisamment hydrophobes pour partitionner favorablement dans la phase lipidique sortent latéralement du translocon et se placent en position transmembranaire. Ceux qui ne remplissent pas cette condition, soit restent dans le cytosol, soit sont sécrétés, selon que le segment transmembranaire qui les précède est intégré dans la membrane avec son extrémité C-terminale dans l’une ou l’autre phase aqueuse. Le sens d’insertion des segments hydrophobes est déterminé par le bilan des charges portées par les résidus polaires voisins de leurs extrémités : l’extrémité la plus chargée positivement reste dans le cytosol, l’autre passe dans le lumen. C’est la règle dite de l’« extrémité positive à l’intérieur » (positive inside rule) (von Heijne et Gavel, 1988). Le décodage par le translocon des signaux contenus dans la séquence détermine donc le sens d’insertion de la protéine membranaire dans son ensemble, ainsi que la nature et l’orientation des hélices transmembranaires et des boucles extracytosoliques et cytosoliques. La plupart des données actuelles indiquent qu’un translocon ne contient, à un moment donné, qu’un ou deux segment(s) polypeptidique(s), mais certaines observations suggèrent que plusieurs translocons peuvent coopérer lors de l’insertion d’une protéine complexe. Il existe actuellement un débat concernant la façon dont segments destinés à être transmembranaires et segments non membranaires transitent par le translocon. Traditionnellement, on considère que les deux types de séquences empruntent un pore central, les séquences hydrophiles étant sécrétées, les séquences hydrophobes relarguées latéralement vers la membrane (figure 9.13, schéma A). Selon une proposition récente (Cymer et al., 2015), les deux types de segments pourraient utiliser des voies partiellement différentes, les futurs segments transmembranaires s’insérant dans une gouttière amphiphile à la surface du translocon, en contact avec les lipides (figure 9.13, schéma B). Les segments expulsés vers la membrane commencent probablement à former le faisceau d’hélices transmembranaires avant même que la synthèse de la protéine soit

166

“Chap9” — 2018/12/6 — 16:32 — page 167 — #19

9. Formation de la structure tridimensionnelle :le repliement des protéines

entièrement terminée, sans doute en interaction avec des protéines du réticulum endoplasmique. Divers enzymes et chaperons moléculaires assistent ce processus et assurent notamment la formation des ponts disulfure (le cytosol est un milieu réducteur, le lumen du réticulum endoplasmique et le périplasme bactérien des milieux oxydants), ainsi que, chez les eucaryotes, la glycosylation des asparagines qui apparaissent dans le lumen au sein d’une séquence Asn-X-Ser-Thr, la liaison covalente éventuelle des lipides, etc. Lorsque la synthèse est terminée, le ribosome se détache du translocon et la protéine membranaire nouvellement synthétisée diffuse latéralement dans la membrane du réticulum ou la membrane plasmique de la bactérie, où elle pourra éventuellement former des homo- ou hétéro-oligomères. Chez les eucaryotes, la plupart d’entre elles seront ensuite transportées vers l’appareil de Golgi, où leurs sucres seront modifiés, puis vers la membrane plasmique et les autres compartiments cellulaires. Chez les bactéries, deux translocons, le translocon SecYEG, homologue du translocon des eucaryotes, ainsi qu’un système supplémentaire non homologue, YidC, assurent l’intégration des protéines dans la membrane plasmique, les deux systèmes pouvant coopérer. L’intégration toutefois est moins fortement couplée à la synthèse (en cas de translocation post-traductionnelle, des protéines chaperons assurent la solubilité de la protéine dans le cytosol) et il n’y a pas de glycosylation. La plupart des protéines des membranes internes des organelles des cellules eucaryotes, chloroplastes et mitochondries, sont synthétisées dans le cytosol, importées dans l’organelle, et insérées par voie post-traductionnelle. Certaines d’entre elles toutefois sont synthétisées dans la matrice mitochondriale ou chloroplastique et insérées via un système homologue au système SEC. Les interactions qui gouvernent le repliement et l’assemblage des protéines membranaires et leurs étapes probables ont été discutées au chapitre 7.

9.5.1.2

Insertion dans la membrane externe des bactéries Gram-négatives

Un mécanisme très différent est mis en œuvre pour l’intégration de protéines dans la membrane externe des bactéries Gram-négatives (figure 9.14). Ces protéines sont repliées en tonneau β et les éléments de séquence correspondant aux brins qui constituent ces tonneaux ne sont pas globalement très hydrophobes. De ce fait, le système SEC ne les reconnaît pas comme susceptibles de former des hélices α transmembranaires. La protéine est donc sécrétée dans le périplasme (espace entre la membrane plasmique et la membrane externe), où elle est reconnue et stabilisée par des chaperons qui la dirigent vers la membrane externe. Elle s’y insère de manière concertée, la formation du tonneau transmembranaire accompagnant l’insertion, un processus lui aussi assisté par des chaperons, après quoi elle s’assemble éventuellement en oligomères (figure 9.14).

167

“Chap9” — 2018/12/6 — 16:32 — page 168 — #20

La structure des protéines

Milieu extérieur

Tonneau β

Membrane externe

Périplasme

Membrane interne Cytosol

Figure 9.14 Synthèse, transfert et repliement des protéines de la membrane externe des bactéries Gram-négatives (d’après Kleinschmidt, 2015).

9.5.2

Repliement in vitro des protéines membranaires

Compte tenu de la vectorialité de l’insertion in vivo des protéines membranaires et du fait que cette insertion et le repliement qui l’accompagne mettent en jeu un grand nombre de protéines, on peut se poser la question de l’applicabilité aux protéines membranaires du principe d’Anfinsen : rien ne semblerait en effet interdire qu’une telle protéine soit bloquée cinétiquement dans une conformation qui ne correspondrait en rien à un minimum d’énergie libre du système constitué par la protéine et son environnement, par exemple insérée avec son extrémité C-terminale exposée au cytosol alors qu’une orientation inverse serait énergétiquement plus favorable. La barrière énergétique élevée qui s’opposerait à une inversion d’orientation de la protéine suffirait à la maintenir dans cet état métastable pour la durée de son existence. Or, de façon surprenante, de nombreuses protéines membranaires (actuellement près d’une centaine) ont pu être repliées in vitro, en l’absence de toute machinerie cellulaire (figure 9.15). Cette observation, qui s’applique aussi bien aux protéines organisées en faisceau d’hélices α qu’à celles qui sont repliées en tonneau β, est d’un très grand intérêt à la fois pratique et théorique. Sur le plan pratique, la possibilité de replier des protéines membranaires in vitro permet de court-circuiter les difficultés rencontrées par la surexpression in vivo. De nombreuses études structurales et fonctionnelles sont désormais réalisées sur des protéines membranaires exprimées sous forme inactive dans des corps d’inclusion (précipités intracellulaires) et repliées in vitro. Sur le plan théorique, il apparaît que le repliement de nombreuses protéines membranaires obéit au principe d’Anfinsen, ce qui indique que l’information structurale codée dans la séquence peut être correctement décodée par le seul effet des interactions physico-chimiques du polypeptide

168

“Chap9” — 2018/12/6 — 16:32 — page 169 — #21

Nombre cumulé de protéines membranaires repliées in vitro

9. Formation de la structure tridimensionnelle :le repliement des protéines

100

90

42

B

mono aαmono

A

aαpoly oligo mono bβmono

80

bβpoly oligo 29

Total Total

70

60

10

50

8 40

30

αa mono mono

αa oligo poly

β mono mono b

βb poly oligo

20

10

0

Année de la première publication

Figure 9.15 Évolution du nombre de protéines membranaires repliées in vitro depuis 1981 et répartition par type structural (d’après Popot, 2014).

avec lui-même et avec un environnement ne contenant aucune autre protéine. Plus étonnant, la présence d’une bicouche lipidique n’est même pas un prérequis, de nombreuses protéines membranaires ayant été repliées in vitro avec des rendements élevés dans des systèmes non biologiques, tensioactifs fluorés ou amphipols par exemple. Autrement dit, le décodage sophistiqué de la séquence par le translocon, par exemple, est nécessaire in vivo, mais non in vitro. Il ne dicte pas ce que doit être la structure tridimensionnelle de la protéine, il permet seulement que celle-ci soit atteinte avec une rapidité et un rendement suffisants dans l’environnement très encombré du milieu cellulaire. Une hypothèse intéressante, émise par C.R. Sanders (Nagy et al., 2001), propose que la structure de la majorité des protéines membranaires a été acquise, au cours de l’évolution, avant le développement du translocon, ce qui expliquerait que le rôle de celui-ci ne soit que de faciliter l’intégration et le repliement, sans que, du moins dans la majorité des cas, il ne soit amené à guider le repliement vers une structure tridimensionnelle métastable. Il est remarquable que les contraintes physiques très spécifiques que peut imposer une bicouche lipidique ne soient pas nécessaires au repliement. Il semble que l’acquisition de la structure tridimensionnelle ne demande à l’environnement que de le protéger du contact avec l’eau, afin d’éviter une agrégation anarchique. Cette condition étant remplie, ce sont les interactions du polypeptide avec lui-même qui guident le repliement, sans nécessiter l’information que pourrait fournir l’environnement

169

“Chap9” — 2018/12/6 — 16:32 — page 170 — #22

La structure des protéines

membranaire. Cette hypothèse expliquerait les rendements de repliement importants observés dans des milieux aussi peu biologiques que les amphipols (figure 9.16).

Figure 9.16 Repliement d’une protéine membranaire en amphipols (d’après Popot & Engelman, 2016).

Bibliographie Alberts, B., Johnson, A., Lewis, J., Morgan, D., Raff, N.M. Roberts, K., & Walter, P. (2015) Molecular Biology of the Cell, Sixth ed., New-York & London, Garland Pub. Inc. Anfinsen, C.B. (1973) Principles that govern the folding of protein chains. Science 181: 223-230. Cohen, F.E., & Prusiner, S.B. (1998) Pathologic conformations of prion proteins. Annu. Rev. Biochem. 67: 793-819. Cymer, F., von Heijne, G. & White, S.H. (2015) Mechanisms of integral membrane protein insertion and folding. J. Mol. Biol. 427: 999-1022. Dill, A. & Chan N.S. (1997) From Levinthal to pathways to funnels, Nat. Struct. Biol. 4: 10-19. Dobson, C.M. (1999) Protein misfolding, evolution and disease. Trends Biochem. Sci. 24: 329-332. Ellis, R.J., & Hartl, F.U. (1999) Principles of protein folding in the cellular environment. Curr. Opin. Struct. Biol. 9: 102-110. Engelman, D.M., Chen, Y., Chin, C.-N., Curran, R., Dixon, A.M., Dupuy, A., Lee, A., Lehnert, U., Mathews, E., Reshetnyak, Y., Senes, A. & Popot, J.-L. (2003). Membrane protein folding: beyond the two-stage model. FEBS Lett. 555: 122-125. Harrison, S.C., & Durbin, R. (1985) Is there a single pathway for the folding of a polypeptide chain? Proc. Natl. Acad. Sci. USA 82: 4028-4030. Karplus, M., & Weaver, A. (1976) Protein folding dynamics. Nature 260: 404-406. Karplus, M., & Weaver, D.L. (1994) Protein folding dynamics: the diffusion-collision model and experimental data. Protein Sci. 3: 650-668. Kauzmann, I. (1959) Some factors in the interpretation of protein denaturation. Adv. Prot. Chem. 14: 1-67. Kleinschmidt, J.H. (2015) Folding of β-barrel membrane proteins in lipid bilayers – Unassisted and assisted folding and insertion. Biochim. Biophys. Acta 1848: 1927-1943. Levinthal, C. (1968) Are there pathways for protein folding? J. Chim. Phys. 65: 44-45.

170

“Chap9” — 2018/12/6 — 16:32 — page 171 — #23

9. Formation de la structure tridimensionnelle :le repliement des protéines

McMorran, L.M., Brockwell, D.J. & Radford, S.E. (2014). Mechanistic studies of the biogenesis and folding of outer membrane proteins in vitro and in vivo: What have we learned to date? Arch. Biochem. Biophys. 564: 265-280. Monod, J. (1970) Le hasard et la nécessité. Le Seuil, Paris. Nagy, J.K., Lonzer, W.L., & Sanders, C.R. (2001) Kinetic study of folding and misfolding of diacyl glycerol kinase in model membranes. Biochemistry 40: 8971-8980. Otzen, D.E. & Andersen, K.K. (2013). Folding of outer membrane proteins. Arch. Biochem. Biophys. 531: 34-43. Park, E. & Rapoport, T.A. (2012). Mechanisms of Sec61/SecY-mediated protein translocation across membranes. Annu. Rev. Biophys. 41: 21-40. Popot, J.-L. (2014). Folding membrane proteins in vitro: A table and some comments. Arch. Biochem. Biophys. 564: 314-326. Popot, J.-L. & Engelman, D.M. (1990). Membrane protein folding and oligomerization: the two-stage model. Biochemistry 29: 4031-4037. Popot, J.-L. & Engelman, D.M. (2016). Membranes do not tell proteins how to fold. Biochemistry 55: 5-18. Ptitsyn, O. (1995) Molten globule and protein folding. Adv. Prot. Chem. 47: 83-229. von Heijne, G. & Gavel, Y. (1988) Topogenic signals in integral membrane proteins. Eur. J. Biochem. 174: 671-678. Wang, J.D. & Weissmann, J.S. (1999) Thinking outside the box: new insights into the mechanisms of GroEL mediated protein folding. Nature Struct. Biol. 6: 597-600. Wetlaufer, D.B. (1973) Nucleation, rapid folding and globular intrachain regions in proteins. Proc. Natl. Acad. Sci. USA 70: 697-701. Wolynes P.G., Onuchic, J.N., & Thurumalai, D. (1995) Navigating the folding routes. Science 267: 1618-1620. Yon, J.M. (2001) Protein folding: a perspective for biology, medicine and biotechnology. Braz. J. Med. Biol. Res. 34: 419-435. Yon, J.M. (2002) Protein folding in the post-genomic era. J. Cell. Mol. Med. 6: 307-327.

171

“Chap10” — 2018/12/6 — 16:40 — page 173 — #1

10 Prédictions conformationnelles 10.1

Introduction

Partant du postulat d’Anfinsen qui spécifie que toute l’information nécessaire pour déterminer la structure tridimensionnelle d’une protéine est contenue dans sa séquence en acides aminés, la connaissance de celle-ci pourrait théoriquement rendre possible la prédiction de la conformation de la protéine. Cependant, compte tenu de la complexité du problème, du grand nombre de paramètres impliqués, une telle approche rencontre beaucoup de difficultés. Aussi les premières études qui sont apparues dans les années 1960 se sont limitées à des prédictions de structures secondaires. Les méthodes de simulation de la structure protéique sont apparues dans les années 1970 à partir de modèles très simplifiés. L’école russe a construit des modèles mécaniques. Des méthodes de minimisation d’énergie utilisant des modèles simplifiés de la chaîne polypeptidique et des méthodes de Monte Carlo furent utilisées vers la fin des années 1970. Toutes ces méthodes reposaient sur l’hypothèse que la structure native d’une protéine est la structure la plus stable. En dépit de nombreux efforts, la prédiction de la structure d’une protéine à partir de sa séquence reste un problème d’une grande difficulté. La structure d’une protéine est complexe et comporte de nombreux degrés de liberté. Progressivement les méthodes de calcul se sont perfectionnées, les fonctions d’énergie se sont affinées et la puissance des ordinateurs s’est considérablement accrue. La plupart des approches prédictives avaient été effectuées à partir de structures connues. Or une évaluation objective nécessitait d’effectuer des prédictions en aveugle.

173

“Chap10” — 2018/12/6 — 16:40 — page 174 — #2

La structure des protéines

C’est dans ce but que J. Moult de l’université de Maryland a institué en 1994 les réunions CASP (pour Critical Assessment of Protein Structure Prediction) qui rassemblent tous les deux ans les spécialistes de prédiction des structures protéiques.

10.2

Problèmes rencontrés dans les calculs conformationnels

La prédiction de la conformation d’une protéine à partir de sa séquence rencontre de nombreuses difficultés dues à la complexité de la molécule. Les principaux problèmes résident dans l’existence de multiminima et la difficulté qui en résulte pour trouver le minimum global, le très grand nombre d’interactions et l’effet du solvant. Les énergies potentielles calculées ne sont pas exactes et impliquent des approximations.

10.2.1

Le problème des multiminima

L’hyperespace conformationnel dans lequel la surface d’énergie d’une protéine peut être représentée est très complexe. Cette surface a de multiples minima et il n’existe pas de méthode pour trouver le minimum global. Les méthodes de minimisation d’énergie ne permettent pas de surmonter les barrières de potentiel pour passer d’un minimum à l’autre.

10.2.2

Le grand nombre d’interactions

Il est admis que l’énergie qui résulte des interactions interatomiques est exprimée par la somme des paires d’interactions : E =

n 

Eij (rij )

i =1 j>i L’évaluation de l’énergie comporte donc le calcul d’un grand nombre de termes. Pour n atomes dans la molécule, il y a n(n – 1)/2 termes dans l’équation. Des simplifications ont été apportées afin de réduire ce nombre, comme le calcul jusqu’à une certaine distance. Parmi les approximations utilisées, des représentations simplifiées de la chaîne polypeptidique ont été proposées, l’une d’elles décrit le squelette peptidique par une séquence de liaisons virtuelles allant d’un Cα au suivant. Dans ce modèle, un angle de torsion α remplace les deux angles de torsion ϕ et ψ, ainsi que le montre la figure 10.1. Un autre type d’approximation, celle de l’atome unifié, consiste à

174

“Chap10” — 2018/12/6 — 16:40 — page 175 — #3

10. Prédictions conformationnelles

réduire le nombre des atomes, par exemple CH3 et CH2 par un atome unique. Une simplification supplémentaire est réalisée dans l’approximation du résidu unifié, dans laquelle les chaînes latérales sont réduites à leur centre d’interaction (figure 10.1B). (A)

(B)

Figure 10.1 Tétrapeptide Val-Ala-Asp-Gly en A. En B sa représentation simplifiée.

10.2.3

L’effet de solvant

Les interactions entre les atomes de la molécule protéique et l’eau sont de même nature que les interactions intramoléculaires. Cependant les molécules de solvant ne sont pas fixes et leurs contributions peuvent être traitées seulement comme des moyennes, sauf dans le cas où une molécule d’eau est liée à la protéine par une forte liaison hydrogène. Les approches pour décrire les interactions avec le solvant sont soit des méthodes de Monte Carlo, soit des méthodes de dynamique moléculaire où l’introduction du solvant est effectuée en plaçant la protéine dans une boîte d’eau.

10.3

Prédictions de structures secondaires

Les prédictions de structures secondaires utilisent des modèles impliquant des interactions à courte et à moyenne distance. Trois types de méthodes furent développés, des méthodes empiriques utilisant des règles prédictives déduites de l’examen des

175

“Chap10” — 2018/12/6 — 16:40 — page 176 — #4

La structure des protéines

structures connues, des méthodes plus rigoureuses basées sur la mécanique statistique et des méthodes utilisant la théorie de l’information. Dans les méthodes empiriques, la fréquence de chaque acide aminé dans une structure définie est déduite de l’observation des structures aux rayons X d’un ensemble de protéines. Sur ces bases, plusieurs algorithmes de prédiction furent développés au cours des années 1970. L’approche la plus connue est celle de Chou et Fasman. En 1974, ces auteurs présentèrent une analyse basée sur la structure de 15 protéines comportant 2 473 acides aminés. Ils calculèrent la fréquence de chaque acide aminé dans une conformation donnée et déterminèrent ainsi leur paramètre de conformation, Pα, Pβ. Les paramètres conformationnels furent réévalués ultérieurement à partir d’un plus grand nombre de protéines. Le tableau ci-après indique la préférence conformationnelle des différents acides aminés. Tableau 10.1

Préférences conformationnelles des acides aminés. Acide aminé

hélice α

structure β

Glu

1,59

0,52

Ala

1,41

0,72

Leu

1,34

1,22

Met

1,30

1,14

Gln

1,27

0,98

Lys

1,23

0,69

Arg

1,21

0,84

His

1,05

0,80

Val

0,90

1,87

Ile

1,09

1,67

Tyr

0,74

1,45

Cys

0,66

1,40

Trp

1,02

1,35

Phe

1,16

1,33

Thr

0,76

1,17

Gly

0,43

0,58

Asn

0,76

0,48

Pro

0,34

0,31

Ser

0,57

0,96

Asp

0,99

0,39

Les méthodes basées sur la théorie de la mécanique statistique furent introduites au début des années 1970 par Lewis et Schéraga, Go et ses collaborateurs. Elles admettent la prépondérance des interactions à courte distance pour l’établissement des structures secondaires et s’appuient sur le modèle d’Ising pour déterminer les préférences conformationnelles des acides aminés. Pour la première fois apparut une

176

“Chap10” — 2018/12/6 — 16:40 — page 177 — #5

10. Prédictions conformationnelles

théorie quantitative sur la tendance des acides aminés à former (helix maker) ou à rompre (helix breaker) des hélices. Les modèles utilisés étaient une extension des modèles de transition hélice pelote statistique de Zimm et Bragg, Lifson et Roig. Dans ces modèles, les processus élémentaires de nucléation et croissance des hélices sont définis par les paramètres σ et s, respectivement. L’équilibre pour l’élongation d’une unité d’une hélice peut être représenté comme suit : s hhc

hhh

h et c représentent l’acide aminé dans une conformation hélicoïdale et en pelote statistique respectivement. ccc

σs3

hhh

Le processus de nucléation pour la formation d’une hélice requiert la participation de trois acides aminés consécutifs qui permettent la formation d’une liaison hydrogène. La constante d’équilibre est σ s3 : Sur les mêmes principes, une approche incluant les différents états conformationnels fut élaborée ultérieurement. Un troisième type de méthode pour la détermination des préférences conformationnelles des acides aminés repose sur une application des théories de l’information. L’approche introduite par Robson et Pain en 1971 consiste à évaluer la tendance de chaque acide aminé et celle de ses voisins à adopter une conformation définie. L’information directionnelle se définit comme l’information qu’un résidu porte sur la conformation d’un résidu voisin quelle que soit sa nature. L’information directionnelle a été calculée sur les 8 résidus dans la direction du N-terminal et les 8 résidus dans la direction du C-terminal. La mesure de l’information était évaluée à partir de l’analyse statistique des structures connues. Une version améliorée fut publiée en 1978 par Garnier, Osguthrope et Robson connue sous le nom de méthode GOR. Ces différentes méthodes furent progressivement affinées à mesure que l’on disposait d’un nombre plus important de données structurales. Cependant, leur performance reste assez faible. Avec l’augmentation des données structurales et l’accroissement des banques de données, des méthodes de seconde génération se sont développées vers la fin des années 1980. Elles considèrent une séquence unique et établissent la comparaison avec des matrices dérivées d’alignements multiples. En 1986, Levin a développé la méthode dite du proche voisin qui part du principe que des séquences proches ont des structures secondaires similaires. La séquence est comparée à une banque de structures. La qualité de la prédiction augmente si l’on agrandit la banque de données. Une autre approche introduite en 1988 par Qian et Seijnowski utilise le modèle des réseaux de neurones. Le calcul des paramètres est effectué dans la phase d’apprentissage. À la fin des années 1990, sont apparues les méthodes de troisième génération. L’approche porte sur une séquence alignée avec des homologues et la comparaison

177

“Chap10” — 2018/12/6 — 16:40 — page 178 — #6

La structure des protéines

est effectuée avec des matrices dérivées d’alignements multiples, en particulier les matrices PSIBLAST. Elles permettent de comparer une séquence à une base de données de séquences. Ainsi les méthodes se sont progressivement affinées, mais dans les meilleurs des cas leur fiabilité ne dépasse pas 80 %. Une méthode différente a été introduite dans les années 1990, l’analyse des amas hydrophobes (ou Hydrophobic Cluster Analysis, HCA). L’analyse des amas d’acides aminés hydrophobes dans les protéines permet de déterminer leur contenu en hélices α et feuillets β ainsi que la localisation de ces éléments structuraux au sein de la structure protéique. Dès 1974, V. Lim avait remarqué l’implication des regroupements d’acides aminés hydrophobes à l’intérieur des protéines dans l’établissement de leur structure secondaire et en 1979 A. Efimov montra l’importance du rassemblement de résidus hydrophobes à la surface des hélices α pour leur association. J.P. Mornon et ses collaborateurs ont développé une méthode graphique de détermination de la structure secondaire basée sur la forme des amas de résidus hydrophobes au sein des protéines. La méthode consiste à représenter l’ensemble de la structure primaire de la protéine sous la forme d’une hélice régulière de 3,6 acides aminés par tour. Le cylindre ainsi obtenu est alors coupé en deux parallèlement à son axe et déroulé en une représentation à deux dimensions. Pour faciliter l’examen de l’environnement de chaque acide aminé et la proximité des chaînes latérales hydrophobes, la représentation est dupliquée. Les amas d’acides aminés hydrophobes sont alors identifiés et entourés. Des programmes informatiques effectuent toutes ces opérations et fournissent la représentation graphique montrée sur la figure 10.2. La forme des amas est caractéristique soit des hélices α, soit des structures β. La méthode s’est avérée particulièrement performante pour la comparaison de protéines homologues de différentes espèces et l’étude de l’évolution de ces protéines. En effet, elle fournit des informations plus précises que la simple comparaison des séquences protéiques.

10.4

Prédictions de la structure tertiaire

Cependant, le but recherché était de pouvoir prédire ab initio la structure tridimensionnelle d’une protéine à partir de sa seule séquence. Les premières approches proposées dans les années 1970 portaient sur des modèles très simplifiés, de simples modèles mécaniques, des méthodes de minimisation d’énergie et des méthodes de Monte Carlo. L’école russe de Puschino a construit des modèles mécaniques de la molécule de myoglobine dont le repliement était simulé manuellement à l’aide de cordes et de poulies qui faisaient bouger les acides aminés. Ptitsyn et Rashin en 1975 ont appliqué cette méthode au repliement de l’apomyoglobine. Dans les modèles mécaniques, les hélices étaient représentées par des cylindres. Les méthodes de minimisation d’énergie partent du principe que la structure native d’une protéine est la structure la plus stable. Afin de réduire le nombre de variables et

178

“Chap10” — 2018/12/6 — 16:40 — page 179 — #7

10. Prédictions conformationnelles

Figure 10.2 Graphiques HCA des Aspartate transcarbamylases de Bacillus subtilis (en haut) et de Saccharomyces cerevisiae (en bas). Les motifs caractéristiques des hélices α et des feuillets β sont indiqués en rouge et bleu, respectivement. Les résidus de proline qui interrompent les structures en hélices sont indiqués par des étoiles et les résidus de glycine par des losanges (G. Hervé et J.P. Mornon, non publié).

de rendre les calculs compatibles avec la puissance des ordinateurs, les méthodes de minimisation d’énergie utilisent des modèles simplifiés de la chaîne polypeptidique tels qu’ils sont représentés p. 175. Parmi les premiers, Levitt et Warshel ont appliqué cette méthode au repliement d’une petite protéine, l’inhibiteur de la trypsine du pancréas de bœuf (BPTI). Les méthodes de Monte Carlo furent utilisées à partir du milieu des années 1970. Le protocole décrit le repliement d’une chaîne polypeptidique par un mécanisme en trois étapes, les trois pouvant procéder simultanément. Dans l’étape A, les structures ordonnées du squelette polypeptidique sont formées, le système est en équilibre au-dessous de la température de dénaturation. Dans l’étape B, l’équilibre est déplacé en changeant les conditions physiques (température) et des contacts résultant d’interactions à longue distance se forment entre petites régions. Ils sont stabilisés par le solvant. Les structures régulières formées dans l’étape A se réarrangent. Dans l’étape C, des régions de contact s’associent avec de possibles réarrangements des structures intermédiaires formées dans les étapes A et B. Malgré toutes ces tentatives, on était encore loin de pouvoir prédire ab initio la structure tridimensionnelle d’une protéine à partir de sa séquence. Même avec les modèles simplifiés, le nombre de variables restait encore trop grand. Une autre difficulté résidait dans le choix d’un bon modèle de l’eau. Après plusieurs décades d’effort, la prédiction de la structure des protéines à partir de leur séquence reste un problème d’une extrême difficulté par suite de leur structure complexe et du grand nombre de variables. Alors que la plupart des approches prédictives avaient été effectuées à partir de structures connues, il était important d’effectuer des prédictions en aveugle. C’est dans ce but que John Moult de l’université de

179

“Chap10” — 2018/12/6 — 16:40 — page 180 — #8

La structure des protéines

Maryland a institué en 1994 les réunions CASP (pour Critical Assessment Techniques of Protein Structure Prediction). La première de ces réunions, CASP1, eut lieu en décembre 1994 à Asilomar en Californie et tous les deux ans les spécialistes de prédiction des structures protéiques se réunissent pour tester leurs méthodes et leurs progrès. En décembre 2014 eut lieu la réunion CASP11. En décembre 2016 eut lieu la réunion CASP12. Les opérations se déroulent comme suit. Les cristallographes et les spectroscopistes de RMN sont sollicités pour déterminer des structures de protéines avant la prochaine réunion CASP, mais aucun résultat ne doit être divulgué au préalable. Les séquences de protéines tests sont disponibles sur le serveur web. Les scientifiques désirant participer à l’expérience CASP doivent soumettre jusqu’à cinq prédictions pour chaque protéine avant une date limite. Des examinateurs sont désignés pour effectuer l’analyse critique des prédictions structurales présentées à Asilomar. Les résultats de 18 groupes sélectionnés pour présenter leurs résultats à la réunion sont ensuite publiés dans un numéro spécial de la revue Proteins, Structure, Function and Genetics. Trois catégories de méthodes prédictives sont considérées dans le système CASP. Dans la première méthode ou prédiction par homologie, la modélisation est effectuée à partir de la comparaison de la séquence proposée avec les séquences de protéines contenues dans les banques de données. L’émergence de nouvelles méthodes d’alignement de séquences telles que PSI-BLAST ou les modèles de Markov (HMM) a permis de réels progrès dans la détection de similitudes de séquences. Un modèle est donc construit sur les bases d’une grande similitude de séquences avec une protéine de structure tridimensionnelle connue. Une grande variété de méthodes et de programmes a été mise en œuvre pour cette reconstruction. Une fois la protéine reconstruite, des méthodes de minimisation d’énergie ou d’optimisation du champ moyen sont utilisées. Ces méthodes furent critiquées dans la première réunion CASP1 pour leur incapacité à aboutir à un modèle proche de la structure déterminée expérimentalement. Les résultats de CASP3 ont montré une amélioration, les meilleures méthodes de ce type pouvant conduire à un modèle réaliste avec 70 % des carbones α présentant une déviation moyenne de l’ordre de 2 Å par rapport à la structure établie expérimentalement. Le deuxième type de méthodes ou méthodes de « threading » est basé sur une reconnaissance de repliement connu. Elle consiste à tenter d’ajuster la séquence sur chacune des topologies contenues dans une banque de données de tous les repliements tridimensionnels de protéines. Ces méthodes ont connu un succès limité lors des réunions CASP1 et CASP2. À la réunion CASP3, les repliements corrects de 13 séquences furent reconnus par au moins un groupe de théoriciens. Le troisième type d’approche est une prédiction ab initio qui ne fait appel à aucune structure connue. Certains groupes effectuent tout d’abord des prédictions de structure secondaire cherchant à déterminer quelles parties de la séquence sont en hélice α ou en segment β. Ils assemblent ensuite ces éléments de structure et minimisent la fonction d’énergie de la structure ainsi modélisée. D’autres minimisent la fonction d’énergie à partir d’une représentation simplifiée de la chaîne

180

“Chap10” — 2018/12/6 — 16:40 — page 181 — #9

10. Prédictions conformationnelles

polypeptidique. Les progrès dans les méthodes de prédiction ab initio ont marqué l’un des points forts de la réunion CASP3. David Baker et ses collègues ont introduit une méthode appelée Rosetta dans laquelle la structure tertiaire était engendrée par de courts fragments de 3 à 9 résidus qui présentaient une grande similitude de séquence avec des structures connues. Une fonction d’énergie était utilisée pour évaluer les fragments à mesure qu’ils étaient additionnés durant la construction. Cette réunion a été marquée par un perfectionnement des techniques rendu possible grâce à l’accroissement des ressources en ordinateurs. Toutefois la fiabilité des prédictions structurales ne dépassait pas 52 %. À l’issue de CASP3, Fisher et ses collègues ont créé une sous-section de CASP appelée CAFASP (pour Conformational Assessment of Fully Automated Structure Prediction). L’idée de base était l’évaluation des outils de prédiction complètement automatisés éliminant l’assistance des chercheurs dans le processus de prédiction. La première réunion s’est tenue peu de temps après celle de CASP3 et fut considérée comme une étude pilote. La deuxième réunion CAFASP2 était une partie officielle de CASP4 et CAFASP3 de CASP5. Des progrès notables ont été obtenus à CASP5. En particulier, cette évaluation a montré que le serveur Rosetta qui est un serveur de prédiction de structure complètement automatisé et qui utilise la méthode d’insertion de fragments intégrés par la méthode Rosetta a produit des prédictions raisonnables. Dans CASP6, une nouvelle fonction de prédiction fut introduite et reprise dans les CASP suivants ; il s’agit de la prédiction des sites de fixation de ligands. L’identification des zones de contact entre domaines fut aussi prise en compte. Contrairement aux CASP précédents, les progrès entre CASP7 et CASP8 furent modestes. On peut noter cependant une meilleure capacité à juger la qualité d’un modèle. CASP9 comportait des cibles possédant de nouvelles caractéristiques structurales. Pour la réunion CASP10, la nature des cibles a changé comportant un plus grand nombre de structures irrégulières, des molécules à plusieurs domaines et même à plusieurs sous-unités. Il est à noter un progrès soutenu dans les modèles obtenus en utilisant la dynamique moléculaire. L’intérêt croissant de la communauté scientifique pour les méthodes prédictives des structures protéiques est dû au fait que la biologie est entrée dans l’ère postgénomique. La protéomique structurale et fonctionnelle a révolutionné l’étude des protéines par toutes ses potentialités, l’évolution rapide du déchiffrage des génomes, l’attribution rapide des correspondances entre gène et protéine et l’accélération des comparaisons de séquences. Il fallait attribuer une structure et une fonction aux produits des nouveaux gènes. Or il est clair qu’il serait très lourd et très coûteux de déterminer expérimentalement les structures de toutes ces protéines et que les méthodes prédictives constituent un outil précieux. Ce domaine d’étude domine aujourd’hui la communauté des biologistes structuraux, qu’ils soient expérimentateurs ou théoriciens. Dans ce contexte, des biologistes structuraux se sont concertés dès 1998 pour choisir et préciser les produits des gènes à étudier et répartir les tâches entre théoriciens et expérimentateurs. Avec ce domaine d’investigation, on assiste à une mutation importante dans l’organisation, mais aussi dans la conception même de la recherche. Il se manifeste par un changement d’échelle, par le nombre des objets à décrypter,

181

“Chap10” — 2018/12/6 — 16:40 — page 182 — #10

La structure des protéines

par le nombre des acteurs nécessairement impliqués, par le caractère systématique et répétitif de certains aspects des travaux qui relèvent plus du travail de l’ingénieur que de celui du chercheur, par les moyens mis en œuvre, le coût que représente l’ensemble des opérations et par les enjeux socio-économiques qu’il implique. La démarche du chercheur intervient dans la réflexion qui doit guider la sélection des parties du génome à considérer, c’est-à-dire les régions à lecture ouverte, les orf (acronyme de Open Reading Frame), ainsi que dans le choix et le perfectionnement des méthodologies et dans l’interprétation des résultats. Mais cette démarche implique une pluralité d’acteurs et de compétences et une coordination des efforts entrepris. On est loin de la conduite d’une recherche au sein d’une petite équipe, loin aussi d’une recherche pluridisciplinaire effectuée en collaboration entre plusieurs équipes sur un projet défini dont la seule finalité serait la connaissance. Il faut souligner que ce type de démarche marque une large socialisation de la recherche par le grand nombre des acteurs impliqués, la pluralité des disciplines et les échanges constants entre les groupes.

Bibliographie Chou, P.Y., & Fasman, G.D. (1974) Conformational parameters for aminoacids in helical, β-sheets and random coil regions calculated from proteins. Biochem. 13: 211-222. Chou, P.Y., & Fasman, G.D. (1978) Empirical predictions of protein conformation. Annu. Rev. Biochem. 47: 251-276. Garnier, J., Osguthrope, D.J., & Robson, B. (1978) Analysis of the accuracy and implications of simple methods for predicting the secondary structure of globular proteins. J. Mol. Biol. 120: 97-120. Ghelis, C., & Yon, J. (1982) Protein folding. Acad. Press, New-York. Lemesle-Varloot, L., Henrissat, B., Gaboriot, C., Bissery, V., Morgat, A., & Mornon, J.P. (1990) Hydrophobic cluster analysis procedure to derive structural and functional information from 2D-representation of protein sequences. Biochimie 72: 555-574. Levin, J.M. (1997) Exploring the limits of the nearest neighbour secondary structure prediction. Protein Eng. 10: 771-776. Levin, J.M., Robson, B., & Garnier, J. (1986) An algorithm for secondary structure determination in proteins based on sequence similarity. FEBS Letters 205: 303-308. Lewis, P.N. & Scheraga, H. (1971) Predictions of structural homologies in cytochrome C proteins. Arch. Biochem. Biophys. 144: 576-583. Ptitsyn, O.B., & Rashin, A.A. (1975) A model of myoglobin self organization. Biophys. Chem. 3: 1-20.

182

“Chap11” — 2018/12/4 — 18:41 — page 183 — #1

11 Dynamique structurale Pendant une longue période, les protéines furent considérées comme des objets rigides. La métaphore de la clé dans la serrure utilisée dans les premiers temps pour décrire l’activité enzymatique en est une illustration. L’existence de mouvements dans les protéines a cependant été considérée dès 1955 par Linderstrøm-Lang et Kirkwood. À cette date, Linderstrøm-Lang avait émis l’hypothèse que les protéines ont une structure relativement flexible et fluctuante en solution et avait décrit cette mobilité comme une respiration des protéines. La même année, Kirkwood souligna le rôle des fluctuations de charges dans la catalyse enzymatique. Ces concepts furent proposés à une époque où aucune structure protéique n’était encore connue. Avec les premiers succès de l’analyse structurale, la vision rigide de la conformation des protéines s’est à nouveau imposée. L’analyse des données de rayons X indiquait en effet une grande compacité des atomes à l’intérieur des molécules. Ainsi que l’a énoncé Philipps : « The period 1965-1975 may be described as the decade of the rigid macromolecule. » Les aspects dynamiques furent négligés pendant plus d’une décade. Cependant des preuves expérimentales de plus en plus nombreuses vinrent confirmer le comportement dynamique des protéines et en souligner l’importance pour l’expression et la régulation des propriétés fonctionnelles. Ainsi l’importance des mouvements internes dans les protéines s’est progressivement imposée. Mais à côté des preuves expérimentales, l’apport de la théorie avec les simulations de dynamique moléculaire a été décisif pour que la vision dynamique de la structure des protéines soit reconnue par la communauté scientifique.

183

“Chap11” — 2018/12/4 — 18:41 — page 184 — #2

La structure des protéines

11.1

Différents types de mouvements dans les protéines

Il existe une grande variété de mouvements internes dans les protéines, ces mouvements de différentes amplitudes s’effectuent sur une grande échelle de temps, allant de 10−14 s à plusieurs secondes. Les mouvements vibrationnels correspondent à des temps allant de 3.10−14 s à 3.10−12 s. Différentes méthodes ont été appliquées à l’étude de ces mouvements telles que la spectroscopie infrarouge, la spectroscopie Raman, la diffusion quasi élastique des neutrons. Ces études ont révélé des vibrations de haute fréquence qui correspondent à des déformations dans les longueurs de liaisons, comme des étirements (stretching) ou dans les angles de liaisons (bending). Des vibrations de basse fréquence (de l’ordre de 25 cm−1 ) correspondant à des mouvements de caractère collectif ont été observées pour plusieurs protéines. Les rotations autour des angles dièdres du squelette peptidique et des chaînes latérales des protéines, en particulier de la tyrosine et des groupements méthyles, ont des constantes de temps de l’ordre de 10−8 s. Ces mouvements rotationnels sont accessibles à différentes méthodes telles que la RMN et la dépolarisation de fluorescence. Des mouvements concertés de plus grande amplitude se produisent en des temps plus longs. C’est le cas par exemple de la transition allostérique dans laquelle la protéine oscille entre deux conformations présentant des affinités différentes pour ses ligands. Le mouvement relatif des domaines dans les protéines formées de deux domaines structuraux s’apparente à ce type de mouvement. Dans le cas d’enzymes, il a pour conséquence fonctionnelle la séquestration du substrat au site actif de la protéine. Il existe dans les protéines des parties flexibles et des parties compactes qui assurent la transmission des mouvements à travers la molécule. Par exemple la relative rigidité des hélices permet la transmission vectorielle de mouvements et la transduction de signaux de part en part de la molécule protéique. C’est le cas de l’hélice H2 de la chaîne régulatrice de l’aspartate transcarbamylase d’E. coli dont le mouvement est impliqué dans la transmission de l’effet régulateur de l’effecteur allostérique ATP. Les mouvements de plus grande amplitude ont été détectés par tout un ensemble de méthodes ainsi que nous l’avons indiqué plus haut. La connaissance de la structure tridimensionnelle des enzymes est une condition nécessaire mais insuffisante pour comprendre le mécanisme de l’activité catalytique ; l’analyse de la dynamique interne de la molécule est également nécessaire. Les mouvements locaux aussi bien que les mouvements collectifs de grande amplitude jouent un rôle important dans la catalyse enzymatique et sa régulation ainsi que dans l’activité biologique en général.

11.2

Preuves expérimentales des mouvements dans les protéines

Dès 1955, Linderstrøm-Lang développa une méthode d’échange hydrogènedeutérium qui lui permit de détecter et d’étudier les fluctuations conformationnelles

184

“Chap11” — 2018/12/4 — 18:41 — page 185 — #3

11. Dynamique structurale

des protéines. À partir de 1974, Carreri a repris les idées de Kirkwood sur la catalyse enzymatique. Il introduisit le modèle du fluctuating enzyme, signifiant que l’enzyme est soumis à des fluctuations conformationnelles importantes pour la catalyse. Le modèle implique un couplage fort et direct entre les différentes parties de la molécule avec la capacité de corréler dans le temps les fluctuations essentielles pour la catalyse. C’est en termes d’événements temporels statistiques que Carreri et ses collègues interprétaient la catalyse enzymatique, et par là-même opéraient un transfert de méthodes du champ de la physique statistique à celui de la biologie. La flexibilité conformationnelle des protéines devait se refléter au centre actif des enzymes pour la reconnaissance spécifique des substrats. Ainsi, en 1960, Koshland proposa le modèle de l’ajustement induit pour décrire les ajustements conformationnels d’un enzyme induits par la fixation de son substrat permettant une meilleure orientation des groupes d’atomes réagissant dans l’acte catalytique. Les modèles de la transition allostérique développés pour expliquer en termes structuraux la coopérativité de fixation de ligands et les propriétés régulatrices d’enzymes oligomériques, sont basés sur les variations conformationnelles des protéines. Le modèle développé par Monod, Wyman et Changeux, qui implique l’existence d’un équilibre entre deux états conformationnels de la protéine en l’absence de ligand, est très proche du concept énoncé par Linderstrøm-Lang. Le modèle développé par Koshland, Néméthy et Filmer est une extension de la théorie de l’ajustement induit aux protéines oligomériques. L’image d’un enzyme flexible a progressivement supplanté l’image rigide de la clé dans la serrure qu’avaient proposée les premiers auteurs. Le concept d’adaptabilité conformationnelle des protéines fut largement développé dans la communauté des enzymologistes, comme le reflète la revue de Citri de 1973. Cependant la vision dynamique des protéines ne s’est pas imposée d’emblée. Elle a été occultée pour un temps par les succès des études cristallographiques. L’analyse des données de rayons X indiquait une grande compacité des atomes au sein des molécules protéiques. Comme l’énonçait Tanford, « The structure of proteins must be quite rigid ». Dans le courant des années 1970, on se trouvait en présence de deux représentations apparemment opposées, celle de la protéine rigide et celle de la protéine flexible. Suivant le champ disciplinaire auquel ils appartenaient, les scientifiques insistaient préférentiellement sur l’une ou l’autre vision. Cependant des preuves expérimentales de plus en plus nombreuses vinrent confirmer le comportement dynamique des protéines et en souligner l’importance pour l’expression des propriétés fonctionnelles. La démonstration de l’existence de fluctuations conformationnelles dans les protéines a été apportée en 1973 par Laskowitz et Weber. Ces auteurs ont étudié l’extinction de fluorescence des résidus de tryptophane par l’oxygène dans quatorze protéines. Ils ont constaté que même les tryptophanes profondément enfouis au sein des molécules étaient transitoirement accessibles à l’oxygène. Ces résultats furent corroborés par Eftink et Ghironqui ont étudié l’extinction de fluorescence des tryptophanes par l’acrylamide qui est de plus grande taille que l’oxygène. Bien que certains tryptophanes demeuraient inaccessibles, l’élévation de température provoquait des fluctuations plus importantes qui facilitaient la pénétration de l’acrylamide.

185

“Chap11” — 2018/12/4 — 18:41 — page 186 — #4

La structure des protéines

Les échanges hydrogène-deutérium ont été largement utilisés après LinderstrømLang pour étudier les fluctuations conformationnelles des protéines. Les résultats ont fait l’objet de plusieurs revues, dont celles d’Englander et al., en 1972, mais les données expérimentales les plus détaillées ont été apportées à partir de la seconde moitié des années 1970, grâce aux développements des méthodes de RMN à haute résolution utilisant les résonances de l’hydrogène et du 13 C. Une description quantitative de la mobilité des noyaux aromatiques dans une petite protéine de 58 acides aminés, l’inhibiteur trypsique du pancréas de bœuf (BPTI), a été effectuée par le groupe de Wüthrich à Zurich, puis dans des molécules de plus grande taille comme le lysozyme et le cytochrome c par le groupe de Williams à Oxford. Des calculs ont montré que les mouvements des noyaux aromatiques sont la conséquence de la respiration des protéines incluant un mouvement du squelette polypeptidique. Les données obtenues au moyen de la spectroscopie de résonance magnétique nucléaire se sont finalement imposées. Elles ont conduit à prendre en considération les aspects dynamiques de la structure des protéines et ont confirmé l’hypothèse de Linderstrøm-Lang. À partir de 1979, l’existence de mouvements dans les protéines a été finalement reconnue par les cristallographes. Les structures cristallographiques ne représentent que des moyennes dans le temps. Une analyse des facteurs de température ou facteurs B fut effectuée lors de l’affinement des données cristallographiques à différentes températures. Des méthodes d’affinement des données de diffraction de rayons X par des cristaux de protéines ont été développées conduisant à l’obtention de coordonnées atomiques précises et permettant la détermination des facteurs de température et les fluctuations de la position des atomes. Une des premières applications aux protéines fut publiée en 1979 par Sternberg et ses collègues et portait sur la molécule de lysozyme. Une étude analogue fut présentée la même année par Frauenfelder et ses collègues dans le cas de la molécule de metmyoglobine. Les données d’autres méthodes comme la spectroscopie Raman sur le cristal de lysozyme conduisaient aux mêmes conclusions. Ces développements montrèrent que la diffraction des rayons X pouvait donner des informations sur les distributions spatiales des états conformationnels des protéines. L’analyse des facteurs B s’est progressivement imposée dans les études cristallographiques. Il est apparu des fluctuations de plus grande amplitude à la surface de la structure que dans le cœur des molécules protéiques. De plus, des fluctuations importantes ont été observées au centre actif des enzymes.

11.3

Approches théoriques : la dynamique moléculaire

Mais à côté des preuves expérimentales, l’apport de la théorie avec les simulations de dynamique moléculaire a été décisif pour que cette vision dynamique de la structure des protéines soit reconnue par la communauté scientifique. La conformation des protéines est déterminée par des interactions non covalentes de faible énergie et des fluctuations de la structure sont donc prévisibles. Ces considérations ont conduit les théoriciens à étudier les mouvements internes dans les protéines et donc

186

“Chap11” — 2018/12/4 — 18:41 — page 187 — #5

11. Dynamique structurale

à entreprendre des simulations de dynamique moléculaire sur ces molécules. Les méthodes de simulation sur des molécules de grande taille comportent obligatoirement des approximations et il est essentiel qu’elles soient validées par l’expérience. C’est donc par un dialogue constant entre théoriciens et expérimentateurs que ces méthodes ont été développées. L’une d’elles a concerné les calculs de trajectoires. L’autre approche dans l’élaboration des méthodes de dynamique moléculaire relevait plus de la physique que de la chimie, avec la considération des propriétés thermodynamiques et dynamiques d’un ensemble de molécules à l’équilibre plutôt que celle de trajectoires détaillées de quelques particules. Les idées de base dans les simulations de dynamique moléculaire des macromolécules biologiques résultent d’un transfert de concepts et de méthodes de la chimie théorique d’une part, de la physique d’autre part. Ainsi les simulations peuvent être utilisées pour approcher les propriétés d’équilibre comme dans la dynamique moléculaire des fluides, aussi bien que les aspects détaillés des mouvements atomiques comme dans les calculs de trajectoires. Au départ des simulations de dynamique moléculaire sur les macromolécules biologiques, l’hypothèse de base fut que les fonctions potentielles pouvaient être élaborées avec suffisamment de précision pour donner des résultats significatifs sur des systèmes aussi complexes que les protéines. En 1976, Herman Berendsen organisa un atelier sur la dynamique des protéines au Centre européen de calcul atomique et moléculaire (CECAM) à Orsay et cet atelier marqué par les travaux de Martin Karplus peut être considéré comme le point de départ de la dynamique moléculaire des protéines. Les techniques de dynamique moléculaire furent appliquées dans les premiers temps par McCammon, Gelin et Karplus à l’étude d’une petite protéine, l’inhibiteur trypsique du pancréas de bœuf (BPTI), qui peut être considérée comme la molécule paradigmatique pour les approches théoriques au même titre que la molécule d’hydrogène pour la chimie théorique. La molécule de BPTI est constituée de 58 acides aminés, possède trois ponts disulfure et comporte 458 atomes. Ces études qui avaient débuté lors de l’atelier du CECAM de 1976 furent publiées en 1977. Les simulations de dynamique moléculaire furent effectuées en résolvant les équations du mouvement de Newton sur tous les atomes et en utilisant une fonction potentielle empirique. Dans cette première étude, les temps de simulations étaient courts, de l’ordre de dix picosecondes. Les plus grands déplacements observés après trois picosecondes de simulation étaient localisés dans la région C-terminale de la molécule et dans une boucle. Ces observations ont suggéré que l’intérieur de la protéine ressemble à un fluide dont les mouvements atomiques locaux ont un caractère diffusionnel. Cependant, deux limitations furent signalées, la première portait sur l’approximation de la fonction d’énergie potentielle, la deuxième sur le fait que le solvant était négligé. Les simulations de dynamique moléculaire requièrent en effet l’établissement d’une fonction d’énergie potentielle, afin de connaître les forces agissant sur le système. Cette connaissance permet d’établir les équations du mouvement qui gouvernent la dynamique des particules. Pour les petites molécules, la fonction d’énergie peut être établie par des calculs de mécanique quantique. Pour les macromolécules qui

187

“Chap11” — 2018/12/4 — 18:41 — page 188 — #6

La structure des protéines

comportent plusieurs milliers d’atomes, la méthode utilise des fonctions d’énergie empiriques. Pour obtenir la fonction d’énergie avec la précision requise, il est nécessaire d’en utiliser une forme relativement complexe et d’optimiser la valeur des paramètres qui déterminent la grandeur des différents termes contribuant à cette fonction. Celle-ci dépend de la position de toutes les paires d’atomes ; la connaissance précise de la structure est donc nécessaire. Pour une protéine, la structure utilisée est obtenue par minimisation de l’énergie potentielle établie à partir de la structure aux rayons X ou de celle obtenue par RMN. Les forces d’attraction sont soit attractives, soit répulsives. Pour l’estimation des forces répulsives, le modèle le plus simple est de considérer les atomes comme des sphères impénétrables caractérisées par leur rayon de van der Waals. La fonction d’énergie utilisée pour les protéines comporte plusieurs termes. Les interactions non liantes sont généralement estimées par le potentiel de Lennard-Jones qui inclut des termes attractifs et des termes répulsifs. Sont également prises en compte les interactions électrostatiques, les variations des longueurs et des angles de liaisons ainsi que les rotations autour des angles dièdres. Le terme électrostatique dépend de la constante diélectrique. Divers modèles ont été utilisés pour estimer cette constante lorsque le solvant n’était pas inclus explicitement. Des valeurs variant entre 2 et 10 à l’intérieur des protéines furent prises en compte, mais aussi des valeurs estimées en fonction de la distance. En 1995, Simonson et Perahia ont étudié les propriétés diélectriques internes et interfaciales du cytochrome c dans une boîte d’eau en appliquant la théorie des diélectriques de Fröhlich-Kirkwood pour analyser les simulations de dynamique moléculaire. Ils ont montré que la constante diélectrique varie depuis l’intérieur vers l’extérieur de la protéine. Progressivement le solvant a été introduit explicitement dans les simulations de dynamique moléculaire. L’introduction du solvant est effectuée en plaçant la protéine dans une boîte d’eau limitée par des frontières conventionnelles, soit stochastiques, soit périodiques. Dans les modèles sphériques, l’eau ne peut sortir de la sphère ; le système est traité soit à volume constant, soit à pression constante. Dans les modèles périodiques, le cube central réel comportant la protéine et le solvant est entouré de répliques de la cellule centrale. Le nombre de molécules d’eau doit rester constant ; lorsque l’une d’elles sort de la cellule centrale, elle est remplacée par une autre d’une cellule périphérique. Pour une protéine de 1 200 atomes, le nombre de molécules d’eau à prendre en compte est de 8 à 10 fois plus grand. Plusieurs méthodes de dynamique ont été appliquées aux protéines en plus de la dynamique classique, ce sont la dynamique stochastique, la dynamique activée et la dynamique harmonique. La dynamique stochastique inclut des termes aléatoires qui sont introduits dans l’équation de Newton, tels que formulés par Langevin et connus sous le nom d’équation de Langevin. Celle-ci comporte un terme d’impulsions stochastiques, un terme de dissipation tenant compte de la viscosité du milieu pour simuler les chocs provenant du solvant implicite. Cette méthode a été particulièrement utile pour introduire des simplifications dans des systèmes complexes sans tenir compte explicitement de l’eau. Lorsqu’elle est appliquée à de petits systèmes, il est possible d’effectuer des simulations qui peuvent aller jusqu’à des microsecondes. Par exemple, elle fut utilisée pour explorer les effets de solvant sur la dynamique du dipeptide alanine.

188

“Chap11” — 2018/12/4 — 18:41 — page 189 — #7

11. Dynamique structurale

La dynamique activée est basée sur le fait que l’échelle de temps de beaucoup de processus chimiques ou physiques est limitée par la vitesse de passage des barrières d’énergie. Au départ la molécule est placée au sommet de la barrière d’énergie. Cette méthode avait été appliquée initialement à la dynamique de collision de petites molécules. Pour les protéines, des méthodes spéciales de simulation ont été développées autour des années 1980 qui rendaient possible la détermination des trajectoires en calculant les vitesses des processus activés. Elles ont été appliquées principalement à l’analyse des mouvements des acides aminés aromatiques dans les protéines. Ces travaux qui remontent à 1975 représentent la première étude détaillée des mouvements dans les protéines. Elles ont permis d’évaluer à 103 secondes−1 la vitesse de rotation des résidus aromatiques, ce qui a été trouvé en bon accord avec les mesures de RMN. La dynamique activée a également été appliquée à la détermination du chemin de l’oxygène pour parvenir à l’hème dans la myoglobine et l’hémoglobine. La structure aux rayons X de ces protéines ne révèle aucun chemin permettant à l’oxygène d’accéder jusqu’à l’hème compte tenu de la compacité de la structure. La considération de la structure rigide révèle des barrières d’énergie qui conduiraient à des transitions infiniment longues. Les fluctuations temporelles sont donc importantes pour permettre la pénétration de l’oxygène. Les résultats de la dynamique ont conduit à déterminer un chemin dans la molécule qui est loin d’être direct. La dynamique activée représente une synthèse des méthodes de dynamique moléculaire et de la théorie de l’état de transition.

11.4

Autres méthodes

Des méthodes ont été développées pour franchir plus facilement les barrières énergétiques permettant une exploration étendue de l’espace conformationnel. Ces méthodes sont basées soit sur une modification de la fonction d’énergie potentielle en diminuant par exemple les barrières énergétiques des angles dièdres (dynamique moléculaire accélérée), soit en introduisant de l’énergie cinétique par une augmentation de la température, ce qui accélère les transitions d’une conformation à l’autre (recuit simulé). Les méthodes de dynamique harmonique et quasi harmonique reposent sur l’hypothèse que le déplacement d’un atome autour de sa position d’équilibre est petit et que l’énergie potentielle peut en première approximation y être représentée par une somme de termes quadratiques pour les déplacements atomiques. Les constantes de force et les masses atomiques sont utilisées pour déterminer les modes normaux de vibration de la molécule. L’approximation harmonique ne donne pas une description complète des propriétés dynamiques d’une molécule lorsque les contributions anharmoniques sont importantes. En revanche, c’est une méthode de choix pour le calcul des propriétés thermodynamiques telles que la capacité calorifique, l’énergie libre et l’entropie vibrationnelle. La dynamique harmonique s’est révélée très utile pour explorer les mouvements des hélices. Elle a été tout d’abord appliquée à de petits polypeptides hélicoïdaux comme l’hexadécaglycine et la décaglycine. Dans ce

189

“Chap11” — 2018/12/4 — 18:41 — page 190 — #8

La structure des protéines

dernier cas, les résultats ont été comparés aux simulations de dynamique moléculaire dans une zone de température allant de 5 à 300 K. Un bon accord a été trouvé pour les températures inférieures à 100 K, mais pour les températures supérieures, les fluctuations des Cα obtenues par la dynamique moléculaire étaient deux fois supérieures à celles du modèle harmonique et semblables à celles obtenues à partir des facteurs B déduits des données de rayons X pour les hélices de la myoglobine. L’analyse harmonique a été étendue tout d’abord à de petites protéines dont le BPTI, la crambine, la ribonucléase et le lysozyme. Il est apparu que les mouvements lents ont un caractère collectif, les modes de plus basses fréquences reflètent les fluctuations globales de la chaîne polypeptidique. Des simulations quasi harmoniques plus réalistes utilisant un modèle simplifié ont ensuite été effectuées. Il résultait de ces études que les fluctuations de la chaîne principale sont correctement approchées par le modèle harmonique, l’anharmonicité devenant importante pour les chaînes latérales par suite de leurs multiples conformations. Les modes collectifs de grande amplitude sont importants pour rendre possibles les larges déplacements qui sont significatifs pour la fonction biologique. Mais afin de relier ces mouvements aux propriétés fonctionnelles, il devenait nécessaire de développer des techniques permettant d’étudier des protéines de plus grande taille. Beaucoup de protéines sont constituées de domaines structuraux reliés par une partie flexible de la chaîne polypeptidique que l’on peut considérer comme une charnière. Les mouvements relatifs de ces domaines (hinge bending motion) jouent un rôle essentiel dans le processus catalytique de certains enzymes permettant le rapprochement des substrats et isolant la réaction du solvant. Pour quelques enzymes, la structure ouverte en absence de substrat et la structure fermée du complexe protéine-ligand sont connues, pour d’autres une seule structure est disponible dans la banque de données. L’analyse des mouvements des domaines dans le lysozyme peut être considérée comme la première approche de l’étude d’un tel mouvement. Le mouvement était traité comme celui d’un oscillateur angulaire harmonique constitué de deux sphères rigides dont les moments d’inertie correspondent à ceux des domaines. La technique fut ensuite appliquée à d’autres protéines parmi lesquelles des molécules d’anticorps, la protéine qui fixe l’arabinose et l’alcool déshydrogénase qui présente une structure ouverte en absence du coenzyme NAD+ (nicotinamide dinucléotide) et une structure fermée lorsque celui-ci est fixé. Les transitions conformationnelles de grande amplitude s’étendant sur une échelle de temps de plusieurs millisecondes sont d’une grande importance biologique. En particulier la transition allostérique, qui implique des protéines oligomériques de grande taille assure la régulation de leurs propriétés fonctionnelles. La dynamique moléculaire conventionnelle ne peut être appliquée à de tels mouvements. Il fallut donc développer de nouvelles méthodes pour aborder l’étude de tels systèmes. L’une des approches proposées par Elber et Karplus en 1987 consistait à imaginer une trajectoire à partir de la structure initiale jusqu’à la structure finale et à optimiser cette trajectoire afin d’obtenir le meilleur chemin de transition. Cette méthode, appliquée initialement à la molécule de myoglobine, exige l’élaboration d’un grand nombre de structures intermédiaires afin d’échantillonner correctement

190

“Chap11” — 2018/12/4 — 18:41 — page 191 — #9

11. Dynamique structurale

l’espace conformationnel. Des affinements méthodologiques ont été apportés et cette approche est encore utilisée aujourd’hui. Zaloj et Elber ont proposé une approche stochastique d’une trajectoire entre deux états. Une variante de la méthode d’Elber et Karplus, dans laquelle les coordonnées cartésiennes étaient remplacées par les coordonnées internes de la molécule, a été utilisée par El-Kettani et Durup en 1992 pour décrire le chemin conformationnel entre les deux structures cristallographiques de la citrate synthase. On peut aussi citer une autre méthode de recherche du chemin conformationnel entre deux états permettant d’atteindre d’une façon correcte la structure de l’état de transition, introduite par Fisher et Karplus (conjugate peak refinement method). Un autre type de méthodologie impliquant une approche séquentielle de la recherche d’un chemin conformationnel a été introduit en 1995 par Guilbert et al. Cette méthode nommée PEDC (pour Path Exploration with Distance Constraints) permet d’explorer des chemins de basse énergie en contraignant le système à évoluer graduellement de sa conformation initiale vers une autre conformation. Elle permet d’une part d’explorer l’espace conformationnel d’une structure sans connaître la structure finale ; d’autre part de déterminer le chemin de transition entre deux structures connues. Ceci est réalisé en ajoutant des termes de pénalité à la fonction potentielle, notamment une contrainte de distance isotrope qui permet de faire évoluer le système vers une conformation se trouvant à une distance donnée de la conformation de départ ou d’arrivée. La contrainte de distance est augmentée graduellement afin de permettre au système d’évoluer à des distances de plus en plus proches d’une conformation finale ou de s’éloigner d’une structure initiale au cours d’une simulation de dynamique moléculaire ou de calcul par minimisation d’énergie. Par cette méthode, le mouvement relatif des domaines de la phosphoglycérate kinase a été étudié à une période où l’on ne connaissait que la structure initiale de l’enzyme libre. Une méthode basée sur le même principe a été publiée en 1994 par Schlitter et ses collègues. Dans cette méthode appelée TMD (pour Targetted Molecular Dynamics), le temps pour aller d’une structure à l’autre est précisé. La dynamique harmonique a été utilisée pour étudier les mouvements lents de grande amplitude dans des protéines de taille importante. L’analyse des modes normaux a été appliquée à la transition allostérique. Compte tenu du nombre d’atomes et de la difficulté des calculs difficilement réalisables même avec des ordinateurs très puissants, il fallut là encore développer de nouvelles techniques de calcul. Le procédé introduit par Mouawad et Perahia ou DIMB (pour Diagonalization in a Mixed Basis) est une méthode itérative de diagonalisation utilisant une base mixte composée des coordonnées cartésiennes et des modes normaux. Les auteurs l’ont appliqué à l’état T de l’hémoglobine mettant ainsi en évidence une structure intermédiaire entre les deux états T et R sur le chemin de la transition allostérique. Les modes normaux de basse fréquence correspondant aux mouvements collectifs des molécules décrivent correctement la direction du mouvement de la transition. Ces auteurs ont également étudié la transition allostérique par la méthode des modes normaux dans le cas d’une molécule de taille encore plus grande que l’hémoglobine, l’aspartate

191

“Chap11” — 2018/12/4 — 18:41 — page 192 — #10

La structure des protéines

transcarbamylase, molécule oligomérique constituée de six sous-unités catalytiques et six sous-unités régulatrices. Une nouvelle approche associant les simulations de dynamique moléculaire et l’analyse des modes normaux a été récemment développée par De Souza Costa et al. (2015). La méthode appelée MDeNM (pour Molecular Dynamics with excited Normal Modes) permet un échantillonnage étendu de l’espace conformationnel. La méthode consiste en de multiples répliques de courtes simulations de dynamique moléculaire dans lesquelles les mouvements décrits par un sous-ensemble de modes normaux de basse fréquence sont cinétiquement excités. Ceci est complété par l’addition de vitesses atomiques le long de vecteurs, combinaisons linéaires de modes normaux. Les différentes opérations impliquées assurent un couplage efficace entre les mouvements rapides et les mouvements lents. La méthode a été appliquée à deux protéines, le lysozyme d’œuf de poule et la protéase du HIV-1. Dans les deux cas, une étroite corrélation a été obtenue avec les mouvements observés expérimentalement. Des systèmes de taille de plus en plus grande sont donc abordés aujourd’hui grâce aux développements de techniques de calcul et à l’accroissement de la puissance des ordinateurs. Une méthode approximative à gros grain dans laquelle les atomes Cα sont reliés entre eux par des ressorts (Elastic Network Model) a été développée, ce qui a permis d’obtenir les mouvements de très basses fréquences de molécules de très grandes dimensions ou des assemblages protéiques en utilisant peu de ressources informatiques. Elle a été utilisée par exemple pour caractériser les mouvements du ribosome (Wang et al. 2004). On assiste à tout un foisonnement d’études théoriques sur les mouvements des protéines y compris des protéines membranaires, et des associations entre protéines. L’apport des théoriciens fut essentiel pour que s’impose une vision dynamique de la structure des protéines que nul ne conteste aujourd’hui. En 2013, l’attribution du prix Nobel de chimie à M. Karplus, A. Warshel et M. Levitt

Figure 11.1 Martin Karplus (courtoisie de Martin Karplus).

192

“Chap11” — 2018/12/4 — 18:41 — page 193 — #11

11. Dynamique structurale

est venue récompenser une contribution exceptionnelle à la connaissance de cet aspect dynamique de la structure des protéines. Ces dernières décennies ont donc été marquées par l’acquisition de la structure des protéines dans l’espace et de leur mobilité temporelle, « l’étendue et le mouvement », permettant ainsi de mieux comprendre les mécanismes par lesquels elles expriment leurs propriétés fonctionnelles.

Bibliographie Becker, O.M. & Karplus, M. (2005) Guide to Biomolecular Simulations. Springer. Carreri, G. (1974) The fluctuating enzyme. In: Quantum Statistics in the natural sciences. Ed. by B. Kursonoglu & S.L. Minty, Plenum Pub. Corp., New-York, 15: 353. Citri, N. (1973) Conformational adaptability in enzymes. Adv. Enzymol. Relat. Areas Mol. Biol. 37: 397-648. Costa, M.G., Batista, P.R., Bisch, P.M., & Perahia, D (2015) Exploring free energy landscapes of large conformational changes: molecular dynamics with excited normal modes. J. Chem. Theory Comput. 11(6): 2755-2767. Englander, S.W., Downer, N.W., & Teitelbaum, H. (1972) Hydrogen exchange. Ann. Rev. Biochem. 41: 903-924. Fischer, S., & Karplus, M. (1992) Chem. Phys. Lett. 194: 252-261. Guilbert, C., Perahia, D., & Mouawad, L. (1995) A method to explore transition paths in macromolecules. Application to haemoglobin and phosphoglycerate kinase. Comp. Phys. Commun. 91: 263-273. Koshland, D.E. (1960) The active site and enzyme action. Adv. Enzymol. 27: 45-78. Koshland, D.E., Nemethy, G. & Filmer, D. (1966) Comparison of experimental binding data and theoretical models in proteins containing subunits. Biochemistry 5: 365-385. Lakovitz, J.R. & Weber, G. (1973) Quenching of fluorescence by oxygen A probe for structural fluctuations in macromolecules. Biochemistry 12: 4161-4170. McCammon, J.A., Gelin, B.R., & Karplus, M. (1976) Dynamics of folding proteins. Nature 262: 325-326. Monod, J., Wyman, J. & Changeux, J.P. (1965) On the nature of allosteric transitions. A plausible model. J. Mol. Biol. 12: 88-118. Mouawad, L., & Perahia, D. (1996) Motions in haemoglobin studied by normal mode analysis and energy minimization: evidence for the existence of tertiary T-like quaternary R-like intermediate structures. J. Mol. Biol. 258: 293-410. Schlitter, J.C., Engel, S.M., & Kruger, P. (1994)Targeted molecular dynamics; a new approach for searching pathways of conformational transitions. J. Mol. Graph. 12: 84-89. Simonson, T., & Perahia, D. (1995) Internal and interfacial dielectric properties of cytochrome c from molecular dynamics in aqueous solutions. Proc. Natl. Acad. Sci. USA 92: 1082-1086. Sternberg, M.J.E., Grace, D.E.P., & Phillips, D.C. (1979) Dynamic informations from crystallography analysis of temperature factors from refinement of the hen egg-white lysozyme structure. J. Mol. Biol. 130: 231-253. Wang, Y., Rader, A.J., Bahar, I., & Jerrigan, R.L. (2004) Global ribosome motions revealed with elastic network model. J. Struct. Biol. 147: 302-314. Wüthrich, K., & Wagner, G. (1975) NMR investigations of the dynamics of the aromatic aminoacid residues in the basic pancreatic trypsin. FEBS Letters 50: 265-268.

193

“INDEX” — 2018/12/6 — 20:43 — page 195 — #1

Index A absorbance 7, 8, 23–25, 87 acylation 11, 12, 18, 20, 22, 26, 69 alkylation 13, 18–23, 26, amidination 12, 23 amphipols 104–106, 108–110, 119, 127, 169, 170 Anfinsen, CB 39, 170 angle de rotation 9, 41, 58 arginine 4–6, 11, 14, 17, 18, 26, 138 arylation 13, 18, 20, 22 asparagine 4–6, 11, 138, 167 aspartate 5, 6, 29, 36, 71, 74, 84, 85, 87, 146, 179, 184, 191 aspartate transcarbamylase 29, 36, 71, 74, 84, 146, 179, 184 ATPase 91, 123

B bactériorhodopsine 106–108, 112, 115, 116, 120, 122, 124, 125 barrière d’énergie 162, 189 base de Schiff 116

BLAST 37, 123, 167, 178, 180 Blobel, G 126 BPTI 179, 186, 187, 190

C canal ionique 108, 109 canaux mécanosensibles 91 carboxypeptidase 58, 61, 74 chaperons moléculaires 156, 158 choc osmotique 146 chromatographie 27, 28, 35, 87 chymotrypsine 45, 60, 69, 71, 72, 139 code génétique 4, 36 coenzyme 59, 71, 74, 85, 190 coefficient molaire d’absorbance 7, 8 collagène 36, 50 constante de Planck 9 constante diélectrique 11, 97, 98, 120, 139, 188 cristallographie 1, 75–77, 87, 107, 108, 110 cryomicroscopie électronique 158, 160 cytosquelette 92, 94, 120

195

“INDEX” — 2018/12/6 — 20:43 — page 196 — #2

La structure des protéines

D décarboxylation oxydative 85 detergents 100–102, 104, 109, 110, 112, 123, 126 diagramme de Ramachandran 42, 44, 132, 133 dichroîsme circulaire 10, 50, 51, 112, 161 diffraction des neutrons 110 diffusion facilitée 90 dihydrolipoamide déshydrogénase 86 dipôle 130, 135, 139 DTNB 24, 25 disprot 73 domaine 2, 37, 56, 60, 67, 69, 70–74, 76, 84, 92, 97, 109, 114–116, 122, 124, 125, 152, 158, 161–163, 166, 181, 184, 190, 191

E élastase 69, 71, 72, 139 électrophorèse 21, 27, 36, 87 électrostriction 145, 146 ellipticité 10, 51 enanthiomère 6 énergie de Gibbs 126, 151 Engelman, DM 127, 170, 171 entropie 141, 142, 155, 189 ergostérol 93, 94 esterification 16

F fluorescence 8, 9, 112, 127, 184, 185, 193

G gap junctions 90 groupe aminé 3, 10, 11, 15 groupe carboxyle 7, 12, 16

196

glutamate 5, 6, 98 glutamine 4–6, 11, 138 glycine 4–6, 17, 36, 49, 50, 179, 189 glycogène phosphorylase 20

H hélice 42, 44, 46–51, 52, 55–59, 62, 73, 99, 104, 108, 113–115, 120–123, 125, 136, 160, 164–168, 176, 178, 179, 180 hème 35, 56, 58, 75, 84, 115, 171, 189, 190 hémoglobine 1, 45, 47, 74, 77, 79, 84, 85, 146, 189, 191 Henderson, R 126, 127 histidine 4–6, 11, 14, 16, 18, 19, 21–23, 74, 138 homosérine 26, 35 hydrophobe 5, 36, 55, 67–69, 89, 93, 96–98, 100–106, 113–117, 120 hydroxyproline 4, 120 hyperthermophile 36

I insuline: 32, 37, 160 interactions de Keesom 130 de Debye 130 de London 130 covalentes 130, 134 électrostatiques 135, 139, 144, 147, 188 hydrophobes 140–142, 158 iodation 19, 21, 22 isoleucine 4–6, 11

K Karplus, M 187, 192 kinases 59, 91

“INDEX” — 2018/12/6 — 20:43 — page 197 — #3

Index

L LDL 92 leucine 4–6, 11, 97, 98 liaison peptidique 10, 31, 36, 37, 41–43 hydrogène 44, 45, 69, 97, 98, 120, 135–138, 141, 142, 175, 177 Linus Pauling 43, 45 lipides membranaires 93, 100, 103 loi de Biot 9 lysozyme 45, 60, 68 , 69, 145, 160, 163, 186, 190, 192, 194

M méthionine 4, 5, 6, 11, 21, 23, 26, 27, 35 microscopie électronique 77, 85, 87, 107–109, 111, 119, 158, 160 microscopie à force atomique 111, 160, 161 myoglobine 45, 56, 58, 68, 77, 163, 178, 186, 189, 190

N Nicolson, GL 127 ninhydrine 14, 15

P paradoxe de Levinthal 151 Pauling, L 43, 45 Perutz, M 76 , 77 phénylalanine 4–8, 11, 138 pK 10, 11, 17, 18, 20, 26, 27, 138 phosphofructokinase 80, 83 phospholipides 93, 94

phosphorylation 20, 36, 92, 114 ponts disulfures 36 pores transmembranaires 91, 112 porines 115, 120, 123, 125 postulat d’Anfinsen 129, 151, 158, 173 potentiel d’action 91 proline 3–6, 11, 36, 42, 44, 46, 47, 49, 50, 179 Protein Data Bank 2, 67, 112 pyrrolysine 4–6 pyruvate deshydrogénase 85, 86

R radiocristallographie 75, 77, 87, 108, 110 RMN 2, 50, 53, 77, 104, 107, 110, 111, 124, 145, 150, 153, 158, 160, 161, 180, 184 , 186, 188, 189 réunions CASP 174, 180 rhodopsine 91 ribonucléase 14, 16, 34, 37, 39, 60, 68, 135, 150, 151–153, 190 ribonucléotide réductase 85

S Sanders, CR 171 sélénocystéine 4–6 sérine 5, 6, 11, 14, 20, 35, 69, 71, 93, 94, 138, 139, 146 Singer, SJ 127 spectrométrie de masse 27, 35, 36, 87, 111, 112 spectroscopie infrarouge 50, 51, 53, 145, 161, 184 spectroscopie Raman, 184, 186 sulfonylation 13 superoxyde dismutase 60, 61, 71 Synthèse peptidique 37

197

“INDEX” — 2018/12/6 — 20:43 — page 198 — #4

La structure des protéines

T taxonomie des protéines 37 thréonine 5, 6, 11, 14, 20, 138 translocon 164–167, 169

198

transport secondaire 91 tryptophane 4–9, 11, 21, 26, 27, 138, 185 tyrosine 4–9, 11, 14, 16, 20–22, 138, 184

“Credits” — 2019/1/12 — 11:53 — page 199 — #1

Crédits photographiques Couverture

Chapitre 7

Reprinted with permission from [Snijder, J., Schuller, J.M., Wiegard, A., Lössl, P., Schmelling, N., Axmann, I.M., Plitzko, J.M., Förster, F. & Heck, A.J.R. (2017) Structures of the cyanobacterial circadian oscillator frozen in a fully assembled state. Science 355: 1181-1184], copyright (2019) AAAS.

Figure 7.3 : Reprinted with permission from [Singer, S. J. & Nicolson, G. L. (1972) The fluid mosaic model of the structure of cell membranes. Science 175: 720-731] copyright (2019) AAAS. Figure 7.4 : Reprinted from [Jakobsson, E. (1997) Computer simulation studies of biological membranes: progress, promise and pitfalls. Trends Biochem. Sci. 22: 339-344], copyright (2018), with the permission from Elsevier. Figure 7.6 : Reprinted from [Nicolson, G.L. (2014) The fluid-mosaic model of membrane structure: still relevant to understanding the structure, function and dynamics of biological membranes after more than 40 years. Biochim. Biophys. Acta 1838: 1451-1466], copyright (2018), with the permission from Elsevier. Figure 7.9 : Reprinted from [Zoonens, M. & Popot, J.-L. (2014) Amphipols for each season. J. Membr. Biol. 247: 759-796], copyright (2018), with the permission from Nature/Springer/Palgrave. Figure 7.10 : Reprinted from [Perlmutter, J.D., Popot, J.-L. & Sachs, J.N. (2014) Molecular dynamics simulations of a membrane protein/amphipol complex. J. Membr. Biol. 247: 883-895], copyright (2018), with the permission from Nature/Springer/Palgrave. Figure 7.11 : Reprinted (adapted) with permission from [Nath, A., Atkins, W.M. & Sligar, S.G. (2007) Applications of phospholipid bilayer nanodiscs in the study of membranes and membrane proteins. Biochemistry

Chapitre 3 Figure 3.14 : Reprinted from [Dalal, S., Balasubramanian, S. & Regan, l. (1997) Transmuting α helices and β sheets. Folding & Design 2: R71], copyright (2018), with the permission from Elsevier. Chapitre 4 Figure 4.2 : Reprinted with permission from [Chothia, C., Levitt, M. & Richardson, M.D. (1977) Structure of proteins: packing of α helices and pleated sheets. Proc. Natl. Acad. Sci. USA 74: 4130-4134], copyright (2018) National Academy of Sciences. Figure 4.4 : Reprinted from [Chothia, C. (1989) Polyhedra for helical proteins. Nature 337(6204): 204-206], copyright (2018), with the permission from Nature/ Springer/Palgrave. Figure 4.5 : Reprinted from [Richardson, J.S., (1977) β-sheet topology and the relatedness of proteins. Nature 265: 498], copyright (2018), with the permission from Nature/Springer/Palgrave.

199

“Credits” — 2019/1/12 — 11:53 — page 200 — #2

La structure des protéines

46: 2059-2069]. Copyright (2018) American Chemical Society.

Biochem. 69: 881-923]. Copyright 2019 Annual Reviews.

Figure 7.12 : Reprinted from [Henderson, R. & Unwin, P.N.T. (1975) Three-dimensional model of purple membrane obtained by electron microscopy. Nature 257: 28-32], copyright (2018), with the permission from Nature/Springer/Palgrave.

Figure 7.23 : Reprinted (adapted) with permission from [POPOT, J.-L. & ENGELMAN, D.M. (1990) Membrane protein folding and oligomerization: the two-stage model. Biochemistry 29: 4031-4037]. Copyright (2018) American Chemical Society.

Figure 7.13 : Reprinted from [Liao, M., Cao, E., Julius, D. & Cheng, Y. (2014) Single particle electron cryomicroscopy of a mammalian ion channel. Curr. Opin. Struct. Biol. 27: 1-7], copyright (2018), with the permission from Elsevier.

Figure 7.24 : Reprinted with permission from [Popot, J.-L. & Engelman, D.M. (2000) Helical membrane protein folding, stability and evolution. Annu. Rev. Biochem. 69: 881-923]. Copyright 2019 Annual Reviews.

Figure 7.15 : Reprinted from [Picot, D., Loll, P.J. & Garavito, R.M. (1994) The X-ray crystal structure of the membrane protein prostaglandin H2 synthase-1. Nature 367: 243-249], copyright (2018), with the permission from Nature/Springer/Palgrave. Figure 7.16 : Reprinted from [McDermott, G., Prince, S.M., Freer, A.A., Hawthornthwaite-Lawless, A.M., Papiz, M.Z., Cogdell, R.J. & Isaacs, N.W. (1995) Crystal structure of an integral membrane light-harvesting complex from photosynthetic bacteria. Nature 374: 517-521], copyright (2018), with the permission from Nature/Springer/Palgrave. Figure 7.17 : Reprinted from [Henderson, R., Baldwin, J.M., Ceska, T.A., Zemlin, F., Beckmann, E. & Downing, K.H. (1990) Model for the structure of bacteriorhodopsin based on high resolution electron cryo-microscopy. J. Mol. Biol. 213: 899-929], copyright (2018), with the permission from Elsevier. Figure 7.18 : Reprinted from [Buchanan, S.K., Smith, B.S., Venkatramani, L., Xia, D., Esser, L., Palnitkar, M., Chakraborty, R., Van der Helm, D. & Deisenhofer, J. (1999) Crystal structure of the outer membrane active transporter FepA from Escherichia coli. Nat. Struct. Biol. 6: 56-63], copyright (2018), with the permission from Nature/Springer/Palgrave.

Chapitre 9 Figure 9.7 : Reprinted from [Wang, J.D. & Weissmann, J.S. (1999) Thinking outside the box were insights into the mechanisms of GroEL mediated protein folding. Nature Struct. Biol. 6: 597-600], copyright (2018), with the permission from Nature/Springer/Palgrave. Figure 9.9 : Reprinted from [Dobson, C.M. (1999) Protein misfolding, evolution and disease. Trends Biochem. Sci. 24: 329-332], copyright (2018), with the permission from Elsevier. Figure 9.12 : Reprinted from [Park, E. & Rapoport, T.A. (2012). Mechanisms of Sec61/SecY-mediated protein trans-location across membranes. Annu. Rev. Biophys. 41: 21-40] Copyright (2019) Annual Reviews. All rights reserved. Figure 9.13 : Reprinted from [Cymer, F., Von Heijne, G. & White, S.H. (2015) Mechanisms of integral membrane protein insertion and folding. J. Mol. Biol. 427: 999-1022], copyright (2018), with the permission from Elsevier.

Figure 7.20 : Reprinted from [Vinothkumar, K.R. (2015). Membrane protein structures without crystals, by single particle electron cryomicroscopy. Curr. Opin. Struct. Biol. 33: 103-114], copyright (2018), with the permission from Elsevier.

Figure 9.14 : Reprinted from [Kleinschmidt, J.H. (2015) Folding of ß-barrel membrane proteins in lipid bilayers Unassisted and assisted folding and insertion. Biochim. Biophys. Acta 1848: 1927-1943], copyright (2018), with the permission from Elsevier.

Figure 7.21 : Reprinted with permission from [Althoff, T., Mills, D.J., Popot, J.-L. & Kühlbrandt, W. (2011) Assembly of electron transport chain components in bovine mitochondrial supercomplex I1III2IV1. EMBO J. 30: 4652-4664]. Copyright © 2018 EMBO.

Figure 9.15 : Reprinted from [Popot, J.-L. (2014). Folding membrane proteins in vitro: A table and some comments. Arch. Biochem. Biophys. 564: 314-326], copyright (2018), with the permission from Elsevier.

Figure 7.22 : Reprinted with permission from [Popot, J.-L. & Engelman, D.M. (2000) Helical membrane protein folding, stability and evolution. Annu. Rev.

200

Figure 7.25 : Reprinted with permission from [Popot, J.-L. & Engelman, D.M. (2000) Helical membrane protein folding, stability and evolution. Annu. Rev. Biochem. 69: 881-923]. Copyright 2019 Annual Reviews.

Figure 9.16 : Reprinted (adapted) with permission from [Popot, J.-L. & Engelman, D.M. (2016)]. Membranes do not tell proteins how to fold. Biochemistry 55: 5-18. Copyright (2018) American Chemical Society.