La biologie cellulaire par les nombres 9782759826155

Cet ouvrage est destiné aux étudiants de licence en sciences de la vie, et constitue un support pédagogique pour les ens

155 61 29MB

French Pages 416 Year 2021

Report DMCA / Copyright

DOWNLOAD FILE

Polecaj historie

La biologie cellulaire par les nombres
 9782759826155

Citation preview

La biologie cellulaire par les nombres

Ron Milo et Rob Phillips Traduit par Amsha Proag Illustré par Nigel Orme

La biologie cellulaire par les nombres

“Cell Biology by the Numbers”, 1st edition (ISBN 9780815345374), by Ron Milo and Rob Phillips was originally published in 2016, all Rights Reserved. Authorised translation from the English language edition published by Garland Science, a member of the Taylor & Francis Group LLC. L'ouvrage « Cell Biology by the Numbers », 1re édition (ISBN 9780815345374), de Ron Milo et Rob Phillips a été initialement publié en 2016, tous droits réservés. Cette traduction est publiée avec l’autorisation de Garland Science, membre de Taylor & Francis Group LLC.

Illustration de couverture : Cellules immunitaires (macrophages humains) observées en microscopie électronique à balayage et colorées pour l’illustration. © Renaud Poincloux (CNRS).

Imprimé en France

ISBN (papier) : 978-2-7598-2506-6 – ISBN (ebook) : 978-2-7598-2615-5 Tous droits de traduction, d’adaptation et de reproduction par tous procédés, réservés pour tous pays. La loi du 11 mars 1957 n’autorisant, aux termes des alinéas 2 et 3 de l’article 41, d’une part, que les « copies ou reproductions strictement réservées à l’usage privé du copiste et non destinées à une utilisation collective » et, d’autre part, que les analyses et les courtes citations dans un but d’exemple et d’illustration, « toute représentation intégrale, ou partielle, faite sans le consentement de l’auteur ou de ses ayants droit ou ayants cause est illicite » (alinéa 1er de l’article 40). Cette représentation ou reproduction, par quelque procédé que ce soit, constituerait donc une contrefaçon sanctionnée par les articles 425 et suivants du Code pénal. © EDP Sciences, 2021

Ce livre est dédié à nos parents, Ada & Igal et Lee & Bob

Partager avec le public le plus large la compréhension des échelles cellulaires, unités du vivant ! Tous les êtres vivants sont constitués d’une ou de milliards de cellules, dont il est essentiel de comprendre le fonctionnement interne car elles représentent les unités de base des organismes. Les recherches en biologie cellulaire couvrent toutes les champs de la biologie, comme par exemple la microbiologie, la biologie du développement, la neurobiologie, l’évolution et l’immunologie, en interaction avec d’autres disciplines comme la biophysique, la biochimie, la statistique et la biologie quantitative, la modélisation, l’intelligence artificielle. Les découvertes en biologie cellulaire intéressent donc un public large. Faire comprendre l’étendue, la diversité, les échelles et l’interdisciplinarité de la biologie cellulaire est un enjeu majeur pour la Société de biologie cellulaire de France. Aider les chercheurs à expliquer avec des mots adaptés leurs recherches à un public élargi et répondre aux attentes de la société est aussi un grand défi afin de promouvoir notre discipline. C’est la raison pour laquelle, la SBCF souhaite s’associer à cet ouvrage qui prend le temps d’expliquer avec des mots simples l’importance des échelles en biologie, afin de permettre aux chercheurs de diffuser leurs découvertes pour que leurs impacts soient mieux appréhendés. Toutes les informations sur la SBCF sont disponibles via ce lien : https://sbcf.fr/ la-sbcf/

Table des matières

Table des Estimations 11 Préface du traducteur 13 Lexique et notations 15 Préface 19 Remerciements 25 Introduction : vers l’intuition numérique en biologie 29 Pourquoi nous devrions nous intéresser aux nombres ? 29 La base de données BioNumbers 32 Comment effectuer des calculs de coin de table 33 Boîte à outils des ordres de grandeur pour la biologie 35 Règles rigoureuses pour des calculs approximatifs 38 La géographie de la cellule 42  Chapitre 1  • La taille et la forme 49 Les cellules et les virus 51 Quelle taille font les virus ? 51 Quelle taille fait une cellule d’E. coli et combien pèse-t-elle ? 56 Quelle taille fait la levure à bourgeon ? 59 Quelle taille fait une cellule humaine ? 62

7

La biologie cellulaire par les nombres

Quelle taille fait un photorécepteur ? 65 Quelle est la gamme des tailles et des formes de cellules ? 69 Quelle taille font les noyaux des cellules ? 72 Quelle taille fait le réticulum endoplasmique ? 75 Quelle taille font les mitochondries ? 79 Quelle taille font les chloroplastes ? 82 Quelle taille fait une synapse ? 84 Les briques qui composent la cellule 88 Quelle taille font les rouages biochimiques de la cellule ? 88 Entre l’ARNm et la protéine, quelle molécule est la plus grande ? 91 Quelle taille fait la protéine moyenne ? 93 Quelle taille font les machines moléculaires impliquées dans le dogme central ? 99 Quelle est l’épaisseur de la membrane cellulaire ? 102 Quelle taille font les filaments intracellulaires ? 106  Chapitre 2  • Concentrations et nombres absolus 113 Comment fabriquer une cellule 116 De quels éléments se compose la cellule ? 116 Quelle est la densité de la cellule ? 119 Quelles sont les concentrations ambiantes en O2 et en CO2 ? 122 Combien de nutriments faut-il fournir dans un milieu de culture ? 128 Quelle est la concentration de cellules bactériennes dans une culture saturée ? 132 Le recensement cellulaire 135 Quel est le pH à l’intérieur de la cellule ? 135 Quelles sont les concentrations des différents ions dans la cellule ? 139 Quelles sont les concentrations des métabolites libres dans la cellule ? 142 Quels sont les lipides les plus abondants dans les membranes ? 147 Combien de protéines y a-t-il dans une cellule ? 152 Quelles sont les protéines les plus abondantes dans une cellule ? 156 Dans quelle mesure l’expression protéique varie-t-elle entre les cellules ? 160 Quelles sont les concentrations des molécules du cytosquelette ? 164 Combien d’ARNm y a-t-il dans une cellule ? 168 Quelle est la proportion relative de protéine et d’ARNm ? 172 Quelle est la composition macromoléculaire de la cellule ? 177 Machines et signaux 181 Quel est l’effectif des facteurs de transcription ? 181 Combien y a-t-il de protéines de signalisation ? 184 Combien de molécules de rhodopsine y a-t-il dans un bâtonnet ? 191 Combien de ribosomes y a-t-il dans une cellule ? 196

8

Table des matières

 Chapitre 3  • Forces et énergies 201 La biologie rencontre la physique 203 Quelle est l’échelle d’énergie thermique et quelle est sa pertinence en biologie ? 203 Quelle est l’échelle d’énergie d’une liaison hydrogène ? 207 Quelle est l’échelle d’énergie associée à l’effet hydrophobe ? 211 Combien d’énergie apportent les photons lors de la photosynthèse ? 213 Comment varie l’entropie lorsque deux molécules forment un complexe ? 216 Quelle force exercent les filaments du cytosquelette ? 219 Quelles sont les limites physiques à la détection par les cellules ? 222 Monnaie et budget énergétiques 228 Combien d’énergie libère l’hydrolyse de l’ATP ? 228 Quelle est l’énergie associée au transfert d’un groupe phosphate ? 232 Combien d’enthalpie libre dégage la combustion du sucre ? 235 Quel est le potentiel redox d’une cellule ? 236 Quelle est la différence de potentiel électrique à travers les membranes ? 243 Quelle est la puissance consommée par la cellule ? 246 Quelle est la relation entre l’activité métabolique et la taille d’une cellule ? 251  Chapitre 4  • Temps et vitesse 255 Les échelles de temps pour les petites molécules 257 Quelles sont les échelles de temps de la diffusion à l’intérieur d’une cellule ? 257 Combien de réactions les enzymes effectuent-elles chaque seconde ? 262 Quel est l’effet de la température sur les vitesses de réaction ? 267 À quelle vitesse fonctionnent les transporteurs membranaires ? 270 Combien d’ions traversent un canal ionique par seconde ? 272 Quel est le temps de renouvellement des métabolites ? 275 Les processus du dogme central 278 Laquelle est la plus rapide, la transcription ou la traduction ? 278 Quel est le temps de maturation des protéines fluorescentes ? 284 À quelle vitesse le protéasome dégrade-t-il les protéines ? 288 À quelle vitesse les molécules d’ARN et les protéines se dégradent-elles ? 291 La dynamique cellulaire 296 À quelle vitesse se propagent les signaux électriques dans les cellules ? 296 Quelle est la vitesse des moteurs moléculaires rotatifs ? 301 Quelles sont les vitesses d’assemblage et de désassemblage du cytosquelette ? 305

9

La biologie cellulaire par les nombres

À quelle vitesse les moteurs moléculaires se déplacent-ils le long d’un filament ? 310 À quelle vitesse les cellules se déplacent-elles ? 315 Le cycle cellulaire 318 Combien de temps une cellule prend-elle pour copier son génome ? 318 Combien de temps durent les différentes étapes du cycle cellulaire ? 322 À quelle vitesse les différentes cellules du corps se renouvellent-elles ? 325  Chapitre 5  • L’information et les erreurs 329 Le génome 331 Quelle est la taille des génomes ? 331 Combien de chromosomes les différents organismes possèdent-ils ? 334 Combien de gènes y a-t-il dans un génome ? 339 À quel point deux personnes sont-elles génétiquement semblables ? 342 Les mutations et les erreurs 345 Quel est le taux de mutation au cours de la réplication du génome ? 345 Quel est le taux d’erreur de la transcription et de la traduction ? 352 Quel est le taux de recombinaison ? 354  Chapitre 6  • Un cabinet de curiosités quantitatif 359 Combien de cellules y a-t-il dans un organisme ? 360 Combien de fois les chromosomes se répliquent-ils à chaque génération ? 365 Combien de copies d’un gène d’ARN ribosomal y a-t-il dans le génome ? 369 Quelle est la perméabilité de la membrane cellulaire ? 372 Combien de photons faut-il pour fabriquer une cyanobactérie ? 376 Combien de virions sont produits lors d’une infection virale ? 378 Épilogue 381 Références 385 Index 407

10

Table des Estimations

Estimation 0‑1 Conversion entre le dalton et le gramme. 36 Estimation 0‑2 Concentration molaire en unités de E. coli. 37 Estimation 0‑3 Relation entre la concentration de soluté et la pression osmotique. 37 Estimation 0‑4 Déterminer le nombre approprié de chiffres significatifs pour présenter une valeur. 41 Estimation 2‑1 Combien d’atomes y a-t-il dans le corps humain ? 117 Estimation 2‑2 Constituants principaux de la cellule. 118 Estimation 2‑3 Quel est le volume d’air requis pour fournir l’oxygène nécessaire à la croissance ? 126 Estimation 2‑4 Quelle est la densité optique correspondant à la concentration standard d’azote dans le milieu de culture ? 130 Estimation 2‑5 Nombre d’ions hydrogène dans une cellule bactérienne à pH=7. 137 Estimation 2‑6 Concentration d’alcool au cours de la fermentation de la levure. 147 Estimation 2‑7 Combien de protéines y a-t-il dans une cellule ? 153 Estimation 2‑8 Proportion de Rubisco parmi les protéines solubles d’une cellule de feuille. 157 Estimation 2‑9 Nombre de molécules d’ARNm dans une cellule. 169 Estimation 2‑10 Proportion de ribosomes dans la masse sèche cellulaire à un taux de croissance proche du taux maximal. 197 Estimation 2‑11 Combien de ribosomes y a-t-il dans un volume cellulaire ? 200

11

La biologie cellulaire par les nombres

Estimation 3‑1 Comprendre la variation de pKa en fonction de la distance de liaison : la compétition énergie-entropie. 206 Estimation 3‑2 Affinité de liaison due à l’effet hydrophobe. 212 Estimation 3‑3 Comment varie le taux d’occupation d’un récepteur situé dans un gradient de concentration ? 228 Estimation 3‑4 Enthalpie libre de l’hydrolyse de l’ATP en conditions physiologiques. 229 Estimation 3‑5 Nombre de protons requis pour maintenir la tension membranaire. 245 Estimation 3‑6 Taux de production d’énergie chez l’humain et la bactérie. 246 Estimation 3‑7 Combien d’ATP requiert la reptation d’une cellule adhérente ? 248 Estimation 4‑1 Relation de Stokes-Einstein et constante de diffusion dans l’eau. 258 Estimation 4‑2 Temps de diffusion d’une protéine à travers la cellule. 260 Estimation 4‑3 Taux d’association kon pour une réaction contrôlée par la diffusion. 265 Estimation 4‑4 Variation de la vitesse pour une augmentation de température de 10 °C. 268 Estimation 4‑5 Proportion de membrane occupée par les transporteurs 270 Estimation 4‑6 Débit caractéristique des ions qui traversent un canal ionique. 274 Estimation 4‑7 Courant caractéristique à travers un canal ionique. 275 Estimation 4‑8 Définition du temps de renouvellement. 277 Estimation 4‑9 Laquelle est la plus rapide, la transcription ou la traduction ? 279 Estimation 4‑10 Quel est le temps de renouvellement des protéines par dégradation active ? 290 Estimation 4‑11 Combien d’énergie requiert la rotation d’un flagelle ? 302 Estimation 4‑12 Le paradoxe de la réplication du génome. 320 Estimation 5‑1 La propension d’une paire de bases à subir une mutation. 347 Estimation 5‑2 Nombre de mutations par génération chez l’être humain. 350 Estimation 6‑1 Nombre de cellules dans le corps humain. 361 Estimation 6‑2 Nombre de réplications chromosomiques par génération chez l’être humain. 366 Estimation 6‑3 Combien faut-il de gènes d’ARNr ? 370 Estimation 6‑4 Temps de fuite d’une molécule neutre à travers la membrane. 375 Estimation 6‑5 Nombre de photons requis pour fabriquer une cyanobactérie. 378 Estimation 6‑6 Proportion du volume cellulaire occupé par des virions en cours de libération. 380

12

Préface du traducteur

Ce livre est une introduction à la biologie quantitative de la cellule. Il aborde les phénomènes biologiques à travers les nombres qui les décrivent, et montre ce que nous pouvons apprendre des processus cellulaires en s’intéressant aux échelles de ces grandeurs que sont la taille, la concentration, l’énergie, la vitesse et l’information. La biologie quantitative est une branche récente des sciences de la vie, et forme depuis peu un domaine d’étude et d’enseignement. Elle bénéfice de l’essor des instruments à haute résolution spatiale et temporelle et des puissants moyens de simulation et d’analyse de données volumineuses. Ces techniques sont présentées au fil des pages, replaçant les mesures dans un contexte expérimental qui permet d’apprécier les solutions astucieuses et les défis qui restent à relever. Le lecteur, la lectrice, trouveront peut-être insolite la structure de l’ouvrage. Cette organisation en rubriques centrées sur une question, mais interdépendantes, vise à la curiosité et à l’autonomie. Il s’agit d’abord que le lecteur découvre, ou redécouvre, la cellule sous un angle quantitatif, en développant une intuition des échelles en jeu et en aiguisant son raisonnement sur les ordres de grandeur. Puis, le but sera atteint si les thèmes abordés l’inspirent à approfondir une question biologique de son choix et à en éclairer la compréhension. Il me semble en effet que c’est dans la démarche active de recherche, de classification et d’interprétation des valeurs que l’on pourra le mieux acquérir l’intuition des nombres, et étoffer ainsi sa connaissance du monde tout à la fois encombré et dynamique de la cellule. Pendant les années que j’ai passées dans des laboratoires de biologie et de physique, j’ai pu observer un intérêt croissant pour les approches quantitatives dans l’étude du vivant. J’ai eu envie de favoriser cette ouverture vers l’interdisciplinarité dès la première année d’université, et l’ouvrage de Ron Milo et Rob Phillips me paraît adapté pour ce rôle.

13

La biologie cellulaire par les nombres

Je souhaite exprimer mes remerciements aux éditions EDP Sciences : à France Citrini pour la volonté de mener ce projet à bien, à Sophie Hosotte pour le suivi de la production, ainsi qu’à toute l’équipe de production. Je remercie également les auteurs pour leur confiance. Je suis reconnaissant à la Société de Biologie Cellulaire de France pour le soutien apporté à cette initiative. Je remercie Corinne Benassayag, Jonathan Fouchard, Arnaud Labrousse, Isabelle Maridonneau-Parini et Christel Moog-Lutz pour leurs encouragements ; Renaud Poincloux pour ses nombreux conseils, ainsi que pour les portraits de macrophages en couverture ; et Denis Hudrisier pour son appui enthousiaste et ses éclaircissements sur les attentes des étudiants et des enseignants. Enfin, je remercie mes parents Ashlékha CallikanProag et Virendra Proag, traductrice et scientifique.

14

Lexique et notations

Lexique Dans cet ouvrage, les ordres de grandeur font référence à la démarche de présenter une valeur numérique avec une précision qui reflète l’incertitude sur la mesure expérimentale dont cette valeur est issue. « L’ordre de grandeur » d’une certaine quantité correspond à sa valeur caractéristique. Par exemple, l’ordre de grandeur du volume de E. coli est 1 µm3 ; on dira aussi que ce volume « est de l’ordre de » 1 fL. Enfin, nous dirons que deux valeurs « diffèrent de n ordres de grandeurs » lorsque l’ordre de grandeur de leur rapport est de 10n. La fonction thermodynamique G, dont la variation mesure le gain énergétique d’un système lors d’une transformation à pression constante, porte le nom d’enthalpie libre. Nous attirons l’attention sur le fait que cette grandeur est parfois appelée « énergie libre » en référence à l’anglais Gibbs free energy. Néanmoins, l’énergie libre désigne une grandeur thermodynamique distincte (que les Anglophones appellent en l’occurrence Helmholtz free energy) et nous désignerons donc ici systématiquement G par le nom d’enthalpie libre. La « tension » désigne deux grandeurs physiques distinctes. La tension électrique (voltage) entre deux points de l’espace est la différence entre leurs potentiels électriques : elle s’exprime en volts. La tension superficielle (surface tension) mesure l’énergie requise par unité de surface pour maintenir en contact des corps qui présentent une répulsion. Ces deux grandeurs sont à l’œuvre dans le comportement des bicouches lipidiques : la tension électrique est liée aux différences de concentrations ioniques de part et d’autre de la membrane ; la tension superficielle se manifeste comme une résistance mécanique à la déformation, par exemple dans un processus d’endocytose ou de protrusion.

15

La biologie cellulaire par les nombres

L’expression générique « force motrice » (driving force) sera employée pour décrire l’origine d’un phénomène de mise en mouvement, comme une différence de concentrations qui provoque un écoulement, d’une tension électrique qui occasionne un courant, d’une différence de température source de convection, etc. Il s’agit plutôt d’une description commode de la cause d’un retour à l’équilibre, qu’une grandeur bien définie. En particulier, sa dimension et ses unités dépendent du contexte.

Notations Pour faciliter la lecture, les chiffres des milliers, des millions, etc. seront séparés du chiffre suivant par une espace, ainsi : 105 = 100 000 et 106 = 1 000 000. Les décimales seront indiquées par un point et la notation scientifique s’écrira de manière équivalente 6.02×1023 ou 6.02e23.

Conversions On rappelle les préfixes usuels : – kilo (k) : 103 ; méga (M) : 106 ; giga (G) : 109 ; téra (T) : 1012 ; péta (P) : 1015 ; – milli (m) : 10–3 ; micro (µ) : 10–6 ; nano (n) : 10–9 ; pico (p) : 10–12 ; femto (f) : 10–15. NB : 1 µm se dit 1 « micron », le « micromètre » étant un instrument de mesure. La comparaison des différentes échelles est au cœur de la biologie quantitative. Aussi, il est essentiel de s’entraîner à manipuler ces préfixes afin de faciliter la voie à l’intuition des échelles mises en jeu dans la cellule. Ainsi : – 1 millimètre = 1 mm = 10–3 m = 10–6 km = 103 µm = 106 nm ; – 1 micron carré = 1 µm2 = (1 µm)2 = (10–6 m)2 = 10–12 m2 ; – 1 micron cube = 1 µm3 = (1 µm)3 = (10–6 m)3 = 10–18 m3.

Unités Les unités de mesure récurrentes dans cet ouvrage sont les suivantes. 1 mole, notée 1 mol, est une unité sans dimension permettant de se passer de puissances de 10 élevées dans les mesures relatives aux composants élémentaires de la matière. 1 mol d’entités (atomes, molécules...) correspond à NA entités. NA, le nombre d’Avogadro, vaut ≈ 6.02×1023 et correspond au nombre d’atomes contenus dans un gramme d’hydrogène.

16

Lexique et notations

1 Å = 1 Ångström = 0.1 nm. 1 L = 1 litre = 1 dm3 = 10–3 m3 ; 1 µL = 1 mm3 ; 1 fL = 1 µm3. 1 M = 1 mol/L. 1 Da = 1 dalton = 1 g/mol correspond à la masse d’un atome d’hydrogène. La densité d’un corps (par rapport à l’eau) est sans dimension. Elle est le rapport de la masse volumique du corps à celle de l’eau. Les unités de temps sont les unités communes : 1 h = 60 min = 3 600 s. Les fréquences, ou le nombre d’événements qui se produisent par unité de temps, seront exprimées en s–1, min–1, h–1 : par exemple, la dégradation de 10 protéines par seconde correspond à une fréquence de 10 s–1. De plus, 1 Hz = 1 hertz = 1 s–1. 1 N = 1 newton = 1 kg⋅m/s2. 1 V = 1 volt est l’unité de potentiel électrique et de tension (différence de potentiel). 1 W = 1 watt = 1 N⋅m/s = 1 V⋅A. 1 J = 1 joule = 1 N⋅m = 1 W⋅s = 1 C∙V. Les longueurs de séquences seront notées : – pour un acide nucléique double-brin : 1 pb = 1 paire de bases ; on utilisera, à l’aide des préfixes ci-avant, 1 kpb = 103 pb ; 1 Mpb = 106 pb, 1 Gpb = 109 pb ; – pour un acide nucléique simple-brin : 1 nt = 1 nucléotide ; – pour un polypeptide ou une protéine : 1 aa = 1 acide aminé.

17

Préface

« Je dis souvent que, si vous pouvez mesurer ce dont vous parlez et l’exprimer en nombres, vous savez quelque chose de votre sujet ; mais si vous ne pouvez pas le mesurer, si vous ne pouvez pas l’exprimer en nombres, vos connaissances sont d’une pauvre espèce et bien peu satisfaisantes ; ce peut être le commencement de la connaissance, mais vous vous êtes à peine, dans vos pensées, avancés vers la Science, quel que puisse être le sujet. » William Thomson (Lord Kelvin) 1

Bien que Lord Kelvin n’ait pas eu conscience des avancées que l’on peut faire en regardant des bandes sur des gels sans avoir recours à des nombres, sa philosophie quantitative, quoiqu’un peu exagérée, attire l’attention sur les bénéfices potentiels de l’intuition numérique en biologie. Les sciences quantitatives partenaires de la biologie, comme la chimie et la physique, ont traditionnellement valorisé les données quantitatives classifiées et centralisées. Qu’il s’agisse de données astronomiques qui décrivent les mouvements des planètes ou des conductivités thermiques et électriques des matériaux, les nombres eux-mêmes constituent un élément central du contexte factuel et conceptuel de ces disciplines. En effet, le simple acte de chercher pourquoi certaines grandeurs ont les valeurs qu’elles ont s’avère souvent être le moteur de la découverte.

1.  Thomson (1893)

19

La biologie cellulaire par les nombres

Il nous semble que l’époque est propice à un effort semblable en biologie, afin d’établir des affirmations définitives concernant les valeurs des principales grandeurs qui décrivent la vie des cellules. L’une des missions centrales de notre livre est de servir de point d’entrée dans le monde des nombres qui caractérisent la biologie cellulaire, et d’inviter le lecteur à l’explorer. Les lecteurs auxquels nous nous adressons vont des chercheurs chevronnés qui veulent simplement trouver les valeurs les plus à jour d’une grandeur d’intérêt, aux étudiants qui souhaitent des compléments à leurs cours d’introduction. Dans les pages qui suivent, nous proposons plusieurs dizaines de rubriques, dont chacune examine des grandeurs qui nous aident à réfléchir aux tailles, aux concentrations, aux énergies, aux vitesses, à la quantité d’information ainsi qu’à d’autres grandeurs-clés qui décrivent le monde du vivant. Cependant, notre histoire ne se réduit pas à fournir une compilation de nombres biologiques d’intérêt. Nous avons tenté de trouver un équilibre entre l’objectif de présenter les données elles-mêmes et celui de proposer un raisonnement à partir de ces nombres, en particulier à l’aide d’estimations simples qui servent de tests de cohérence et recèlent parfois des surprises. Chaque rubrique présente deux manières de penser la biologie cellulaire par les nombres. D’une part, nous essayons de rassembler les nombres relatifs à une structure ou un phénomène biologiques particuliers. D’autre part, nous proposons de réfléchir à ces nombres afin de comprendre ce qui détermine leurs valeurs et ce que ces valeurs peuvent avoir comme répercussions biologiques. Nous nous inspirons des fameux « problèmes de Fermi », rendus célèbres en raison des estimations simples faites par Enrico Fermi sur des sujets allant du nombre d’accordeurs de piano dans une grande ville aux avantages d’avoir des fenêtres à double vitrage pour l’isolation thermique en hiver. Nous nous intéressons à l’intuition que l’on peut développer à partir d’une biologie par ordres de grandeur à la façon de Fermi, suivant laquelle l’estimation d’un ordre de grandeur permet de vérifier la cohérence de notre compréhension des phénomènes biologiques. Lorsque nos lecteurs arrivent à la page où se trouve l’entrée qu’ils cherchent, que ce soit la vitesse de traduction de l’ARN ou le nombre de gènes de leur organisme favori, nous avons voulu leur proposer une rubrique qui soit à la fois didactique, divertissante et surprenante. Plutôt qu’une présentation aride des nombres tels qu’énumérés dans nos nombreux tableaux, chaque rubrique est, pour nous, l’occasion de raconter une histoire qui nous a attirés et qui se rapporte au sujet. Nous considérons notre livre comme un complément quantitatif des manuels classiques de biologie moléculaire et cellulaire et une source d’enrichissement pour des cours d’introduction et de perfectionnement. L’objectif est de fournir une composante quantitative qui est, pour nous, une approche complémentaire importante pour appréhender et organiser la réalité biologique. Nous pensons que connaître la mesure des choses est une façon puissante et alternative d’atteindre une perception intuitive des organismes et de leur vie intérieure. Une autre raison d’écrire ce livre est issue de notre propre recherche. Nous avons souvent besoin de faire des analyses « rapides et grossières » pour estimer des échelles de temps, de vitesse, d’énergie ou d’autres paramètres biologiques intéressants afin de vérifier si une observation ou une affirmation est plausible. La difficulté est de le faire rapidement. Chercher des nombres-clés en biologie sur Internet, ou en

20

Préface

feuilletant des manuels, est laborieux, dans le meilleur des cas, et souvent futile. Il est fréquent que, même après des heures de recherche, l’on se retrouve soit avec aucun résultat du tout, soit avec une valeur dissociée des conditions expérimentales de sa mesure, ce qui ne donne, en conséquence, aucune idée de l’incertitude et de la variabilité des valeurs rapportées. Nous aspirons à une biologie qui puisse revendiquer le même genre de cohérence dans ses données que ce qu’illustre la figure P-1, qui montre comment au début du XXe siècle une multitude de méthodes différentes ont conduit à un ensemble étonnamment cohérent de valeurs du nombre d’Avogadro. Bien qu’en biologie l’on ne mesure pas souvent des constantes telles que le nombre d’Avogadro, l’usage de différentes méthodes pour mesurer la même quantité devrait néanmoins conduire à des résultats semblables pour des conditions environnementales identiques. L’une des idées récurrentes du premier chapitre est qu’en premier lieu, on a besoin de reproductibilité pour pouvoir identifier des régularités. C’est lorsque les scientifiques ont confiance en ces régularités qu’il leur est possible d’identifier les anomalies. Aussi bien les régularités que les anomalies ouvrent la voie à de nouvelles découvertes scientifiques.

 Figure P-1   Les nombreuses mesures du nombre d’Avogadro. Dans son livre « Les atomes », le physicien français Jean Perrin a recensé treize manières distinctes de dénombrer les atomes et était fier, à juste titre, de la cohérence de l’image du monde qui émergeait d’approches si différentes (Perrin 1913).

Notre vision est que nous avons besoin d’une sorte d’aide-mémoire pour la biologie, exactement comme ceux que nous avions au lycée pour les constantes physiques et chimiques. Nous espérons que ce livre servira de grande antisèche ou de petit formulaire de référence, comme ceux utilisés par les ingénieurs, les physiciens... Marc Kirschner, qui dirige le département de biologie des systèmes à l’université

21

La biologie cellulaire par les nombres

Harvard, a comparé la pratique de la biologie sans connaître les ordres de grandeur, à l’apprentissage de l’histoire sans connaître la géographie. Notre objectif est que ce livre soit pour nos lecteurs un atlas utile des nombres biologiques importants, renforcé par des fiches qui replacent ces nombres dans leur contexte. Nous sommes bien conscients du fait que la liste particulière des thèmes que nous avons choisi de détailler est subjective, et que d’autres auraient fait des choix différents. Nous avons limité nos rubriques aux études de cas qui correspondent à nos intérêts communs et aux thèmes où nous pensions soit en savoir assez, soit pouvoir en apprendre assez pour tenter une première caractérisation de l’état de l’art de la quantification de ces questions biologiques. Dans les pages qui suivent, l’organisation des diverses grandeurs se fonde sur environ cinq axes physiques différents, plutôt que le contexte biologique. Tout d’abord, nous présentons l’état d’esprit et les méthodes sur lesquels repose le reste du livre, en détaillant la raison pour laquelle, selon nous, il faut s’intéresser aux nombres rapportés ici. Nous exposons ensuite les méthodes pour réaliser des calculs de coin de table pertinents, ainsi que des règles simples sur l’usage des chiffres significatifs dans l’écriture des résultats. Puis, nous commençons le recensement « par les nombres » proprement dit en examinant la taille des objets de la biologie cellulaire. S’ensuivent de nombreuses rubriques dont le but est de nous dire combien il existe d’exemplaires des diverses structures d’intérêt. Ce type de recensement biologique devient de plus en plus important à mesure que nous essayons de comprendre les relations biochimiques qui composent les nombreuses voies découvertes dans les cellules. Le troisième axe s’intéresse aux échelles de force et d’énergie. Les vitesses des processus biologiques forment la substance du quatrième chapitre du livre, suivies des différentes manières d’appréhender la quantité d’information des cellules. Comme souvent en biologie, notre effort humain de catégorisation rationnelle ne parvient pas à rendre compte de l’appétit insatiable de la Nature pour la diversité : le dernier chapitre est donc un cabinet de curiosités regroupant certains de nos exemples favoris qui n’entrent pas dans les chapitres précédents. À mesure que notre projet évoluait, il nous est apparu de plus en plus clairement que la progression que nous avons choisie est associée à une hiérarchie dans l’exactitude. Par exemple, le premier chapitre traite de la taille des composants de la cellule : ces connaissances, mûres et relativement précises, sont issues de la biologie structurale moderne, appuyée par les nombreux systèmes de microscopie. Notre deuxième chapitre sur le recensement cellulaire augmente en difficulté : en effet, plusieurs des nombres que nous rapportons viennent de la littérature scientifique très récente, dont certains travaux montrent que l’étalonnage de différentes méthodes telles que les techniques de fluorescence et celles fondées sur des anticorps ne sont pas tout à fait cohérentes. Le chapitre 3, qui traite des échelles d’énergie de divers processus à l’intérieur de la cellule, bute sur des défis importants, comme l’ambiguïté de la définition des grandeurs elles-mêmes. Nous avons réfléchi longtemps à la manière de mettre à l’écrit les incertitudes associées aux valeurs recueillies dans la littérature. La convention que nous suivons, quant au nombre de chiffres significatifs à utiliser pour cela, est récapitulée dans le chapitre d’introduction. Nous avons l’espoir que

22

Préface

l’attention portée à cette question d’hygiène quantitative sera reprise par les étudiants et les chercheurs en biologie. L’approche que nous adoptons ici, consistant à « jouer » avec les nombres, a plusieurs sources d’inspiration. Parmi nos préférées, que nous encourageons vivement nos lecteurs à consulter, se trouvent : Guesstimation (Weinstein, Adam 2008), les deux livres de « Soit une vache sphérique » (Harte 1998) et « Soit une vache cylindrique » (Harte 2001), « La physiologie par les nombres » (Burton 2000) et « La biologie par les nombres » (Burton 1998), « Pourquoi les grands animaux féroces sont peu nombreux » (Colinvaux 1979) et les superbes livres « Mathématiques pour le combat de rue » (Manahan 2010) et « L’art de l’intuition en sciences et technologie : comment maîtriser la complexité » (Manahan 2014). Nous sommes également de grands amateurs des notes de cours et des exercices de Peter Goldreich, Dave Stevenson et Stirl Phinney sur « La physique des ordres de grandeurs » 2. Ce que toutes ces sources ont en commun, c’est le plaisir de jouer avec des nombres tout en démontrant l’utilité. Certains aspects de nos rubriques sont adaptés des exemples donnés dans ces livres, et si nous réussissons à inspirer nos lecteurs autant que ceuxlà nous ont inspirés, alors notre livre sera un succès.

2.  P. Goldreich, D. Stevenson & S. Phinney, « Order of Magnitude Physics ».

23

Remerciements

Dans l’écriture d’un livre tel que celui-ci, ce qui apporte un vrai plaisir est l’ensemble des nombreuses interactions profondes et stimulantes que nous avons pu avoir avec nos collègues. La plus importante de ces interactions est notre longue collaboration avec Nigel Orme, notre illustrateur. Nous espérons que nos lecteurs se rendront compte que le simple fait de réfléchir à la manière de représenter un phénomène biologique peut conduire à une découverte concernant le fonctionnement des systèmes vivants. C’est dans le même esprit que cette observation faite par Darwin dans son autobiographie : en l’occurrence, qu’en formulant mathématiquement ses pensées, l’on voit des relations qui sont complètement invisibles lorsqu’elles sont exprimées dans un langage verbal. Lorsque nous traduisons soigneusement nos pensées dans un langage visuel, cela nous révèle de nouvelles manières de comprendre la biologie. Nigel Orme nous a permis de clarifier nos pensées, d’améliorer notre communication, et de mieux comprendre le monde dans lequel nous vivons. Nous sommes aussi profondément reconnaissants à Uri Moran, qui a fait preuve d’un dévouement exceptionnel en parcourant un vaste corpus de ressources scientifiques et en fouillant la bibliographie à la recherche des nombres essentiels pour que ce livre ait une pertinence scientifique. Il a supporté les nombreuses itérations portant sur les rubriques et même les différentes versions successives du livre, et nous a patiemment guidés grâce à son érudition et sa tranquillité. De nombreuses âmes charitables ont lu le livre en entier et nous ont fait part de leurs remarques, suggestions, critiques et encouragements. Ce groupe se compose d’Olaf Andersen, David Bensimon, Maja Bialecka-Fornal, Ian Booth, Dennis Bray, Rachel Brockhage, Avantika Lal, Molly Phillips, Rahul Sarpeshkar et Carolina Tropini. Nous sommes profondément reconnaissants à eux tous pour leurs retours instructifs et approfondis, qui ont modifié et amélioré substantiellement notre livre.

25

La biologie cellulaire par les nombres

D’autres courageux explorateurs de notre manuscrit ont émis des commentaires importants, parmi lesquels Niv Antonovsky, Wilfredo Ayala-López, Uri Barenholz, Bill Broadhurst, Robert Endres, Arren Bar Even, Wayne Fagerberg, Shai Fuchs, Akira Funahashi, Noriko Hiroi, lan Kay, Stefan Klumpp, Tetsuya Kobayashi, Jenny Koenig, Patricia Marsteller, Stephen Martin, Steve Quake, Doug Rees, Maya Shamir et Zhanchun Tu. Bien sûr, il est clair que les erreurs de contenu ou de raisonnement restent de notre propre responsabilité. La plupart des thèmes présentés ici ont constitué le contenu de plusieurs cours que chacun d’entre nous a assurés. Les retours que nous avons reçus de la part de nombreux étudiants a été une source de motivation, et nous avons apprécié leur disposition à servir de cobayes alors que nous développions les idées que nous présentons ici. Il s’agit des participants aux cours de Biologie cellulaire par les nombres de 2009 à 2015 au Weizmann Institute of Science, à l’institut Caltech et au Cold Spring Harbor Laboratory. Nous avons eu la formidable chance de pouvoir travailler ensemble pendant les dernières sept années. Nous sommes reconnaissants à Elliot Meyerowitz, qui fut notre entremetteur et reconnut le potentiel d’une collaboration scientifique entre deux esprits frères, malgré 12 000 km de distance et 10 heures de décalage horaire. Jon Widom a été une source permanente de soutien et de stimulation au cours des phases initiales de notre projet. Une autre source de soutien extrêmement importante, dont on ne peut sous-estimer l’impact, est le soutien financier requis pour mener à bien une entreprise telle que le site Internet BioNumbers et le livre qui en a émergé. Le Director’s Pioneer Award du NIH d’un côté de l’Atlantique et le Conseil européen de la recherche de l’autre côté ont fourni le soutien indispensable aux laboratoires des auteurs, ce qui a rendu ce livre possible. Le Donna and Benjamin M. Rosen Bioengineering Center à Caltech, sous l’excellente direction de Niles Pierce et Frances Arnold, a constitué une source de soutien généreux et constant, qui a servi à financer de nombreuses parties critiques de ce projet et qui a nous a permis de fournir des exemplaires gratuits à tous ceux qui sont moins favorisés que des chercheurs bien soutenus. Le développement du site Internet BioNumbers doit beaucoup à la vision, la générosité et l’expertise de Paul Jorgensen, Marc Kirschner, Daniel Kreiter, Ben Marks, Mason Miranda, Uri Simhony, Mike Springer et Becky Ward. Nous sommes également profondément reconnaissants à l’équipe de Garland Science qui nous a accompagnés dans cette aventure, avec des remerciements particuliers à Summers Scholl pour son soutien constant pour le projet, à Natasha Wolfe, éditrice de production experte, et à John Murdzek pour avoir amélioré la lisibilité et la précision de notre livre par son travail de correction. Les membres de notre conseil scientifique sont nombreux et distingués. Ces amis nous ont généreusement fait part de leurs réflexions concernant des sujets allant de la taille des synapses aux limites physiques des sens, en passant par la régulation de la taille du noyau. Nous exprimons notre reconnaissance à Yaarit Adamovich, Noam Agmon, Ariel Amir, Shira Amram, Tslil Ast, David Baltimore, Naama Barkai, Scott Barolo, Mark Bathe, Nathan Belliveau, Danny Ben-Zvi, Howard Berg, Michael Brenner, James Briscoe, Jan Brugués,

26

Remerciements

Tabita Bucher, Richard Burton, Michael Clague, Bil Clemons, Adam Cohen, Athel Cornish-Bowden, Peter Curtin, Dan Davidi, Avigdor Eldar, Yuval Eshed, Daniel Fisher, Avi Flamholtz, Sarel Fleishman, Dan Fletcher, Michael Gliksberg, Dani Gluck, Matthew Good, Talia Harris, Yuval Hart, Elizabeth Haswell, Peter Henderson, Hermann-Georg Holzhütter, Joe Howard, KC Huang, Shalev Itzkovitz, Grant Jensen, Daniel Koster, Eric Lander, Michael Laub, Heun Jin Lee, Avi Levy, Wendell Lim, Jennifer Lippincott-Schwartz, Jeff Marlow, Wallace Marshall, Sarah Marzen, Markus Meister, Joe Meyerowitz, Lishi Mohapatra, Phil Mongiovi, Daniel Needelman, Ronny Neumann, Tom O’Halloran, Victoria Orphan, Linnaea Ostroff, Michal Perach, Matthieu Piel, Tzachi Pilpel, Rami Pugatch, Tobias Reichenbach, Joel Rothman, Michael Roukes, James Saenz, Dave Savage, Elio Schaechter, Declan Schroeder, Oren Schuldiner, Maya Schuldiner, Eran Segal, Pierre Sens, Joshua Shaevitz, Tom Shimizu, Tomer Shlomi, Alex Sigal, Thomas Simmen, Victor Sourjik, Todd Squires, Lucia C. Strader, Lubert Stryer, Arbel Tadmor, Amos Tanay, Dan Tawfik, Julie Theriot, Elitza Tocheva, Katja Tummler, Antoine van Oijen, Alexander Varshavsky, Doug Weibel, Talia Weiss, Irving Weissman, Jeremy Young, Yossi Yovel et Jesse Zalatan. Nous souhaitons remercier les sociétés et maisons d’éditions suivantes pour avoir accordé leur autorisation à l’adaptation et à la republication du contenu des figures suivantes : l’American Association for the Advancement of Science pour les figures 1-16, 2-7, 2-9, 2-18, 2-22, 2-24, 2-27, 3-18, 4-12, 4-37, 4-44, 5-4 et 5-10 ; l’American Chemical Society pour la figure 1-25 ; l’American Institute of Physics pour la figure 3-2 ; l’American Physical Society pour la figure 3-14 ; l’American Society for Biochemistry and Molecular Biology pour la figure 2-14 ; l’American Society for Cell Biology pour les figures 1-19 et 1-23 ; l’American Society for Microbiology pour les figures 1-14, 2-34 et 4-13 ; l’Association for Research in Vision and Ophthalmology pour la figure 2-37 ; la Bibliothèque de Genève pour la figure 2-2 ; les éditions Elsevier pour les figures 1-2, 1-5, 1-22, 1-26, 1-47, 2-21, 2-31, 2-35, 2-42, 4-2, 4-4, 4-14, 4-16, 4-24, 4-31, 4-34, 4-36, 4-38, 4-39, 4-46, 5-12, 6-2 et 6-9 ; les éditions John Wiley & Sons pour les figures 1-12, 2-38, 2-43, 3-13, 4-18, 4-27 et 4-32 ; les éditions Macmillan pour les figures 1-6, 1-24, 1-29, 1-31, 2-13, 2-16, 2-19, 2-20, 2-29, 3-5, 3-10, 3-17, 4-30, 4-41, 5-8, 5-9, 6-3 et 6-4 ; la National Academy of Sciences pour les figures 1-3, 1-20, 1-41, 2-6, 2-10, 2-15, 2-17, 2-36, 3-9, 3-19 et 6-6 ; la Royal Society of Chemistry de Londres pour la figure 4-17 ; les presses de l’université Rockefeller pour la figure 1-46 ; la Society for General Microbiology de Londres pour la figure 2-11 ; les éditions Springer pour les figures 1-21 et 2-12 ; et le Natural History Museum de Londres pour la figure 1-15. Au-delà des aspects scientifiques, nous avons reçu le soutien de Yoram Adler, Uri Alon, Efrat Binya Talmi, Efrat Cohen, Hernan Garcia, David Goodsell, Alon Gildoni, Alex Kizin, Jane Kondev, Ronen Levi, Yael Milo, Elad Noor, Daniel Ramot, Richard Sever et Julie Theriot. Une longue tradition veut que les remerciements se terminent par la famille. Il y a bien sûr une raison à cela. Bien que l’acte d’écrire enrichisse la vie de ceux qui

27

La biologie cellulaire par les nombres

écrivent des livres, ils savent qu’il existe autre chose de bien plus important : il s’agit de nos proches. Nous accordons tous deux une place très importante à nos familles, et nous sommes profondément reconnaissants à nos compagnes, Hilla et Amy, à nos parents, Ada et Igal Milo et Lee Cudlip et Bob Phillips, et à nos enfants, Geffen, Yaara et Rimon et Molly et Casey, pour toute la magie qu’ils mettent dans nos vies.

28

Introduction : vers l’intuition numérique en biologie

« … dans les années qui suivirent, j’ai profondément regretté de n’avoir pas été assez loin pour comprendre au moins quelque chose aux grands principes des mathématiques, car ceux qui en sont capables possèdent un sens supplémentaire. » Charles Darwin 3

Pourquoi nous devrions nous intéresser aux nombres ? Cette introduction prépare le terrain pour les actes qui se déroulent dans les chapitres suivants. Si vous avez une envie pressante de trouver un nombre dès maintenant, vous pouvez sauter à n’importe quelle rubrique du livre et revenir plus tard à ce chapitre, qui présente à la fois la logique d’ensemble et les outils fondamentaux qui visent à forger une intuition numérique en biologie. Chacune des ≈102 rubriques 3.  Darwin (1887)

29

La biologie cellulaire par les nombres

du livre peut être lue comme une réponse indépendante à une question quantitative portant sur la biologie cellulaire par les nombres. La structure formelle pour le reste du livre est organisée en fonction de différentes classes de nombres biologiques, allant des tailles des objets (chapitre 1) aux règles quantitatives de gestion de l’information chez les organismes vivants (chapitre 5), en passant par toute la gamme des concepts intermédiaires. Ce chapitre introductif, volontairement généraliste, plaide pour l’intuition numérique et indique comment y arriver à l’aide d’estimations simples. Nous nous intéressons également à la manière de manipuler correctement l’incertitude qui provient des mesures biologiques autant que des estimations. Nous nous fondons sur les principes développés dans les sciences physiques, où les estimations et les incertitudes sont monnaie courante, tandis qu’il nous faut les adapter au désordre inhérent aux systèmes biologiques. Que gagne-t-on à adopter le point de vue numérique en biologie, ou ce que nous avons appelé « la biologie cellulaire par les nombres » ? On peut répondre à cette question de plusieurs points de vue. Par exemple, on peut tout d’abord faire appel aux nombreux exemples historiques où c’est la dissection quantitative d’un problème donné qui a fourni la clé à sa solution finale. Les exemples abondent, qu’il s’agisse des découvertes classiques en génétique qui ont abouti à la cartographie du génome de la drosophile par Sturtevant, ou des découvertes des lois quantitatives qui régissent la dynamique des impulsions nerveuses par Hodgkin et Huxley. Plus récemment, la précision des questions formulées d’un point de vue quantitatif a permis d’approfondir les limites à la transmission de l’information biologique dans des processus allant du chimiotactisme bactérien au développement embryonnaire, et a aidé à établir la nature de la machinerie biologique de correction d’erreurs, qui permet de recopier le matériel génétique avec une fidélité plus élevée que ce que prévoit la thermodynamique seule 4. Deuxièmement, l’intuition numérique prend toute son importance dans le fait que la formulation quantitative d’un phénomène biologique donné nous permet d’établir des affirmations précises et falsifiables permettant d’expliquer comment ça marche. Plus précisément, l’état de l’art des mesures biologiques commence à atteindre un tel point de reproductibilité, de précision et d’exactitude, que nous pouvons déceler les anomalies entre les attentes théoriques et les mesures, ce qui permet de dévoiler des phénomènes nouveaux et inattendus. De plus, l’intuition numérique en biologie confère aux scientifiques « un sens supplémentaire », pour reprendre les mots de Darwin lui-même, un sens qui permet de décider si une affirmation biologique est vraiment cohérente. Autrement dit, avec toute science, au début, l’emphase est mise sur l’élucidation des faits principaux de la discipline. Par exemple, en astronomie, ce n’est qu’à la lumière de techniques avancées d’observation à l’œil nu par Tycho Brahe que l’orbite de Mars fut suffisamment bien comprise pour pouvoir élucider des faits centraux, par exemple que l’orbite de Mars autour du Soleil suit une trajectoire elliptique dont le Soleil est l’un des foyers. Mais la

4.  Certains de ces exemples se trouvent dans notre article sur « l’intuition des nombres en biologie » (Phillips, Milo, 2009). (Note des auteurs – NdA. Les autres notes sont du traducteur.)

30

Introduction : vers l’intuition numérique en biologie

maturité de tels faits s’accompagne d’un nouvel impératif théorique, à savoir, celui d’expliquer ces faits à partir d’un certain cadre théorique. Par exemple, dans le cas des orbites elliptiques des planètes, l’idée géniale fut de comprendre comment les propriétés des orbites planétaires étaient la conséquence naturelle de la loi de la gravitation en carré inverse de la distance. Nous pensons que la biologie a aujourd’hui atteint un point où suffisamment de faits quantitatifs solides ont été accumulés pour que cette discipline aussi puisse chercher à rassembler ces faits à travers des principes généraux exprimés sous forme mathématique, qui puissent alors servir de théorie pour expliquer ces faits et indiquer les anomalies lorsqu’elles se produisent. Dans les chapitres qui suivent, nous compilons de tels faits biologiques, souvent avec une emphase qui appelle de nouveaux genres d’analyse théorique. Une autre manière de penser à cette quête de l’intuition numérique en biologie est d’imaginer une certaine forme de vie extraterrestre qui arrive sur Terre et souhaite savoir à quoi ressemblent notre société et notre vie quotidienne. Par exemple, si nous imaginions pouvoir donner au visiteur extraterrestre un ouvrage simple, quel ouvrage pourrait s’avérer le plus utile ? Bien que différents lecteurs puissent proposer différentes idées, notre suggestion préférée serait le rapport du l’Institut des statistiques qui détaille toute une série de données, des revenus à l’âge au mariage en passant par le niveau d’éducation et les distributions d’habitants à la ville et à la campagne. L’ONU rend publiques de telles statistiques sur son site Internet 5. Hans Rosling a pu faire sensation sur Internet avec les approches intelligentes et intéressantes qu’il a trouvées non seulement pour organiser les données, mais également pour en extraire des significations inattendues. Notre but est de fournir un rapport du genre de celui de l’Institut des statistiques pour la cellule, et d’essayer de trouver le sens caché et inattendu dans l’économie et la géographie de la cellule. Pour illustrer le genre d’informations étonnantes qui peuvent émerger de cet exercice, nous demandons à notre lecteur de se joindre à nous en comparant les protéines, les vrais chevaux de labour de la cellule, et leur « plan de construction », c’est-à-dire l’ARN messager. Demandez-vous rapidement : qu’est-ce qui est plus grand, le plan ou l’objet construit à partir du plan ? Notre intuition se représente souvent le plan d’un grand monument et il est tout de suite évident que le plan est un schéma minuscule et aplati du bâtiment dont il constitue le « code ». Qu’en est-il pour l’ARNm et la protéine ? Que vous dit votre intuition sur la taille relative de ces deux molécules ? Comme nous le montrerons, l’intuition de la plupart des gens est très éloignée de la taille sensiblement plus grande de la molécule d’ARNm par rapport à la protéine qu’elle code. Cette conclusion n’est pas sans conséquences, par exemple pour savoir s’il est plus facile de transporter le plan ou la machine que code ce plan. En conclusion, nous avons également beaucoup d’espoir qu’un jour, les anomalies numériques en biologie jouent de plus en plus le rôle d’un générateur de découverte. Plus les données expérimentales qui caractérisent une discipline mûrissent

5. https://unstats.un.org/unsd/default.htm

31

La biologie cellulaire par les nombres

et deviennent reproductibles à l’aide de méthodologies distinctes, plus il devient possible de demander de manière fiable si un résultat donné est anormal. Jusqu’aux travaux de David Keeling dans les années 1950, l’on ne pouvait même pas se mettre d’accord sur la quantité de CO2 dans l’atmosphère, et encore moins déterminer si elle variait. Ce n’est qu’une fois que Keeling fut parvenu à évaluer les variations périodiques de CO2 au cours d’une année, que l’on pouvait commencer à étudier la question des petits changements globaux de concentration atmosphérique du CO2 sur le long terme. Autre exemple, peut-être plus frappant : Newton resta perplexe devant l’écart de 20 % entre la valeur qu’il avait calculée pour la vitesse du son et les résultats des mesures. Ce n’est que nombre d’années plus tard que des savants tels que Laplace réalisèrent que cette anomalie pouvait être expliquée en traitant le problème comme un phénomène adiabatique plutôt qu’isotherme. L’explosion récente du nombre d’exoplanètes connues est un autre exemple où de petites anomalies numériques jouissent d’une telle confiance qu’elles peuvent être employées comme outil de découverte. À notre point de vue, il n’y a aucune raison de croire que ceux qui étudient la matière vivante ne feront pas des découvertes semblables, une fois que les mesures auront été codifiées au point que nous puissions identifier une irrégularité en la voyant. Dans un contexte où il existe un facteur 100 entre différentes réponses à la même question, telle que le nombre de protéines dans une cellule d’E. coli, il y a peu de chances de discerner des régularités et encore moins d’avoir confiance dans le fait que les anomalies sont en effet anormales. Souvent, les phénomènes scientifiques qui portent le nom d’« effets » découlent de l’identification d’une anomalie. Par exemple, le changement de la longueur d’onde de la sirène d’une ambulance qui se rapproche est le célèbre effet Doppler. La biochimie a elle aussi ses effets propres, comme l’effet Bohr, qui désigne la variation de l’affinité de liaison de l’oxygène à l’hémoglobine en fonction du pH. Nous soupçonnons que de nombreux effets de ce genre existent en biologie, et qu’ils attendent, pour être découverts, une quantification reproductible des propriétés des cellules et une attention particulière à ce que les nombres peuvent nous dire.

La base de données BioNumbers Pour rappeler à quel point certains nombres biologiques sont difficiles à obtenir, nous recommandons au lecteur l’exercice rapide suivant. Choisissez un sujet d’intérêt en biologie moléculaire ou cellulaire, puis cherchez les nombres correspondants sur Internet ou en consultant vos manuels préférés. Par exemple, combien de ribosomes y a-t-il dans une cellule humaine ? Ou quelle est l’affinité de liaison à l’ADN de tel facteur de transcription connu ? Ou encore, combien de copies d’un récepteur donné y a-t-il par cellule, tel que les récepteurs du chimiotactisme bactérien ou des hormones de croissance chez les cellules mammifères ? Dans notre expérience, de telles recherches sont au mieux fastidieuses et, souvent, peu concluantes ou même futiles. Comme antidote à ce problème, pratiquement tous les nombres présentés dans ce livre sont recensés dans une même source, à savoir la base de données

32

Introduction : vers l’intuition numérique en biologie

BioNumbers  6. L’idée de cette ressource en ligne est de servir de tremplin pour accéder à la vaste littérature biologique où sont archivées les données quantitatives. En particulier, les données recensées dans la base BioNumbers ont été soumises à une classification manuelle ; elles présentent des références complètes à la littérature primaire dont elles sont issues, ainsi qu’une brève description de la méthode qui a permis d’obtenir les données en question. Ainsi, chaque fois que nous citons un nombre, il sera lié à une référence bibliographique correspondant à un numéro d’identification BioNumbers (BNID 7). Tout comme nos lecteurs biologistes sont peut-être familiers du PMID qui est un identificateur unique assigné à des articles publiés dans la littérature biologique et médicale, le BNID sert d’identificateur unique de données biologiques quantitatives différentes. Par exemple, BNID 103023 indique l’une des déterminations du nombre d’ARNm par cellule de levure. Le lecteur pourra constater qu’à la fois nos rubriques et nos tableaux de données sont remplis de BNID, et en cherchant ce nombre sur le site Internet de BioNumbers (ou simplement dans un moteur de recherche), il pourra retrouver les détails liés à cette grandeur.

Comment effectuer des calculs de coin de table Les nombres disponibles dans la base de données BioNumbers et dans les rubriques de l’ensemble de ce livre peuvent être considérés comme plus que de simples données. Ils peuvent servir de points de repère pour estimer d’autres quantités d’intérêt, mais on peut également vérifier leur propre cohérence en raisonnant à partir d’autres nombres connus. Nous recommandons fortement au lecteur assidu d’essayer de faire de telles contre-vérifications et inférences. C’est ce qui constitue, pour nous, la méthode éprouvée pour atteindre une intuition numérique puissante. Par exemple, nous présentons au chapitre 4 les taux de réplication maximaux des chromosomes. Mais on pourrait déduire une estimation élémentaire de ce taux à partir de notre connaissance de la longueur du génome d’une bactérie et de la durée du cycle cellulaire. Bien sûr, de telles évaluations sont souvent grossières (disons à un facteur 2 près), mais elles seront assez bonnes pour nous donner l’ordre de grandeur pertinent, ce qui permet de vérifier la cohérence des valeurs mesurées. Il existe de nombreuses situations où nous pouvons avoir envie d’évaluer approximativement une certaine grandeur d’intérêt. Au milieu d’une conférence, vous pourriez ne pas avoir accès à une base de données des valeurs numériques. L’estimation de bornes supérieure et inférieure de la grandeur inconnue est un outil puissant qui peut éclairer la signification des valeurs mesurées.

6. http://bionumbers.hms.harvard.edu/ 7.  BNID : BioNumber identification number

33

La biologie cellulaire par les nombres

Voici un outil commode pour obtenir une estimation concrète à partir de bornes supérieure et inférieure plausibles. Supposons que nous voulions estimer une certaine grandeur. Notre première étape consiste à conjecturer les bornes. En effet, si nous pouvons dire que la grandeur que nous cherchons est plus grande qu’une borne inférieure xI et plus petite qu’une borne supérieure xS, alors une façon simple d’estimer notre grandeur d’intérêt sera d’en prendre la moyenne géométrique, c’est-à-dire : xestimée = x I xS . Bien que cela puisse sembler très abstrait, en fait, dans la plupart des cas nous pouvons nous poser une série de questions qui nous permettent d’estimer des bornes supérieures et inférieures raisonnables à un facteur 10 près. Par exemple, si nous souhaitons estimer la longueur de l’aile d’un avion de ligne, nous pouvons commencer par « est-ce plus grand que 1 m ? ». Oui. « Est-ce plus grand que 5 m ? » Oui. « Est-ce plus grand que 10 m ? » Je pense que oui mais je n’en suis pas sûr. Ainsi, nous prenons 5 m pour borne inférieure. De même, pour la borne supérieure : « estce plus petit que 50 m ? » Oui. « Est-ce plus petit que 25 m ? » Je pense que oui mais je n’en suis pas sûr. Ainsi, nous prenons 50 m pour borne supérieure. En utilisant 5 m et 50 m comme bornes inférieure et supérieure, nous pouvons alors estimer la taille d’une aile comme 5 m50 m  250 m 2  15 m. Si nous avions été un peu plus audacieux, nous aurions pu utiliser 10 m pour borne inférieure, et nous aurions évalué une longueur de ≈22 m. Dans les deux cas, nous sommes précis à un facteur 2 près de la valeur réelle, tout à fait dans la fourchette que l’on peut attendre en biologie des ordres de grandeur. Essayons un problème plus ardu, qui peut défier l’intuition de n’importe qui. Que donneriez-vous comme estimation du nombre d’atomes dans votre corps ? 1010 est probablement trop faible, cela fait plutôt penser au nombre de personnes sur terre. 1020 ? Peut-être, cela rappelle vaguement l’exposant du nombre d’Avogadro. 1080 semble beaucoup trop grand, car de tels exposants sont réservés au nombre d’atomes dans l’univers. 1040 ? Peut-être. Alors 1020  1040  1030 . Le livre présentera plus loin un calcul plus rigoureux, utilisant la constante d’Avogadro (sauriez-vous le faire ?), mais il suffit de dire que nous sommes à environ deux ordres de grandeur de l’ordre de grandeur correct, simplement à partir d’une estimation éclairée. On peut s’opposer au choix de 1020 et 1040 comme des nombres tombés du ciel. Nous affirmons que c’est exactement le genre de cas où nous avons extrêmement peu d’intuition et n’avons donc aucun point de départ hormis de vagues impressions. Mais nous pouvons néanmoins construire des bornes en éliminant les estimations qui sont trop petites et trop grandes comme nous l’avons fait ci-dessus et, de manière un peu étonnante, la moyenne géométrique nous rapproche de la vérité. Nous encourageons le lecteur à essayer cette méthode plusieurs fois pour vérifier que l’efficacité annoncée fonctionne réellement. La moyenne géométrique consiste en réalité à prendre la moyenne arithmétique usuelle dans l’espace logarithmique (c’est-à-dire la moyenne arithmétique des exposants des puissances de 10). Si nous avions utilisé la moyenne arithmétique des valeurs estimées elles-mêmes, notre évaluation aurait été complètement dominée par la borne supérieure choisie, ce qui conduit souvent à une grosse surestimation.

34

Introduction : vers l’intuition numérique en biologie

L’on pourrait nous demander comment nous savons si nos estimations sont réellement « bonnes ». En effet, ceux qui n’ont pas l’habitude de faire des estimations ont souvent peur d’obtenir la « mauvaise » réponse. Dans son excellent livre « Mathématiques de rue » 8, Sanjoy Mahajan argumente que l’emphase sur ce genre de « rigueur » peut mener en fait à la rigor mortis mathématique. Nous recommandons de voir les estimations comme des approximations successives, chaque itération incorporant plus de connaissances pour affiner le véritable sens de l’estimation. Il n’y a aucun mal à faire un premier essai et à obtenir une « mauvaise » réponse. En effet, l’une des raisons pour lesquelles les estimations sont valables est qu’elles commencent à entraîner notre intuition de sorte que nous puissions sentir, a priori, si un ordre de grandeur donné est cohérent ou non, sans même recourir à un calcul formel.

Boîte à outils des ordres de grandeur pour la biologie Comme signalé ci-dessus, l’une des compétences parmi les plus insaisissables mais aussi les plus importantes consiste à pouvoir estimer rapidement et efficacement les ordres de grandeur associés à un certain phénomène biologique d’intérêt. Nous avons fourni certaines des règles conceptuelles qui alimentent de telles estimations. Ici, nous les complétons par diverses règles numériques utiles que l’on peut employer pour trouver rapidement le chemin vers une estimation approximative mais satisfaisante. Nous ne nous attendons pas à ce que vous les mémorisiez toutes à la première lecture, mais jetez-y un coup d’œil et peut-être que lorsque vous en aurez besoin, certaines d’entre elles seront disponibles, au fond de votre esprit.

Grands nombres à votre disposition • Nombre de secondes dans une année ≈ π × 107 (avec la valeur approximative de pi, une coïncidence intéressante et une manière simple de se souvenir de cette valeur). • Nombre de secondes dans un jour ≈ 105. • Nombre d’heures dans une année ≈ 104. • Le nombre d’Avogadro ≈ 6×1023. • Nombre de cellules dans le corps humain ≈ 4×1013.

8.  Manahan (2010)

35

La biologie cellulaire par les nombres

Règles pratiques Tout comme il existe des règles arithmétiques qui nous aident à obtenir rapidement nos estimations d’ordre de grandeur, de même il existe des règles pratiques physiques qui permettent de développer notre capacité d’estimation. Nous donnons ici certaines de nos règles favorites ; n’hésitez pas à y ajouter les vôtres et même à nous les envoyer. Plusieurs de ces évaluations sont aussi représentées de manière imagée. À noter qu’ici et dans tout le livre, nous essaierons de suivre la notation correcte où « approximativement » indiquera une précision à un facteur 2 près et sera noté par le symbole ≈. Le symbole ~ signifiera « ordre de grandeur », soit seulement à un facteur 10 près (pour une écriture littérale, il signifiera « proportionnel »). Nous écrirons en général « approximativement » lorsque nous connaissons en effet à peu près la valeur d’une grandeur mais mieux qu’un facteur 10, et noterons alors ≈ et non ~. Dans les cas où nous connaissons seulement l’ordre de grandeur, nous écrirons la valeur seulement sous la forme d’une puissance de 10 sans chiffres significatifs supplémentaires. • 1 Dalton = 1 g/mol ≈ 1.6×10–24 g (voir Estimation 0‑1). • 1 nM correspond à environ 1 particule par cellule bactérienne (voir Estimation 0‑2), 101–102 particules par cellule de levure et 103–104 particules dans une cellule caractéristique de mammifère (HeLa). • 1 M correspond à environ 1 particule par nm3. • Il y a environ 2 à 4 millions de protéines dans 1 μm3 de volume cellulaire. • 1 ppm (partie par million) du protéome de la cellule équivaut à une concentration de ≈ 5 nM. • 1 mg de fragments d’ADN de 1 kpb de long chacun comprend ≈1 pmol de molécules, c’est-à-dire ≈1012 molécules. • Des particules à une concentration de 1 M sont espacées de ≈1 nm les unes des autres, en conditions standard de température et de pression. • Masse d’un acide aminé typique : ≈100 Da. • Masse de protéine (en Da) : ≈100 × nb. d’acides aminés. • Densité de l’air : ≈ 1 kg/m3. • Densité de molécules d’eau : ≈55 M ≈ 1000 fois celle de l’air ≈1000 kg/m3. Conversion entre le dalton et le gramme +



atome H

mH = 1 Da 1 g d’hydrogène = NA x mH nombre d’Avogadro

mH =

1g 6 x 1023

1.6 x 10–24g

masse de l’atome d’hydrogène

 Estimation 0‑1  Conversion entre le dalton et le gramme.

36

Introduction : vers l’intuition numérique en biologie La concentration molaire en unités d’E. coli volume cellulaire

1 µm3 = 1 fL

molécule unique c=

1 molécule 1 mole 1 fL 1 x x = x 10–8 M 1 fL 6 6 x 1023 molécules 10–15 L règle pratique : 1 molécule par volume bactérien

1.6 nM

1 nM

 Estimation 0‑2  Concentration molaire en unités de E. coli.

• La pression osmotique due à des osmolytes à une concentration de 50 mM vaut ≈1 bar (voir Estimation 0‑3). • Volume d’une molécule d’eau : ≈0.03 nm3 ≈ (0.3 nm)3. • Volume d’une paire de bases : ≈1 nm3. • Masse d’une paire de bases : ≈600 Da. • Masse d’une molécule de lipide : ≈500–1000 Da. • 1 kBT ≈ 2.5 kJ/mol ≈ 0.6 kcal/mol ≈ 25 meV≈ 4 pN.nm ≈ 4×10–21 J. • Maintenir une différence de concentration d’un facteur 10 requiert une énergie de kBT ln(10) ≈ 6 kJ/mol ≈ 1.4 kcal/mol). • Le mouvement à travers la membrane correspond à 10–20 kJ/mol par unité de charge nette due au potentiel de membrane. • L’hydrolyse de l’ATP en conditions physiologiques libère 20 kBT ≈ 50 kJ/mol ≈ 12 kcal/mol ≈ 10–19 J. • La respiration de 1 litre d’oxygène engendre ≈20 kJ. • Un petit métabolite diffuse sur une distance de 1 nm en ~1 ns. • 1 DO600 ≈ 0.5 g de masse cellulaire sèche par litre. • Il y a ≈1010 atomes de carbone dans un volume cellulaire de 1 μm3. Relation entre la concentration de soluté et la pression osmotique

kg

1L

eau 55 M

air g 1L Différence de concentration de 50 mM 1/1000 Ceau Cair pression osmotique de 1 bar

pression de 1 bar densité de l’air 1/1000 × densité de l’eau

 Estimation 0‑3  Relation entre la concentration de soluté et la pression osmotique.

37

La biologie cellulaire par les nombres

Tours de passe-passe arithmétiques • • • • • • • • • • •

210 ≈ 1000 220 = 410 ≈ 106 e7 ≈ 103 100.1 ≈ 1.3 2 ≈ 1.4 0.5 ≈ 0.7 ln(10) ≈ 2.3 ln(2) ≈ 0.7 log10(2) ≈ 0.3 log10(3) ≈ 0.5 log2(10) ≈ 3

Règles rigoureuses pour des calculs approximatifs Une des questions les plus importantes que chaque lecteur devrait se poser est la suivante : les nombres donnés dans ce livre sont-ils vraiment « justes » ? D’ailleurs, est-ce que cela a un sens d’assigner des nombres à des grandeurs comme la taille, la concentration et la vitesse, qui sont intrinsèquement diverses ? Les processus cellulaires présentent en effet une immense variabilité, qui dépend aussi bien du type cellulaire en question que des conditions de la mesure. L’une des clés de compréhension de ces dernières années, qui a été confirmée à plusieurs reprises, est que, même dans une population clonale de cellules, il y a une grande variabilité intercellulaire. Étant donné cette diversité et cette variabilité intrinsèque, attribuer des nombres particuliers aux propriétés et aux processus biologiques comporte de nombreux risques de mésinterprétation. Une manière de relever ce défi consiste à présenter une distribution de valeurs, plutôt que « la » valeur. Tout aussi important, une discussion détaillée des conditions de mesure est de rigueur, qui explique l’environnement de croissance des cellules et la manière dont la mesure a été effectuée et analysée. Malheureusement, cela rend la discussion très encombrante, ce qui se résout souvent dans les manuels et les revues scientifiques en évitant carrément les valeurs numériques. Nous avons choisi dans ce livre de donner des valeurs concrètes qui ne donnent effectivement pas une image « complète ». Ce que nous faisons, et que nous recommandons au lecteur de faire, c’est de considérer ces valeurs seulement comme des estimations grossières et des points d’entrée à la bibliographie. À chaque fois qu’un lecteur a besoin d’un nombre pour ses recherches, et pas seulement pour obtenir une impression générale, il devra se tourner vers les sources. Pour la plupart des valeurs données dans ce livre, trouver une valeur supérieure ou inférieure d’un facteur 2 dans une source différente est la règle plutôt que l’exception. Nous avons constaté qu’une connaissance de l’« ordre de grandeur » peut être très utile et nous en donnons des exemples dans le texte. Cependant, il est crucial d’avoir conscience de la variabilité inhérente pour ne pas entretenir une impression fausse, ou réaliser des inférences qui ne correspondent

38

Introduction : vers l’intuition numérique en biologie

pas à la qualité actuelle des données. On dit que la diversité (et par extension la variabilité) fait le sel de la vie – c’est évident en ce qui concerne la cellule et il faudrait toujours avoir cette idée à l’esprit en discutant les valeurs des grandeurs biologiques. Combien de chiffres faut-il inclure lorsque l’on présente la valeur de grandeurs biologiques telles que celles discutées dans tout ce livre ? Bien que cette question puisse sembler insignifiante, nous avons en fait été confrontés à beaucoup de problèmes subtils, qui peuvent influencer la capacité du lecteur à employer ces nombres de manière judicieuse. Pour donner un exemple concret, supposons que vous ayez dénombré les mitochondries de trois cellules et ayez trouvé 20, 26 et 34. La moyenne vaut 26.666…, donc comment devriez-vous rapporter ce résultat ? Plus précisément, combien de chiffres significatifs devriez-vous conserver pour caractériser la disparité des trois mesures ? Votre tableur informatique vous incitera peut-être à écrire quelque chose comme 26.667. Faut-il lui faire confiance ? Avant d’aller plus loin, nous vous proposons une règle pratique prudente très utile. Si vous deviez oublier tout ce qui suit, rappelez-vous ceci : en biologie, il est généralement raisonnable de présenter des valeurs avec 2 chiffres significatifs. Toute l’information pertinente y sera souvent contenue, et cela évitera qu’un surcroît de chiffres donne artificiellement une fausse impression d’exactitude. Si vous écrivez 3 chiffres ou plus, nous espérons qu’une voix intérieure vous indiquera de bien peser ce que cela signifie, ou juste d’appuyer sur la touche « Suppr ». Allons dans le détail. Les chiffres significatifs regroupent tous les chiffres différents de zéro, plus les zéros situés à droite du premier chiffre différent de zéro. Par exemple, le nombre 0.00502 a trois chiffres significatifs. Les chiffres significatifs doivent fournir l’information sur la précision d’une valeur rapportée. Le dernier chiffre significatif, celui situé le plus à droite, est le chiffre au sujet duquel nous pourrions nous tromper, mais qui est néanmoins la meilleure conjecture que nous ayons de la valeur exacte. Pour trouver ce qui doit être considéré comme des chiffres significatifs, nous emploierons une règle fondée sur la précision de l’estimation. La précision d’une valeur est la « répétabilité » de la mesure, indiquée par l’écarttype, ou dans le cas d’une moyenne, par l’erreur-type. Si la phrase qui précède vous rend perplexe, soyez assuré que vous êtes en bonne compagnie. Poursuivez la lecture et rappelez-vous de consulter Wikipedia à vos heures de loisir pour ces termes compliqués, comme nous le faisons nous-mêmes régulièrement. Si nous revenons à l’exemple de décompte de mitochondries ci-avant, une calculatrice donnera un écart-type de 4.0552… La règle que nous suivons est de rapporter l’incertitude avec 1 chiffre significatif. Ainsi, 4.0552 est arrondi à 4 et nous rapportons notre évaluation de la moyenne simplement comme 26, ou plus rigoureusement comme 26 ±4. Le dernier chiffre significatif rapporté dans la moyenne (dans ce cas 6) est à la même position décimale que le premier chiffre significatif de l’écart-type (dans ce cas-ci 4). Notons que selon certaines conventions, un 1 initial ne compte pas comme chiffre significatif (par exemple, écrire 123 avec un chiffre significatif donnera 120, tandis que 100 désigne simplement l’ordre de grandeur). De plus, dans certains cas, il est utile de rapporter l’incertitude avec deux chiffres plutôt qu’un seul, mais nous ne devrions pas nous en soucier plus que cela pour l’instant. Mais juste pour être sûr, il est préférable d’éviter l’emploi de 3 chiffres ou plus dans l’incertitude. Le lecteur

39

La biologie cellulaire par les nombres

intéressé à en savoir plus pourra lire un rapport complet du Bureau International des Poids et Mesures sur le sujet 9. Malheureusement, on peut trouver de nombreuses mesures de grandeurs biologiques pour lesquelles l’imprécision n’est pas rapportée. La précision correspond à l’ampleur de la variation au sein des mesures, tandis que l’exactitude correspond à l’écart entre la mesure et la valeur réelle. Une erreur systématique conduira à de l’inexactitude mais pas à de l’imprécision. On peut calculer la précision à partir des mesures (par exemple à l’aide de l’écart-type), mais pour évaluer l’exactitude, il faut comparer à une autre méthode de mesure. On pourrait également ajouter la distinction entre exactitude et précision à la liste des mots à consulter sur Wikipedia, mais poursuivons encore un moment. Non seulement on ne rapporte pas l’imprécision (l’erreur) dans la plupart des études en biologie, mais la valeur numérique est souvent écrite avec beaucoup de chiffres, bien au-delà de la significativité à laquelle on pourrait s’attendre, compte tenu de la reproductibilité biologique du contexte expérimental. Par exemple, on peut trouver un volume moyen d’une cellule HeLa évalué à 2 854.3 μm3. Nous pensons toutefois que présenter un volume de cette manière est en réalité trompeur, même si c’est ce que le tableur a indiqué au chercheur. Selon notre mode de pensée, attribuer un niveau aussi élevé de précision donne au lecteur une représentation erronée de ce que la mesure a permis de réaliser ou de la valeur à garder à l’esprit comme règle pratique. Puisque l’incertitude de ces mesures est souvent omise, nous devons recourir à des règles pratiques (voir Estimation 0‑4). À partir de la lecture de nombreuses études, nous estimons que beaucoup de grandeurs biologiques sont connues avec une exactitude d’un facteur 2 ; dans de très bons cas la mesure peut être exacte à 10 % près (un facteur 0.1) ; et en cas de forte variabilité, à un facteur 5 ou 10 près. Une exactitude faible ne vient pas des instruments de mesure, qui ont en général une très bonne précision ; c’est plutôt l’existence de différences systématiques, par exemple des conditions de culture distinctes, qui peut affaiblir l’exactitude dans les applications qui utilisent cette valeur. Dans ce livre, nous faisons l’effort de rapporter des valeurs avec un nombre de chiffres qui représente implicitement l’incertitude. Les règles pratiques que nous suivons sont récapitulées dans l’estimation 0‑4 sous forme d’un algorigramme permettant de déterminer combien de chiffres significatifs employer pour présenter un nombre en tenant compte de l’incertitude de son estimation. Par exemple, supposons que nous nous attendions à ce que le volume moyen d’une cellule HeLa soit inexact à 10 % (c’est une exactitude plutôt bonne pour des données biologiques), c’est-à-dire environ 300 μm3. Comme expliqué ci-avant, nous présentons l’incertitude à l’aide d’un chiffre significatif : autrement dit, les autres chiffres sont arrondis à zéro. Nous en déduisons que le volume devrait s’écrire 2 900 μm3 (deux chiffres significatifs). Si nous estimons que l’incertitude est comparable à la valeur elle-même, soit environ ±3 000 μm3, nous écrirons pour la moyenne 3 000 μm3 (un chiffre significatif). Finalement, si nous pensons que les imprécisions sont grandes, d’un facteur 5 ou 10 par exemple, nous donnerons seulement l’ordre de grandeur, soit 1 000 μm3, ou mieux encore, nous utiliserons l’écriture 103 μm3, qui reflète cette incertitude. Nous indiquons seulement l’ordre de grandeur dans les cas où l’imprécision attendue est si élevée (en pratique, supérieure à 3×) qu’il 9.  Comité commun pour les guides en métrologie (2008)

40

Introduction : vers l’intuition numérique en biologie

n’est pas raisonnable d’espérer avoir une estimation d’un chiffre, mais seulement du nombre de chiffres de la valeur exacte. Le chiffre 1 est spécial au sens où il ne signifie pas nécessairement une valeur de 1, mais désigne plutôt l’ordre de grandeur. Dans ce cas, on peut considérer le nombre 1 comme ayant moins d’un chiffre significatif. Arrondir peut bien sûr créer de la confusion. Si on écrit 100, comment les gens sauront-ils s’il s’agit simplement d’un ordre de grandeur, ou d’une valeur inexacte à 100 près, voire même à 10 % près (c’est-à-dire si le zéro qui suit le 1 est précis également) ? Pour résoudre cette ambiguïté, une convention possible consiste à souligner le dernier chiffre significatif. Ainsi, dans l’écriture 100, le zéro (et le 1) sont les chiffres significatifs et dans 100, seul le 1 est un chiffre significatif ; tandis que 100 désigne seulement un ordre de grandeur. Les zéros suivants sont généralement une autre manière d’écrire la notation scientifique (comme dans 3 × 103). La notation scientifique est plus précise dans son utilisation des chiffres, mais souvent moins intuitive. Les zéros ne devraient donc pas être interprétés comme indiquant une valeur exacte de zéro pour ces chiffres, sauf indication spécifique (par exemple s’ils sont soulignés). Déterminer le nombre approprié de chiffres significatifs pour présenter une valeur Votre calcul donne 2854.3 ; faut-il présenter le résultat sous le format 3000, 2900, 2854.3 ?

L’incertitude sur le calcul est-elle connue ?

NON

il vous faut utiliser votre expérience

Quelle est une estimation raisonnable de l’incertitude ?

OUI

supposons que l’incertitude soit de 437

10%, c.-à-d. 285

la valeur elle-même, c.-à-d. 2854

> 3× la valeur, c.-à-d. l’ordre de grandeur

Réécrire l’incertitude estimée avec un chiffre significatif incertitude :

437 → ±400

285 → 300

2854 → 3000

1000

Règle : le dernier chiffre (le plus à droite) doit être à la même position que l’incertitude à un chiffre significatif valeur présentée :

2900 ± 400

deux chiffres significatifs, 2900

un chiffre significatif, 3000

ordre de grandeur seulement, 1000

Nous choisissons de suivre la convention selon laquelle un 1 initial n’est pas significatif : ainsi 1234 avec un chiffre significatif s’écrit 1200 ; pour arrondir l’ordre de grandeur sur l’échelle logarithmique : ainsi, 3000 → 1000 ; 4000 → 10000.

 Estimation 0‑4  Déterminer le nombre approprié de chiffres significatifs pour présenter une valeur.

41

La biologie cellulaire par les nombres

Nous ne pourrons pas toujours donner l’incertitude d’une valeur, car il est fréquent qu’elle ne soit pas explicite dans l’article d’origine qui rapporte cette valeur, de sorte que nous ne la connaissons pas. Cependant, en faisant attention à l’écriture d’une valeur numérique, le lecteur pourra en déduire notre estimation approximative d’après les normes ci-avant. En fait, tout le monde devrait être familier d’une indication implicite de l’exactitude attendue, comme l’illustre l’exemple suivant emprunté à l’excellent livre Guesstimation 10. Si, pour vous indiquer le chemin, un ami vous dit de prendre à gauche après 20 km, vous pourrez commencer à vous inquiéter après 22 km. Mais si son instruction était de tourner à gauche après 20.1 km, vous aurez certainement un doute avant même d’avoir atteint 21 km. En cherchant l’ordre de grandeur, nous arrondissons dans l’espace des logarithmes, c’est-à-dire que 3 000 est arrondi à 1 000, mais 4 000 est arrondi à 10 000 (car log10(3)  0.5). Nous emploierons ce procédé, étant donné qu’aussi bien notre perception du monde que de nombreux modèles d’erreur de mesure sont logarithmiques (c’est-à-dire que nous percevons des variations relatives plutôt que des changements en valeur absolue). Ainsi, c’est selon l’échelle logarithmique que l’on peut s’attendre à ce que les erreurs suivent une distribution gaussienne, et c’est donc sur cette échelle que l’on pourra trouver le nombre rond le plus proche. En exécutant une série de calculs (multiplications, soustractions...), il est souvent prudent de conserver plus de chiffres significatifs au cours du calcul et d’arrondir le résultat seulement à l’étape finale. Cette démarche est d’autant plus pertinente lorsque la soustraction annule les chiffres dominants, car les chiffres suivants deviennent alors critiques. Nous pensons que ce type de règles peut améliorer l’hygiène quantitative, qui est essentielle pour utiliser et interpréter correctement les nombres en biologie cellulaire.

La géographie de la cellule Les rubriques qui occupent le devant de la scène dans le reste du livre caractérisent plusieurs aspects de la vie des cellules. Il n’y a pas de chemin unique à travers l’ensemble des données que nous avons compilées ici, mais presque toutes se rapportent aux cellules, à leurs structures, aux molécules qui les habitent et à la façon dont elles varient au cours du temps. En explorant le paysage numérique de la cellule, il est important de garder en tête que plusieurs de nos rubriques sont intimement liées. Par exemple, en examinant la rotation du moteur flagellaire qui propulse les bactéries en avant, un thème abordé au chapitre sur les vitesses, nous n’oublierons pas que la source d’énergie qui engendre cette rotation est le potentiel transmembranaire abordé au chapitre sur les énergies et les forces. De plus, c’est la rotation du moteur qui régit la vitesse de déplacement de ces cellules, un phénomène également attrayant d’un point de vue quantitatif. Bien que nous ayons essayé de faire ressortir le réseau des liens entre les différents nombres biologiques que nous présentons,

10.  Weinstein et Adam (2008)

42

Introduction : vers l’intuition numérique en biologie

nous demanderons au lecteur d’être vigilant quant aux liens entre nos différentes rubriques que nous n’aurions pas notés et qui pourraient conduire à de nouvelles intuitions. Pour préparer le terrain cellulaire pour le reste du livre, nous présentons dans cette brève section les trois cellules-modèles sur lesquelles se fondent les prochains chapitres. Nous pensons qu’en développant une intuition pour la bactérie « typique », la cellule de levure « typique » et la cellule mammifère « typique », nous aurons un mode d’emploi pour traiter des cellules plus spécialisées. Par exemple, même lorsque nous présentons les cellules photoréceptrices ultraspécialisées, les beaux résultats de l’évolution d’« organes de perfection extrême » qui ont tant déconcerté Darwin, nous aurons toujours à l’esprit ces trois points de repère que sont les cellules « standard » bactérienne, de levure et de mammifère. Il ne s’agit pas de naïveté de notre part concernant la variabilité de ces cellules « typiques », une question à laquelle plusieurs rubriques sont d’ailleurs consacrées. C’est plutôt que nous connaissons la valeur d’une description mentale quantitative de quelques cellules standard : cette description sert de repère pour réfléchir quantitativement à la situation biologique en question, tout comme un globe terrestre nous permet d’appréhender la proportion relative de la surface de notre planète bien-aimée recouverte par les océans et par les masses continentales, ainsi que les éléments géographiques principaux tels que les chaînes de montagne, les déserts et les fleuves. Nos trois cellules-modèles sont schématisées sur la figure 0‑1. Leur recensement moléculaire est indiqué dans le tableau 0‑1 et sur la figure 0‑2, que l’on peut considérer comme une manière compacte de visualiser ces nombres. En un certain sens, une grande partie de notre livre se concentre sur les questions suivantes : d’où viennent ces nombres ? Sont-ils cohérents ? Quel est leur influence sur le fonctionnement d’une cellule vivante ? En quoi ces cellules se ressemblent-elles, et en quoi sont-elles différentes ? La figure 0‑1A nous montre la structure de la bactérie préférée de tout biologiste moléculaire ou presque, la célèbre Escherichia coli. La figure 0‑2A présente son recensement moléculaire. La cellule de levure dévoile des couches de complexité supérieures à celles de la bactérie standard (Figures 0‑1B et 0‑2B), notamment dues à la présence d’une multitude de structures confinées par des membranes internes. L’une des raisons principales pour lesquelles les cellules de levure ont permis de caractériser la biologie des eucaryotes est leur division en compartiments, comme le noyau, le réticulum endoplasmique et l’appareil de Golgi. De plus, leurs génomes sont étroitement empaquetés dans le noyau de la cellule dans des complexes nucléoprotéiques connus sous le nom de nucléosomes, une architecture commune à tous les eucaryotes. Outre ses structures cellulaires représentatives, c’est « la puissance impressionnante de la génétique de la levure » qui lui vaut cette place sur le podium, ce qui signifie que, de même que nous pouvons modifier le câblage du génome de bactéries telles qu’E. coli, nous pouvons maintenant également changer le génome de la levure presqu’à volonté. Les principaux constituants des cellules de levure peuvent être considérés grosso modo comme la version à plus grande échelle du recensement déjà esquissé pour les bactéries.

43

La biologie cellulaire par les nombres

(A) Cellule bactérienne

(B) Cellule de levure

membrane externe paroi cellulaire

paroi cellulaire

membrane plasmique

membrane plasmique

ADN

mitochondrie

nucléoïde ribosomes dans le cytosol

bourgeon

vacuole appareil de Golgi noyau

1 µm

réticulum endoplasmique lysosome

flagelle

filaments d’actine

5 µm

(C) Cellule animale (fibroblaste) microtubule

centrosome et ses deux centrioles chromatine (ADN)

matrice extracellulaire

pore nucléaire vésicules

lysosome mitochondrie filaments d’actine

noyau nucléole

membrane peroxysome plasmique ribosomes dans appareil filaments le cytosol de Golgi intermédiaires

réticulum endoplasmique 10 µm

 Figure 0‑1  Les cellules-modèles. (A) Bactérie schématique, avec la taille et les composants caractéristiques de E. coli. (B) Cellule de levure à bourgeon avec sa taille caractéristique, ses organites et les différentes familles de molécules qu’elle contient. (C) Cellule adhérente mammifère. Chacune de ces cellules est représentée à une échelle distincte : noter la barre d’échelle présente sous chaque cellule. Les silhouettes en bas à droite de la figure situent la bactérie et la levure à l’aune de la cellule mammifère (A et C d’après Alberts et al. (2015)).

44

Introduction : vers l’intuition numérique en biologie

(A) Cellule bactérienne (précisément, E. coli : V ≈ 1 µm3 ; L ≈ 1 µm ; τ ≈ 1 h) protéine eau membranaire

5 × 105

lipide

ion inorganique

protéine 5 × 107

+ 108

2 × 1010 3 × 106 3

4

2 × 10 ARNm

2 × 10

6

5 × 10 pb

ribosome

ADN

(B) Cellule de levure (précisément, S. cerevisiae : V ≈ 30 µm3 ; L ≈ 5 µm ; τ ≈ 3 h)

107 6 × 1011 3 × 104

109

+ 3 × 109

105

108

1.2 × 107 pb

(C) Cellule mammifère (précisément, HeLa : V ≈ 3000 µm3 ; L ≈ 20 µm ; τ ≈ 1 jour)

109 6 × 1013



1011

+ 2 × 1011 3 × 109 pb

105

1010

106

 Figure 0‑2   Recensement par ordre de grandeur des principaux composants de ces trois cellules-modèles, qui sont souvent utilisées au laboratoire et dans ce livre. Une cellule bactérienne (E. coli), un eucaryote unicellulaire (la levure S. cerevisiae) et une cellule mammifère immortalisée (telle qu’une cellule adhérente HeLa). V, L et τ désignent respectivement le volume, la longueur et le temps de division caractéristiques.

45

La biologie cellulaire par les nombres

 Tableau 0‑1  Valeurs typiques des grandeurs caractéristiques d’une cellule bactérienne d’E. coli, de l’eucaryote unicellulaire S. cerevisiae, et d’une cellule mammifère immortalisée HeLa. Noter qu’il s’agit de valeurs caractéristiques approximatives correspondant à des cellules prolifératives des souches de laboratoire usuelles (Alon 2006). Voir aussi BNID 111494 pour les références complètes. Grandeur Volume cellulaire Nombre de protéines par de volume cellulaire

E. coli

S. cerevisiae

Cellule mammifère (lignée HeLa)

0.3‒3 µm3

30‒100 µm3

1000‒10 000 µm3

µm3

Quantité d’ARNm par cellule Nombre de protéines par cellule

2‒4×106 103‒104

104‒105

105‒106

~106

~108

~1010

4‒5×106

Diamètre moyen d’une protéine Taille du génome Nombre de gènes codant des protéines

4.6 Mpb

12 Mpb

3.2 Gpb

4300

6600

21 000

Longueur des sites de liaison des protéines régulatrices

10‒20 pb

Longueur de promoteur

~100 pb

~1000 pb

~104‒105 pb ~104‒106 pb (introns y compris)

~1000 pb

Longueur de gène Concentration d’une protéine par cellule

~1 nM

~10 pM

~0.1‒1 pM

Constante de diffusion d’une protéine à travers la cellule

~0.01 s

~0.2 s

~1‒10 s

Constante de diffusion d’une petite molécule à travers la cellule

~0.001 s

~0.03 s

~0.1‒1 s

Durée de transcription d’un gène en ARNm

10 % du volume cellulaire (voir Tableau 1‑5). Ces dernières années, l’arrivée de la microscopie à fluorescence et des méthodes tomographiques en microscopie électronique ont permis de construire une représentation beaucoup plus fidèle de la structure tridimensionnelle de ces organites.

76

1. La taille et la forme

 Tableau 1‑4  Pourcentage de la membrane cellulaire totale de chaque type de membrane pour deux cellules modèles. Le symbole « – » indique que la valeur n’a pas été pas déterminée. (D’après Alberts et al. (2015).) Pourcentage de l’ensemble de la membrane cellulaire Type de membrane

Hépatocyte

Cellule pancréatique exocrine

Membrane plasmique

2

5

RE rugueux

35

60

RE lisse

16

13

Protéines des plaques d’actine Arp2

2.9

47 000

10

Arp3

4.1

67 000

7

ARPC1

2.5

40 000

15

ARPC3

2.4

39 000

12

ARPC5

1.9

31 000

12

Protéine-coiffe Acp2p

1.2

19 000

17

5.3

87 000

15

Fimbrine Fim1p

Protéines des pôles du fuseau Sad1p

0.2

3 300

31

Polo-kinase Plo1p

0.3

6 600

1

Kinase Cdc7p

0.2

4 000

5

Protéines intervenant dans la cytodiérèse

166

Mid1p (homologue de l’anilline)

0.09

2 100

40

Myosine-II Myo2p kan

0.5

7 300

27

Chaîne légère essentielle de la myosine-II Cdc4p

4.8

77 000

22

Chaîne légère régulatrice de la myosine-II Rlc1p

0.6

9 600

18

IQGAP Rng2p kan

0.2

2 700

35

mYFP-Cdc15p kan

2.1

36 000

21

Formine Cdc12pII

0.04

600

11

Rng3pII

0.1

1 900

3

Rng3p (myo2-E1II)

0.3

6 800

30

Actinine-α Ain1p

0.2

3 600

8

Myosine-II Myp2p

0.4

6 100

21

Septine Spn1p

0.6

10 000

35

Septine Spn4p

0.5

8 100

34

Mid2p (homologue de l’anilline)

0.1

1 800

NA

Kinase C Pck2p

0.3

4 300

13

RhoGEF Rgf1p

0.3

4 300

5

RhoGEF Rgf3p

0.2

3 200

4

Chitine-synthase Ch2p

0.1

2 100

3

2. Concentrations et nombres absolus

(C)

5 µm

concentration cytoplasmique (µM)

(B)

6.0

100 000 Fim1p

5.0

80 000

Ar p3p

4.0 3.0

60 000 Arc1p Ar p2p

2.0 1.0

Ain1p

40 000

20 000 Spn1p Spn4p

00

1 2 3 4 5 6 7 0 intensité moyenne / cellule (u.a.)

nb. de molécules par cellule (transfert de protéines)

(A)

cytométrie en flux microscopie

 Figure 2‑22  Recensement moléculaire du cytosquelette d’actine chez la levure à fission. (A) Images de microscopie à contraste de phase des cellules de S. pombe. (B) Images de fluorescence de la myosine. (C) Étalonnage de l’intensité de fluorescence. Le nombre de molécules par cellule, déterminé par transfert de protéines, présente une relation linéaire avec la fluorescence moyenne par cellule. (D’après Wu et Pollard (2005).)

Comment pouvons-nous comprendre les valeurs détaillées dans le tableau 2‑6 ? Une des premières impressions qui vient de l’observation des données est qu’il existe dans certains cas plusieurs ordres de grandeur de différence entre les effectifs de protéines différentes. Par exemple, alors qu’il y a plus d’un million de monomères d’actine, il n’y a approximativement que 50 000 copies d’Arp2/3, le complexe protéique qui régule le réseau d’actine, et seulement 600 copies de formine, qui agit sur l’élongation des filaments. Bien sûr, ces nombres paraissent intuitivement raisonnables, puisqu’un filament donné pourrait ne porter qu’un seul complexe d’Arp2/3 ou un dimère de formine. On peut comprendre ces quantités en distinguant plusieurs catégories distinctes des molécules. D’abord, il n’est pas surprenant que l’actine constitue à elle seule une catégorie, puisqu’il s’agit de la brique élémentaire pour construire de longs filaments qui impliquent chacun entre plusieurs dizaines et des milliers de monomères. La deuxième catégorie de molécules regroupe celles qui interagissent avec une stœchiométrie d’une ou quelques-unes par filament ou plaque, telle que les protéines de coiffe et de branchement. On s’attendrait donc dans cette catégorie à voir des dizaines de milliers de molécules par cellule. Enfin, nous pouvons nous attendre à trouver les protéines de régulation, avec des effectifs de moins d’une copie par filament. En référence au tableau 2‑6, nous voyons que la plupart des facteurs, tels que des composants moteurs (la myosine) ou de branchement (Arp) présentent des nombres de copies de plusieurs milliers, tandis que les

167

La biologie cellulaire par les nombres

protéines de régulation (kinases) sont au nombre de quelques milliers. Pour estimer le nombre de filaments et de monomères, il peut être utile de penser à l’interphase du cycle cellulaire, lorsqu’une grande partie de l’actine est engagée dans la formation de plusieurs centaines de plaques d’actine distribuées à travers la cellule, chacune de ces plaques contenant plus de 100 petits filaments formés de 10–100 monomères. Pour construire toutes ces plaques, il faut plus de 500 000 monomères d’actine, ce qui correspond à près de la moitié du réservoir total des monomères utilisés. Pendant la mitose, cet équilibre est déplacé étant donné qu’à ce stade du cycle cellulaire, près de la moitié de l’actine est mise en jeu dans la construction de l’anneau contractile au centre de la cellule. C’est cet anneau de constriction qui enserre la cellule-mère pour la séparer en deux cellules-filles. On peut estimer la quantité d’actine engagée dans l’anneau en notant que celui-ci comporte approximativement 2 000 filaments, chaque anneau mesurant environ ½ µm de long, ce qui correspond à des centaines de milliers de monomères. Ce ne sont que quelques exemples des architectures complexes et variées du cytosquelette que l’on trouve dans les cellules vivantes. Comme on peut le voir pendant la division cellulaire des cellules eucaryotes, il existe un réseau tout aussi fascinant de filaments de tubuline, ou microtubules, qui joue un rôle essentiel dans la répartition des copies nouvellement formées des chromosomes dans les cellules-filles. Les microtubules forment aussi les autoroutes moléculaires le long desquelles des moteurs moléculaires transportent une cargaison. On pourrait effectuer un raisonnement semblable pour recenser les microtubules et leurs protéines auxiliaires, quoique les tentatives expérimentales actuelles de caractérisation du cytosquelette de microtubules soient en retard sur le cytosquelette d’actine. Tout compte fait, le cytosquelette est l’un des dispositifs les plus indispensables de la vie de la cellule et, tout comme il nous faut connaître la concentration des facteurs de transcription pour comprendre comment ils régulent la prise de décision génétique, la connaissance des concentrations des protéines du cytosquelette et de leurs facteurs auxiliaires est essentielle pour développer une intuition de la dynamique finement orchestrée que l’on trouve dans la cellule.

Combien d’ARNm y a-t-il dans une cellule ? Étant donné le rôle central de la régulation génétique dans tous les domaines de la biologie, le recensement de l’ARNm présente un grand intérêt pour plusieurs types cellulaires. Nous nous intéressons à la fois à des gènes spécifiques et au transcriptome entier, en fonction des conditions environnementales et de l’état du développement. De telles mesures fournissent une lecture directe de l’état instantané de régulation de la cellule à un moment donné et, à ce titre, elles sont pour nous un outil puissant pour analyser comment la cellule prend des décisions. Nous commençons par un exercice de pensée afin de voir si nous pouvons estimer le nombre d’ARNm à partir de quelques données cellulaires principales, telles que la cinétique des processus du dogme central pendant un cycle cellulaire (voir Estimation 2‑9).

168

2. Concentrations et nombres absolus Combien une cellule contient-elle de molécules d’ARNm? Commençons par la concentration intracellulaire caractéristique de protéine : Nprotéine

3 x 106 protéines/µm3

V

taux de production de protéine par cellule

R=

Nprotéine

bactéries V 1 µm3, τ 1h

τ

période de doublement

cellule mammifère V 3000 µm3, τ 24 h

3 x 106 protéines 3000 s 1010 protéines 105 s

103 protéines/s

105 protéines/s

vitesse de traduction

v 10–50 bases/s

taux de production de protéine par ARNm

r= distance entre ribosomes

d

0.1–1 protéine/ARNm/s

30–300 bases

ribosomes adjacents

ribosomes espacés (selon les observations)

bactéries NARNm =

v d

R r cellule mammifère

103 protéines/s 0.1–1 protéine/ARNm/s

103–104 ARNm/cellule bactérienne

105 protéines/s 0.1–1 protéine/ARNm/s

105–106 ARNm/cellule mammifère

 Estimation 2‑9  Nombre de molécules d’ARNm dans une cellule.

Le principe de cette estimation consiste à exploiter la notion selon laquelle, au cours du cycle cellulaire, le nombre de protéines doit doubler, grâce à la synthèse de nouvelles protéines. Cette synthèse de protéine repose elle-même sur la distribution des molécules d’ARNm présentes dans la cellule. Avec ce calcul de coin de table, nous estimons, pour des cellules en division rapide, 103–104 ARNm par cellule bactérienne et de 105-106 ARNm pour une cellule mammifère typique de 3 000 μm3 de volume. Les techniques modernes ont aujourd’hui en grande partie remplacé les méthodes classiques de recensement. Une approche de mesure qui vise à couvrir le génome entier consiste à dénombrer les ARNm à partir du transcriptome entier, par exemple à l’aide de la technique de séquençage de l’ARN, ou RNA-Seq, qui consiste à séquencer les molécules d’ARNm individuelles issues du lysat cellulaire. Puisque le décompte se fonde sur le nombre de séquences détectées, un étalonnage est nécessaire. À cet effet, l’échantillon est saupoudré d’ARNm standard de quantité connue,

169

La biologie cellulaire par les nombres

avant de procéder au séquençage. La figure 2‑23 montre un exemple de distribution d’ARNm obtenue sur des cellules E. coli cultivées en milieu riche ou minimal. Le résultat de cette étude est que le nombre de transcrits par cellule (≈8 000 copies d’ARNm par cellule) pour des cellules cultivées dans du LB est environ le triple du nombre de transcrits par cellule (≈3 000 copies d’ARNm par cellule) de cellules développées en milieu minimum. Étant donné que le nombre de gènes est légèrement supérieur à 4 000, cela entraîne que le nombre moyen de transcrits est de l’ordre de 1 par cellule (en milieu LB). Pour la plupart des gènes, il est en fait même inférieur, c’est-à-dire que la plupart des cellules ont zéro copie de certains transcrits, tandis que certaines en contiennent une ou deux. Ce fait saisissant est pour nous un bel exemple de la manière dont la biologie quantitative peut guider notre intuition. (A)

(B) PROCÉDURE EXPÉRIMENTALE EXTRACTION D’ARN milieu minimal

ARNm cellulaire ARNm de calibration

0.15 fréquence

LB

0.20

0.10

milieu minimal, ≈ 3000 ARNm

×32 milieu LB, ≈ 8000

0.05 0.00

0.001 0.01 0.1 1 10 100 1000 nb. de molécules d’ARNm/cellule

SÉQUENÇAGE

 Figure 2‑23  Utilisation du séquençage pour évaluer le nombre d’ARNm par cellule. (A) L’ARNm est soigneusement extrait des cellules et mélangé à de l’ARNm synthétisé qui sert à l’étalonnage. Le séquençage de cellule unique permet de compter le nombre de copies de chaque type d’ARNm, ce qui permet d’estimer le nombre total d’ARNm. (B) Décompte d’ARNm pour des bactéries E. coli développées en milieu riche et en milieu minimum. (Avec l’aimable autorisation de Zoya Ignatova.)

Une des questions centrales de la biologie quantitative est celle de la reproductibilité, surtout lorsque différentes méthodes sont appliquées au même problème. Une alternative très utile au recensement d’ARNm s’appuie sur le décompte direct des différentes molécules d’ARNm au microscope. Plus précisément, une décomposition à l’échelle du gène individuel à l’aide de techniques telles que l’hybridation de fluorescence in situ (FISH) de la molécule unique complète le point de vue RNA-Seq décrit ci-avant. La méthode FISH fournit un aperçu de la distribution spatiale et intercellulaire de l’ARNm pour une espèce particulière de molécule

170

2. Concentrations et nombres absolus

d’ARNm (voir Figures 2‑24 et 2‑19, p. 162). L’idée dans ce cas est de concevoir des sondes qui se lient à l’ARNm d’intérêt par appariement de bases complémentaires. Chacune de ces sondes porte un fluorophore et, en conséquence, lorsque l’on examine au microscope les cellules fixées, on peut employer l’intensité de fluorescence de ces sondes pour lire le nombre de molécules d’ARNm. Le nombre d’ARNm par cellule est généralement entre 0.1 et 1, avec plusieurs exceptions présentant des valeurs plus petites et plus grandes (voir Figure 2‑24B). Comme le souligne l’ensemble du livre, différentes conditions conduisent à des valeurs différentes et les résultats de FISH représentés ici correspondent à la croissance lente. (B)

(C)

sonde nombre de gènes

(A) fluorophore unique oligonucléotide 5’

ARNm 3’

≈4 µm

40 30 20 10 0 –6 –5 –4 –3 –2 –1 0 1 log2 (nb. de copies d’ARNm)

2

 Figure 2‑24  Recensement d’ARNm par microscopie à fluorescence. En utilisant l’hybridation de fluorescence in situ (FISH), on peut compter les copies de cet ARNm en mesurant l’intensité de fluorescence de sondes spécifiques qui s’hybrident à cet ARNm d’intérêt. (A) Schéma des sondes destinées à marquer une molécule d’ARNm. (B) Image de microscopie à fluorescence de cellules d’E. coli dont l’ARNm d’un gène spécifique est marqué. (C) Histogramme du nombre moyen d’ARNm chez E. coli pour un certain nombre de gènes. (D’après Taniguchi et al. (2010).)

Que peut-on dire du recensement d’ARNm chez d’autres types cellulaires que les bactéries ? Aussi bien les méthodes de séquençage que la microscopie ont été appliquées à ces questions chez la levure et chez d’autres eucaryotes. La figure 2‑25 présente les résultats pour le recensement d’ARNm chez les levures à bourgeon et à fission. Le nombre total d’ARNm par cellule va de 20 000 à 60 000 dans des cellules en croissance exponentielle (BNID 104312, 102988, 103023, 106226, 106763). Comme les résultats précédents chez les bactéries, nous constatons de nouveau que chaque gène ne présente généralement que quelques molécules d’ARNm dans la cellule à un instant donné. La rubrique « Quelle est la proportion relative de protéine et d’ARNm ? » (p. 172) introduit le facteur d’amplification relatif à un ARNm donné pendant qu’il est traduit en protéine. Pour des cellules mammifères « typiques », on a pu rapporter une valeur de 200 000 ARNm par cellule (BNID 109916), conforme à notre estimation simple ci-avant, ce qui autorise une première conjecture que le nombre d’ARNm varie proportionnellement à la taille et à la vitesse de croissance.

171

La biologie cellulaire par les nombres

(A)

S. cerevisiae

0.30

500

YPD SD

400 300 200 100

0 0.01 0.1 1 10 100 1000 niveau d‘expression (exemplaires d‘ARNm/cellule)

0.25 fréquence de gènes

nombre de gènes

700 600

S. pombe

(B)

800

0.20 0.15 0.10 0.05

0.0 0.01 0.1 10 100 1000 1 niveau d’expression (exemplaires d’ARNm/cellule)

 Figure 2‑25  Distributions d’ARNm chez la levure. (A) Distribution d’ARNm chez la levure à bourgeon S. cerevisiae cultivée en milieu (YPD) et minimal (SD) et mesurée par PCR. 42 (B) Distribution d’ARNm chez la levure à fission S. pombe, mesurée par RNA-Seq. Le nombre total vaut environ ≈40 000. (A d’après Miura et al. (2008) ; B d’après Marguerat et al. (2012).)

Quelle est la proportion relative de protéine et d’ARNm ? Le dogme central s’articule autour de l’existence et des propriétés d’une armée de molécules d’ARNm qui sont transitoirement produites par la transcription et souvent dégradées peu après. Pendant leur brève existence dans la cellule, ces ARNm servent de modèle à la création d’une nouvelle génération de protéines. La question que pose cette rubrique est la suivante : en moyenne, quel sont les proportions relatives du message traduit et du message lui-même ? Bien que de nombreux facteurs gouvernent la proportion relative de protéine et d’ARNm, un modèle simple suggère d’effectuer une estimation à partir de quelques grandeurs principales seulement. Pour cela, nous devons écrire une « équation cinétique » simple qui nous indique comment la teneur en protéines varie pendant un court laps de temps. Plus précisément, nous cherchons la dépendance fonctionnelle entre le nombre p de copies de protéine d’un gène et le nombre m de molécules d’ARNm qui engendrent cette protéine. La vitesse de formation de p est égale à la vitesse de traduction multipliée par le nombre de messages, m, puisque chaque molécule d’ARNm peut elle-même être considérée comme source de protéine. Cependant, en même temps que de nouvelles protéines sont synthétisées, la dégradation de protéine retire constamment des protéines de la circulation. Le nombre de protéines dégradées est égal au taux de dégradation multiplié par le nombre total 42.  PCR : amplification en chaîne par polymérisation, en anglais polymerase chain reaction.

172

2. Concentrations et nombres absolus

de protéines. On peut reformuler tous ces mots de manière élégante et concise en une équation qui nous indique que pendant un court laps de temps Δt, le nombre de protéines varie de p(t) à p(t + Δt) selon : p(t + Δt) = p(t) – αp(t)Δt + bmΔt, où α désigne la vitesse de dégradation et β la vitesse de traduction 43. La solution qui nous intéresse concerne l’état stationnaire, c’est-à-dire, ce qui se produit après un temps suffisamment long, lorsque le système ne change plus. Dans ce cas : Δp/Δt = dp / dt = 0, c’est-à-dire : βm – αp = 0 La proportion relative de protéine par rapport à l’ARNm est donc donnée par : p / m = β / α. Notons que ce n’est pas la même chose que le nombre de protéines produites à partir de chaque ARNm, car cette valeur exige de connaître également le taux de renouvellement d’ARNm, que nous étudierons à la fin de la rubrique. Combien vaut β ? Un ARNm rapidement traduit portera des ribosomes comme des perles sur un fil, ce qu’illustre la célèbre image de microscopie électronique de la figure 2‑26. Leur espacement le long de l’ARNm doit être supérieur au pas physique du ribosome, soit ≈20 nm (BNID 102320, 105000), ce qui correspond à environ 60 paires de bases (un nucléotide mesurant ≈0.3 nm de long, BNID 103777), ou ≈20 acides aminés. La vitesse de traduction est d’environ 20 aa/s. Ainsi, il faut au moins une seconde pour qu’un ribosome se déplace de sa propre taille le long de l’ARNm, ce qui implique, à l’état stationnaire, une vitesse maximale de traduction β = 1 s–1 par transcrit. ribosomes

protéines en formation

ARNm

100 nm

 Figure 2‑26  Ribosomes sur l’ARNm comme des perles sur un fil. (Avec l’aimable autorisation de Donald Fawcett, Visuals Unlimited, Inc.)

43.  La bibliographie est malheureusement partagée entre ceux qui utilisent cette notation et ceux qui inversent ces deux lettres. (NdA)

173

La biologie cellulaire par les nombres

La vitesse efficace de dégradation résulte non seulement de la dégradation des protéines mais également d’un effet de dilution à mesure que la cellule grossit. En effet, des deux effets, la dilution par division cellulaire domine souvent : en conséquence, le temps efficace caractéristique de dégradation, qui tient compte de la dilution, est de l’ordre de la durée d’un cycle cellulaire, notée τ. Nous avons donc : α = 1/τ. À la lumière de ces nombres, le rapport p/m vaut donc β/α = 1 /(1/τ) = τ. Pour E. coli, τ vaut approximativement 1 000 s et ainsi p/m ~ 1000. Bien sûr si les ARNm ne sont pas transcrits à la vitesse maximale, le rapport sera plus faible. Vérifions la cohérence de ce résultat. En croissance exponentielle à vitesse de croissance intermédiaire, on sait que E. coli contient environ 3 millions de protéines et 3 000 ARNm (BNID 100088, 100064). Ces constantes impliquent que le rapport protéine/ARNm vaut ≈1 000, tout à fait conforme à l’estimation donnée ci-avant. Nous pouvons effectuer un second test de cohérence à partir des données des rubriques précédentes. Dans la rubrique « Entre l’ARNm et la protéine, quelle molécule est la plus grande ? » (p. 91), nous avons calculé un rapport de masse de 10:1 de l’ARNm relativement à la protéine qu’il code. Dans la rubrique « Quelle est la composition macromoléculaire de la cellule ? » (p. 177), nous avons mentionné que les protéines font environ 50 % de la masse sèche d’E. coli tandis que l’ARNm fait seulement environ 5 % de tout l’ARN de la cellule, qui vaut lui-même approximativement 20 % en masse sèche. Cela implique que l’ARNm constitue environ 1 % de la masse sèche globale. Ainsi, le rapport protéine/ARNm devrait être d’environ 50 fois 10, ou 500. De notre point de vue, toutes ces estimations sont cohérentes entre elles. Comment déterminer expérimentalement ce rapport protéine/ARNm ? Une méthode élégante consiste à employer la microscopie à fluorescence pour observer simultanément les ARNm à l’aide d’hybridation de fluorescence in situ (FISH) et leurs protéines correspondantes, fusionnées à une protéine fluorescente. La figure 2‑27 montre des images de microscopie de l’ARNm et de la protéine marquée correspondante pour un gène particulier chez E. coli. Les résultats de ces méthodes pour plusieurs gènes confirment que le nombre de protéines est 100 à 1 000 fois plus élevé que le nombre d’ARNm correspondants (Figure 2‑27C). Cela montre aussi que l’on peut utiliser non seulement la visualisation directe par microscopie, mais aussi des méthodes de séquençage. Pour des organismes à croissance plus lente comme la levure ou les cellules mammifères, nous nous attendons à un rapport protéine/ARNm plus élevé, mais il faut noter que nos hypothèses sur la vitesse maximale de traduction deviennent encore plus ténues, ce qui réduit d’autant notre confiance en cette estimation. Pour la levure, à vitesse de croissance moyenne ou rapide, on a pu mesurer un nombre d’ARNm de 10 000–60 000 par cellule (BNID 104312, 102988, 103023, 106226, 106763). Comme les cellules de levure sont ≈50 fois plus grandes en volume qu’E. coli, le nombre de protéines peut être estimé comme étant augmenté dans la même proportion, soit 200 millions. Le rapport p/m vaut alors ≈2×108/2×104≈104, en conformité avec la valeur expérimentale d’environ 5 000 (BNID 104185, 104745). Pour la levure, qui se divise toutes les 100 minutes, ou 6 000 secondes, c’est en accord avec l’évaluation simple de p/m ci-avant.

174

2. Concentrations et nombres absolus

ARNm (FISH)

(B)

(C) nombre moyen d’ARNm mesuré par FISH 10–4 10–3 10–2 10–1 100 101 102

protéine (YFP)

nombre moyen de protéines

(A)

≈4 µm

104 103 102 101 100

10–1 10–4 10–3 10–2 10–1 100 101 102 niveau moyen d’ARNm mesuré par RNA-Seq (u.a.)

≈4 µm

 Figure 2‑27  Mesure simultanée de l’ARNm et la protéine chez E. coli. (A) Images de microscopie du niveau d’ARNm dans des cellules d’E. coli. (B) Images de microscopie de la protéine dans des cellules d’E. coli. (C) Nombre de copies de la protéine en fonction du niveau d’ARNm, obtenus par deux méthodes, la microscopie (A) et le séquençage (B). D’après Taniguchi et al. (2010).

Comme pour plusieurs des quantités décrites dans tout le livre, l’engouement pour le séquençage haut-débit du génome entier touche aussi le thème de cette rubrique. Plus précisément, en combinant le RNA-Seq pour déterminer le nombre de copies d’ARNm avec des méthodes de spectrométrie de masse et de profilage ribosomal pour évaluer la teneur en protéine des cellules, on peut dépasser les estimations ci-avant pour des gènes individuels. La distribution d’ARNm et de protéine sur l’ensemble du génome confirme les évaluations réalisées ci-avant, avec plus de 1 000 fois plus de protéine que d’ARNm dans la plupart des cas (voir Figure 2‑28 pour la levure à fission). Chez les lignées cellulaires mammifères, on peut calculer un rapport protéine/ARNm d’environ 104 (BNID 110236). ×1000

(B)

0.30

fréquence

ARNm 0.20 protéines 0.10

0.00

–5

0 5 10 15 log2 (copies/cellule)

20

log2 (copies de protéines/cellule)

(A)

20 15 10 5

×1000

0 –5

–5 0 5 10 15 20 log2 (copies d’ARNm/cellule)

 Figure 2‑28   Rapport protéine/ARNm chez S. pombe. (A) Histogramme illustrant le nombre de copies d’ARNm et de protéines déterminé par des méthodes de séquençage et de spectrométrie de masse, respectivement. (B) Quantité de protéine et d’ARNm pour des gènes individuels. Une analyse plus récente suggère que les niveaux de protéine ont été sous-estimés et qu’il faudrait appliquer un facteur de correction d’environ 5, ce qui rapproche le rapport protéine/ARNm d’une valeur de 104. (D’après Marguerat et al. (2012), avec une analyse récente par Milo (2013).)

175

La biologie cellulaire par les nombres

Jusqu’ici, nous nous sommes concentrés sur le nombre total de copies de protéine par ARNm, et non le nombre de protéines produites en une seule salve à partir d’un ARNm donné. La figure 2‑29 montre la distribution de cette « efficacité » pour la bêta-galactosidase chez E. coli, avec quelques occurrences de synthèse de plus de 10 molécules de protéine pour une molécule d’ARNm. (B)

salve de protéines

nombre d’événements

(A)

50 45 40 35 30 25 20 15 10 5 0

0

5 10 15 20 nombre de β-gal par salve

 Figure 2‑29  Dynamique de production de protéine. (A) Salve de production de protéine résultant des nombreux cycles de traduction sur la même molécule d’ARNm, avant qu’elle ne soit dégradée. (B) Distribution des paquets pour la bêta-galactosidase chez E. coli. (D’après Cai et al. (2006).)

Pour finir, notons qu’il y a une troisième signification à la question du titre de cette rubrique, selon laquelle nous pourrions demander combien de protéines sont produites à partir de chaque ARNm individuel avant qu’il ne soit dégradé. Par exemple, chez E. coli, en croissance rapide, les ARNm sont dégradés environ toutes les 3 minutes, (voir la rubrique « À quelle vitesse les molécules d’ARN et les protéines se dégradent-elles ? », p. 291). Cette échelle de temps est environ 10–100 fois plus courte que la durée du cycle cellulaire. En conséquence, pour passer d’un rapport typique protéine/ARNm de 1000 au nombre de protéines produites à partir d’un ARNm avant qu’il ne soit dégradé, il faut diviser par le nombre de vies de l’ARNm au cours d’un cycle cellulaire. Nous constatons que dans le scénario où E. coli se divise rapidement, chaque ARNm produit environ 10-100 protéines avant d’être dégradé. Une étude récente suggère de revoir la question fondamentale de cette rubrique. 44 L’analyse approfondie de dizaines d’études sur les niveaux d’ARNm et de protéine chez S. cerevisiae, l’organisme modèle le plus courant pour de telles études, suggère une relation non linéaire où les gènes avec des niveaux élevés de transcrits auraient un rapport protéine/ARNm supérieur à celui des gènes moins exprimés. Elle suggère que la corrélation entre l’ARNm et la protéine n’a pas une pente de 1 sur une échelle « log-log », mais plutôt une pente d’environ 1.6. Cela peut expliquer

44. Csárdi et al. (2015)

176

2. Concentrations et nombres absolus

également pourquoi le nombre de copies de protéines couvre un intervalle sensiblement plus grand que les effectifs d’ARNm.

Quelle est la composition macromoléculaire de la cellule ? L’objectif de la biologie moléculaire est d’expliquer les phénomènes cellulaires à partir des acteurs moléculaires : elle attribue ce faisant les premiers rôles à certaines protéines, ARN et lipides spécifiques. En revanche, historiquement, la physiologie proposait une vision plus holiste de la cellule ou de l’organisme entiers. Récemment, cette vision intégratrice a été adoptée par la biologie des systèmes, qui boucle la boucle en utilisant les connaissances réductionnistes chèrement gagnées par la biologie moléculaire pour construire une vision holiste des interconnexions moléculaires qui font émerger le comportement d’ensemble de la cellule. Pour penser globalement la cellule, le point de départ est de comprendre l’abondance relative de ses différents constituants.

ADN

ARNr 23S

ARNm

ARNr 16S

métabolites peptidoglycane lipopoly-

ARNt saccharide

lipide

ARNr 5S

protéine

polyamines

glycogène

 Figure 2‑30  Carte proportionnelle de Voronoi de la composition d’une cellule d’E. coli qui croît avec une période de doublement de 40 min. La surface de chaque polygone correspond à la fraction relative en masse sèche du constituant correspondant. Les couleurs ont été choisies de sorte que les composants avec un rôle fonctionnel proche aient une teinte semblable. La méthode de visualisation par carte proportionnelle de Voronoi a été développée afin de représenter des mesures sur l’ensemble du génome issues de la quantification génomique ou protéomique.

177

La biologie cellulaire par les nombres

La figure 2‑30 propose ce genre de vue d’ensemble de la composition cellulaire chez E. coli, en croissance exponentielle avec un temps de doublement de 40 minutes. La figure est dominée par les protéines, qui composent un peu plus de la moitié du contenu cellulaire. Plus étonnant, malgré leur rôle essentiel de passeurs de l’expression génétique, les ARNm constituent seulement une petite fraction de la masse, environ 1 % de la masse sèche. La figure est fondée sur une compilation de données de la composition cellulaire d’E. coli reproduite dans le tableau 2‑7 (BNID 104954). Cette compilation a paru pour la première fois dans un manuel classique de physiologie de la cellule bactérienne 45, une référence qui illustre l’obsession constructive pour les nombres qui caractérise les débuts de la physiologie bactérienne. Les protéines représentent environ ≈55 % de la masse sèche de la cellule, suivi de l’ensemble des ARN à ≈20 %, des lipides à ≈10 % et de l’ADN à ≈3 % (le reste étant formé de polysaccharides, de métabolites, d’ions, etc.). Des efforts semblables chez S. cerevisiae ont montré que les protéines constituaient 40 à 50 % de la masse sèche cellulaire, les ARN ≈10 %, et les lipides ≈10 % (BNID 111209, 108196, 108198, 108199, 108200, 102327, 102328). Chez les cellules mammifères, la fraction occupée par l’ARN diminue environ à 4 % tandis que la fraction des lipides augmente (BNID 111209). Quelle logique se cache derrière ces valeurs ? L’ARNr, par exemple, quoiqu’assez monotone en termes de diversité, constitue 2/3 de la masse de ribosome : il doit être abondant pour assurer une synthèse constante de protéine. L’ARNr est en fait plus abondant, de plus d’un ordre de grandeur, que tout l’ARNm. Cependant, l’ARNm est rapidement dégradé, avec une demi-vie caractéristique d’environ 4 minutes (BNID 104324), tandis que l’ARNr est très stable, sa dégradation (in vitro) ne se produisant qu’après plusieurs jours (BNID 108023, 108024). Du fait de la dégradation rapide de l’ARNm, la synthèse globale de l’ARNm requis par la cellule n’est pas négligeable et son rythme atteint environ la moitié de celui de la synthèse d’ARNr (pour un temps de doublement d’E. coli de 40 minutes, BNID 100060). Autre élément de compréhension de la composition cellulaire : la teneur en protéines, le constituant cellulaire dominant, semble limitée par des effets d’encombrement. Augmenter le nombre de protéines par unité de volume dans le cytoplasme entraverait des phénomènes tels que la diffusion, qui est déjà environ dix fois plus lente à l’intérieur de la cellule que dans l’eau pure. Nous discutons ce genre d’effets à la rubrique « Quelles sont les échelles de temps de la diffusion à l’intérieur d’une cellule ? » (p. 257). La concentration moyenne en protéine dans le cytoplasme est déjà telle que la protéine moyenne possède une couche de solvatation de seulement ≈10 molécules d’eau qui la séparent de la couche de solvatation des protéines voisines.

45. Neidhardt et al. (1990)

178

2. Concentrations et nombres absolus

 Tableau 2‑7  Composition macromoléculaire globale d’une cellule moyenne d’E. coli en croissance aérobie équilibrée en milieu minimum de glucose à 37°C, avec un temps de doublement de 40 minutes et 1 pg de masse humide de cellule (volume cellulaire de ≈0.9 μm3). Parmi les modifications apportées à ces données, la masse cellulaire sèche a été augmentée de 284 fg à 300 fg et la masse cellulaire totale de 950 fg à 1 000 fg ; d’autres valeurs ont été arrondies pour diminuer le nombre de chiffres significatifs, de sorte que les valeurs reflètent le niveau d’incertitude. À différents taux de croissance, le volume et la masse cellulaires peuvent changer de plusieurs facteurs. La composition relative change avec le taux de croissance mais pas de manière significative. Pour un volume et un taux de croissance donnés, on s’attend à une incertitude de l’ordre de 10–30 % en écart-type. Les valeurs originales se rapportent à la souche B/r, mais en tenant compte de l’incertitude prévue, les valeurs présentées ici sont caractéristiques de la plupart des souches d’E. coli usuelles. (Adapté et modifié d’après Neidhardt et al. (1990).) Macromolécule

Pourcentage Masse par de la masse cellule (fg) sèche totale

Protéine

55

165

ARN

20

60

ARNr 23S ARNr 16S ARNr 5S ARNt ARNm

Masse molaire caractéristique (Da)

Nombre de molécules par cellule

3×104

3 000 000

32

1×106

20 000

16

5×105

20 000

1

4×104

20 000

9

2×104

200 000

2

1×106

1 400 2

ADN

3

9

3×109

Lipide

9

27

800

20 000 000

Lipopolysaccharide

3

9

8 000

1 000 000

Peptidoglycane

3

9

(1 000)n

1

1×106

4 000

Glycogène

3

9

Métabolites et réservoir de cofacteurs

3

9

Ions inorganiques

1

3

Masse sèche totale

100

300

Eau (70 % de la cellule)

700

Masse cellulaire totale

1000

Règles pratiques (pour E. coli) • ~ 1010 atomes de carbone • 1 molécule par cellule ~ 1nM • ~ 1010 molécules d’ATP consommées au cours d’un cycle cellulaire • ~ 3×109 molécules de glucose consommées au cours d’un cycle cellulaire (2/3 des atomes de carbone sont utilisés pour la biomasse et 1/3 pour l’ATP)

179

La biologie cellulaire par les nombres

On peut déduire la quantité de lipide dans une « cellule typique » directement de la superficie de la membrane, quoique dans le cas des eucaryotes, il soit nécessaire de compter les nombreuses membranes internes liées aux organites dans l’estimation. Voyons comment ce genre d’estimation fonctionne pour une cellule d’E. coli sphérocylindrique en forme de gélule. En prenant un diamètre de ≈1 µm et un rythme de croissance caractéristique tel que la longueur totale soit de ≈2 µm (un cylindre de 1 µm de long et deux coiffes hémisphériques de 0.5 µm de rayon chacune), la superficie prend la valeur élégante de A = 2π, soit ≈6 µm2. Le volume est également un bel exercice géométrique dont le résultat vaut V = 5π/12, soit ≈1.3 µm3 (bien que nous choisissions souvent de considérer un volume de 1 µm3 par simplicité lorsque nous effectuons des calculs par ordre de grandeur). La bicouche lipidique mesure environ 4 nm d’épaisseur, les plus grandes valeurs souvent mentionnées pouvant provenir des éléments qui dépassent de la membrane (voir la rubrique « Quelle est l’épaisseur de la membrane cellulaire ? », p. 102). Le volume de membrane est donc d’environ 6 µm2 × (4×10–3 µm) = 0.024 µm3. Avec ≈70 % d’eau et ≈30 % de masse sèche de densité ≈1.3 (BNID 104272), la densité globale vaut ≈1.1 (BNID 103875) et le volume occupé par la masse sèche fait donc environ 1.3 µm3 × 1.1 g/cm3 × 0.3/(1.3 g/cm3) ≈ 0.33 µm3. Ainsi, la bicouche lipidique occupe une fraction d’environ 7 % de la masse sèche. E. coli possède deux bicouches lipidiques, la membrane externe et la membrane interne, et cette valeur doit donc être doublée à ≈14 %. Considérant que les protéines membranaires occupent entre un quart et la moitié de l’aire de la membrane (BNID 105818), nous sommes raisonnablement proches de la valeur expérimentale de ≈9 %. Dans quelle mesure la composition diffère-t-elle lorsqu’on considère d’autres états de croissance ou d’autres organismes ? Étant donné que la composition classique pour E. coli a été obtenue déjà dans les années 1960 et 1970 et qu’aujourd’hui nous avons accès à la quantification de milliers des protéines et d’ARNm, nous aurions pu nous attendre à ce que la réponse expérimentale à cette question soit un exercice standard. Les méthodes de quantification de protéines sont en général des variantes de celle développée par Lowry en 1951. L’article annonçant ces méthodes, qui avait été renvoyé par la revue avec des coupes énergiques après la première soumission, semble être devenu l’article le plus fortement cité dans l’histoire de la science, avec plus de 200 000 citations. Malgré toutes leurs vertus et leurs citations, les méthodes de ce travail tendent à avoir une exactitude limitée une fois appliquées à l’ensemble de la cellule, conduisant souvent à de véritables épreuves méticuleuses de biochimie. Par exemple, d’autres constituants cellulaires tels que le glutathion, le principal compensateur redox de la cellule, peuvent influencer la mesure. En conséquence, la caractérisation complète du recensement cellulaire pour différentes conditions est en général manquante. Cette situation limite notre capacité de nous faire une véritable idée physiologique ou systémique de la cellule dynamique, et elle attend encore d’être rectifiée par des biologistes qui combinent une dextérité expérimentale et un penchant pour l’approche quantitative.

180

2. Concentrations et nombres absolus

Machines et signaux Quel est l’effectif des facteurs de transcription ? Les facteurs de transcription sont les protéines sentinelles de la cellule, qui assurent une veille permanente pour décider lesquels des nombreux gènes cachés dans l’ADN devraient être transformés en messages (transcrits en ARNm) à un moment donné. Il existe de l’ordre de 200–300 types différents de facteurs de transcription (c’est-àdire codés par des gènes distincts) chez les bactéries modèles comme E. coli (BNID 105088, 105089) et ≈1 000 sortes différentes dans les cellules animales (BNID 105072, 109202). Ceux qui sont épris de systèmes-modèles biologiques simples seront enchantés d’apprendre que des parasites tels que Mycoplasma pneumoniae ou Buchnera aphidicola semblent n’avoir que 4 facteurs de transcription différents (BNID 105075). Les facteurs de transcription sont des acteurs-clés de la régulation de la composition protéique de la cellule, qu’ils assurent souvent en se liant à l’ADN et en interagissant activement avec l’appareil constitutif de transcription, ce qui active ou réprime la transcription. Puisqu’il s’agit de régulateurs majeurs, ils ont été beaucoup étudiés, mais contrairement à leur omniprésence dans les articles scientifiques, leur concentration réelle à l’intérieur des cellules est en général assez faible. La concentration dépend fortement de la protéine spécifique, du type cellulaire et des conditions environnementales, mais en règle pratique, les concentrations de ces facteurs de transcription sont de l’ordre du nM, ce qui correspond à seulement 1–1000 copies par cellule chez les bactéries ou 103–106 dans les cellules mammifères. C’est un contraste net avec les protéines les plus abondantes telles que les enzymes glycolytiques ou les facteurs d’élongation, qui tendent à présenter plusieurs milliers de copies chez les bactéries et plusieurs millions dans les cellules mammifères. Comme on pouvait s’y attendre, les concentrations cellulaires des facteurs de transcription sont souvent comparables aux Kd  de ces protéines pour la liaison à l’ADN. Souvent, les facteurs de transcription au bas de la gamme de concentrations interviennent dans la régulation spécifique de certains gènes (par exemple LacI qui régule l’opéron lactose), tandis que ceux présentant des concentrations plus élevées ont beaucoup de gènes-cibles et sont parfois connus comme des régulateurs globaux (par exemple la protéine réceptrice de l’AMPc qui oriente le choix des sources de carbone chez les bactéries). Étant donné le rôle central joué par le répresseur LacI dans les cours de biologie moléculaire de licence en tant que paradigme de régulation génétique, on pourrait être surpris d’apprendre qu’il présente en général seulement environ 10 tétramères par cellule (soit une concentration de ≈10 nM, BNID 100734). Il est curieux de noter que son affinité non spécifique à l’ADN conduit ≈90 % des protéines de LacI à se lier à l’ADN ailleurs que sur le site du promoteur nominal, tandis que quelques copies à peine diffusent librement dans le cytoplasme (les deux formes sont probablement importantes pour trouver leur cible, comme l’ont montré d’élégantes études théoriques). Ce faible nombre de copies a suscité des questions importantes sur la manière dont les cellules vivantes contrôlent (ou exploitent) les fluctuations stochastiques inévitablement associées aux petits nombres. Par exemple, si la partition de ces protéines lors de la division cellulaire est strictement aléatoire, un

181

La biologie cellulaire par les nombres

nombre si petit donne une chance non négligeable que certaines cellules-filles se retrouvent à n’avoir aucune copie d’un certain facteur de transcription.

(A) 1.0

(B)

distribution cumulée

distribution cumulée

Bien que LacI soit le facteur de transcription modèle, la plupart des facteurs de transcription présentent des concentrations plus élevées, en dizaines ou centaines de nM (voir Figure 2‑31 ; BNID 102632, 104515). Les résultats représentés sur cette figure ont été obtenus à l’aide d’une belle méthode récente, en l’occurrence l’une de celles qui ont transformé le séquençage de l’ADN en outil biophysique valide pour effectuer des recensements moléculaires. Dans ce cas, l’idée est de séquencer des fragments d’ARNm protégés par la traduction des ribosomes. La densité linéique de ces ribosomes sur la chaîne d’ARNm nous apprend quelque chose sur la vitesse de synthèse protéique, laquelle, après un étalonnage soigneux, permet d’estimer le nombre de protéines par cellule. Ces données font apparaître beaucoup de nuances intéressantes. Par exemple, les distributions de nombres de copies d’activateurs et de répresseurs sont différents, les activateurs étant en moyenne moins nombreux que les répresseurs. Une deuxième observation intrigante qui émerge de ces mesures sur l’ensemble du protéome est l’observation que les facteurs de transcription sujets à un contrôle allostérique par la liaison d’un ligand sont en moyenne beaucoup plus nombreux que ceux qui fonctionnent sans ligand.

0.8 0.6 0.4 0.2 0.0

1

10 100 1000 10 000 nombre d’exemplaires (relativement au génome) activateur

répresseur

1.0 0.8 0.6 0.4 0.2 0.0

1

10 100 1000 10 000 nombre d’exemplaires (relativement au génome) autorégulateur négatif autorégulateur positif

 Figure 2‑31   Nombre de copies de facteurs de transcription mesuré chez E. coli. (A) Distributions cumulées des activateurs et répresseurs, montrant que les activateurs présentent typiquement entre 1 et 100 copies par cellule, tandis que les répresseurs présentent généralement entre 10 et 1 000 copies par cellule. (B) Distributions cumulées des protéines autorégulatrices. (D’après Li et al. (2014).)

Outre les bactéries, beaucoup d’effort a été investi dans l’étude de ce que l’on peut appeler la protéine la plus étudiée de tous les temps, p53 (une autre prétendante à ce titre serait l’hémoglobine), un facteur de transcription qui semble être impliqué dans plus de 50 % des cas de cancer (BNID 105092). Son nom, comme beaucoup d’autres protéines, provient de sa caractérisation initiale sur gel : sa migration

182

2. Concentrations et nombres absolus

correspondait à celle d’une protéine de 53 kDa de masse moléculaire. Aujourd’hui, nous savons que sa masse vaut en fait 44 kDa, sa migration lente étant due à la présence de nombreux résidus proline encombrants, mais le nom perdure. Ce facteur de transcription essentiel intervient dans la décision d’une cellule de lancer la mort cellulaire programmée afin de lutter contre la prolifération continue, et de limiter ainsi la croissance tumorale. Elle a une concentration caractéristique de ≈100 nM (correspondant à ≈100 000 molécules chez MCF7, une lignée cellulaire mammifère de cancer du sein ; BNID 100420). Les facteurs de transcription peuvent moduler la transcription en changeant leurs propriétés de liaison à l’ADN, par exemple à travers l’intégration des signaux provenant des récepteurs. Des mutations dans l’ADN de cellules cancéreuses changent les propriétés de liaison de p53 aux gènes qu’elle régule en aval, ce qui inhibe souvent la mort cellulaire et mène à une croissance incontrôlée.  Tableau 2‑8  Nombre de copies de facteurs de transcription chez divers organismes. Les valeurs sont arrondies à l’ordre de grandeur le plus proche. Pour plus de valeurs, voir Biggin (2011) (BNID 106842). Ordre de grandeur du nombre d’exemplaires par cellule

BNID

LacI (utilisation du carbone)

101‒102

100734

AraC (utilisation du carbone)

102

105139

ArcA (contrôle de la respiration aérobie)

104

102632

Gal4 (utilisation du carbone)

102

109208

Tfb3 (facteur d’initiation de la transcription)

103

109208

Pho2 (métabolisme du phosphate)

104

109208

D. melanogaster, noyaux Bicoid (développement) du blastoderme antérieur

104

106843

D. melanogaster, 52 cellules

106

106846

104

106899

105

106901

P53 (croissance et apoptose)

104‒105

100420

Glucocorticoïde, œstrogène et doigts de zinc associés aux récepteurs à stéroïdes

104‒105

106904, 106906, 106911

STAT6

104‒105

106914

NF-kappaB p65

105

106909

Myc (régulation de la structure de la chromatine)

105

106907

Organisme

E. coli

S. cerevisiae

Facteur de transcription

Doigt de zinc GAGA

Glucocorticoïde, thyroïde et doigts de Macrophage de souris/rat zinc associés aux récepteurs à androgènes NF-kappaB p65

Lignées cellulaires H. sapiens

183

La biologie cellulaire par les nombres

Le tableau 2‑8 donne des exemples du recensement d’une série d’autres facteurs de transcription et d’une caractérisation en ordre de grandeur de leur nombre de copies absolu. Étant donné que les facteurs de transcription prennent une si grande part de la vie quotidienne de tant de chercheurs, ce tableau vise à faciliter le développement de règles pratiques intuitives pour l’analyse quantitative. Que nous apprennent les effectifs ou les concentrations ? Ils sont essentiels pour analyser la séquestration des facteurs de transcription dans des complexes et leur inhibition par des régulateurs, pour considérer l’effet de la liaison non spécifique à l’ADN ou pour calculer le temps de réponse du déclenchement d’un programme transcriptionnel, puisque, dans chacun de ces cas, la formation des complexes moléculaires dépend des concentrations des acteurs moléculaires en question. Nous préconisons de garder à disposition des ordres de grandeur caractéristiques comme ceux du tableau 2‑8, mais tout en se rappelant que l’effectif de ces facteurs varie souvent dans l’espace et le temps. C’est particulièrement clair dans le cas de la structuration des tissus en développement, où la variation spatiale des concentrations de facteurs de transcription peut établir les patrons qui deviennent finalement le plan d’organisation de l’animal. Par exemple, le gradient du facteur de transcription Bicoid le long de l’axe antéro-postérieur de l’embryon de drosophile est un ingrédient essentiel de la structuration de la mouche ; et des protéines semblables interviennent pour nous former, nous les humains.

Combien y a-t-il de protéines de signalisation ? Les bactéries sont capables de se diriger vers les régions plus riches en nutriments. Les neutrophiles, les assassins employés par le système immunitaire, poursuivent les envahisseurs bactériens en flairant les signaux chimiques provenant de leurs proies. Les photorécepteurs réagissent à l’arrivée de photons en induisant des cascades de signalisation que nous interprétons comme la vue. Les cellules d’un embryon acquièrent différents destins en fonction de leur emplacement dans l’organisme. Pour accomplir ces tâches, les cellules sont guidées par toute une série de sentinelles moléculaires dont le travail est de recevoir des signaux du monde extérieur et de prendre des décisions en fonction de ces informations. L’architecture conceptuelle des modules de signalisation qui permettent ce genre de réponses est représentée sur la figure 2‑32. Ce diagramme montre clairement que différents acteurs moléculaires implémentent la réponse aux signaux, de sorte que les phénomènes d’amplification de signal, de spécificité et de rétroaction peuvent tous dépendre du nombre de copies de chacun des partenaires moléculaires. Un des chemins conceptuels qui sous-tend l’ensemble de notre examen de la signalisation est que des protéines sont modifiées en ajoutant (en « écrivant ») et en enlevant (en « effaçant ») des groupes chimiques tels que des groupes phosphate ou méthyle. Bien que nous employions cette notation dans plusieurs figures, le lecteur ne devrait pas penser que l’addition du groupe correspond nécessairement à la forme active de la protéine modifiée. Dans de nombreux cas, au contraire, la signalisation élimine le groupe phosphate et la conformation non phosphorylée est la forme active.

184

2. Concentrations et nombres absolus

Par exemple, dans le cas de la molécule de signalisation CheY impliquée dans le chimiotactisme, chez certains organismes la forme phosphorylée déclenche le changement de direction du moteur tandis que chez d’autres organismes c’est la forme non phosphorylée qui induit cette réponse. À notre connaissance, la question de savoir s’il y a un avantage évolutionnaire à l’une ou l’autre tactique attend toujours une réponse.

substrat

se hata hosp

P

P

kinase

kinase

p

phosphatase

P

P ADN

 Figure 2‑32  Schéma d’une voie de signalisation générique. Un récepteur membranaire (orange) à la surface de la cellule libère un substrat. Le substrat est modifié par une kinase qui lui ajoute un groupe phosphate (elle « écrit » une marque). L’addition du groupe phosphate envoie la protéine au noyau (région marron) où elle agit alors comme facteur de transcription. Le groupe phosphate est ensuite ôté par une phosphatase (qui « efface » la marque).

Un des traits caractéristiques des protéines de signalisation est que, en fonction des conditions environnementales, la concentration de la molécule en question, ou de sa forme active, peut varier considérablement. En conséquence, la propriété-même de ces protéines qui les rend très intéressantes fait obstacle à la recherche d’une réponse précise et définitive à la question du nombre « générique » de protéines de signalisation dans la cellule. En conséquence, nous choisissons de présenter une collection d’exemples qui serviront à dresser un aperçu des échelles de concentration pertinentes, tout en restant conscients que le recensement dépend des conditions environnementales auxquelles la cellule est soumise. Pour donner un portrait quantitatif des molécules de signalisation, nous recourons à certains des systèmes les plus célèbres. Peut-être la plus simple des voies de signalisation cellulaires se trouve-t-elle chez les bactéries : il s’agit des systèmes de transduction de signal à deux composants (voir Figure 2‑33A). Ces voies se caractérisent par deux parties majeures : un récepteur lié à la membrane qui reçoit des signaux de l’environnement extérieur, mais qui porte aussi un domaine intracellulaire (histidine-kinase), et un régulateur de la réponse, qui peut subir une modification chimique par le récepteur membranaire. Souvent, ces régulateurs sont des

185

La biologie cellulaire par les nombres

facteurs de transcription qui doivent être phosphorylés pour pouvoir induire des changements d’expression génétique. Chez E. coli, il y a plus de 30 systèmes à deux composants de ce genre (BNID 107848). La figure 2‑33B schématise un système de transduction de signal également central chez les eucaryotes, connu sous le nom de voie MAP-kinase. Comme leurs équivalents bactériens, ces voies permettent à certains stimuli externes, comme une phéromone ou une osmolarité élevée, d’induire un changement de l’état de régulation de la cellule. (A) Signalisation bactérienne à deux composants

(B)

Cascade MAP-kinase eucaryote

ENTRÉE

ENTRÉE

ligand

ligand

P récepteur (histidine kinase)

kinase

ATP ADP

P

protéine régulatrice

P

MAPKKK

MAPKKK

tase spha

SORTIE

P P

P

pho

kinase

P

MAPKK

MAPKK tase spha

P P

P

pho

kinase

P

MAPK tase spha pho

MAPK

P P

P SORTIE

 Figure 2‑33  Modèles de voies de signalisation. (A) Systèmes de signalisation à deux composants chez les bactéries. Le récepteur membranaire est une kinase qui phosphoryle une molécule messagère soluble qui est activée par phosphorylation. (B) Voie MAP-kinase. La protéine MAPKKK phosphoryle MAPKK qui phosphoryle à son tour MAPK qui induit alors un effet.

Le mieux étudié de tous les systèmes bactériens à deux composants est probablement celui lié au chimiotactisme bactérien. Ce système de signalisation détecte des chimio-attractants dans le milieu extérieur, et conduit à un changement de la fréquence à laquelle les cellules motiles se réorientent 46. Les chimiorécepteurs ont une 46.  Ou effectuent un tumble, qui sépare les phases directionnelles (run).

186

2. Concentrations et nombres absolus

sensibilité délicate sur une plage dynamique très large (voir la rubrique « Quelles sont les limites physiques à la détection par les cellules ? », p. 222). La figure 2‑34A montre le diagramme du réseau qui implémente cette belle voie de signalisation. Une des manières dont le recensement stœchiométrique de ces protéines de signalisation est fait utilise des méthodes en bloc, consistant à prélever une population de cellules, à les lyser et à exposer leur contenu à des anticorps dirigés contre la protéine d’intérêt. En comparant la quantité de protéine repêchée par ces anticorps aux quantités mesurées sur les protéines purifiées de concentration connue, on peut mesurer la quantité de protéine (voir Figure 2‑34B pour le système à deux composants du chimiotactisme bactérien). Malgré une différence d’un facteur 10 dans les nombres de molécules par cellule selon la souche et les conditions de croissance, les concentrations relatives de ces différentes molécules sont maintenues à des rapports stœchiométriques presque constants. (A)

ligand (C)

Ch

nb. de molécules par cellule

(B) 40 000

P

rapport

B-P

P

P CheY

100

CheB

P

0

CheB-P

riche min.

(D) souche RP437 souche RP2867 souche OW1 CheA

riche minimal

riche minimal

CheW

riche minimal

riche min. récepteurs CheZ

12

récepteurs Tsr/Tar

20 000

0

Che

récepteurs CheB

rapport

CheY-P

eR

eA

P

récepteurs CheR

Ch

Ch

eA

Me Me Me Me

200

8 récepteurs CheY 4

0

riche min.

riche min.

 Figure 2‑34  Recensement des molécules de la voie de signalisation du chimiotactisme bactérien. (A) Schéma des participants moléculaires impliqués dans le chimiotactisme bactérien. (B) Nombre de molécules réceptrices du chimiotactisme et nombre de molécules de CheA et de CheW (qui relie les récepteurs Tsr/Tar à CheA). Les résultats sont affichés pour différentes souches et différents milieux de culture. (C) Rapport du nombre de récepteurs à CheR et de CheB en milieu enrichi et minimum. (D) Rapport du nombre de récepteurs à CheY et à CheZ (la phosphatase de CheY) en milieu riche et minimal. (B, C et D d’après Li et Hazelbauer (2004).)

187

La biologie cellulaire par les nombres

7500

protéine régulatrice histidine kinase

5000

2500

0

ArcBA RcsDB CpxAR EnvZ/OmpR NarQL NarXL PhoQP BarA/UvrY BasSR BaeSR EvgSA RstBA TorSR DcuSR DpiBA PhoRB UhpBA CusSR CreCB QseCB GlnLG KdpDE GlrKR ZraSR CheAY AtoSC

taux de synthèse (nb. de molécules par génération)

Les années récentes ont vu l’apparition du séquençage d’ADN non seulement comme outil génomique, mais également comme outil biophysique puissant et quantitatif qui permet d’aborder de nombreuses catégories du recensement moléculaire de la cellule. En effet, ces méthodes puissantes ont fortement étoffé l’arsenal des techniques employées pour caractériser les processus du dogme central, tels que le nombre de molécules d’ARNm par cellule et le nombre de protéines. La manière dont ces méthodes fonctionnent consiste à récolter l’ARNm des cellules, par exemple, et à séquencer les parties d’ARNm « protégées » par des ribosomes. L’abondance de fragments protégés fournit une mesure de la vitesse de synthèse de protéine sur le gène correspondant à cet ARNm. Dans le cadre des systèmes de signalisation à deux composants, on a pu effectuer le recensement moléculaire de plus de vingt de ces systèmes par cette méthode, connue sous le nom de profilage ribosomal. Les histidine-kinases se présentent en général avec des dizaines voire des centaines de copies par cellule, tandis que les régulateurs de réponse associés sont bien plus nombreux par cellule, environ d’un ordre de grandeur (voir Figure 2‑35).

 Figure 2‑35  Recensement moléculaire pour des systèmes de signalisation à deux composants chez E. coli. Ces systèmes à deux composants se composent d’une histidinekinase liée à la membrane et d’un régulateur de réponse soluble. La figure montre le nombre de molécules de la kinase et du régulateur de réponse pour plusieurs des systèmes à deux composants d’E. coli. (D’après Li et al. (2014).)

Mais pourquoi devrions-nous nous intéresser à ces nombres de copies de protéines ? Les interactions entre différentes espèces moléculaires dépendent de leurs concentrations. Le processus biologique dépend lui-même souvent des liaisons qui induisent un changement de conformation, que ce soit dans le cadre des chimio-attractants dans le milieu bactérien ou de l’acétylcholine et de l’ouverture des canaux ioniques dans le système nerveux. Cela suggère que tous nos efforts devraient se concentrer sur un recensement minutieux des concentrations dans la cellule. Bien que les concentrations soient la priorité, nous constatons que les nombres absolus servent souvent de base utile pour acquérir une intuition du milieu cellulaire, analogue à

188

2. Concentrations et nombres absolus

« l’intuition profonde de l’organisme » 47 qui animait Barbara McClintock, une des héroïnes de la génétique du XXe siècle. Comparons nos capacités cognitives pour traiter des concentrations et des nombres absolus. Nous avons tous appris très tôt à faire la distinction entre mille et un million, mais il nous faut développer une intuition semblable pour comparer le μM et le mM. Il nous semble que la familiarité et l’intuition concernant des valeurs absolues apportent avec elles des capacités presque automatiques de se faire des notes mentales de ces ordres de grandeur. Nous confondons ainsi rarement mille avec un million ou un milliard, tandis que nous avons été témoins de beaucoup de cas de confusion entre le mM et le μM ou le nM. Dans la suite de cette rubrique, nous faisons en sorte d’insister sur la règle pratique selon laquelle le nombre d’exemplaires caractéristique de nombreuses molécules de signalisation est d’environ un million par cellule mammifère. Il reste que 1 μM en donne une caractérisation plus significative d’un point de vue biochimique. Pour continuer à établir ce genre d’intuition quantitative, nous considérons un autre système de signalisation extrêmement bien caractérisé qui se trouve chez la levure (voir Figure 2‑33B). L’accouplement lié aux phéromones, la version S. cerevisiae de l’attraction sexuelle, utilise la voie MAPK. Cette voie a été étudiée chez la levure à l’aide de méthodes d’immunoprécipitation quantitative améliorées afin de mesurer les concentrations cellulaires des acteurs moléculaires en jeu (voir Figure 2‑36 et Tableau 2‑9). Les nombres de copies par cellule vont de 40 à 20 000 avec des concentrations correspondantes de 1 nM à 1 μM. Bien que S. cerevisiae soit plus petite qu’une cellule HeLa de deux ordres de grandeur (les auteurs ont utilisé un volume de ≈30 μm3), nous voyons que les concentrations tendent à être beaucoup plus semblables à travers les organismes. Dans quelle mesure les effectifs ou les concentrations affectent-elles la fonction de la voie de signalisation ? L’étude des phéromones de levure prouve que la concentration de la protéine structurale (Ste5, environ 500 molécules par cellule, ou ≈30 nM) dicte le comportement cellulaire en effectuant un compromis entre la plage dynamique du système de signalisation et la réponse maximale 48. (A)

(B) phéromone

MAPKKK MAPKK MAPK

Ste11 Ste7 Fus3

fécondation

nombre relatif de protéines de signalisation

nombre de molécules

Ste5

500

Ste7

900

Ste11

4000

Fus3

20 000

 Figure 2‑36  Recensement des protéines dans un système de signalisation de la levure. (A) Schéma de la voie MAPK associée à l’accouplement chez la levure. (B) Recensement des diverses molécules dans la voie de signalisation liée à l’accouplement. (B d’après Thomson et al. (2011).)

47.  Cela fait référence au titre du livre d’E.F. Keller sur la vie et les travaux de Barbara McClintock, A feeling for the organism (Keller 1983). 48. Thomson et al. (2011)

189

La biologie cellulaire par les nombres

 Tableau 2‑9  Nombre de molécules de signalisation associées à la cascade MAPK chez la levure à bourgeon avant ajout de phéromones. Les valeurs proviennent d’expériences d’immunoprécipitation quantitative. La concentration a été calculée pour un volume cellulaire de 29 fL. L’erreur-type quantifie l’incertitude sur le nombre de molécules par cellule dans cette expérience. Les valeurs sont arrondies à un chiffre significatif. (D’après Thomson et al. (2011).) Protéine

Nom

Nombre de molécules par cellule

Erreur-type

Concentration (nM)

Récepteur couplé aux protéines G

Ste2

7 000

400

400

G-α

Gpa1

2 000

300

130

G-β

Ste4

2 000

100

110

PAK kinase

Ste20

4 000

500

200

Structurale

Ste5

500

60

30

Partenaire de liaison à MAPKKK

Ste50

1 000

100

70

MAPKKK

Ste11

4 000

90

200

MAPKK

Ste7

900

70

50

MAPK

Fus3

20 000

3 000

1 100

MAPK

Kss1

20 000

2 000

1 200

MAPK

Hog1

6 000

400

300

Structurale/MAPKK

Pbs2

2 000

200

140

Phosphatase MAPK

Msg5

40

3

2

Inhibiteur du cycle cellulaire

Far1

200

20

14

Activateur transcriptionnel

Stw12

1 400

40

80

Répresseur transcriptionnel

Dig1

5 000

500

300

Répresseur transcriptionnel

Dig2

1 000

80

70

Les voies de signalisation MAPK sont également importantes chez les organismes multicellulaires, où elles constituent un modèle de voie de transduction de signal intimement lié à la régulation de la croissance et à de nombreux autres processus. Une des protéines qui intervient en amont de ces voies est la protéine Ras. Dans les cellules HeLa et les fibroblastes 3T3, on a pu mesurer que cette protéine présentait 104–107 copies sous diverses conditions (BNID 101729). Cette variabilité de près de trois ordres de grandeur indique une large gamme de concentrations viables. Ras interagit avec Raf, qui est estimé à environ 104 copies par cellule et interagit lui-même avec Mek à approximativement 105–107 copies, qui interagit à son tour avec Erk estimé à 106–107 copies. Pour une cellule HeLa avec un volume médian caractéristique de ≈3 000 fL, ces nombres de copies correspondent à des concentrations de ≈10 nM à ≈10 μM, en supposant une distribution homogène dans le

190

2. Concentrations et nombres absolus

volume cellulaire. D’autres voies comme la voie Wnt/caténine-β (BNID 101958) ou TGFβ présentent des échelles de concentration semblables. Une des exceptions à ces concentrations typiques est l’axine dans la voie Wnt/caténine-β, dont la concentration est estimée au pM (BNID 101951). Les effets de localisation spatiale peuvent avoir un effet drastique en augmentant les concentrations efficaces. Un exemple est l’importation dans le noyau de facteurs de transcription provenant du cytoplasme : le nombre absolu ne change pas mais la concentration locale augmente de plusieurs facteurs relativement à sa valeur dans le cytoplasme, ce qui conduit le facteur de transcription dans le noyau à activer ou réprimer des gènes sans que sa concentration globale ne change. Un autre exemple est l’effet des protéines structurales, qui maintiennent des protéines-cibles à côté les unes des autres, facilitant de ce fait leur interaction, comme dans la cascade MAPK évoquée ci-avant. L’importance des effets de concentration locale élevée a conduit Müller-Hill à la considérer comme l’un des ingrédients principaux de la vie 49. Cette étude ainsi que d’autres plus récentes mettent en avant le fait que l’important n’est pas seulement la concentration moyenne ou les nombres absolus, mais aussi comment ces protéines de signalisation s’organisent dans l’espace intracellulaire (BNID 110548). Une des conclusions importantes qui émerge de ces études est une juxtaposition intéressante de la grande variabilité des nombres de molécules de signalisation suivant les conditions de culture et les souches, et du rapport plutôt constant des différents acteurs moléculaires. Très souvent on observe qu’une variation de la concentration est à la fois la cause principale qui détermine la fonction, et la grandeur à laquelle les circuits de la transduction de signal semblent s’adapter. Bien que la variabilité intercellulaire des effectifs présente souvent un facteur 2, un doublement de la proportion relative des composants au cours du temps sera rapidement détecté et induira une réponse forte. Les différentes valeurs présentées ici soulignent le besoin d’une interprétation théorique, qui puisse fournir un cadre pour comprendre, par exemple, l’abondance relative des récepteurs et de leurs partenaires en aval de la voie de signalisation.

Combien de molécules de rhodopsine y a-t-il dans un bâtonnet ? Les réponses des voies de signalisation dépendent fortement du nombre de molécules impliquées dans la réponse au signal d’intérêt. Les concentrations de molécules telles que la rhodopsine dans les cellules photoréceptrices déterminent l’intensité de lumière qui peut être détectée par les yeux chez les vertébrés. Par ailleurs, le nombre de rhodopsines nous aide également à comprendre à quelle fréquence un bâtonnet dans l’obscurité émettra spontanément un signal. Bien que cette emphase sur la rhodopsine puisse sembler très spécifique, il s’agit pour nous d’une étude de cas instructive car la cascade de signalisation liée à la vision est l’une des mieux 49.  Müller-Hill (2006)

191

La biologie cellulaire par les nombres

caractérisées chez l’être humain. De plus, elle présente de nombreux aspects génériques qui se retrouvent dans d’autres phénomènes de signalisation. Parmi les acteurs moléculaires majeurs impliqués, on trouve les récepteurs couplés aux protéines G et les récepteurs ionotropes, des molécules des cascades de signalisation qui sont omniprésentes dans l’ensemble du monde vivant. La figure 2‑37 montre comment les molécules dans le segment externe d’un photorécepteur réagissent à l’arrivée d’un photon absorbé par le pigment rétinien, capturé par l’opsine de manière covalente mais réversible, ce qui forme ensemble la molécule de rhodopsine. (A) segment externe

disque

OBSCURITÉ

Ca2+

GMPc GMPc

segment interne

noyau

GMPc CaM rhodopsine

Gγ Gα Gβ

transducine

PDE6 GDP

membrane du bâtonnet Ca2+ Na+ 4Na+ K+ Ca2+

(B) ACTIVATION

disque

membrane du bâtonnet

lumière Ca2+ Na+ Gγ Gα Gβ

GDP



Gα PDE6*

GTP

4Na+ GMP

GMPc

K+ Ca2+

 Figure 2‑37  Transduction de signal dans la rétine. (A) Dans l’obscurité, la rhodopsine est à l’état inactif et les ions peuvent traverser librement la membrane des bâtonnets. Dans l’obscurité, PDE6, une phosphodiestérase à GMPc, est inactive, et la GMPc peut s’accumuler dans le bâtonnet. La GMPc se lie à un récepteur ionotrope (en vert foncé) qui est perméable aux ions sodium et calcium. Le calcium est réexporté par un contre-transporteur (en marron) : celui-ci récupère l’énergie libérée par les ions sodium et potassium tandis qu’ils suivent leurs gradients électrochimiques, et l’utilise pour réexporter les ions calcium à contre-courant de leur gradient. (B) L’activation de la rhodopsine par la lumière conduit à l’hydrolyse de la GMPc, ce qui ferme les canaux cationiques. Lorsqu’un photon active une rhodopsine, cela déclenche un échange GTP-GDP sur la transducine, et la sous-unité α de la transducine active à son tour PDE6, qui clive la GMPc. Les récepteurs ionotropes se ferment et le potentiel transmembranaire devient plus fortement négatif. (D’après Stockman et al. (2008).)

192

2. Concentrations et nombres absolus

Dans cette rubrique, nous réalisons plusieurs estimations pour établir le nombre de rhodopsines présentes dans un photorécepteur. Nous commençons par estimer le nombre de disques de membrane dans le segment externe d’un bâtonnet. Le segment externe du bâtonnet fait approximativement 25 µm de long et est rempli de disques de membrane d’environ 10 nm d’épaisseur, espacés de 25 nm (voir Figure 1‑13, p. 68). Cela signifie qu’il y a environ 1 000 de ces disques dans le segment externe d’un bâtonnet. Étant donné que le bâtonnet lui-même a un rayon d’environ 1 µm, cela signifie que la superficie de chaque disque est d’environ 6 µm2, soit une superficie globale des disques de membrane de 6 000 µm2. Une manière simple d’estimer le nombre de rhodopsines dans chaque segment externe de bâtonnet est de faire une hypothèse sur la densité surfacique de rhodopsines dans les disques de membrane. On sait que les rhodopsines sont étroitement tassées dans les disques de membrane et nous pouvons estimer que leur espacement moyen est de 5–10 nm (c’est-à-dire environ un à deux diamètres d’une protéine caractéristique), correspondant à une densité surfacique de 1/25 à 1/100 nm–2. À la lumière de ces densités surfaciques, nous pouvons encadrer le nombre de rhodopsines par disque de membrane entre (6×106 nm2) × (1/25 nm–2) ≈ 2 × 105 et (6×106 nm2) × (1/100 nm–2) = 6×104. Les valeurs empiriques sont de ≈105 rhodopsines par disque de membrane ou ≈108 par photorécepteur (BNID 108323), qui est de l’ordre du nombre total de protéines attendues pour ce volume cellulaire (voir la rubrique « Combien de protéines y a-t-il dans une cellule ? », p. 152). C’est cette compacité qui permet à l’œil de fonctionner si bien à des intensités lumineuses extrêmement faibles. Pour une molécule capable d’absorber des photons, telle que le rétinal, il est commode de définir la section efficace qui mesure son pouvoir absorbant. Concrètement, la section d’absorption est définie comme la surface perpendiculaire au rayonnement incident telle que le produit du flux de photons par cette surface soit égal au nombre de photons absorbés par la molécule. Cette grandeur relie une propriété physique (le pouvoir absorbant) à une grandeur géométrique (l’aire du photorécepteur). La section efficace du rétinal est d’environ 1 Å2 (BNID 111337), c’est-à-dire 10–2 nm2. Voyons un exemple d’application de cette notion. Avec 108 rhodopsines par photorécepteur, la section d’absorption totale vaut (10–2 nm2/rhodopsine) × (108 rhodopsines/photorécepteur) = 1 µm2/photorécepteur. Chaque cellule photoréceptrice a une surface d’environ 4 µm2 (voir la rubrique « Quelle taille fait un photorécepteur ? », p. 65). De la similitude entre la section d’absorption et la section réelle du photorécepteur, nous pouvons déduire que l’ordre de grandeur de la concentration de rhodopsine est compatible avec une absorption efficace de tous les photons incidents (au moins à des niveaux de faible luminosité, lorsque la réactivation de la rhodopsine après absorption n’est pas limitante). Cela ne signifie pas qu’il n’y a pas de perte de photon. En effet, pour améliorer leur vision de nuit, de nombreux animaux nocturnes ont une couche spéciale sous la rétine appelée le tapetum lucidum, ou tapis clair : celui-ci agit comme un réflecteur et renvoie à la rétine les photons qui n’ont pas été absorbés par les rhodopsines, pour leur donner une deuxième chance d’absorption. Cela améliore la capacité de ces animaux à chasser des proies la nuit et permet à des naturalistes d’identifier les hyènes et les loups (ainsi que les chats domestiques) à distance la nuit, en cherchant des yeux brillants qui réfléchissent la lumière d’une lampe-torche.

193

La biologie cellulaire par les nombres

Le recensement membranaire de la rhodopsine éclaire également la fréquence à laquelle les bâtonnets subissent des isomérisations thermiques spontanées du rétinal. En effet, des mesures de courant effectuées sur différents bâtonnets mettent en évidence des isomérisations spontanées (voir Figure 2‑38). Une lecture graphique permet d’estimer environ 30 isomérisations pendant 1 000 secondes, soit une fréquence d’un événement toutes les 30 secondes pour l’ensemble des rhodopsines du bâtonnet. La fréquence globale s’écrit : fréquence = (nombre de rhodopsines) × (fréquence/rhodopsine) Grâce au nombre de rhodopsines estimé ci-avant, nous en déduisons que la fréquence d’isomérisation spontanée par rhodopsine vaut (30/1000 s)/10–8 = 3×10–10 s–1, ou environ une fois tous les 100 ans ! 4 pA 2 0

obscurité

lumière 0

100

200 temps (s)

300

 Figure 2‑38   Isomérisation spontanée du rétinal. Les trois tracés principaux correspondent au courant mesuré au cours du temps sur un seul photorécepteur dans l’obscurité. Le tracé inférieur montre le courant en présence de lumière et démontre que les canaux ioniques sont fermés en présence de lumière. (D’après Baylor et al. (1980).)

La cascade de signalisation qui suit l’absorption d’un photon commence seulement par l’isomérisation d’une molécule de rétinal. Une fois que la molécule de rhodopsine a été activée ainsi, elle déclenche une cascade de signalisation dans le bâtonnet, qui amplifie le signal initial (voir Figure 2‑37, et plus quantitativement Figure 2‑39). En particulier, la rhodopsine activée rencontre un récepteur membranaire couplé aux protéines G et active sa sous-unité alpha. Au cours d’une période de 100 ms, une rhodopsine activée créera ≈103 de ces sous-unités alpha actives (Gα) comme expliqué en détail dans le merveilleux livre de R.W. Rodieck 50. Ces molécules se lient à une autre molécule connue sous le nom de phosphodiestérase, qui peut convertir la guanosine monophosphate cyclique (GMPc) en guanosine monophosphate (GMP). Cette réaction moléculaire a pour conséquence que la GMPc active les canaux GMPc-dépendants (les récepteurs ionotropes) de la membrane du bâtonnet qui permettent le changement du potentiel de membrane. Par conséquent, l’activation du récepteur par des photons conduit à une fermeture des

50.  Rodieck (2003)

194

2. Concentrations et nombres absolus

canaux et à un changement du potentiel de membrane. La figure 2‑40 présente le recensement des divers acteurs moléculaires impliqués dans cette cascade de signalisation. Bien que nous puissions représenter les détails moléculaires et les nombres de copies correspondants de manière compliquée, comme une machine de Rube Goldberg, l’avantage évolutionnaire de cette forme particulière de cascade, outre la nécessité évidente d’amplifier un signal faible, reste un mystère même pour les chercheurs dans ce domaine. Pour finir, considérons une autre grandeur étonnante liée à la fonction du bâtonnet. Chaque molécule de pigment blanchit juste après avoir absorbé un photon, et il lui faut environ 10 minutes et une série d’étapes biochimiques après transport dans un autre organite pour régénérer complètement (BNID 111399, 111394). C’est à l’ensemble des pigments présents dans le bâtonnet qu’il incombe de compenser ce long délai.

1 molécule de rhodopsine absorbe 1 photon 103 molécules de protéine G (transducine) sont activées

nombre relatif de protéines dans le disque rhodopsine

R 103 molécules de phosphodiestérase sont activées 105 molécules de GMP cyclique sont hydrolysées 300 canaux Na+ se ferment 106–107 Na+ restent bloqués à l’extérieur de la cellule pendant ~1 s le potentiel de membrane varie de 1 mV

transducine Gγ Gα Gβ

GDP

phosphodiestérase PDE6 canal à GMPc GMPc

SIGNAL TRANSMIS AU CERVEAU

 Figure 2‑39  Le signal est amplifié à plusieurs étapes de la voie de signalisation, de sorte que l’énergie d’un photon déclenche finalement une variation de charge nette d’environ un million d’ions sodium.

Na+ Ca2+

 Figure 2‑40  Recensement des principales molécules impliquées dans la cascade de signalisation dans la rétine.

195

La biologie cellulaire par les nombres

Combien de ribosomes y a-t-il dans une cellule ? Un des refrains familiers de la plupart des manuels de biologie est que les protéines sont les chevaux de labour de la cellule. En conséquence, les cellules font très attention à toutes les étapes entre le décryptage de l’information génétique cachée dans l’ADN et l’expression de protéines actives. Une des manières dont le rythme global de production de protéine est contrôlé est le dosage du nombre de ribosomes. Les ribosomes sont l’un des constituants dominants des cellules, et dans des cellules en division rapide, ils occupent bientôt une fraction significative de l’espace intracellulaire. L’ARN composant ces ribosomes constitue ≈85 % de la totalité de l’ARN de la cellule (BNID 106421). Bien que la réplication d’ADN, la transcription et la traduction soient les trois piliers du dogme central, la fraction du protéome consacrée à l’ADN polymérase (BNID 104123) ou à l’ARN polymérase (BNID 101440) est bien plus faible que les dizaines de pourcent de protéines dédiées aux ribosomes (BNID 107349, 102345). Ainsi, le nombre de ribosomes acquiert un intérêt particulier, tout comme sa dépendance à l’égard du taux de croissance. Le travail pionnier de Schaechter et ses collaborateurs a établi très tôt le fait notable que la fraction ribosomale est une fonction du taux de croissance mais est relativement indépendante du substrat, c’est-à-dire que dans différents milieux menant à des taux de croissance semblables, les fractions ribosomales tendent à être semblables 51. Les membres de ce qu’on peut appeler l’« école de Copenhague » (dont font partie Schaechter, Maaloe, Marr, Neidhardt, Ingraham et d’autres) ont approfondi la caractérisation quantitative de la façon dont les constituants cellulaires varient avec le taux de croissance. Leurs résultats servent de référence des décennies après leur publication et fournit un exemple irrésistible de biologie quantitative bien avant l’avènement des techniques haut-débit.  Tableau 2‑10  Nombre et fraction de ribosomes en fonction du temps de doublement. Les valeurs sont arrondies à un chiffre significatif. Le nombre de ribosomes et la masse sèche par cellule provient de Bremer et Dennis (1996). La fraction de masse sèche fait l’hypothèse d’une masse de ribosome de 2.7 MDa (BNID 100118). Période de doublement (min)

Nombre de ribosomes par cellule

Masse sèche par cellule (fg)

Fraction massique de ribosomes (%)

Fraction ribosomale × période de doublement (min)

24

72 000

870

37

9.0

30

45 000

640

32

9.5

40

26 000

430

27

11

60

14 000

260

24

14

100

6 800

150

21

20

51. Schaechter et al. (1958)

196

2. Concentrations et nombres absolus Proportion de ribosomes de la masse sèche cellulaire à un taux de croissance proche du taux maximal période de doublement de 24 min 70 000 ribosomes (Mribo = 2.7 MDa) masse cellulaire sèche 1 pg g 70 000 x 2.7 x 106 mol

fraction massique sèche =

1 x 10

–12g

x

1 6 x 1023

mol

1 3

 Estimation 2‑10  Proportion de ribosomes dans la masse sèche cellulaire à un taux de croissance proche du taux maximal.

proportion de protéines ribosomales synthétisées relativement à l’ensemble des protéines

Le tableau 2‑10 montre le nombre de ribosomes chez E. coli pour différents temps de doublement. On voit ainsi comment la masse (et le volume) cellulaire dépend fortement du taux de croissance, les cellules qui se divisent plus rapidement étant beaucoup plus grandes. Comme calculé dans la quatrième colonne du tableau et indiqué schématiquement sur l’estimation 2-10, à un temps de doublement rapide de 24 minutes, les 72 000 ribosomes par cellule représentent plus de 1/3 de la masse sèche de la cellule. La figure 2‑41 présente des mesures précises de cette fraction réalisées dès les années 70. 0.3

0.2

0.1

0

0 1 2 taux de croissance (nb de doublements / heure)

 Figure 2‑41  Rapport du taux de synthèse de protéine ribosomale au taux de synthèse protéique globale de la cellule. Les mesures ont été effectuées sur des cultures en croissance équilibrée et le taux relatif est donc semblable à l’abondance relative des protéines ribosomales dans le protéome. D’après Neidhardt et al. (1994).

Plusieurs modèles ont été proposés pour expliquer les tendances observées pour le nombre de ribosomes par cellule. Afin de se diviser, une cellule doit répliquer l’ensemble de ses protéines. Si la vitesse de traduction est constante, on peut effectuer une déduction élégante. Nous faisons cette hypothèse quoique la vitesse de traduction varie chez E. coli de ≈20 aa/sec en croissance rapide à près de ≈10 aa/sec en croissance lente (BNID 100059). Considérons un volume donné de cytoplasme.

197

La biologie cellulaire par les nombres

Indépendamment de la période de doublement, les ribosomes présents dans ce volume doivent produire toute la masse de protéine contenue dans ce volume au cours d’un cycle cellulaire. Si le cycle cellulaire est trois fois plus court, par exemple, alors la concentration de ribosome nécessaire doit être trois fois plus élevée pour accomplir cette tâche. Cela suppose implicitement que la vitesse de polymérisation est constante, que la dégradation active de protéine est négligeable et que la teneur globale en protéines ne varie pas avec le taux de croissance. C’est sur cette logique que repose la prévision que la fraction ribosomale est proportionnelle au taux de croissance. Autrement dit, si la période de doublement diminue, la fraction ribosomale nécessaire devrait augmenter de sorte que le produit de la fraction ribosomale par le temps de doublement soit une constante qui correspond à la concentration totale du protéome. L’analyse suggère également que le taux de synthèse varie comme le carré du taux de croissance, parce que le temps mis pour atteindre la concentration de ribosomes nécessaire diminue en proportion directe de la période de doublement. À quel point ce modèle simple correspond-il aux observations expérimentales ? Le rapport de la fraction de ribosome au taux de croissance est relativement constant pour une croissance plus rapide, de 24 à 40 minutes (voir Tableau 2‑10 et Figure 2‑41), comme le prévoit le modèle simple ci-dessus. De plus, le facteur de proportionnalité n’est pas constant à croissance lente. En effet, dans ce cas, la vitesse de traduction ribosomale semble également ralentie (BNID 100059). Des modèles plus élaborés 52 qui considèrent différents compartiments cellulaires (par exemple, une fraction protéique indépendante du taux de croissance, une fraction liée aux ribosomes et une fraction liée à la qualité du milieu de croissance) font des prévisions plus nuancées qui correspondent aux mesures sur une plage de conditions expérimentales plus étendue. Ce genre de modèles est un grand pas pour pouvoir répondre à la question fondamentale de ce qui régit le taux de croissance maximal des cellules. Traditionnellement, la mesure du nombre de ribosomes par cellule consistait à séparer les ribosomes du reste des constituants cellulaires, à mesurer la fraction de ces ribosomes relativement à la masse totale, puis, à l’aide de facteurs de conversion fondés sur des estimations du volume et de la masse cellulaire, de la masse moléculaire des ribosomes, etc., de déduire l’abondance de ribosomes dans la cellule. Une approche plus directe est récemment devenue possible : elle consiste à compter explicitement les ribosomes sur des images de la cellule. En microscopie cryo-électronique, on congèle rapidement des cellules et on les observe de plusieurs angles différents pour créer ce que l’on appelle une carte 3D tomographique, ou tomogramme, de la cellule. La structure connue du ribosome peut alors être utilisée comme gabarit à chercher dans le tomogramme complet de la cellule. Cette technique a par exemple été appliquée à Spiroplasma melliferum, un petit procaryote en forme d’hélice. Dans cette cellule minuscule, 10–100 fois plus petite qu’E. coli en volume (BNID 108949, 108951), et qui croît plus lentement, les chercheurs ont pu compter en moyenne 1 000 ribosomes par cellule (voir Figure 2‑42 ; BNID 108945). Un décompte direct semblable a été réalisé à l’aide de techniques de super-résolution qui ont récemment transformé la microscopie à fluorescence (voir Figure 2‑43 pour des ribosomes chez E. coli). 52. Scott et al. (2010)

198

2. Concentrations et nombres absolus

(A)

(B)

(C)

100 nm

ribosomes

50 nm

 Figure 2‑42  Tomographie cryo-électronique du minuscule procaryote Spiroplasma melliferum. Des algorithmes de reconnaissance et de classification de structures ont permis de déceler et de compter les composants cellulaires tels que les ribosomes. (A) Image de microscopie cryo-électronique. (B) Reconstruction 3D montrant les ribosomes détectés. Les ribosomes marqués en vert ont été identifiés avec une haute fidélité, ceux marqués en jaune avec une fidélité moyenne. (C) Agrandissement d’une partie de la cellule. D’après Ortiz et al. (2006).

(B) intensité lumineuse de la molécule 400 350 300 250 200 150 100 50 0 0 2000 4000 intensité de fluorescence

fréquence

ribosome marqué unique

1 µm

probabilité

nucléoïde riche en ADN 1 0.8 0.6 0.4 0.2 0

(C) 80 000 nb. de ribosomes

(A)

70 000 60 000 50 000 40 000 30 000

1.4 1.6 1.8 2.0 2.2 2.4 volume cellulaire (µm3)

–2

–1 0 1 position (µm)

2

 Figure 2‑43  Décompte et localisation des ribosomes à l’intérieur de cellules par microscopie à l’échelle moléculaire. (A) Deux ribosomes identifiés sur l’image de super-résolution. (B) Distribution d’intensité de molécules individuelles. (C) Nombre de ribosomes en fonction du volume cellulaire. (D’après Bakshi et al. (2012), avec l’autorisation des éditions John Wiley & Sons.)

199

La biologie cellulaire par les nombres

L’estimation 2‑11 compare les résultats de ces deux méthodes, en évaluant d’abord la densité de ribosomes à partir des images de microscopie cryo-électronique, puis en l’utilisant pour le volume d’E. coli : cela démontre une uniformité encourageante entre les différentes méthodes. Combien de ribosomes y a-t-il dans un volume cellulaire ? L 150 nm

R 50 nm

volume cellulaire

πR2L

densité ribosomale

3 x (50 nm)2 x 150 nm

50 ribosomes 10–3 µm3

106 nm3

10–3 µm3

50 000 ribosomes/µm3

 Estimation 2‑11  Combien de ribosomes y a-t-il dans un volume cellulaire ?

200

3 Forces et énergies

La force et l’énergie sont deux des grands concepts unificateurs de la physique et de la chimie. Mais ces deux concepts-clés sont également essentiels pour l’étude des organismes vivants. Dans ce chapitre, nous nous servons d’une série d’études de cas pour donner une intuition des échelles de force et d’énergie pertinentes en biologie cellulaire (Figure 3-1). concentration 10× activation plus élevée que l’équilibre d’une enzyme agitation thermique (kBT)

liaison hydrolyse hydrogène de l’ATP

100

101

oxydation du NADH photon

ionisation de l’atome H respiration du glucose (≈ 30 ATP)

liaison covalente (C–C)

combustion du glucose

102

103 –21

1 kBT ≈ 2.5 kJ/mol ≈ 0.6 kcal/mol ≈ 25 meV ≈ 4.1 pN × nm ≈ 4.1 × 10

J

104

énergie (kBT)

 Figure 3‑1  Échelle des énergies caractéristiques au centre des processus biologiques. Les énergies vont de l’agitation thermique à la combustion de la riche molécule de glucose.

Dans la première partie de ce chapitre, nous examinons certaines des principales valeurs d’échange énergétiques chez les organismes vivants, ce qui détermine leur ordre de grandeur et à quoi cette énergie sert. L’idée-maîtresse est que l’unité

201

La biologie cellulaire par les nombres

fondamentale d’énergie en biologie physique est déterminée par l’énergie d’agitation thermique – en l’occurrence, kBT, où kB est la constante de Boltzmann et T est la température en Kelvin. Notre discussion de l’énergie thermique s’attache à la manière dont de nombreux processus biologiques reflètent une compétition entre l’entropie et l’énergie. Rappelons que l’enthalpie libre G s’écrit : G = H – TS, où H désigne l’enthalpie et S l’entropie. Qu’il s’agisse de l’assemblage spontané de protéines de capside pour former des virions, ou de la liaison d’un chimio-attractant à un récepteur, les effets opposés de l’entropie et de l’enthalpie déterminent l’état du système. Nous commençons par la principale devise énergétique de la cellule, l’ATP, puis nous examinons deux autres systèmes de stockage et d’échange d’énergie : les potentiels transmembranaires et la source du pouvoir réducteur dans des composés tels que le NADPH. Puis nous passons à l’étude du potentiel redox et de la fascinante série d’interactions moléculaires qui se produisent au cours des réactions d’oxydoréduction dans la cellule. Dans la seconde partie de ce chapitre, nous complétons l’étude de l’énergie par une exploration de la manière dont l’énergie est convertie en travail utile à travers l’application de forces. Notre étude des forces commence par décrire comment aussi bien les moteurs moléculaires que les filaments du cytosquelette exercent des forces, dans des processus qui vont du transport vésiculaire à la séparation des chromosomes, en passant par la division cellulaire et le déplacement des cellules sur une surface. S’ensuit une discussion des limites physiques des appareils de production de force tels que les filaments du cytosquelette. Quelle force un filament d’actine ou un microtubule peut-il soutenir avant de rompre ? En écrivant ce chapitre, nous nous sommes aperçus qu’il est facile d’évaluer avec précision certaines énergies, comme celle du photon ou de la combustion du sucre ; mais cette évaluation est plus délicate pour d’autres énergies, qui dépendent de la concentration de divers acteurs moléculaires : c’est le cas de l’hydrolyse de l’ATP. Enfin, dans certains cas, il est très difficile de définir l’énergie, sans parler d’en donner une estimation numérique. Parmi les exemples de ces cas subtils, on trouve l’énergie d’une liaison hydrogène, l’enthalpie libre associée à l’effet hydrophobe et le coût entropique de la formation d’un complexe de deux molécules. S’il est facile de définir clairement la longueur et la largeur d’un objet biologique et de les distinguer, il est beaucoup plus difficile de distinguer l’énergie issue d’une liaison hydrogène de celle provenant des autres interactions, comme avec l’eau environnante. Dans l’ensemble, les études de cas exposées dans ce chapitre démontrent l’importance de l’énergie dans les systèmes biologiques, et visent à donner une intuition des transformations énergétiques nécessaires à la croissance et à la survie cellulaire.

202

3. Forces et énergies

La biologie rencontre la physique Quelle est l’échelle d’énergie thermique et quelle est sa pertinence en biologie ? Les molécules sont impliquées dans un ballet incessant de mouvements aléatoires, qui résultent de leurs collisions avec les molécules du milieu environnant (voir aussi la discussion sur le mouvement brownien dans la rubrique intitulée « Quelles sont les échelles de temps de la diffusion à l’intérieur d’une cellule ? », p. 257). Lorsque Robert Brown découvrit les mouvements qui portent aujourd’hui son nom, il n’était pas clair que ses observations étaient au cœur de l’un des principes organisateurs les plus importants de toute la biologie – en l’occurrence, la manière dont la compétition entre des énergies déterministes et des énergies stochastiques régit presque tous les processus moléculaires de la vie. Les conséquences physiques qui résultent des forces thermiques nous sont familières à tous. Par exemple, considérons la diminution de la densité de l’air avec l’altitude. Le fait que la densité de l’air dépende de l’altitude reflète l’interaction entre la force de pesanteur, qui implique un potentiel énergétique croissant à mesure que les molécules s’élèvent dans l’atmosphère, et le gain entropique, qui provient des possibilités qu’ont les molécules d’explorer un plus grand volume en allant plus haut. Dans le contexte de la biologie moléculaire et cellulaire, la façon la plus simple d’estimer les effets de la compétition entre les termes énergétique et entropique qui contribuent à l’enthalpie libre consiste à égaliser l’énergie déterministe d’intérêt à la valeur kBT, qui reflète l’échelle d’énergie thermique. Pour voir ce que cela donne dans l’exemple quotidien de la densité de l’air en fonction de l’altitude, cette stratégie correspond à égaliser l’énergie potentielle de pesanteur de la molécule, qui s’écrit mgh, à l’énergie thermique kBT (voir Tableau 3-1). En résolvant cette équation d’inconnue h, on obtient une échelle spatiale de : h = kBT /mg ≈ 10 km, ce qui constitue effectivement une estimation cohérente de l’altitude à laquelle la densité de l’atmosphère est notablement réduite par rapport à la densité à la surface de la Terre (plus précisément, par un facteur égal à e, le nombre d’Euler, soit environ 3). En mécanique statistique, on formalise l’équilibre entre l’énergie et l’agitation thermique par la distribution de Boltzmann, selon laquelle la probabilité qu’un état possède une énergie E est proportionnelle à exp(–E/kBT ). Ce facteur quantifie l’accessibilité des états microscopiques en fonction des différentes valeurs d’énergie relativement à l’énergie thermique. Dans le contexte de la cellule, la compétition entre les énergies thermique et déterministe fait émerger plusieurs échelles spatiales (voir le Tableau 3‑1 pour des exemples). Si nous considérons l’ADN (ou un filament du cytosquelette) comme une barre élastique, alors égaliser l’énergie de courbure à l’énergie thermique donne l’échelle de longueur au-delà de laquelle l’agitation thermique peut produire une

203

La biologie cellulaire par les nombres

courbure spontanée : il s’agit de la longueur de persistance. Pour l’ADN, cette longueur vaut environ 50 nm (BNID 103112), et pour les filaments d’actine, bien plus rigides, elle vaut 10 µm (BNID 105505). Dans le cas de particules chargées en solution, la compétition entre les forces électrostatiques de Coulomb et les effets thermiques est régie par une autre échelle spatiale, appelée la longueur de Bjerrum. Elle correspond à la distance à laquelle l’énergie potentielle d’attraction électrique atteint kBT, et elle représente la distance au-dessous de laquelle les effets électrostatiques dominent l’agitation thermique. Pour deux particules chargées dans l’eau, la longueur de Bjerrum vaut environ 0.7 nm (BNID 106405).  Tableau 3‑1  Échelles de longueur caractéristiques qui émergent de l’interaction des énergies déterministes et thermiques. Échelle de longueur

Énergie associée

Entropie associée

Équation mgh  kBT  hth 

Gravitation

Occupation d’états dans l’espace

Longueur de persistance

Élastique (flexion)

EI EI Nombre d’états   kBT   p  k T p B d’une chaîne E : module d’Young polymère I : moment d’inertie

Longueur de Bjerrum

Occupation Interaction d’états dans électrostatique l’espace

Longueur de Debye

BNID

8 km

111406

ADN : 50 µm actine : 10 µm microtubule : 1‒10 µm

103112, 105505, 105534

0.7 nm

106405

1 nm (pour une concentration ionique de 100 mM)

105902

kBT mg

Longueur de décroissance de la concentration atmosphérique

Occupation Interaction d’états dans électrostatique l’espace

Longueur caractéristique

m : masse h : altitude g : accélération de la pesanteur

kq 2 kq 2  kBT  l B  kBT lB q : charge k : constante de Coulomb 2c D2 q 2  kBT 0D  Dk T  D  0 B2 2c q c ∞  : concentration en ion D : constante diélectrique

Les exemples ci-dessus constituent un premier exercice pour réfléchir aux phénomènes ubiquitaires des réactions de complexation en biologie. En réfléchissant à l’équilibre entre un état lié et un état libre, comme lors de la liaison de l’oxygène à l’hémoglobine, un ligand à un récepteur, ou entre un acide H-A et sa base conjuguée A-, il y a une compétition entre les énergies de liaison (terme enthalpique) et la multiplicité des états associés à l’état libre (terme entropique). On peut étudier formellement cette équivalence à l’aide de l’enthalpie libre ∆G. Les potentiels

204

3. Forces et énergies

thermodynamiques, telle l’enthalpie libre, tiennent compte des influences opposées de l’enthalpie et l’entropie. Bien que l’enthalpie libre soit souvent l’outil le plus commode pour le calcul, il faut néanmoins garder à l’esprit que, conceptuellement, il vaut mieux réfléchir à la thermodynamique de la situation à l’aide de l’entropie du système d’intérêt et du « réservoir » environnant : les réactions tendent à se produire lorsqu’elles ont tendance à augmenter l’entropie du monde. Le terme enthalpique, qui quantifie l’énergie dégagée lors de la formation d’une liaison, est un résumé commode de la quantité d’entropie créée à l’extérieur du système suite à la chaleur produite par cette réaction. À la lumière de ces idées sur l’enthalpie libre, nous pouvons reformuler les questions de liaison en termes de compétition entre l’enthalpie et l’entropie. L’entropie gagnée par le fait d’avoir une particule libre est, dans l’approximation usuelle des solutions diluées, proportionnelle à –ln(c /1 M), où c est la concentration. Notons que nous faisons attention de ne pas froisser les règles mathématiques, qui n’autorisent que le logarithme d’une valeur sans dimension : c’est pourquoi nous divisons par une concentration standard. Plus la concentration c est faible, plus le gain d’entropie dû à la particule libre supplémentaire est élevé (noter le signe moins devant le logarithme). Mais comment relier le gain d’entropie à l’enthalpie ? Ce lien implique encore une fois la grandeur kBT. Notons que kBT⋅ln(c /1 M) a la dimension d’une énergie, et correspond à la contribution entropique à l’enthalpie libre gagnée par la dissociation d’une molécule d’intérêt. En comparant ce terme entropique à l’énergie dégagée par la formation d’une liaison, le terme le plus élevé des deux détermine la direction de la réaction, c’est-à-dire vers la formation d’une liaison ou bien vers la dissociation. Lorsque les deux termes sont égaux, cela correspond à un état d’équilibre ayant une propension égale à former des liaisons ou à les dissocier. En calculant la condition d’égalité, nous pouvons déterminer la concentration critique à laquelle les termes entropiques et enthalpiques s’équilibrent exactement. Munis de cette façon de voir, nous pouvons à présent nous intéresser à l’un des cas d’école que connaît tout étudiant de biochimie. Plus précisément, voyons comment on peut comprendre les pKa des acides aminés en tant que résultat d’une compétition. On peut comprendre cette compétition comme l’équilibre entre l’avantage entropique de libérer des charges pour les laisser se promener en solution, et les avantages énergétiques résultant des interactions telles que la loi de Coulomb, qui tend à rapprocher les charges opposées. Le pKa est défini comme le pH auquel un groupe ionique (donneur de H+) est présent sous sa forme ionisée et sa forme neutre en concentrations égales (il s’agit alors de la concentration d’ionisation moitié). Dans le terme d’entropie vu ci-avant, c devient alors 10–pKa M. La compréhension du lien entre le pKa et le terme entropique nous permet de mieux apprécier le sens du pKa en tant que paramètre de contrôle. Remarquons que la variation d’entropie due à la dissociation d’une molécule (ou d’un ion) à la concentration c est : ∆S = –kB⋅ln(c /1 M) Pour c = 10–pKa M, la variation d’entropie s’écrit : ∆S = pKa ∙ kB ln(10)

205

La biologie cellulaire par les nombres

En particulier, si le pKa est plus élevé d’une unité, le terme entropique nécessaire pour contrebalancer l’énergie d’interaction (le gain enthalpique) augmente de kBT⋅ln(10), c’est-à-dire 6 kJ/mol (voir la règle pratique qui relie les concentrations relatives et les énergies p. 37). Si l’interaction est purement électrostatique, nous pouvons l’interpréter à l’aide de la loi de Coulomb : prenons par exemple deux charges opposées distantes de 0.3 nm ou de 0.15 nm (deux distances interatomiques caractéristiques). L’énergie électrostatique entre ces charges dans l’eau est plus faible de 6 kJ/mol pour la distance lorsque les charges sont plus proches de 0.15 nm (la différence entre 0.3 et 0.15 nm) D’après la relation ci-dessus entre variation d’entropie et concentration, ce rapprochement va avec un rapport de concentrations inférieur d’un facteur 10, et donc un pKa plus élevé d’une unité (voir Estimation 3‑1). Cela explique pourquoi, à l’équilibre, pour une distance plus courte entre les charges, la force d’attraction électrostatique est plus élevée et la concentration d’ionisation moitié des charges isolées dans le solvant est plus faible. Une concentration plus faible occasionne en effet un gain entropique plus élevé pour chaque charge individuelle, permettant de compenser la force d’attraction. Il s’agit d’une manifestation, certes assez abstraite, Comprendre pourquoi pKaforces varie enetfonction de la distance de la manière dont les les énergies sont liées aux concentrations. de liaison : la compétition énergie-entropie constante de dissociation de l’acide

pKa ( –log10(Ka/1M)) est le pH auquel un site est à moitié lié r1

r2

c1

c2

charges individuelles

terme enthalpique (électrostatique) U =

q1 x q2 4π ε0εrr 80 dans le cas de l’eau

∆U = U2 – U1 = –3 x 10–30J x m

q1 x q2 4π ε0εr

1 1 1 Jxm = –2 x 10–6 x – mol r2 r1 0.3 x 10–9m

Jxm –2 x 10–6 mol

–6 kJ/mol

2kBT

prenons r1 = 0.3 nm; r2 = 0.15 nm

terme entropique à l’équilibre : ∆Genthalpique 6 kJ/mol = –kBT ln(c2/c1)

c2/c1 0.1

∆pH = 1

∆pKa = 1

Un pKa plus élevé conduit à une liaison forte: la dissociation se produit donc à de faibles concentrations, pour lesquelles la contribution entropique est plus élevée pour la dissociation.

 Estimation 3‑1  Comprendre la variation de pKa en fonction de la distance de liaison : la compétition énergie-entropie.

206

3. Forces et énergies

Il est intéressant de noter qu’à l’échelle du nanomètre, l’énergie de nombreux phénomènes physiques prend un même ordre de grandeur (voir Figure 3‑2). Cette convergence peut expliquer que la vie des biomolécules soit si riche : au lieu d’être soumises à un phénomène majeur qui domine les interactions, comme la gravitation aux échelles astronomiques, elles sont régies par un jeu subtil entre, par exemple, la répulsion électrostatique et les forces d’attraction, les déformations mécaniques, l’énergie thermique et les énergies de liaison chimique.

énergie électrostatique d’une coque sphérique

1

énergie (J)

10– 5 10–10 10–15

fracture d’une poutre 20:1

proton liaisons chimiques

noyau

énergie thermique

10–20

énergie de liaison d’un électron dans une boîte

10– 25 10–30

flexion d’une poutre 20:1

10 –15

10 –12

10 – 9

10 – 6

10 –3

longueur (m)

 Figure 3‑2  À l’échelle du nanomètre, les énergies associées à de nombreux phénomènes physiques convergent et présentent un ordre de grandeur semblable. (D’après Phillips et Quake (2006).)

Quelle est l’échelle d’énergie d’une liaison hydrogène ? Les liaisons hydrogène sont omniprésentes et au cœur de nombreux phénomènes biologiques, tels que la formation des hélices alpha et des feuillets bêta, les structures secondaires des protéines (voir Figure 3‑3). De même, la double hélice de l’ADN repose sur la liaison de paires de bases, chaque adénine formant deux liaisons hydrogène avec la thymidine et chaque cytosine formant trois liaisons hydrogène avec la guanine (voir Figure 3‑4). Des liaisons hydrogène peuvent également réunir un acide nucléique et une protéine, comme lors de la liaison des facteurs de transcription à l’ADN. Ces liaisons régissent le taux de dissociation du facteur de transcription, et donc aussi la constante de dissociation 53. De plus, les liaisons hydrogène sont souvent essentielles pour le fonctionnement des sites actifs catalytiques des enzymes. 53.  En revanche, le taux d’association est souvent contrôlé par la diffusion et n’est donc pas spécifique au site de liaison (voir aussi la rubrique sur les vitesses de réaction, p. 267). (NdA)

207

La biologie cellulaire par les nombres

feuillet bêta

hélice alpha

liaison H R

R R

R

R

R R

0.54 nm

liaison H R

carbone

R

R R

R R

R

azote R

R

R

R

oxygène

0.7 nm

R

liaison peptidique

hydrogène

R

R

chaîne latérale d’un acide aminé

R

R

R

 Figure 3‑3  Liaisons hydrogène et structures secondaires des protéines. Ces structures, appelées l’hélice alpha et le feuillet bêta, dépendent toutes les deux de la liaison hydrogène, comme indiqué sur ces deux schémas. (D’après Alberts et al. (2015).)

trois liaisons hydrogène C

deux liaisons hydrogène O

_

O _

O

O P O

O O P O O OP _ O O O O _ O P O

O

O

T

A

G

O

O C

O

O

_

O

O

O P O_ O O

0.34 nm

O

G

C

O

O bases

G

O

P

O P O O _ O sucre O_ P O O liaison phosphodiester

2 nm

 Figure 3‑4  Appariement des bases dans la double hélice. Illustration de la façon dont les bases s’assemblent pour former l’ADN, une double hélice avec deux « colonnes vertébrales » faites de groupes désoxyribose et phosphate. Les quatre bases forment des liaisons hydrogène stables avec un partenaire, de sorte que A s’apparie seulement avec T et G avec C. À droite, un modèle atomique compact approchant la structure de l’ADN. L’espacement entre les paires de bases voisines est d’environ 0.34 nm. (D’après Alberts et al. (2015).)

En raison de la fréquence élevée des liaisons hydrogène dans l’économie énergétique des cellules, il est normal de chercher à évaluer l’enthalpie libre associée à leur formation. En effet, l’échelle d’énergie de ces liaisons, légèrement plus élevée que l’échelle d’énergie thermique, est essentielle pour les associations transitoires, si typiques des

208

3. Forces et énergies

interactions macromoléculaires, et qui seraient complètement interdites si ces liaisons reposaient sur des interactions covalentes. Bien que la longueur des liaisons hydrogène soit constante, à ≈0.3 nm (BNID 108091), leur énergie défie une caractérisation simple et définitive. Cela donne un point de vue provocant et intéressant sur cette interaction biologique fondamentale. Une des manières de cerner la variabilité concernant l’enthalpie libre de la liaison hydrogène est de noter que les partenaires d’une liaison hydrogène peuvent interagir avec leur environnement de plusieurs manières différentes. Si une liaison hydrogène se défait, les deux partenaires formeront d’autres liaisons hydrogène avec le solvant, l’eau. Mais cela soulève une question : si la dissociation d’une liaison hydrogène a pour conséquence la formation d’autres liaisons hydrogène, quelle est la source de la variation d’enthalpie libre associée ? En fait, ce type de réarrangements de liaisons modifie le degré d’ordre dans le solvant, et c’est alors l’entropie qui peut apporter la contribution dominante à l’enthalpie libre. Étant donné que les liaisons hydrogène dépendent fortement du contexte, nous sommes ici dans l’un de ces cas où il est plus utile et honnête de penser par ordre de grandeurs que de tenter de donner une valeur définitive. Une règle pratique pour l’énergie associée aux liaisons hydrogène est 6–30 kJ/mol (≈2–12 kBT) (BNID 105374, 103914, 103913). Pour se faire une meilleure idée de l’énergie de la liaison hydrogène, considérons la molécule emblématique de la biologie, l’ADN. Dès ses débuts, la structure de l’ADN a été associée à des hypothèses sur sa fonction, c’està-dire qu’à travers les empilements de paires de base, la double hélice cache en ellemême le mécanisme de sa réplication. Une des premières choses que tout étudiant apprend en rejoignant un laboratoire de biologie moléculaire est la manière d’utiliser une machine de PCR, et un des premiers éléments de la formation correspondante consiste à programmer les phases successives de changement de température de la machine, la double-hélice étant successivement dénaturée et réhybridée à plusieurs reprises. D’où viennent ces températures ? En un mot, c’est la teneur en A=T de la séquence d’intérêt, qui reflète le nombre de liaisons hydrogène qui doivent être perturbées. En effet, l’appariement A=T se caractérise par deux liaisons hydrogène tandis que l’appariement C≡G se caractérise par trois de ces liaisons (Figure 3‑4). Un exemple encore plus irrésistible de l’importance de l’appariement des bases est la spécificité de la correspondance codon-anticodon au cours de la traduction. La règle d’appariement du triplet des ARNt pour identifier leurs partenaires ARNm se fonde sur l’appariement de chacune des trois bases avec son partenaire correspondant. Mais estimons le pouvoir discriminatoire de ce type de liaison. Par exemple, que se passe-t-il lorsqu’une paire de bases C≡G est remplacée par une paire de bases C=T « incorrecte » ? Certes, beaucoup de choses changent, mais au moins une liaison hydrogène qui devrait être présente n’est plus là. La distribution de Boltzmann nous indique comment évaluer la probabilité relative de différents événements selon : p 1 /p 2  exp E / kBT  , où ∆E désigne la différence d’énergie entre ces deux états. En prenant ∆E ≈ –6 kJ/mol (≈  –2.3  kBT), c’est-à-dire la borne inférieure de l’énergie d’une liaison hydrogène, on obtient un rapport d’un facteur 10 entre les deux probabilités à partir de cette simple absence d’une liaison hydrogène. La fidélité effective de la correspondance

209

La biologie cellulaire par les nombres

codon-anticodon est beaucoup plus élevée que cela : elle utilise le mécanisme énergétique que l’on appelle correction cinétique. La beauté de cette estimation simple est qu’elle montre comment utiliser la distribution de Boltzmann pour relier les variations d’énergie de liaisons hydrogène à des degrés de discrimination moléculaire. L’importance des liaisons hydrogène se situe non seulement dans leur énergie, qui permet des liaisons favorables, mais également dans leur forte dépendance à l’égard de la conformation. Une légère variation d’angle ou de distance entre les atomes concernés et l’énergie changera radicalement. Cela peut conduire à des différences de plusieurs ordres de grandeur dans l’intensité de la force de liaison, faisant de ces liaisons un élément-clé de spécificité. Par exemple, la figure 3‑5 montre une liaison hydrogène qui joue le rôle-clé de la spécificité d’une protéine de transport qui doit distinguer deux groupes chimiques de taille et de charge très semblables, le phosphate et l’arséniate. La dépendance spatiale est beaucoup plus faible pour d’autres contributions énergétiques à l’enthalpie libre, comme l’effet hydrophobe examiné à la rubrique suivante. (A)

122°

2.5 Å 109°

179°

phosphore

(B)

127° 162° 2.5 Å 95° arsenic

 Figure 3‑5  Les angles de la liaison hydrogène pour une protéine liant le phosphate sont proches de l’optimum dans la structure avec phosphate, mais tordus avec l’arséniate. (A) Agrandissement de la liaison hydrogène courte entre l’atome d’oxygène d’un phosphate lié et le groupe carboxylate d’une aspartate de la protéine. Les angles de liaison sont proches des valeurs optimales canoniques. (B) Même liaison dans la structure avec l’arséniate, avec un angle d’interaction sous-optimal et tordu. Cette différence peut aisément expliquer la différence d’un facteur ≈500 en faveur de la liaison au phosphate par rapport à l’arséniate. (D’après Elias et al. (2012).)

210

3. Forces et énergies

Quelle est l’échelle d’énergie associée à l’effet hydrophobe ? L’eau est un corps polaire. Cela signifie que la distribution de charge d’une molécule d’eau lui confère un moment dipolaire non nul. Cette caractéristique importante a pour conséquence que, lorsque des molécules qui n’ont pas elles-mêmes de moment dipolaire (comme les acides aminés hydrophobes, par exemple) sont placées dans l’eau, il en résulte une perturbation des molécules d’eau environnantes avec un coût en enthalpie libre. D’un point de vue biologique, ce coût en enthalpie libre joue un rôle majeur dans de grandes classes d’interactions moléculaires : cela inclut certains des assemblages macromoléculaires les plus répandus, comme les bicouches lipidiques et les virus. On observe cette perturbation énergétique le plus souvent dans l’eau, et on l’appelle l’effet hydrophobe. Bien que l’effet hydrophobe soit extrêmement subtil et dépende de la taille du soluté, il agit proportionnellement à l’aire de l’interface entre ce corps et le solvant, en première approximation pour des molécules assez grandes (on parle alors d’énergie de surface). Plus précisément, pour des solutés suffisamment grands, on peut approcher la pénalité énergétique due à l’ajout d’une unité d’aire non polaire dans l’eau par une énergie surfacique de ≈4 kBT/nm2, ou ≈10 kJ/mol/nm2 (BNID 101826). La recherche des origines de cette pénalité en enthalpie libre a une longue tradition théorique très riche. Pour notre discussion, nous nous contentons d’adopter un point de vue heuristique particulièrement simple. L’argument consiste à dire que, lorsqu’on place une molécule avec une « interface hydrophobe » dans l’eau, le nombre de conformations accessibles aux molécules d’eau environnantes diminue (voir Figure 3‑6). Puisque ces molécules d’eau ont moins d’états accessibles, elles ont une entropie inférieure et, par conséquent, la présence de ce soluté dans l’eau est moins favorable en termes d’enthalpie libre. Ce modèle simple suffit pour estimer l’échelle d’enthalpie libre associée aux interactions hydrophobes, bien qu’il ne soit plus valide pour de petits solutés, où le réseau de liaisons hydrogène peut se réajuster autour du soluté. Par rapport aux conformations simplifiées représentées sur la figure 3‑6, on suggère par exemple que seulement 3 des 6 conformations à proximité de l’interface seront possibles car les autres ne seront pas compatibles avec les liaisons hydrogène. Cela illustre comment la conformation du réseau tétraédrique de liaisons hydrogène est compromise lorsque l’on place une molécule non polaire en solution. S’il y a 10 molécules d’eau par nm2 d’interface (chacune mesurant ≈0.3 nm), et si le nombre de conformations de chaque molécule est réduit de moitié, alors le coût d’enthalpie libre vaut 10×kBT×ln(2)/nm2, qui correspond à la valeur expérimentale à un facteur 2 près. Pour se former une meilleure intuition de ces nombres, considérons une molécule d’O2 dissoute dans l’eau. On peut estimer son aire de contact avec l’eau en imaginant un cube de ≈0.2 nm de côté. Cela donne une aire de ≈6×0.22 ≈0.2 nm2, ce qui conduit à une pénalité d’enthalpie libre de 1 kBT. D’après la distribution de Boltzmann, qui stipule qu’une différence d’énergie E se traduit par une diminution du nombre d’états d’un facteur exp E / kBT  , une différence d’énergie de 1  kBT réduit la concentration d’équilibre dans l’eau d’un facteur e (ou 2.718...). Les métabolites non polaires, dont l’aire est plus élevée d’un ordre de grandeur, présentent un coût d’enthalpie libre prohibitif et ne sont donc pas solubles dans l’eau.

211

La biologie cellulaire par les nombres

(A)

(B)

liaison hydrogène

oxygène hydrogène

 Figure 3‑6  Modèle simplifié de l’effet hydrophobe. (A) Modèle simplifié des orientations possibles des molécules d’eau dans un réseau tétraédrique. (B) Chaque image présente un arrangement différent de la molécule d’eau qui permet la formation des liaisons hydrogène avec les molécules d’eau avoisinantes. Les liaisons hydrogène sont orientées vers les sommets qui ne sont pas occupés par des atomes d’hydrogène sur ces schémas. La formation d’une interface hydrophobe prive le système de la capacité d’explorer tous ces différents états, réduisant de ce fait l’entropie. (D’après Dill et Bromberg (2011).)

Inversement, les composés polaires, tels que les peptides, l’ARN et les métabolites faiblement présents dans les environnements hydrophobes, pourront difficilement traverser les bicouches lipidiques non polaires et hydrophobes, et notamment la membrane plasmique. Dans ce cas, ce qui est énergétiquement défavorable est la présence d’une interface entre un composé polaire et les molécules hydrophobes environnantes. Affinité de liaison due à l’effet hydrophobe

H C

H

H

site de liaison hydrophobe d’une protéine

groupe méthyle aire 1 nm2 effet hydrophobe dans l’eau

–10

kJ/mol nm2

e4

50

–4

kBT nm2

–∆G

gain d’affinité = e kBT

 Estimation 3‑2  Affinité de liaison due à l’effet hydrophobe.

212

3. Forces et énergies

L’effet hydrophobe peut jouer un rôle significatif pour spécifier l’affinité de liaison entre un métabolite et une enzyme. Un groupe méthyle a une aire d’environ 1 nm2. Puisque nous avons vu qu’une surface exposée à l’eau puis enfermée dans une poche hydrophobe est stabilisée par un gain d’enthalpie libre ΔG ≈ 10 kJ/mol/nm2, nous trouvons pour un groupe méthyle une différence d’enthalpie libre de ≈10 kJ/mol ≈4 kBT : cela se traduit par une augmentation d’affinité d’un facteur ≈ e4 ≈ 50 (voir Estimation 3‑2).

Combien d’énergie apportent les photons lors de la photosynthèse ? Ce sont des réactions nucléaires à 150 millions de kilomètres, au centre du Soleil, qui alimentent toute l’activité et l’agitation de la vie sur la planète Terre. L’énergie qui alimente ces réactions biologiques chevauche depuis l’espace sur des paquets de lumière connus sous le nom de photons. Dans cette rubrique, nous nous intéressons à la quantité d’énergie transportée par ces photons. Les réactions nucléaires au plus profond du Soleil se produisent à des températures supérieures au million de degrés. Mais durant son trajet jusqu’à la surface du Soleil, un photon est absorbé et réémis plusieurs fois ; et il est émis pour la dernière fois près de la surface, où la température est beaucoup plus basse. Le spectre d’émission du Soleil est en effet celui d’un corps noir à ≈5500°C (Figure 3‑7 et BNID 110208, 110209). Cependant, les photons qui atteignent la surface de la Terre ne présentent pas un spectre de corps noir parfait, puisque plusieurs bandes de longueur d’onde sont absorbées par notre atmosphère, produisant un spectre jalonné de crêtes et de vallons (Figure 3‑7).

irradiance spectrale (W/m2/nm)

UV

visible

infrarouge

2 rayonnement solaire dans la couche supérieure de l’atmosphère 1.5

rayonnement au niveau de la mer 10 m sous la surface de l’océan

1

H2O 0.5

H2O

O2 0

O3 250

H2O 500

750

spectre du corps noir à 5500°C

1000

bandes d’absorption H2O CO 2

1250 1500 1750 longueur d’onde (nm)

2000

2250

H2O 2500

 Figure 3‑7  Spectre d’irradiation solaire. Les différentes courbes montrent le rayonnement dû à un corps noir à une température de ≈5 500 °C, la densité de rayonnement au-dessus de l’atmosphère terrestre et la densité de rayonnement au niveau de la mer. Les divers pics d’absorption par l’atmosphère sont associés aux espèces moléculaires correspondantes. (Données provenant du Laboratoire américain des énergies renouvelables (NREL).)

213

La biologie cellulaire par les nombres

Le déroulement de la photosynthèse, qui sert de source énergétique à notre biosphère, est représenté sur la figure 3‑8. Pour initier la photosynthèse, un photon doit être assez énergétique pour exciter les pigments photosynthétiques. Plus précisément, le photon doit transmettre à un électron du pigment l’énergie nécessaire pour passer d’un niveau d’énergie moléculaire à un niveau supérieur. Ces pigments sont à leur tour couplés à la machinerie photochimique qui convertit l’énergie électromagnétique en énergie chimique par séparation de charge. Cette séparation de charge prend plusieurs formes. L’une des contributions provient d’un déséquilibre de protons à travers les membranes, qui alimente les ATP-synthases, les machines moléculaires dont le produit fini est l’ATP lui-même. La deuxième forme de séparation de charge est le pouvoir réducteur, qui désigne le stockage transitoire des électrons dans des réducteurs forts tels que le NADP, utilisé ultérieurement pour le stockage d’énergie stable sous forme de sucres produits lors du cycle de Calvin. Les réactions redox qui permettent de produire ce pouvoir réducteur sont elles-mêmes alimentées par l’excitation des pigments par la lumière. réaction photochimique

fixation du carbone (cycle de Calvin)

H2O

CO2

NADP+ ADP

RuB isC o RuBP

photosystème II

3-phosphoglycérate

chaîne de transport d’électrons photosystème I

ATP

G3P

NADPH chloroplaste

sucrose (export) O2

amidon (stockage) acides aminés, acides gras

(CHOH)n

 Figure 3‑8  Cycle de l’énergie dans la biosphère. De l’énergie provenant du Soleil sous forme de photons est stockée par des réactions photochimiques dans l’ATP et le NADPH tout en produisant de l’oxygène à partir de l’eau. Ces devises énergétiques sont employées pour fixer le carbone inorganique en prenant le dioxyde de carbone de l’air et en le transformant en sucres, effectuant ainsi l’accumulation de biomasse et le stockage à long terme de l’énergie dans la biosphère.

214

3. Forces et énergies

La grande majorité (plus de 99.9 % 54) de ces transformations photochimiques sont exécutées par le pigment le plus familier et le plus important d’entre eux, à savoir la chlorophylle. Dans la molécule de chlorophylle, un électron atteint un niveau excité suite à l’absorption d’un photon de longueur d’onde ≤ 700 nm. Pour convertir la longueur d’onde en énergie, nous exploitons la célèbre relation de Planck : E = hν, qui relie l’énergie E du photon à sa fréquence ν par l’intermédiaire de la constante de Planck h. Nous employons alors le fait que le produit de la fréquence et de la longueur d’onde λ est égal à la vitesse de la lumière, soit : νλ = c. On peut réécrire cette relation sous la forme : E = hc /λ ≈ 1240/λ, où l’énergie est exprimée en eV (électronvolts) et la longueur d’onde en nm. À 700 nm, nous obtenons ainsi une échelle d’énergie de 1.8 eV par photon. Cette unité d’énergie est équivalente à l’énergie qu’un électron gagne en suivant une différence de potentiel électrique de 1.8 volt. En territoire plus familier, elle est équivalente à 180 kJ/mol de photons, ou encore ≈70 kBT/photon. Cela correspond à plusieurs fois l’énergie libérée par l’hydrolyse de l’ATP, ou au transfert de protons à travers la membrane plasmique : l’énergie d’un seul photon est donc non négligeable à l’échelle moléculaire. À l’aide de la figure 3‑7, nous pouvons estimer le flux d’énergie global lié aux photons incidents ainsi que le nombre de photons impliqués. Une approximation grossière mais simple consiste à remplacer le spectre réel par un rectangle de ≈1 000 nm de large (entre 300 nm et 1 300 nm) et de ≈1 W/m2/nm de hauteur. À partir de ces valeurs, l’aire sous la courbe vaut environ 1 000 W/m2, ce qui approche tout à fait la puissance incidente moyenne par unité d’aire mesurée sur la surface terrestre. En aparté, notons que 1 kW correspond à la puissance électrique moyenne consommée par personne dans le monde occidental. Combien de photons composent le flux d’énergie de ce rayonnement incident ? Si nous faisons encore une autre hypothèse simplificatrice, à savoir, que tous les photons ont la même énergie que celle que nous avons calculée ci-avant pour des photons à 700 nm de longueur d’onde, soit 180 kJ/mol, nous estimons qu’il y a ≈1000 [W/m2]/180[kJ/mol] ≈ 5 mmol/s/m2 de photons. L’unité correspondant à 1 mole de photons par mètre carré est l’einstein, et nos estimations montrent que le nombre de photons qui atteignent une surface de 1 m2 par seconde est de ≈5 millieinstein, ou environ 3×1021 photons. Plus de la moitié de ces photons nous sont en fait invisibles, car situés dans la région des longueurs d’onde infrarouge (au-dessus de 700 nm). Les photons sont absorbés par des pigments tels que les molécules de

54.  Raven (2009)

215

La biologie cellulaire par les nombres

chlorophylle, qui ont des sections efficaces d’absorption d’environ 10–21 m2 (BNID 100339). Étant donné un flux de photons de l’ordre de 1021 photons/m2, nous en déduisons une excitation d’environ une molécule de chlorophylle par seconde. La photosynthèse est la raison principale pour laquelle l’humanité peut utiliser les ressources de la terre et de l’eau douce et pratiquer l’agriculture. Cette conversion d’énergie lumineuse en céréales, par exemple, atteint une efficacité d’environ 1 % sous de bonnes conditions de culture (BNID 100761). Bien que cela paraisse faible, il faut prendre conscience de tous les obstacles rencontrés sur le chemin. Environ la moitié de l’énergie incidente se trouve dans la région des longueurs d’onde infrarouge et n’excite pas les molécules de chlorophylle qui convertissent les photons en électrons excités. Les longueurs d’onde courtes excitent la chlorophylle, mais l’énergie au-delà du seuil d’excitation minimal est rapidement absorbée, provoquant en moyenne une perte supplémentaire d’environ un facteur 2. Les réactions dépendant directement et indirectement de la lumière saturent généralement à environ un dixième de l’intensité maximale de lumière solaire et un processus de photoinhibition détourne cette énergie en chaleur. De cette énergie récoltée et stockée sous forme de sucres, environ la moitié est consommée par la plante pour son propre fonctionnement, à travers la respiration. Enfin, l’indice de récolte énergétique, qui est la fraction de la biomasse qui peut être consommée, est rarement supérieur à 0.5. Une règle pratique approximative est qu’un mètre carré produira environ 1 kg de masse sèche comestible par an. On demande souvent aux personnes qui étudient la photosynthèse : « Pouvez-vous créer un être humain qui vive à partir de la photosynthèse et qui n’ait pas besoin de manger ? ». La réponse rapide est non et la conversation s’achève en général ainsi. Mais imaginons que la peau soit couverte de tissu photosynthétique. La peau humaine fait environ 1 m2 de superficie (BNID 100578). Avec une efficacité caractéristique de 1 %, cela rapporterait, à l’intensité maximale de 1 000 W/m2 du soleil de midi, environ 10 W, ce qui est inférieur aux besoins humains d’environ un ordre de grandeur (voir la rubrique « Quelle est la puissance consommée par la cellule ? », p. 246).

Comment varie l’entropie lorsque deux molécules forment un complexe ? Les processus biologiques fonctionnent grâce à des interactions moléculaires. Nous comprenons le flux et le reflux perpétuels entre des molécules d’identités distinctes essentiellement comme un équilibre d’enthalpie libre entre les réactifs et les produits, comme l’apprennent les étudiants à leur premier cours de chimie. Cependant, cette brève introduction laisse souvent de côté tout un monde de belles subtilités relatives aux nombreuses manières dont l’enthalpie libre d’un système moléculaire change en fonction des associations moléculaires. Ici, nous nous concentrons sur la contribution à l’enthalpie libre qui résulte des changements d’entropie lors de la liaison entre molécules.

216

3. Forces et énergies

Dans cette rubrique, nous abordons une question conceptuelle simple : lorsque deux molécules A et B interagissent pour former le complexe AB, de combien varie l’entropie ? L’enthalpie libre s’écrit de manière générique : G = H – TS où H désigne l’enthalpie et S l’entropie. Nous voyons que dans un cas simple où l’enthalpie ne varie pas, le bilan d’enthalpie libre est dicté par l’entropie. Si une réaction augmente l’entropie, cela signifie qu’il y a une diminution correspondante d’enthalpie libre, ce qui indique la direction que les réactions prendront spontanément. Un aperçu profond, quoique insaisissable, de ces termes abstraits provient d’une des équations les plus importantes de l’ensemble de la science, à savoir : S = kB ln Ω qui nous indique que l’entropie S d’un système dépend du nombre Ω (omega) de micro-états qui lui sont accessibles. Une augmentation d’entropie reflète ainsi une augmentation du nombre de micro-états du système. Si le système a la même probabilité d’être dans n’importe quel micro-état, l’agitation spontanée dans l’espace des états possibles conduira en effet le système à se déplacer dans la configuration avec le plus grand nombre d’états, c’est-à-dire celle ayant l’entropie la plus élevée. Au risque d’être clairs seulement pour ceux qui ont eu d’excellents professeurs (ou à défaut les lecteurs de l’excellent livre de Dill et Bromberg 55), notons que même le terme représentant le changement d’enthalpie dans l’expression de l’enthalpie libre est en fait aussi un terme d’entropie déguisé. Concrètement, ce terme reflète la chaleur libérée à l’extérieur du système, où elle créera de l’entropie. Cet effet est inclus dans le calcul de l’enthalpie libre, parce qu’il s’agit d’une façon compacte de calculer le changement d’entropie de l’« univers » tout en ne se concentrant que sur le système d’intérêt. Ces idées sont omniprésentes dans la compréhension des liaisons intermoléculaires. Dans ces cas, il y a en effet une compétition entre, d’une part, l’entropie accessible au système lorsque les ligands s’agitent librement en solution et, d’autre part, l’enthalpie libérée par la création de liaisons moléculaires, par exemple avec un récepteur. Si un ligand a une constante de dissociation de 1 μM, par exemple, cela signifie qu’à cette concentration, la moitié des récepteurs sera liée à des ligands. Pour un ligand à cette concentration, l’énergie libérée par la liaison, ou le gain d’enthalpie qui augmente le nombre d’états à l’extérieur du système, égalera la perte d’entropie, qui mesure la diminution du nombre d’états dans le système suite à cette liaison. Si la concentration du ligand est inférieure à la constante de dissociation, cela signifie que le ligand en solution aura un plus grand volume efficace à occuper, avec plus de configurations, ce qu’il préférera au gain d’énergie par la

55.  Dill et Bromberg (2011)

217

La biologie cellulaire par les nombres

liaison. En conséquence, le récepteur ou l’enzyme sera dans un état d’occupation partielle plus faible. À l’autre extrême, si la concentration de ligand est plus élevée que la constante de dissociation, le ligand sous sa forme libre dispose d’un sousensemble plus restreint de configurations à explorer en solution, et l’énergie de liaison sera prédominante, avec pour conséquence un taux d’occupation plus élevé de l’état lié. C’est le point de vue de la physique statistique qui interprète l’enthalpie libre de la liaison intermoléculaire comme une compétition stricte entre les termes enthalpique et entropique. Qu’est-ce qui détermine fondamentalement l’amplitude du terme entropique dans ces réactions de liaison ? La question est notoire pour sa complexité, et nous n’en toucherons que quelques mots ici. La variation d’entropie lors de la liaison est en général calculée en fonction de la concentration standard c0 = 1 M (que l’on peut considérer comme une approximation grossière de la concentration efficace dans l’état lié). Elle est donnée par : ∆S = –kB ln(c /c0), où c est la concentration réelle du ligand. Plus précisément, cette formule compare le nombre de configurations accessibles à la concentration d’intérêt au nombre de configurations lorsqu’une particule est liée au récepteur à cette même concentration. Calculons maintenant combien vaut ce terme de variation d’entropie en utilisant cette expression. Si la liaison ligand-récepteur se produit à la concentration c = 10–n M, la variation d’entropie s’écrit : ∆S = –n kB ln(10) ≈ 10–20 kBT pour n ≈ 4–8, c’est-à-dire 10 nM–100 μM. À l’aide d’outils théoriques plus sophistiqués, on a pu estimer que cette variation d’entropie, pour la liaison de ligands à des protéines, couvre la gamme de ≈  6–20  kBT, soit ≈ 15–50 kJ/mol (BNID 109148, 111402, 111419), en accord avec l’estimation simple esquissée ci-avant. Pour la liaison protéine-protéine, elle a été évaluée à l’état standard à environ 40  kBT  ≈ 100 kJ/mol (BNID 109145, 109147). Ces calculs sont partiellement issus de l’étude des gaz, car l’explication complète des effets de solvatation reste une question ouverte. Déduire la variation entropique à partir de mesures expérimentales est difficile mais plusieurs efforts en ce sens ont conduit à des valeurs de ≈ 6-10 kBT, soit ≈ 15-25 kJ/mol (BNID 109146, 111402) pour des cas allant de la polymérisation de l’actine, de la tubuline et de l’hémoglobine à l’interaction entre la biotine et l’avidine. Comme discuté ci-avant, la liaison intermoléculaire est associée à un coût entropique qui est lui-même compensé par un gain enthalpique. Une conséquence importante de cet effet est la capacité d’établir des interactions extrêmement fortes à partir de plusieurs interactions au même substrat, dont chacune est relativement faible. Dans la première interaction, le terme entropique compense l’énergie de liaison, conduisant à une constante de dissociation encore modérée. Mais si une deuxième interaction de liaison au même substrat se produit en même temps que la première, le terme entropique étant déjà « payé », le changement d’enthalpie libre

218

3. Forces et énergies

associé sera beaucoup plus substantiel. Considérons le cas de la liaison du monomère d’actine au filament d’actine composé de deux protofilaments, soit deux interactions de liaison concurrentes. La liaison à chaque protofilament séparément est relativement faible, avec une constante de dissociation de 0.1 M, mais la constante de dissociation couplée vaut 1 μM, car le terme entropique de ≈10 kBT n’a besoin de compenser l’énergie de liaison qu’une seule fois et non deux. Cet effet, que l’on appelle également l’avidité, est au cœur de la liaison spécifique forte des anticorps aux antigènes, ainsi que de nombreux autres cas, comme la liaison des facteurs de transcription à l’ADN ou la formation de la capside virale.

Quelle force exercent les filaments du cytosquelette ? La production de force par les filaments du cytosquelette est responsable d’un ensemble vaste et varié de processus biologiques, allant de la motilité cellulaire à la ségrégation des chromosomes. Ces fonctions mécaniques distinctes sont mises en application par des structures riches et complexes (branchées, réticulées, etc.), dans lesquelles les filaments se lient les uns aux autres pour former divers types d’organisation. Qu’il s’agisse des forces exercées par les filaments d’actine à la proue des cellules motiles ou de l’agencement compliqué des forces exercées par les microtubules pendant la ségrégation des chromosomes, la compréhension des fondements et des limites de la production de force est un pilier central de la biologie cellulaire moderne. Les années récentes ont vu régulièrement émerger des idées intelligentes pour mesurer la force produite par les filaments du cytosquelette. Ainsi, une série de belles expériences a permis d’interroger les forces exercées par des faisceaux de filaments du cytosquelette et, plus étonnamment, par des filaments individuels, au cours de la polymérisation. Comme avec beaucoup de mesures de force, le principe théorique consiste à lire les forces en mesurant la déflexion d’un ressort étalonné. Les mesures sur les filaments du cytosquelette ont exploité ce type de ressorts généralisés de plusieurs manières différentes. D’abord, à l’aide de pinces optiques, on peut utiliser un laser pour capturer par la lumière une bille de l’ordre du micron, et se servir de la bille comme d’un « ressort » pour mesurer les forces de filaments en phase d’élongation à mesure qu’ils poussent contre elle. Pour de petits écarts de la bille au centre du faisceau laser, la lumière produit une force de rappel élastique (d’où l’appellation de « ressort ») qui ramène la bille au centre du faisceau. En conséquence, le déplacement de la bille peut servir de mesure directe de la force elle-même. Grâce à un dispositif comme celui de la figure 3-9, la production de force par différents filaments a pu être mesurée directement en faisant en sorte que le filament pousse sur une barrière pendant la polymérisation. À mesure que l’élongation progresse, la force de rappel élastique exercée par la bille sur le filament augmente jusqu’à atteindre la force maximale que la polymérisation du filament puisse soutenir – appelée force d’arrêt. Alors la dynamique reprend de zéro (voir Figure 3‑9C), un phénomène connu sous le nom d’instabilité dynamique dans le cas des microtubules. Ce type de mesures donne une échelle caractéristique de force de l’ordre de 5 pN, comparable

219

La biologie cellulaire par les nombres

aux forces exercées par les moteurs moléculaires usuels tels que la myosine et la kinésine. On peut comparer cette valeur à l’énergie qui alimente la construction des filaments, en général issue de l’hydrolyse d’ATP ou de GTP. Ce genre de réactions d’hydrolyse fournit une enthalpie libre d’environ 20 kBT par nucléotide hydrolysé, ce qui peut être comparé au travail effectué par une force de 5 pN exercée sur une distance d’élongation d’environ 4 nm, c’est-à-dire 20 pN⋅nm. Parmi les astuces présentées en introduction, nous nous référons à la règle pratique selon laquelle kBT vaut environ 4 pN⋅nm, et la force d’un filament agissant sur une distance de 4 nm correspondrait donc à une enthalpie libre d’environ 5 kBT. Étant donné que la conversion d’énergie n’est pas parfaite, cela semble être une correspondance très raisonnable entre l’enthalpie libre fournie par l’hydrolyse d’un nucléotide et le travail effectué par la polymérisation du filament.

(A) bille maintenue par des pinces optiques

filament en croissance

(B)

filament acrosomal

barrière

faisceau de filaments bille (C)

(D)

sous-unités de tubuline

sous-unités d’actine 4 force (pN)

4 force (pN)

barrière 2 µm

2

0

2

0 croissance

100 s

35 s

catastrophe

 Figure 3‑9  Mesure de force de polymérisation à l’aide de pinces optiques. (A) Schéma de l’utilisation de pinces optiques pour mesurer des forces tandis que le filament s’allonge contre un obstacle. (B) Image de microscopie d’une bille (2 μm de diamètre) liée à un faisceau de filaments d’acrosome. (C) Évolution de la force au cours du temps, avec l’élongation et la catastrophe de microtubules. (D) Accumulation de force au cours du temps pour la polymérisation d’actine. (A et C, d’après Kerssemakers et al. (2006) ; B et D, d’après Footer et al. (2007).)

220

3. Forces et énergies

Souvent, le comportement des filaments du cytosquelette est dicté par leur action collective plutôt que par les propriétés des filaments individuels. Une véritable armée constituée de protéines différentes peut changer l’assemblage des filaments du cytosquelette en les coiffant, en les réticulant, en nucléant des branches et à travers une multitude d’autres modifications, influençant ainsi leurs propriétés de production de force. Pour mesurer les effets collectifs qui émergent lorsqu’un groupe de filaments agit de concert, on a conçu un autre « ressort » astucieux. Cette fois le ressort résulte de la déflexion d’un petit levier (d’environ 20 µm de long) due à la pression d’un réseau de filaments (voir Figure 3‑10). L’expérience consiste à ensemencer la surface sous le levier d’un groupe de filaments d’actine : alors, à mesure que les filaments polymérisent, ils entrent en contact avec le levier et le font fléchir vers le haut. L’action collective de nombreux filaments produit des forces de l’ordre de dizaines de nN plutôt que quelques pN comme pour des filaments individuels. (A)

(B) F

300

Δx

filaments d’actine objectif du microscope

force (nN)

250 200 150 100 50 0

0

50

100 150 200 temps (min)

 Figure 3‑10  Mesure de la force de polymérisation d’un réseau de filaments d’actine. (A) Schéma de la configuration géométrique de la mesure de force à l’aide d’un levier étalonné. (B) Mesure de l’accumulation de force au cours du temps. Noter que le nombre de filaments schématiquement dessinés en (A) est plus faible, de plusieurs ordres de grandeur, que le nombre réel correspondant aux forces mesurées en B. (D’après Parekh et al. (2005).)

Que peut-on obtenir avec une poignée de piconewton ? Une cellule mammifère caractéristique a une masse de quelques nanogrammes (c’est-à-dire 10–12 kg), ce qui correspond à un poids de : W = m × g = 10–12 kg × 10 m/s2 = 10 pN. Nous pouvons affirmer, avec un peu de fantaisie, qu’il suffirait de quelques filaments pour maintenir en l’air une cellule contre la pesanteur, tout comme des grimpeurs professionnels peuvent se stabiliser au-dessus d’une falaise d’une main. Plus sérieusement, cette estimation simple nous aide à comprendre pourquoi la force de pesanteur a généralement peu d’importance dans la vie des cellules. Les forces exercées par les composants de l’environnement cellulaire sont beaucoup plus élevées que celles produites par la pesanteur (voir Figure 3‑1).

221

La biologie cellulaire par les nombres

Quelles sont les limites physiques à la détection par les cellules ? La matière organique a développé une multitude de technologies naturelles pour examiner les propriétés de son environnement. Certains des exemples les plus familiers et les plus impressionnants proviennent de nos cinq sens. Les « détecteurs » utilisés par de nombreux organismes sont particulièrement notables pour leur sensibilité (la capacité de détecter les signaux « faibles ») et leur plage dynamique (la capacité de détecter à la fois des signaux très faibles et des signaux très forts). Les cellules ciliées de l’oreille peuvent réagir à des sons couvrant plus de 6 ordres de grandeur de différence de pression entre le seuil de détection (jusqu’à 2×10–10 atmosphères de pression acoustique) et le début de la douleur (6×10–4 atmosphères de pression acoustique). En aparté, puisque la pression atmosphérique équivaut à la pression à 10 mètres de profondeur sous l’eau, un seuil de détection de 2×10–10 atmosphères correspondrait à la masse d’un film de seulement 10 nm d’épaisseur, c’est-à-dire quelques dizaines d’atomes d’épaisseur. En effet, c’est l’immense plage dynamique de notre capacité auditive qui incite à utiliser des échelles logarithmiques (par exemple le décibel, ou dB) pour décrire l’intensité du son (qui est le carré de la variation de pression). L’usage d’une échelle logarithmique rappelle aussi l’échelle de Richter, qui nous permet de décrire la gamme très large des énergies liées aux tremblements de terre. L’usage d’une échelle logarithmique résulte également de la loi de Weber-Fechner qui stipule que la perception subjective de nombreux de nos sens, y compris l’audition, est proportionnelle au logarithme de l’intensité du stimulus. Plus précisément, lorsqu’un son est plus intense d’un facteur 10n qu’un autre son, nous disons que ce son est plus intense de 10×n décibels. Selon cette loi, nous percevons la même différence entre des bruits qui diffèrent d’un même nombre de décibels (un même rapport d’intensité). La figure 3-11 présente quelques niveaux sonores communs, mesurés en dB. Cette plage de 0 à environ 130 dB signifie que notre ouïe est sensible à un intervalle éblouissant de 13 ordres de grandeur. Outre cette grande plage dynamique d’intensité, l’oreille humaine détecte des sons sur 3 ordres de grandeur en fréquence, entre environ 20 Hz et 20 000 Hz, tout en étant capable de discerner la différence entre 440 Hz et 441 Hz. seuil murmure bibliothèque d’audition chute de feuilles 10–4 0

10

marteau-piqueur

chant d’oiseau –3

10 20

circulation urbaine

conversation

30

10 40

50

–2

10 60

70

–1

80

100 90

100

101 110

concert moteur de rock à réaction seuil de douleur pression (Pa) 102

120

130

 Figure 3‑11  Intensités des sons communs en unités de pression et en décibels.

222

intensité (dB)

3. Forces et énergies

Tout aussi impressionnantes sont les cellules photoréceptrices : nos bâtonnets peuvent enregistrer l’arrivée d’un photon unique (BNID 100709) tandis que le minimum de détection des cônes est de ≈100 photons (BNID 100710). Ici encore, la sensibilité aiguë est complétée par une plage dynamique qui nous permet de voir, non seulement le jour sous un soleil lumineux, mais également les nuits étoilées sans lune, avec une différence d’intensité d’illumination d’un facteur 109. Un regard sur le ciel nocturne dans l’hémisphère Nord nous fait percevoir le clin d’œil de l’Étoile polaire. Dans ce cas, les photons qui arrivent sur notre rétine depuis cette source lumineuse éloignée sont distants d’environ un kilomètre, ce qui montre que l’intensité de la lumière détectée par nos yeux est extrêmement faible (et que la vitesse de la lumière est très élevée). En mesurant les stimuli minimaux que des cellules peuvent détecter, nous pouvons étudier si l’évolution a entraîné les organismes à développer leurs capacités jusqu’aux limites physiques de détection. Pour se faire une idée du défi qu’implique la fabrication de détecteurs ayant une sensibilité élevée et une grande plage dynamique, considérons les effets de la température sur un petit système masse-ressort idéalisé, en l’absence de frottement (voir Figure 3‑12). Le but est de mesurer la force exercée sur la masse. Il est essentiel de comprendre comment le bruit influence notre capacité à effectuer cette mesure. La masse sera soumise à l’agitation thermique permanente en raison des collisions avec les molécules de l’environnement. Dans le prolongement de la discussion de la rubrique « Quelle est l’échelle d’énergie thermique et quelle est sa pertinence en biologie ? » (p. 203), l’énergie résultant de ces collisions vaut ½ kBT, où kB est la constante de Boltzmann et T la température en Kelvin. Ce que cela signifie est que la masse fluctuera spontanément autour de sa position d’équilibre (Figure 3‑12), avec des fluctuations quadratiques moyennes suivant : 1 1 k x 2 = kBT 2 2 Tout comme sur une vieille balance pour mesurer le poids de fruits ou d’êtres humains, la manière dont nous mesurons la force est la lecture du déplacement de la masse. En conséquence, afin de pouvoir mesurer la force, le déplacement doit dépasser un seuil déterminé par l’agitation thermique. Ainsi, nous pourrons dire que nous avons mesuré la force d’intérêt seulement une fois que le déplacement aura dépassé les déplacements qui résultent spontanément des fluctuations thermiques, soit : 1 1 2 k  xmesuré  kBT 2 2 Cette contrainte entraîne : xmin =

kBT k

c’est-à-dire, en termes de force : Fmin  k  kBT

223

La biologie cellulaire par les nombres

Cette limite signifie que nous ne pouvons pas mesurer de forces plus faibles, car les déplacements que produiraient ces forces pourraient tout aussi bien venir de l’agitation thermique. Une manière de surmonter cette limite peut être d’augmenter la durée de la mesure (en jouant sur la raideur du ressort utilisé comme instrument). Plusieurs des outils les plus intelligents de la biophysique moderne, tels que les pinces optiques et le microscope à force atomique, sont conçus à la fois pour surmonter et pour exploiter ces effets. charge nulle (agitation thermique) x

x th t –x th

charge (supérieure à la limite de détection) x1 x th m

–x th

t

 Figure 3‑12  Déflexion d’un système masse-ressort. Dans le panneau supérieur, en l’absence de forces exercées, la masse se déplace spontanément sur la table sans frottement à cause des fluctuations thermiques. Dans le panneau inférieur, une force est exercée sur le système masse-ressort en y accrochant un poids. Les graphiques montrent la position de la masse en fonction du temps, indiquant les origines à la fois stochastiques et déterministes du mouvement. Comme le montre le panneau inférieur, afin d’obtenir un signal détectable, le déplacement moyen doit être plus élevé que l’amplitude des fluctuations thermiques.

Pour donner un exemple concret, considérons le cas des cellules ciliées de l’oreille chez les mammifères. Chaque cellule ciliée comporte un faisceau d’environ 30-300 stéréocils (voir Figure 3‑13) qui font environ 10 µm de long (BNID 109301, 109302). Ces petits appendices cellulaires servent de ressorts permettant la transduction de stimuli mécaniques acoustiques et leur conversion en signaux électriques qui peuvent être interprétés par le cerveau. En réponse aux variations de pression d’air à différentes fréquences, qui nous permettent de distinguer les mélodies de la cinquième symphonie de Beethoven d’une cacophonie de klaxons, les stéréocils sont soumis à des déplacements qui déclenchent l’ouverture de canaux ioniques. Les propriétés mécaniques du stéréocil sont semblables à celles du ressort discuté dans le cadre de la figure 3-12. L’ouverture des canaux ioniques due au mouvement des stéréocils modifie la tension à travers la membrane. En poussant sur un stéréocil individuel avec une petite fibre de verre, il est possible de mesurer les plus petits

224

3. Forces et énergies

déplacements du stéréocil capables de déclencher une variation de tension détectable. Il suffit que le faisceau de cils tourne de seulement 0.01 degré, soit un déplacement nanométrique de son extrémité, pour produire une variation de tension de l’ordre du millivolt (BNID 111036, 111038). Peut-on comparer ces valeurs à l’agitation thermique des stéréocils ? À la fois le mouvement brownien observé et des estimations théoriques à partir de modèles de ressort comme celui décrit ci-avant révèlent que les fluctuations thermiques de l’extrémité des cils sont de l’ordre de plusieurs nanomètres. Cependant, le seuil de détection auditif semble correspondre à des déplacements de 0.1 nm (voir Figure 3‑13). Cet écart intéressant provient du fait que le faisceau cilié est en réalité actif et qu’il amplifie les signaux d’entrée proches de sa fréquence de résonance, mais aussi du couplage entre stéréocils, des effets qui ne sont pas pris en compte dans cette estimation simple. capillaire

(B)

électrode

(A) faisceau de cils

faisceau de cils

≈ 4 µm

cellule ciliée (D) tension maximale de dépolarisation (mV)

(C)

capillaire

10 µm

100

10

1.0 0.1 1 10 100 1000 déplacement du faisceau de cils (nm)

 Figure 3‑13  Réaction des cellules ciliées à la stimulation mécanique. (A) Faisceau de stéréocils dans la cochlée d’un crapaud buffle. (B) Schéma de l’expérience : micromanipulation mécanique du faisceau par une sonde capillaire et mesure de la réponse électrique à l’aide d’une électrode. (C) Image de microscopie des cellules ciliées de la cochlée d’une tortue et de la sonde capillaire employée pour les manipuler. (D) Tension mesurée en fonction du déplacement de l’extrémité du faisceau de cils du C. (A, d’après Hudspeth (1989) ; B, d’après Hudspeth et Corey (1977) ; C et D, d’après Crawford et Fettiplace (1985).)

225

La biologie cellulaire par les nombres

Le même type de raisonnement régit les limites physiques de nos autres sens. Ainsi, il y a un bruit intrinsèque aux propriétés du système que nous mesurons. Par conséquent, pour obtenir la « lecture » d’une certaine entrée, la sortie qui en résulte doit être plus élevée que les fluctuations naturelles de la variable de sortie. Par exemple, la détection et l’exploitation de l’énergie portée par des photons est liée à certains des phénomènes les plus importants de la vie, dont la photosynthèse et la vision. Combien de photons sont nécessaires pour produire une modification de l’état physiologique d’une cellule ou d’un organisme ? Des expériences aujourd’hui classiques sur la vision ont permis de mesurer les courants électriques de différentes cellules photoréceptrices stimulées par la lumière (voir Figure 3‑14). Ces expériences permettent deux interprétations majeures. D’abord, les photorécepteurs subissent des événements de dépolarisation spontanés, même en l’absence de lumière, indiquant précisément le type de bruit que les vrais événements (c’est-à-dire l’arrivée d’un photon) doivent surmonter. En particulier, on pense que ces courants résultent de l’isomérisation thermique spontanée de molécules individuelles de rhodopsine (voir la rubrique « Combien de molécules de rhodopsine y a-t-il dans un bâtonnet ? » p. 191). Notons que cette réaction d’isomérisation est induite en temps normal par l’arrivée d’un photon et conduit à la cascade de signalisation que nous percevons comme la vision. Ensuite, le fait que les courants émergeant de photorécepteurs exposés à très faible lumière arrivent par impulsions discrètes démontre que ces photorécepteurs peuvent répondre à l’arrivée de photons individuels. On peut voir cet effet sur la figure 3‑14B. (B) intensité du courant (pA)

(A) bâtonnet rétinien dans un capillaire

20 µm fragment de rétine rayon de lumière à 500 nm

réponse à deux photons réponse à un photon 1 pA

impulsions lumineuses 0

100 temps (s)

200

 Figure 3‑14  Réponse d’un photorécepteur à un photon individuel. (A) Dispositif expérimental : un bâtonnet individuel de la rétine d’un crapaud est placé dans un capillaire de verre et exposé à un faisceau lumineux. (B) Tracé du courant au cours du temps pour un photorécepteur soumis à des impulsions lumineuses dans ces conditions expérimentales. (A, d’après Baylor et al. (1979) ; B, d’après Rieke et Baylor (1998).)

Parmi les autres classes de paramètres que les cellules sont capables de « mesurer » avec une grande sensibilité, on trouve les quantités absolues, les identités et les gradients de différentes espèces chimiques. Cette dernière grandeur est une condition essentielle au développement de l’organisme, où un gradient de morphogène détermine un patron d’organisation. Une interprétation semblable des gradients

226

3. Forces et énergies

moléculaires est importante pour les cellules motiles lorsqu’elles parcourent le paysage chimique compliqué de leur environnement aqueux. Ces exploits impressionnants ne se limitent pas à de grands organismes multicellulaires pensants comme les humains. On peut même considérer que les bactéries ont une « connaissance » de leur environnement, comme le montre le système typique du chimiotactisme présenté dans la rubrique « Combien y a-t-il de protéines de signalisation ? » (p. 184). Cette « connaissance » conduit à une puissance discriminatoire utile, grâce à laquelle une cellule bactérienne est capable de détecter juste quelques molécules d’attractant (BNID 109306, 109305) tout étant sensible à des différences de concentrations sur une plage d’environ 5 ordres de grandeur. Cela rend possible des comportements unicellulaires par lesquels une bactérie pourra nager en suivant un gradient de concentration de chimio-attractant. Pour se faire une idée de la sensibilité sophistiquée de ces systèmes, l’estimation 3‑3 donne un calcul simple des concentrations mesurées par une bactérie pendant le chimiotactisme et estime les changements de taux d’occupation d’un récepteur de surface qui détecte les gradients. En particulier, si nous voyons la détection chimique à travers des récepteurs membranaires protéiques, la détection de la présence d’un ligand résulte d’une certaine modification du taux d’occupation de ce récepteur. Toute variation faible de concentration du ligand provoque un changement de même ampleur du taux d’occupation du récepteur. Dans le cas du chimiotactisme bactérien, on peut estimer le gradient typique détecté par des bactéries dans une expérience de microscopie comme suit. Si nous considérons que les bactéries nagent à environ 1 mm de la pipette contenant 1 mM de chimio-attractant, le gradient est de l’ordre de 10–2 µM/µm (BNID 111492). Ce gradient est-il élevé ou faible ? On peut définir un seuil de détection de la différence d’une molécule individuelle ainsi : M c 1 molécule/volume bactérien 1 nM    103 L longueur de bactérie 1 m m Des travaux récents ont montré que les bactéries sont capables de détecter des gradients plus petits (quoiqu’il semble que la grandeur « mesurée » par la cellule soit en fait le gradient du logarithme de la concentration). Le fait qu’un gradient si faible puisse être mesuré sur un grand éventail de concentrations absolues illustre la forte sensibilité de ce phénomène. Dans le contexte du développement embryonnaire, l’interprétation du gradient de morphogène repose sur la mesure des différences de concentration d’un noyau à un autre. Par exemple, dans la détermination du patron antéro-postérieur de l’embryon de drosophile, des noyaux voisins « mesurent » approximativement 500 et 550 molécules par volume nucléaire et utilisent cette différence pour prendre des décisions sur leur destin développemental. En résumé, l’évolution a poussé des cellules à détecter les signaux de l’environnement avec une sensibilité délicate et une plage dynamique impressionnante, dans le respect des limites physiques : les photorécepteurs peuvent détecter un photon individuel, le système olfactif approche la molécule individuelle, les cellules ciliées peuvent détecter des différences de pression de 10–9 bar et les bactéries des gradients d’une molécule par cellule par longueur cellulaire. Cela dresse un tableau éblouissant de beaux et subtils mécanismes.

227

La biologie cellulaire par les nombres

concentration de chimioattractant

Quelle est la variation relative du taux d’occupation d’un récepteur situé dans un gradient de concentration ?

10 000 molécules

9400 molécules

1 µm

c0

1 µm c0 –

L

0

10

20

distance (µm)

∆c L ∆x

30

calcul de l’occupation plié d’un récepteur chimiotactique en fonction de la position

plié(x = 0) =

c0 –

c0 Kd 1+

c0 Kd

; plié(x = 30µm) = distance caractéristique des phases de nage

1+

∆c L ∆x Kd

c0 –

∆c L ∆x Kd

calcul de la variation relative de plié plié(x = 0) – plié(x = 30µm) ∆p = p0 plié(x = 0)

pour c0 = 10 µM et

∆c = 0.02 µM/µm ∆x

∆c c0 pour c0 = Kd c 1+ 0 Kd

∆p 1 ∆c = p0 2 c0

∆p variation relative = p0 du taux d’occupation

0.03

mesures

 Estimation 3‑3  Comment varie le taux d’occupation d’un récepteur situé dans un gradient de concentration ?

Monnaie et budget énergétiques Combien d’énergie libère l’hydrolyse de l’ATP ? L’ATP est souvent appelée la monnaie d’échange énergétique de la cellule. Des centaines de réactions de la cellule, allant des transformations métaboliques aux événements de signalisation, sont couplées à l’hydrolyse de l’ATP (du grec, littéralement « cassure par l’eau »). La réaction : ATP + H2 0  ADP + Pi

228

3. Forces et énergies

transforme l’adénosine triphosphate (ATP) en adénosine diphosphate (ADP) et phosphate inorganique (Pi). La variation d’enthalpie libre associée à cette réaction alimente une grande proportion des réactions de la cellule, la différence de potentiel membranaire et le pouvoir réducteur étant les deux autres sources d’énergie dominantes. Mais quelle est vraiment la valeur de cette devise énergétique et quelles transactions chimiques permet-elle d’« acheter » ? Naturellement, il n’y a pas une seule réponse à cette question puisque la quantité d’énergie libérée par cette réaction d’hydrolyse dépend des conditions intracellulaires, mais il est possible d’obtenir une valeur approximative en recourant à quelques estimations simples. La variation d’enthalpie libre (ΔG) due à l’hydrolyse de l’ATP dépend des concentrations des divers participants à la réaction. Plus les concentrations sont éloignées de leurs valeurs d’équilibre, plus la valeur absolue de ΔG est élevée. En conditions standard (c’est-à-dire à des concentrations de 1 M pour tous les réactifs, sauf l’eau qui est prise à sa concentration caractéristique de 55 M), l’enthalpie libre de l’hydrolyse de l’ATP varie de –28 à –34 kJ/mol (c’est-à-dire ≈12 kBT, BNID 101989) en fonction de la concentration du cation Mg2+. La dépendance à l’égard des ions Mg2+ se produit parce que les cations magnésium aident à stabiliser la molécule d’ATP. Cependant, dans la cellule, les conditions ne sont jamais proches des conditions standard. Par exemple, avec une concentration d’ATP de 1M, la masse du soluté serait semblable à celle du solvant lui-même ! Dans l’estimation 3‑4, nous présentons le calcul de l’enthalpie libre physiologique (ΔG), étant donné le rapport des concentrations à la valeur standard (ΔG 0). La division par des termes comme [1M] est nécessaire afin de tenir compte des dimensions, car un logarithme devrait toujours contenir un terme sans dimension. Il est parfois étonnant de penser que si la cellule était à l’équilibre, la valeur de ΔG serait zéro, et il n’y aurait aucune énergie à gagner par l’hydrolyse de l’ATP. Heureusement, ce n’est jamais le cas chez les êtres vivants. Enthalpie libre de l’hydrolyse de l’ATP en conditions physiologiques ATP + H2O

ADP + Pi

concentrations à l’équilibre [ ] eq, soit ∆G´0 l’enthalpie libre standard K´eq =

[ADP]eq/[1M] x [Pi]eq/[1M] [ATP]eq/[1M] x [H2O]eq/[55M]

; ∆G´0 = –RT ln (K´eq) –30 à –40 kJ mol

concentrations physiologiques [ ] phys Q´ =

[ADP]phys/[1M] x [Pi]phys/[1M] [ATP]phys/[1M]

; ∆G´ = ∆G´0 + RT ln Q´

–50 à –70

kJ mol

 Estimation 3‑4  Enthalpie libre de l’hydrolyse de l’ATP en conditions physiologiques.

En pratique, les conditions physiologiques dépendent de l’organisme étudié, du tissu ou du compartiment de la cellule d’intérêt, et de la demande énergétique pour les réactions biochimiques en cours, notamment celles du métabolisme. Par exemple, dans un foie de rat perfusé, on a pu mesurer un rapport d’ATP à l’ADP

229

La biologie cellulaire par les nombres

de 10:1 dans le cytosol, mais de 1:10 dans les mitochondries à des taux élevés de glycolyse, tandis qu’à de faibles taux de glycolyse les deux rapports étaient beaucoup de proches de 1 (BNID 111357). Par conséquent, on doit s’attendre à toute une plage de valeurs de ΔG. La clé pour comprendre cette plage est de comprendre combien Q diffère de K, c’est-à-dire à quel point les concentrations réelles diffèrent des conditions standard. Les concentrations intracellulaires typiques des composants impliqués (ATP, ADP et Pi) sont de l’ordre du mM, beaucoup plus faibles que les conditions standard. Le rapport [ADP][Pi]/[ATP], avec des concentrations de l’ordre du mM, est très inférieur à 1, et l’hydrolyse est alors énergétiquement plus favorable qu’aux conditions standard (voir Tableau 3‑2). La valeur la plus élevée, ≈ –70 kJ/mol (≈30 kBT) a été calculée à partir de mesures sur des athlètes qui récupèrent après l’effort (BNID 101944). Dans des cellules d’E. coli cultivées sur du glucose, on a pu rapporter une valeur de –47 kJ/mol (≈ –20 kBT, BNID 101964). Pour mettre ces nombres en perspective, un moteur moléculaire qui exerce une force d’environ 5 pN (BNID 101832) sur un pas de 10 nm de long (BNID 101857) effectue un travail de 50 pN⋅nm qui exige un peu plus 10 kBT d’énergie : c’est donc tout à fait en conformité avec ce que peut fournir l’hydrolyse d’une molécule d’ATP. Le calcul de ΔG exige une mesure précise des concentrations intracellulaires. On peut mesurer ces concentrations in vivo chez l’être humain à l’aide de la résonance magnétique nucléaire (RMN). L’isotope naturel du phosphore (31P) a des propriétés magnétiques, de sorte qu’il n’est pas nécessaire d’injecter de substance externe. Le tissu d’intérêt, par exemple le muscle, est placé dans un champ magnétique élevé, et les variations de fréquence des impulsions d’ondes radio permettent de déduire la concentration en ATP et en Pi directement des pics sur les spectres RMN. Chez E. coli, les concentrations en ATP peuvent être mesurées plus directement par bioluminescence de l’ATP. On peut analyser un échantillon de bactéries en phase de croissance à l’aide de la luciférase, une enzyme de bactéries qui vivent en symbiose dans des calmars, qui a rejoint à ce jour la boîte à outils des biologistes comme marqueur moléculaire. La luciférase utilise l’ATP dans une réaction qui produit de la lumière, que l’on peut mesurer à l’aide d’un luxmètre, et la concentration en ATP peut être déduite de l’intensité du signal lumineux. Ainsi, le contenu cellulaire est la grandeur en entrée, et la luciférase est l’« appareil » qui transforme la quantité d’ATP en lumière émise, c’est-à-dire le signal de sortie mesuré. À l’aide de ce type d’outils, on montre que « dans la vraie vie », l’ATP vaut environ deux fois plus que dans les conditions « standard », en raison de concentrations plus favorables pour l’avancement de la réaction. Nous finissons en notant que la raison pour laquelle l’adénine a été sélectionné pour servir de devise énergétique principale, alors que la GTP et d’autres nucléotides jouent des rôles beaucoup plus secondaires, reste une question ouverte. Est-ce un choix aléatoire qui s’est perpétué tel quel 56, ou y avait-il un avantage sélectif à l’ATP par rapport à la GTP, la CTP, l’UTP et la TTP ?

56.  Hypothèse de Francis Crick notamment, connue sous le nom de frozen accident en anglais.

230

3. Forces et énergies

 Tableau 3‑2  Enthalpie libre de l’hydrolyse de l’ATP chez divers organismes et dans différentes conditions physiologiques. Les calculs de ΔG’ sous-jacents utilisent une valeur de ΔG’0 de –37.6 kJ/mol. Cela rend les valeurs du tableau cohérentes entre elles mais crée de petits écarts aux valeurs de ΔG’ rapportées par les sources primaires. Ces écarts peuvent résulter de variations de pouvoir ionique, du pH et de biais de méthodes de mesure. Les valeurs sont arrondies à un ou deux chiffres significatifs. Pour les épinards, la concentration de Pi n’a pas été rapportée et une valeur caractéristique de 10 mM a donc été utilisée (BNID 103984, 103983, 111358, 105540). Organisme

E. coli

S. cerevisiae

S. oleracea (épinards)

H. sapiens

Conditions physiologiques

[ATP]

[ADP]

[Pi]

Conditions standard

1 M

1 M

Croissance exponentielle aérobie (glucose)

10 mM

Croissance exponentielle anaérobie (glucose)

ΔG′ estimé

BNID

(kJ/mol)

(kBT)

1 M

-36 à -38

-14 à -15

106580 (selon le pouvoir ionique)

0.6 mM

20 mM

-54

-22

104704

3 mM

0.4 mM

10 mM

-54

-22

101964

Croissance exponentielle aérobie (glycérol)

7 mM

0.7 mM

10 mM

-55

-22

101701

Croissance aérobie (glucose)

2 mM

0.3 mM

22 mM

-52

-21

106017

Stroma de chloroplastes à la lumière

2 mM

0.8 mM

10 mM

-51

-21

108113

Cyotosol + mitochondries à la lumière

3 mM

0.7 mM

10 mM

-52

-22

108113

Cyotosol + mitochondries dans l’obscurité

1.5 mM

0.8 mM

10 mM

-50

-21

108113

Muscle au repos

8 mM

9 µM

4 mM

-68

-27

101943

Muscle après un exercice intense

8 mM

7 µM

1 mM

-72

-29

101944

231

La biologie cellulaire par les nombres

Quelle est l’énergie associée au transfert d’un groupe phosphate ? L’hydrolyse de l’ATP est l’une des réactions quintessentielles de la cellule, ce qui a conduit certains à baptiser l’ATP-synthase, l’enzyme qui ajoute le groupe phosphate à l’ADP, la « deuxième molécule la plus importante du monde » (l’ADN étant indiscutablement la première). Mais les groupes phosphate ont une portée beaucoup plus grande que leur association avec l’une des principales devises énergétiques de la cellule. Suivant une métaphore linguistique du dogme central, les acides nucléiques et les protéines pourraient être des phrases composées de longues chaînes de lettres, les nucléotides et les acides aminés respectivement ; alors ces langages utilisent en fait également des accents. Plus précisément, les lettres composant les alphabets utilisés par ces langages seraient accentuées par toute une série de modifications chimiques différentes, dont certaines comportent l’addition et le retrait de groupes chargés comme les phosphates. Tout comme un accent change la prononciation et la signification d’un mot, ces accents moléculaires font de même pour la fonction d’une molécule. Quels sont les conséquences fonctionnelles de ces diverses modifications des acides nucléiques et des protéines, et comment pouvons-nous les comprendre en termes de budget global d’enthalpie libre de ces molécules ? Les groupes phosphates sont souvent les principaux porteurs d’énergie de la cellule. Le cas de l’ATP et l’énergétique liée à son hydrolyse sont discutés dans une rubrique séparée (p. 228). Chez les protéines, les groupes phosphate servent de porteurs d’information. Plus précisément, un petit ensemble d’acides aminés est sujet à la phosphorylation car ces acides aminés disposent des groupes fonctionnels qui peuvent servir de site de liaison d’un groupe phosphate (–OH pour la sérine, la thréonine, la tyrosine et, plus rarement, l’acide aspartique ; et –NH pour l’histidine). Une image simple du rôle de ces groupes chargés est qu’ils déplacent l’équilibre énergétique entre différents états accessibles de la molécule d’intérêt. Par exemple, une protéine donnée pourrait avoir plusieurs conformations stables, dont l’une aurait une enthalpie libre globalement inférieure. L’addition d’un groupe chargé tel qu’un phosphate peut alors faire pencher la balance énergétique en faveur d’une conformation différente, qui aurait alors l’enthalpie libre la plus faible. Considérons par exemple la protéine Ste5 chez la levure, qui peut être liée à la membrane ou s’en dissocier. Ces deux états ont des implications non négligeables pour la signalisation pendant la fusion sexuée, ainsi que pour plusieurs autres décisions dictées par la voie MAPK. La propension à adopter l’une ou l’autre de ces deux formes de Ste5 est régie par la phosphorylation. On a pu mesurer que, sous sa forme phosphorylée, l’énergie de liaison à la membrane de cette protéine diminuait de ≈6 kJ/mol (≈2 kBT, BNID 105724), ce qui équivaut à une affinité à la membrane ≈20 fois plus élevée pour la forme phosphorylée que pour la forme non phosphorylée. La phosphorylation diminue également l’énergie de liaison à l’ADN du facteur de transcription Ets1 de ≈1.6 kJ/mol (≈0.7 kBT), soit un facteur 2 dans la constante d’affinité (BNID 105725).

232

3. Forces et énergies

En passant du rôle des groupes phosphate comme modificateurs de protéines à leur rôle comme porteurs d’énergie, il est essentiel de comprendre que la quantité d’énergie libérée lors de la dissociation d’un groupe phosphate dépend du composé auquel il est lié. Les métabolites communs présentent une grande différence dans l’énergie libérée lors de l’hydrolyse de leur groupe phosphate. On trouve par exemple ≈60 kJ/mol (≈24 kBT ) pour l’hydrolyse du PEP (phosphoénolpyruvate) mais seulement ≈13 kJ/mol (≈5  kBT ) pour le glucose-6-phosphate (BNID 105564). Le tableau 3‑3 rassemble des informations sur l’énergétique des réactions impliquant des liaisons phosphate 57. Ce genre de différences est au cœur des transformations énergétiques qui se produisent au cours de la glycolyse et du cycle de Krebs, les autoroutes de l’énergie et du carbone cellulaires. D’où proviennent ces différences ? Existe-t-il une règle pratique simple qui permette de prévoir le contenu énergétique de ces groupes ?  Tableau 3‑3  Enthalpie libre standard libérée par l’hydrolyse de différents types de liaisons d’un groupe phosphate. Les valeurs proviennent de mesures expérimentales et sont rassemblées dans la base de données eQuilibrator. Les valeurs sont arrondies à deux chiffres significatifs. Enthalpie libre ΔGr0

Réaction

(kJ/mol)

(kBT)

Hydrolyse de la liaison phosphoanhydride ATP + H2O → ADP + phosphate

-31

-13

ADP + H2O → AMP + phosphate

-31

-13

ATP + H2O → AMP + PPi

-38

-16

PPi + H2O → 2 phosphate

-24

-10

Glucose-6-phosphate + H2O → glucose + phosphate

-12

-5

3-phosphosérine + H2O → sérine + phosphate

-10

-4

AMP + H2O → adénosine + phosphate

-14

-6

DHAP + H2O → dihydroxyacétone + phosphate

-15

-6

Fructose 1,6-biphosphate + H2O → F6P + phosphate

-16

-6

Glycéraldéhyde 3-phosphate + H2O → glycéraldéhyde + phosphate

-17

-7

Thréonine phosphate + H2O → thréonine + phosphate

-19

-8

Hydrolyse de la liaison phosphoester

57. On peut trouver les données sur les propriétés thermodynamiques telles que la variation d’enthalpie libre dans les réactions biochimiques dans la base de données eQuilibrator : http://equilibrator.weizmann.ac.il/ (NdA)

233

La biologie cellulaire par les nombres

On peut comprendre en partie ces différences par les changements du type de liaison, dont les différents scénarios sont représentés sur la figure 3‑15. Les groupes phosphate liés à un autre groupe phosphate (les liaisons phosphoanhydride) et les groupes phosphate liés à un alcool (liaison phosphoester) sont par exemple deux types distincts. On peut l’interpréter en considérant qu’un atome de carbone entouré par des atomes d’hydrogène est un attracteur d’électrons : la liaison au groupe phosphate globalement négatif est plus stable et son hydrolyse moins favorable. Cela diffère du cas d’un groupe phosphate ou carboxylique où le lien double du carbone à l’oxygène en fait un groupe donneur d’électrons : la liaison au phosphate également donneur d’électrons est alors instable et son hydrolyse libère plus d’énergie. On peut formuler une explication plus quantitative à partir des pKa des groupes, tandis que l’explication rigoureuse fait appel à la mécanique quantique. Énergétique de deux types de liaisons phosphate

groupe phosphate

O– O

P



δ+ P

OH

hydrolyse énergétiquement favorable

O– O

O

OH

groupe phosphate

O

O lié à un autre phosphate

P

O

δ–

R liaison phosphoanhydride ex. ATP

H

C

R’

R

lié à un hydroxyle

phosphoester ex. glucose-6-phosphate

 Figure 3‑15  Énergétique de deux types de liaisons phosphate. La liaison phospho-anhydride est moins stable et beaucoup plus éloignée de l’équilibre, ce qui rend son hydrolyse beaucoup plus énergétique. La liaison acide-acide pourrait lier le groupe phosphate à un autre, comme dans l’ATP, ou à un groupe carboxylique (c’est-à-dire l’acétylphosphate), qui est bien plus énergétique que la liaison phosphate-phosphate.

Par exemple, l’ingrédient principal de la transduction de signal, l’hydrolyse de l’ATP en ADP et pyrophosphate (la cassure d’une liaison entre deux phosphates) sert à phosphoryler les acides aminés sur les protéines. Dans les cas les plus communs, la sérine et la thréonine, le groupe phosphate réagit avec un groupe hydroxyle (–OH). D’autres acides aminés qui peuvent être phosphorylés sont la tyrosine, l’histidine et l’acide aspartique, les deux derniers étant impliqués dans l’exemple important des systèmes de signalisation à deux composants chez les procaryotes. Les transferts de ce genre sont effectués par des kinases et sont énergétiquement favorables. Une phosphatase effectue la réaction inverse de dissociation de la liaison phosphate dans une protéine. L’action de la phosphatase est thermodynamiquement favorable (quoiqu’elle ait besoin d’une activation) parce que la liaison phosphate sur la protéine est toujours loin de l’équilibre. En termes biochimiques, le transfert d’un groupe phosphate d’une molécule d’ATP (liaison phosphoanhydride) vers un acide aminé (liaison phosphoester) conserve encore près de la moitié de l’enthalpie libre de l’hydrolyse de l’ATP.

234

3. Forces et énergies

Pour finir, nous rappelons au lecteur que, comme mentionné dans la rubrique dédiée à l’hydrolyse de l’ATP (p. 228), l’enthalpie libre est une fonction de l’écart à l’équilibre, qui dépend des concentrations. Nous soulignons l’affirmation contreintuitive selon laquelle l’énergie d’une liaison dépend des concentrations des molécules. À l’équilibre, les concentrations sont telles que les énergies pour toutes les transformations sont nulles, même la réaction d’hydrolyse de l’ATP, dite « riche en énergie ». En fait, il n’y a aucune énergie à récupérer d’une molécule d’ATP ou d’une liaison phosphate en général, si cette liaison ne se trouve pas hors-équilibre par rapport à l’environnement.

Combien d’enthalpie libre dégage la combustion du sucre ? Comme les humains, les bactéries peuvent être capricieuses quant à leur alimentation. Dans une série de belles expériences très perspicaces, Jacques Monod a montré que lorsque l’on présentait différentes sources de carbone à des bactéries, elles consommaient d’abord leur source de carbone préférentielle, avant d’activer les gènes nécessaires pour digérer les autres sources. Le substrat favori des bactéries telles qu’E. coli est le glucose, une molécule connue par chaque étudiant en biochimie en tant que point de départ des célèbres réactions impliquées dans la glycolyse. L’enthalpie libre dégagée par l’oxydation du glucose vaut ≈ –3 000 kJ/mol (BNID 103388 ; voir aussi sur la base eQuilibrator 58. Avec d’autres unités, cela correspond à ≈ –1 200 kBT, ou encore ≈ –700 kcal/mol, où kcal désigne ce qui s’appelle une calorie dans le registre de la diététique. Comme le montre l’échelle des énergies pertinentes en biologie (Figure 3‑1), cette valeur se place au sommet de l’échelle des énergies moléculaires. Pour mieux comprendre de combien d’énergie il s’agit, considérons le travail utile permis par ce dégagement d’énergie. Pour cela, nous pouvons examiner le nombre de molécules d’ATP produites (à partir d’ADP et de Pi) par la série de réactions associées à la combustion du sucre, également connue en biochimie sous le nom de respiration aérobie de la cellule. Les voies métaboliques de la glycolyse, le cycle de Krebs et la chaîne de transport d’électrons couplent le dégagement d’énergie de la combustion d’une seule molécule de glucose à la production d’environ 30 molécules d’ATP (BNID 101778), une énergie suffisante pour que des moteurs moléculaires effectuent plusieurs pas, ou pour polymériser quelques acides aminés supplémentaires dans un polypeptide en formation. Nous lisons sur nos paquets de céréales que l’apport calorique journalier recommandé pour l’être humain se compose de 2 000 kcal. Si cet apport provenait uniquement de glucose, cela exigerait environ 3 moles de glucose. De la formule chimique du glucose, à savoir, C6H12O6, la masse moléculaire de ce sucre vaut 180 Da et 3 moles correspondent ainsi à ≈500 g. Ainsi, un demi-kilo de sucre pur (qu’il s’agisse de glucose ou de sucrose) fournirait l’énergie de combustion nécessaire 58. http://equilibrator.weizmann.ac.il/classic_reactions

235

La biologie cellulaire par les nombres

pour alimenter tous les processus à l’œuvre chez une personne « moyenne » en un jour – bien que ce ne soit pas recommandé d’un point de vue nutritif. Pour se faire une meilleure idée de la valeur énergétique de tout ce glucose, considérons à présent ce qui se produirait si le corps ne reconduisait pas la chaleur de combustion de ces 2 000 kcal dans l’environnement, mais employait plutôt cette énergie pour chauffer de l’eau. Une calorie est définie comme l’énergie requise pour augmenter de 1 °C la température de 1 g d’eau, et notée c ci-dessous. Pour une masse m ≈ 70 kg, l’augmentation de température pouvant résulter de l’énergie ΔQ dégagée par la combustion pendant un jour peut être estimée par la relation : ΔT = ΔQ /(m × c) = 2×106 cal/(70×103 g × 1 cal/°C/g) ≈ 30 °C. Cela illustre comment l’énergie consommée au quotidien a une grande capacité de chauffage.

Quel est le potentiel redox d’une cellule ? Les potentiels redox sont utilisés pour caractériser le coût en enthalpie libre et la direction des réactions impliquant un transfert d’électron. C’est une des réactions biochimiques les plus omniprésentes et les plus importantes. Les réactions d’oxydoréduction se caractérisent par une variation d’enthalpie libre qui partage certains aspects conceptuels avec ceux employés pour décrire le pKa dans les réactions acidebase qui impliquent un transfert de proton H+ plutôt qu’un transfert d’électron. Dans cette rubrique, une des plus abstraites du livre, nous expliquons comment on peut utiliser le potentiel redox pour mesurer la force motrice d’une réaction d’oxydoréduction donnée. En revanche, à la différence du pH, on ne peut pas attribuer un potentiel redox unique à la cellule entière. Le potentiel redox d’un composé, ou plus exactement son potentiel de réduction, se rapporte à sa tendance à acquérir des électrons et donc d’être réduit. Certains lecteurs se rappelleront peut-être la phrase mnémotechnique « réducteur : donneur, oxydant : gagnant », où ce qui est donné ou gagné sont des électrons. Considérons une réaction qui implique un transfert d’électron : A ox  ne   A red où la forme oxydée (Aox) gagne n électrons et donne la forme réduite (Ared) du composé A. La différence de potentiel redox ΔE entre le donneur et l’accepteur d’électrons est directement liée à la variation d’enthalpie libre associée ΔG de la réaction, par l’intermédiaire de la relation : G  nF E où n est le nombre d’électrons transférés et F est la constante de Faraday (96 485 J/mol/V ou ≈100 kJ/mol/V). En examinant les valeurs de ces potentiels, on peut développer une intuition de la tendance au transfert d’électrons et, par conséquent, du sens de la réaction.

236

3. Forces et énergies

Bien que l’on affirme souvent que l’ATP est la devise énergétique de la cellule, en fait, les porteurs de potentiel de réduction ne sont pas moins importants pour l’équilibre énergétique de la cellule. L’exemple le plus important de ces porteurs est la molécule NADH sous ses formes réduite ou oxydée (NAD+). Nous pouvons employer le potentiel redox pour relier ces deux protagonistes moléculaires, et estimer une borne supérieure au nombre de molécules d’ATP qui peuvent être produites par l’oxydation du NADH (par exemple dans le cycle de Krebs). Le couple NAD+/NADH a un potentiel redox E  = –0.32 V et il est oxydé par l’oxygène pour donner de l’eau (les protons provenant du milieu) avec un potentiel redox E = +0.82 V. La figure 3‑16 représente ces deux couples sur une « tour redox » de demi-réactions biologiques majeures qui peuvent être couplées pour trouver la variation globale de potentiel redox et donc l’enthalpie libre. Ainsi, la réaction d’oxydation du NADH par l’oxygène peut dégager au maximum une enthalpie libre de :

ΔG = nFΔE = 2×100 kJ/mol/V × (0.82 – (–0.32)) V = 228 kJ/mol ≈ 90 kBT, où n = 2 et F ≈ 100 kJ/mol/V. Puisque l’hydrolyse de l’ATP a une variation d’enthalpie libre de ≈50 kJ/mol en conditions physiologiques, nous en déduisons que 228 kJ/mol suffisent pour produire un maximum de 228/50 ≈ 4.5 molécules d’ATP. Dans la cellule, l’oxydation du NADH procède par plusieurs étapes pendant la respiration et aboutit au transfert de 10 protons à travers la membrane, à contrecourant du potentiel électrochimique (BNID 101773). Ces transferts de protons correspondent à une autre manière de capturer l’énergie biochimique. Cette énergie est ensuite utilisée par l’ATPase pour produire 2 ou 3 molécules d’ATP. Nous trouvons donc qu’environ la moitié de l’énergie dégagée lors du transfert d’électrons du NADH à l’oxygène est stockée dans l’ATP. Ainsi, pour garantir que la réaction aille dans le sens de la production d’ATP, plutôt que sa consommation, il faut « gaspiller » une partie de l’énergie afin de maintenir le système hors de l’équilibre. Pour quelle raison s’intéresse-t-on aux potentiels redox des demi-réactions plutôt qu’aux enthalpies libres des réactions complètes ? Les unités nous donnent un indice : elles prennent leur origine dans la capacité, en électrochimie, de mesurer au laboratoire la tension électrique – la différence de potentiel mesurée en volts – entre deux chambres contenant différents porteurs d’électrons ; puis d’arrêter la réaction en appliquant une tension. Les potentiels redox des demi-réactions s’avèrent utiles pour combiner différents donneurs et accepteurs pour évaluer la faisabilité thermodynamique et le gain en énergie de chaque réaction complète. À partir de seulement k potentiels redox, on peut ainsi prévoir les ~k2 réactions issues des combinaisons des k couples redox. Tout comme on parle du pH d’une solution, nous pourrions imaginer qu’il serait possible, par analogie, de parler d’un potentiel redox apparent de la cellule. La concentration des formes réduites et oxydées d’un couple redox donné détermine leur potentiel redox en solution suivant l’équation de Nernst : E  E0 

RT A red  ln nF A ox 

237

La biologie cellulaire par les nombres

potentiel d’oxydoréduction standard E’0 (mV) –700

glucose

2 pyruvate + 4e– (–720 mV)

–600 –500

glucose 6 CO2 + 24e– (–500 mV)

–400

exemple de flux d’électrons favorable

–300 –200 –100 0 100 200 300 400 500

NADH NAD+ + 2e– (–320 mV) 2 GSH GSSG + 2e– (–240 mV) H2S SO42– + 8e– (–220 mV) lactate pyruvate + 2e– (–190 mV) succinate fumarate + 2e– (30 mV) ubiquinol ubiquinone + 2e– (45 mV) cyt b (red) cyt b (ox) + e– (80 mV) cyt c (red) cyt c (ox) + e– (250 mV) cyt a (red) cyt a (ox) + e– (290 mV) NO2– NO3– + 2e– (420 mV)

échelles énergétiques (2e– eq.) 600 hydrolyse de l’ATP (≈250 mV) pompage d’un proton (≈80 mV)

700 800 900

Fe2+ Fe3+ + e– (760 mV) H2O ½O2 + 2e– (820 mV)

 Figure 3‑16  « Tour redox » des demi-réactions métaboliques usuelles. On peut considérer les processus métaboliques comme des transferts d’électrons entre molécules, qui captent une partie de l’énergie libérée par le passage des électrons d’un état de haute énergie à un état de basse énergie, comme dans la glycolyse ou la respiration. Des électrons donnés par les demi-réactions du dessus peuvent être consommés à l’aide d’une demi-réaction du dessous, pour accomplir une réaction thermodynamiquement favorable. Par exemple, le cycle net de la glycolyse implique l’oxydation du glucose en pyruvate, couplée à la réduction de NAD+ en NADH. Puisque l’oxydation du glucose en pyruvate se trouve au-dessus de la réduction de NAD+, ce transfert d’électron est thermodynamiquement favorable. En comparant à la « barre d’échelle » que représente l’énergie dégagée par l’hydrolyse de l’ATP, nous voyons également que ce transfert d’électron est assez favorable pour produire de l’ATP. La respiration aérobie implique de nombreux transferts intermédiaires d’électrons le long de la « chaîne de transport d’électrons ». Plusieurs de ces transitions sont représentées, y compris l’oxydation du succinate en fumarate, qui est couplée (par un complexe enzymatique) à la réduction de l’ubiquinone en ubiquinol dans les membranes mitochondriales internes. Chacun de ces transferts intermédiaires d’électrons doit être thermodynamiquement favorable isolément pour que la respiration fonctionne. En comparant à l’échelle d’énergie de l’hydrolyse de l’ATP, nous voyons aussi que les différentes transformations dans la chaîne de transfert d’électron ne sont pas assez énergétiques pour produire de l’ATP toutes seules. Cependant, elles sont assez favorables pour pomper un proton à travers la membrane cellulaire ou mitochondriale. Il s’agit du fondement énergétique de la chimiosmose : les cellules emmagasinent des paquets d’énergie dans le gradient de proton transmembranaire, chaque paquet étant trop petit pour la synthèse de l’ATP. L’énergie accumulée est employée plus tard pour produire de l’ATP, en convertissant le gradient de H+ en liaisons phosphoanhydride sur l’ATP grâce à l’ATP-synthase. (Avec l’aimable autorisation d’Avi Flamholz.)

238

3. Forces et énergies

Cette relation permet de calculer la valeur du potentiel redox pour des concentration intracellulaires typiques, par opposition aux conditions de l’état standard (où [Ared]=[Aox] par définition). Considérons par exemple le transfert d’un électron à NAD+, ce qui donne la forme oxydée NADH. Dans la matrice mitochondriale, la forme oxydée est 10 fois plus présente que la forme réduite (BNID 100779 ; voir RT A red  vaut ≈30 mV et le potentiel ln Tableau 3‑4). Dans ce cas, le terme  nF A ox  redox passe donc de -0.32 V à -0.29 V. Pour vérifier la cohérence de cette variation, notons que lorsque la forme oxydée est en surabondance, la tendance à être oxydé par l’oxygène diminue quelque peu, ce qui est conforme au fait que le potentiel redox s’est rapproché du couple redox oxygène/eau (+0.82 V).  Tableau 3‑4  Concentrations relatives des couples redox usuels NAD+/NADH et NADP+/ NADPH. On peut voir que le premier est relativement oxydé et le second relativement réduit. Le rapport très généralement supérieur à 1 de ces concentrations relatives signifie que l’écart à l’équilibre est plus important chez NADP+/NADPH.

Condition

[NADH]/ [NAD+]

[NADPH]/ [NADP+]

[NADPH]/[NADP+] / [NADH]/[NAD+]

BNID

E. coli Glucose aérobie

0.13

1.3

10

105427

Glucose

0.19

6

30

108042

Glucose

0.03

60

1900

104679

Acétate

0.5

14

30

108042

Glucose anaérobie

0.9

2.6

3

108044

Moyenne de milieux divers

0.05

0.8

16

108108

8

108105, 108106

3000

108110, 108109

1000

100779

Souris Fibroblaste embryonnaire

0.4

3.3 Rat

Cristallin diabétique pré-cataracte

0.008

24 Matrice mitochondriale

Conditions génériques

0.1

100 Feuilles d’épinards

pH 7.2 à la lumière

0.0005

3.3

7000

108117, 108115

pH 7.2 à l’obscurité

0.0007

4.0

6000

108118, 108115

239

La biologie cellulaire par les nombres

La cellule n’est pas à l’équilibre, et il existe un couplage faible entre différents couples redox. Cette situation fait que les couples redox qui coexistent dans la cellule peuvent avoir des potentiels redox différents. Si les flux de production et de consommation des formes réduite et oxydée d’un couple redox, Ared et Aox, et ceux d’un autre couple, Bred et Box, sont supérieurs à leur flux d’interconversion : A red + Box  A ox + Bred alors les potentiels redox de A et B peuvent être très différents. C’est pourquoi le potentiel redox global de la cellule est mal défini. En revanche, le pH de la cellule (ou d’un certain compartiment intracellulaire) est bien mieux défini puisque l’eau sert de milieu universel qui couple les différentes réactions acide-base et assure l’équilibre de ce que l’on appelle le potentiel chimique de toutes les espèces. Pour un couple redox donné, dans un compartiment intracellulaire donné, la concentration relative des deux formes détermine le potentiel redox de manière bien définie. Les composés qui échangent des électrons rapidement se trouveront en équilibre relatif et partageront ainsi un potentiel redox semblable. Pour illustrer ces notions, il est très utile de considérer un couple redox qui participe à de nombreuses réactions cellulaires majeures et qui est, en conséquence, étroitement lié à l’état redox de nombreux composés. Le glutathion dans le cytoplasme est un exemple d’un tel composé, puisqu’il participe à la réduction et à l’oxydation des liaisons thiol très répandues (celles contenant du soufre) dans les cystéines de nombreuses protéines. Le glutathion est un tripeptide (composé de 3 acides aminés), dont l’acide aminé central est une cystéine qui peut se présenter sous une forme réduite (GSH) ou oxydée, où elle forme un dimère avec la cystéine d’une autre molécule de glutathion (forme notée GSSG). Ainsi, la demi-réaction du glutathion s’écrit : 2GSH  GSSG  2e   2H L’autre demi-réaction est souvent la dissociation d’une liaison disulfure dans une protéine réceptrice qui est donc maintenue sous sa forme réduite, suite à l’action constante du glutathion. Le glutathion est également un acteur majeur dans la neutralisation des composés réactifs qui ont une tendance élevée à arracher des électrons et donc à oxyder d’autres molécules. Appelés dérivés réactifs de l’oxygène, ces composés résultent du stress oxydant, comme par exemple lorsque la respiration ou la photosynthèse atteignent leur capacité maximale de réactions de transfert d’électrons. Ils peuvent faire des ravages dans la cellule et sont notamment impliqués dans de nombreux processus du vieillissement. Le double rôle du glutathion, consistant à assurer le bon repliement des protéines et à limiter les dérivés réactifs de l’oxygène, ainsi que sa concentration relativement élevée et sa réactivité au transfert d’électrons, font de lui le principal indicateur de l’état redox de la cellule. La concentration du glutathion dans la cellule vaut ≈10 mM (BNID 104679, 104704, 111464), ce qui en fait le deuxième métabolite le plus abondant de la cellule (après le glutamate) et assure qu’il joue un rôle dominant en tant que donneur d’électrons dans le contrôle redox de la fonction des protéines. Pour d’autres fonctions de la cellule, il existe d’autres couples redox dominants, comme par exemple le couple NADP+/NADPH

240

3. Forces et énergies

dans des réactions anaboliques biosynthétiques et le couple NAD+/NADH dans des réactions cataboliques de digestion. (A)

(B)

(C)

(D)

(E)

(F) EGSH (mV)

forme réduite

–250 –300 –350 –400

cytoplasme

forme oxydée

–319

chloroplastes

état stationnaire

–366

noyaux

exc: 488 nm

–312

mitochondries

exc: 405 nm

–363

10 μm

rapport: forme oxydée

forme réduite

 Figure 3‑17  Visualisation du potentiel redox subcellulaire du réservoir de glutathion dans des diatomées vivantes. Images de microscopie à fluorescence de cellules de Phaeodactylum tricornutum exprimant roGFP2 dans différentes régions de la cellule. Des images de fluorescence obtenues pour deux longueurs d’onde d’excitation (A, B) ont été divisées pour obtenir des valeurs ratiométriques (C). Pour l’étalonnage, des images ratiométriques ont été réalisées en présence d’un oxydant fort (H2O2 à 150 mM) (D) et d’un réducteur (DTT, 1 mM) (E). Les lignes pointillées représentent le pourtour des cellules, déterminé d’après les images en transmission. (F) Le potentiel redox stationnaire du réservoir de glutathion, EGSH, a été calculé à partir de l’équation de Nernst et en utilisant le niveau d’oxydation à des valeurs de pH correspondant à chaque organite. (D’après Graff van Creveld et al. (2015).)

Comment fait-on pour mesurer les potentiels redox dans des cellules vivantes ? Les potentiels redox ont eux aussi bénéficié de la révolution des protéines fluorescentes. On a ainsi inventé une protéine rapportrice sensible au potentiel redox en incorporant à la GFP des cystéines qui modifient la fluorescence en fonction de leur réduction par le glutathion. La figure 3‑17 montre le résultat de l’utilisation de ce rapporteur pour mesurer le potentiel redox du glutathion dans différents compartiments d’une diatomée.

241

La biologie cellulaire par les nombres

À partir de mesures de l’état redox du réservoir de glutathion dans différents organites cellulaires et dans différentes conditions, on peut en déduire le rapport des concentrations des formes réduite et oxydée. Les valeurs vont d’environ -170 mV dans le RE et les cellules apoptotiques à environ -300 mV dans la plupart des autres organites et les cellules en prolifération (BNID 103543, 101823, 111456, 111465). Étant donné que le potentiel redox standard du glutathion vaut -240 mV (BNID 111453, 111463), quelle est donc la concentration relative de glutathion réduit/ oxydé ? À l’aide de l’équation de Nernst (ou de manière équivalente, de la distribution de Boltzmann), une variation du rapport produit/réactif d’un facteur 10 correspond à une augmentation de ≈6 kJ/mol d’enthalpie libre (≈2 kBT). Puisque la réaction GSH/GSSG transfère 2 électrons, cette variation de concentration relative est en général de 30 mV (quoique ce soit seulement une approximation dans le cas du glutathion, du fait de la stœchiométrie de 2 molécules de GSH se liant de manière covalente en une molécule de GSSG). Lorsque le potentiel redox varie de 100 mV en fonction des conditions, cela reflète donc des rapports de concentrations allant de 1 (autant de formes réduites et oxydées) dans les cellules apoptotiques à 1 000 (une forme réduite 1 000 fois plus concentrée que la forme oxydée). En effet, dans la plupart des conditions cellulaires, la forme oxydée constitue seulement une très petite fraction du réservoir global, bien qu’elle ait toujours des implications physiologiques. Les réactions redox peuvent parfois sembler confuses, étant donné que le transfert peut prendre plusieurs formes. Il peut s’agir seulement d’électrons, comme dans les réactions effectuées par des cytochromes dans les chaînes de transfert d’électron. Un autre cas fréquent concerne des combinaisons d’électrons et de protons, comme dans le cofacteur NAD+/NADH, où deux électrons et un proton (H+) sont transférés. Enfin, il existe des réactions où le même nombre d’électrons et de protons est transféré alors qu’on serait normalement tenté de prévoir un transfert d’atomes d’hydrogène. C’est par exemple le cas de la réaction globale d’oxydation du glucose, où l’oxygène est réduit en eau. Deux atomes d’hydrogènes ont été transférés : faut-il parler d’un transfert d’électrons, de protons ou d’atomes d’hydrogène ? La définition du potentiel redox donnée ci-avant se concentre seulement sur l’état de l’électron. Que dire des protons et de ce qui leur arrive dans une chaîne de réactions de transfert d’électron où certains composés intermédiaires contiennent les protons H+ et d’autres non ? C’est l’eau environnante et son pH qui apporte l’explication. La réaction se produit à un pH donné, et les réactifs sont en équilibre avec ce pH. De ce fait, la libération ou l’acceptation d’un proton n’a aucun effet sur le bilan énergétique. Le milieu aqueux sert de réservoir où on peut « ranger » les protons 59 lorsque la réaction de transfert fait seulement intervenir les électrons. On peut ensuite récupérer ces protons mis de côté aux étapes suivantes, comme cela se produit à l’étape finale de la respiration oxydative, où la cytochrome-oxydase extrait des protons du milieu environnant. Puisqu’on suppose que l’eau est omniprésente, on n’a pas besoin d’expliquer ce qui arrive aux protons, sauf lorsqu’il s’agit d’évaluer 59.  Cette image est empruntée au livre d’introduction à la biochimie de Steven Rose, La chimie de la vie (Rose 1971). (NdA)

242

3. Forces et énergies

le pH qui détermine la tendance de donner ou à recevoir des protons. C’est la raison pour laquelle nous parlons de donneurs et d’accepteurs d’électrons, plutôt que de donneurs et d’accepteurs d’atomes d’hydrogène.

Quelle est la différence de potentiel électrique à travers les membranes ? Parmi les transformations d’énergie les plus importantes des cellules, nombre d’entre elles utilisent la membrane comme condensateur électrique, ce qui aboutit au stockage de l’énergie sous forme de potentiel transmembranaire. Les réactions qui récoltent de l’énergie, comme celles impliquées dans la photosynthèse, pompent des protons à travers la membrane. Lorsqu’ils traversent la membrane dans l’autre sens, ces protons sont alors mobilisés pour synthétiser l’ATP et pour transporter des composés à contre-courant de leur gradient de concentration. Pour les mitochondries, cette différence de potentiel a une valeur d’environ 160 mV (BNID 101102, 101103) et pour E. coli elle est d’environ 120 mV (BNID 103386). Une différence de pH entre deux compartiments liés à la membrane ajoute 60 mV par unité de pH à la « force motrice » globale de transport de protons. Les différences de potentiel électrique et de concentration conduisent à ce que l’on appelle la force protonmotrice 60, qui est essentielle pour le fonctionnent de la plupart des transformations énergétiques liées à la membrane, par exemple celles que l’on trouve chez les chloroplastes. Le tableau 3-5 présente une série d’exemples représentatifs pour des différences de potentiel dans divers contextes cellulaires. Pour reformuler ces valeurs en unités peut-être plus familières, rappelons que l’échelle d’énergie associée à un champ électrique E est donnée par qE, où q est la charge déplacée le long de ce champ. En prenant l’échelle caractéristique d’énergie de 100 mV des potentiels membranaires, et en multipliant par la charge de l’électron, 1.6×10–19 coulombs, on obtient une énergie de 1.6×10–20 J. En se souvenant que kBT ≈ 4 pN⋅nm ≈ 4×10–21 J, on peut voir que l’énergie du potentiel membranaire est de l’ordre de ≈4 kBT. Bien que nous ayons l’habitude de tensions de centaines de volts ou plus dans notre expérience quotidienne, ces valeurs sont en fait moins impressionnantes qu’elles pourraient nous paraître, en comparaison de leurs contreparties microscopiques. La façon la plus simple de le voir consiste à calculer les champs électriques qui correspondent à ces tensions. En effet, nous verrons alors qu’aux échelles microscopiques, l’intensité du champ électrique est extrêmement élevée. Pour estimer ces valeurs, rappelons que le champ électrique est donné par la tension divisée par la distance d’action du champ. Par exemple, 160 mV à travers une membrane d’une épaisseur caractéristique de ≈4 nm équivaut à ≈40 kV/mm (BNID 105801), un champ semblable à celui d’un éclair : nos potentiels membranaires de l’ordre du mV correspondent, en fait, à des champs électriques très intenses. De même, l’électroporation, 60. Comme la force électromotrice des générateurs électriques, la force proton-motrice a la dimension d’un potentiel électrique et s’exprime en volts.

243

La biologie cellulaire par les nombres

une technique utilisée couramment pour insérer de l’ADN dans la cellule en créant des pores dans la membrane plasmique, se produit à une différence de potentiel encore supérieure, de l’ordre de 300–400 mV (BNID 106079) de part et d’autre de la membrane. Par conséquent, la tension de plus de 100 mV à travers une mitochondrie ou une cellule d’E. coli est seulement inférieure d’un facteur 2 à la limite physique qui mènerait à la rupture de la membrane.  Tableau 3‑5  Différence de potentiel électrique pour une variété de membranes biologiques. Les valeurs négatives indiquent que le compartiment externe est plus positif que le compartiment interne. fpm désigne la force proton-motrice totale qui inclut l’effet du pH. Lorsque le pH du milieu change, le potentiel électrique d’organismes unicellulaires tend à varier de sorte que la fpm reste dans la gamme de -100 à -200 mV. Différence de potentiel (mV)

BNID

Globule rouge humain

-10 à -14

104083

Neurone humain ou de rongeur (au repos)

-40 à -80

101479, 106527, 106855, 106956, 106104

Axone de calmar géant

-60

104085

Muscle cardiaque de l’embryon de poulet

-70

104083

Muscle squelettique mammifère

-90

104084

Mitochondrie de foie de rat, régime normal

-120 (fpm = -170)

101103

Mitochondrie de foie de rat, régime riche en graisse

-140 (fpm = -150)

101103

E. coli : croissance par fermentation au glucose

-110 (fpm = -120)

103386

E. coli : croissance aérobie de sphéroplastes en milieu riche

-130 (fpm = -230)

107128

E. coli : croissance aérobie au glycérol

-140 (fpm = -160)

103386

S. aureus : croissance aérobie en milieu riche

-130 (fpm = -210)

107128

-140

104083

Compartiment

Algue Nitella

Combien de protons faut-il pomper pour accumuler des différences de potentiel de cet ordre ? Soyons généreux et supposons que la tension membranaire résulte entièrement du transport de proton (bien que d’autres espèces ioniques y contribuent aussi grandement). Le calcul de coin de table de l’estimation 3-5 modélise la membrane plasmique par un condensateur électrique à plaques parallèles. La densité surfacique de charge s d’un condensateur à plaques parallèles est liée à la différence de potentiel V par la relation :

s = Vere0/d,

244

3. Forces et énergies

où d désigne l’épaisseur de la membrane (≈4 nm) et er et e0 les constantes de permittivité diélectrique relative et du vide, respectivement. La charge totale q vaut : q = sA/e, où A désigne la superficie de la membrane, qui pour E. coli par exemple vaut ≈5 µm2, et e = 1.6×10–19 C est la charge élémentaire. La constante diélectrique relative de la bicouche vaut environ ≈2 (BNID 104080), ce qui conduit à environ 104 protons (voir Estimation 3‑5) et est compatible avec une capacité spécifique de la membrane de 1 μF/cm2 (BNID 110759). Dans la rubrique « Quelle est la puissance consommée par la cellule ? » (p. 246), nous avons noté que le taux d’utilisation de l’ATP par E. coli est d’environ ≈1010 ATP par cycle cellulaire. Pour une période de 1 000 s, nous arrivons à un taux de consommation de 107 ATP/s. Puisqu’il faut ≈4 protons pour fabriquer une molécule d’ATP, la charge membranaire permettrait la production d’à peine 104 molécules d’ATP, s’il n’y avait pas de recharge perpétuelle. Ce potentiel serait épuisé en ≈1 ms en conditions de charge normales dans la cellule. Nombre de protons requis pour maintenir la tension membranaire

εr 2

d 4 nm

modélisons la membrane par un condensateur

différence de potentiel, ∆V 100 mV 2

aire 5 µm

charge, q =

permittivité du vide, εo = 8.8 x 10–12

C mxV

5x10–12 m2 x 0.1V x 2 x 8.8x10–12 m Cx V A x ∆V εr εo = dxe 4x10–9 m x 1.6 x10–19C

104 protons

charge élémentaire = 1.6 x 10–19C

 Estimation 3‑5  Nombre de protons requis pour maintenir la tension membranaire.

On peut aussi voir ces valeurs sous un autre aspect, en l’occurrence le rapport des charges séparées par la membrane à la charge globale des ions dans la cellule. Dans l’introduction (p. 36), nous affirmions qu’une concentration de 1 nM équivaut à 1 molécule dans un volume équivalent à une cellule d’E. coli. Ainsi, une concentration ionique globale de ≈100 mM chez E. coli se traduit par ≈108 charges/cellule. Par ailleurs, pour atteindre l’ordre de grandeur des tensions membranaires typiques, le calcul du paragraphe précédent montre qu’il faut globalement 104 protons, c’està-dire seulement 1/10 000 de toute la charge ionique d’une cellule bactérienne. Dans de plus grandes cellules comme les neurones, les charges associées aux potentiels d’action forment une plus petite fraction encore de la concentration ionique intracellulaire totale. Cela montre que les cellules sont pratiquement électriquement neutres : c’est-à-dire que, même s’il existe une tension électrique membranaire, cela ne représente qu’une minuscule fraction de la concentration totale d’ions.

245

La biologie cellulaire par les nombres

Quelle est la puissance consommée par la cellule ? Les cellules sont des systèmes hors-équilibre et ont donc besoin d’un approvisionnement en énergie constant pour demeurer dans cet état privilégié. Mesurer expérimentalement la puissance nécessaire pour faire fonctionner une cellule, ou la chaleur produite à mesure qu’elle accomplit ses opérations métaboliques usuelles, est très difficile. Outre les difficultés techniques associées à la mesure de la puissance, il y a plusieurs définitions plausibles pour l’énergie utilisée par une cellule par unité de temps, ce qui exige une discussion rigoureuse du problème. Nous expliquerons la signification et la pertinence de certaines de ces définitions, puis nous emploierons des estimations et des mesures expérimentales pour explorer les ordres de grandeur de cette puissance. Nous ne cherchons pas une précision élevée, étant donné que ces valeurs peuvent facilement varier de plus d’un ordre de grandeur en fonction du milieu de culture, de la vitesse de croissance ainsi que d’autres facteurs environnementaux. Taux de production d’énergie par une cellule humaine et une bactérie

puissance

100 W/personne

masse

100 kg/personne

W 1 kg au repos

Phumain

taux de consommation de l’oxygène en croissance exponentielle rapide

30

mmol O2 g MSC x heure masse sèche cellulaire

∆Grespiration O

2

Pbactérie

30

–500 kJ/mol

1 heure kJ g MSC mmol O2 x 500 x x 0.3x10–12 mol O2 3600 s g MSC x heure cellule de 1 µm3 masse humide d’une bactérie

10–12

W cellule

1000

W kg

10–15 kg

 Estimation 3‑6  Taux de production d’énergie chez l’humain et la bactérie.

Pour commencer, nous considérons la règle pratique selon laquelle un humain adulte produit de la chaleur à un taux d’environ 100 W, comparable à une ampoule lumineuse incandescente, ce qui peut expliquer que la chaleur produite dans une salle augmente avec le nombre de personnes qui s’y trouvent. La valeur de 100 W est calculée sur la base d’un apport calorique de 2 000 kcal par jour (voir aussi la rubrique « Combien d’enthalpie libre dégage la combustion du sucre ? », p. 235). En supposant qu’une personne pèse ≈100 kg (on peut omettre le régime au retour des vacances, puisqu’il s’agit d’un calcul d’ordre de grandeur), nous trouvons une puissance consommée d’environ 1 W/kg (voir Estimation 3‑6). Cela correspond à environ 10–15 W/μm3, en revenant à cette unité de volume utile pour considérer les différents types cellulaires ; rappelons qu’une bactérie fait environ 1 μm3 de volume, un globule rouge 100 μm3, une cellule mammifère adhérente de 1 000 à 10 000 μm3. La définition de la puissance consommée utilisée ici repose sur le taux de production de chaleur. Nous considérons d’autres définitions ci-après.

246

3. Forces et énergies

Des mesures récentes de la consommation de glucose dans des fibroblastes humains primaires permettent de proposer une deuxième manière d’estimer la consommation d’énergie d’un être humain. La consommation de fibroblastes humains quiescents, de volume non rapporté, a été évaluée à environ 1 µmol de glucose par gramme de protéine et par heure (BNID 111474). Rappelons que l’énergie totale libérée par la combustion du glucose (où le carbone du sucre réagit avec l’oxygène pour donner du CO2 et de l’eau) vaut environ 3 000 kJ/mol (voir la rubrique « Combien d’enthalpie libre dégage la combustion du sucre ? », p. 235). La teneur en protéines d’un volume cellulaire caractéristique d’environ 3 000 m3 est d’environ 300 pg, ce qui correspond à 3×109 cellules par gramme de protéine. Ainsi, une cellule exige : 3 106 J 103 mol de glucose 1 h 1 g de protéine    3 1010 W/cellule  1 mol de glucose 1 g de protéine 1 h 3600 s 3 109 cellules Exprimée en masse cellulaire, cela équivaut à : 3×10–10 W/cellule × 3×1011 cellules/kg ≈ 100 W/kg de masse cellulaire humide, une valeur supérieure de deux ordres de grandeur à notre évaluation fondée sur l’analyse d’un corps humain entier. Il est possible que les fibroblastes présentent une activité métabolique supérieure à la cellule humaine moyenne. Mais cet écart de deux ordres de grandeur pourrait aussi remettre en question l’exactitude des valeurs rapportées. Il est difficile de le dire sans plus de données. Bien que ce résultat soit inattendu, il concentre bien notre attention sur une question scientifique concrète au sujet de la consommation d’énergie des fibroblastes en laboratoire comparée à une cellule « moyenne » du corps humain, et suggère de futures expériences et mesures. Il est parfois plus utile de mesurer l’énergie en unités d’ATP. Nous pouvons estimer à ≈20 ATP la production par molécule de glucose d’une combinaison de respiration et de fermentation caractéristiques des cellules cancéreuses (BNID 111475). Nous constatons alors que la consommation établie ci-avant se traduit par environ 109 molécules d’ATP/s par cellule mammifère de 3 000 µm3 de volume (BNID 111476). Quel est l’intérêt de connaître cette valeur ? Pensons à la motilité cellulaire. Quand nous observons des vidéos de kératocytes de poisson rouge se déplaçant rapidement à travers le champ visuel du microscope sur leur lamellipode (voir Estimation 3‑7), il est normal de supposer que ces processus exigent une grande fraction de l’énergie disponible de ces cellules. Mais est-ce vraiment le cas ? Pour beaucoup de cellules eucaryotes, la motilité résulte principalement de la polymérisation de l’actine à un coût stationnaire d’environ 1 hydrolyse d’ATP par monomère d’actine ajouté. Le marquage fluorescent de l’actine a permis de montrer que les filaments d’actine dans les kératocytes épithéliaux de poisson rouge polymérisent à la même vitesse que le mouvement de la cellule, soit environ 0.2 µm/s à température ambiante (BNID 111060). Étant donné la taille d’un monomère d’actine, chaque filament doit s’allonger d’environ 100 monomères/s pour permettre la motilité, ce qui coûte ≈100 ATP par filament et par seconde. Mais combien de filaments d’actine faut-il pour déplacer une cellule ?

247

La biologie cellulaire par les nombres

L’estimation 3‑7 montre que le lamellipode de kératocyte fait environ 20 µm de long et contient approximativement 200 filaments d’actine par micron (BNID 111061), soit ≈4 000 filaments au total. Si l’actine polymérise principalement à la proue du lamellipode, le kératocyte doit brûler environ 4 000×100 = 4×105 ATP/s pour alimenter son déplacement. À la lumière de la consommation d’ATP d’une cellule calculée ci-avant, cette valeur s’avère être un besoin en ATP de moins d’un dixième de pourcent. Le calcul de ces coûts énergétiques nous permet d’affiner notre compréhension du budget énergétique des cellules. Combien d’ATP requiert la reptation d’une cellule adhérente ?

20 µm

0.2 µm/s

200 filaments/µm à la proue

D’après Svitkina et al. (1997)

vitesse de polymérisation de l’actine = 0.2 µm/s × 1000 nm × 2 monomères 5 nm 1 µm ATP nécessaire = 20 µm × 200 filaments × 100 monomères × 1 ATP 1 µm (s x filament) monomère

100 monomères (s x filament) 4 x 105 ATP/s

 Estimation 3‑7  Combien d’ATP requiert la reptation d’une cellule adhérente ?

Comment les résultats décrits ci-avant pour des cellules humaines se comparent-ils à ce que nous pouvons dire de la consommation d’énergie chez les bactéries ? Une approche empirique consiste à suivre le taux de consommation d’oxygène des cellules (qui dépend naturellement de la source de carbone et de l’état de croissance). Pour la croissance en milieu minimum avec du glucose, une valeur caractéristique pour le taux de consommation d’oxygène est de 30 mmol d’O2 par gramme de masse cellulaire sèche et par heure (BNID 109687). En réalisant les conversions d’unité nécessaires, et en notant que la respiration de l’oxygène libère une chaleur de 500 kJ/mol (voir la rubrique « Combien d’enthalpie libre dégage la combustion du sucre ? », p. 235), nous trouvons 10–12 W par cellule, ou 1 000 W/kg. Nous en concluons que dans ces conditions de référence, la consommation bactérienne d’énergie par unité de biomasse est supérieur d’environ trois ordres de grandeur à celle d’un être humain. Le lecteur intéressé par ce genre de comparaisons entre différents organismes et par les efforts de compréhension est invité à se reporter à la prochaine rubrique : « Quelle est la relation entre l’activité métabolique et la taille d’une cellule ? » (p. 251). De même, pour voir comment cela se rapporte aux conditions énergétiques de la motilité bactérienne, consulter la rubrique « Quelle est la vitesse des moteurs moléculaires rotatifs ? » (p. 301).

248

3. Forces et énergies

Nous analysons ensuite la croissance bactérienne rapide en termes d’utilisation de l’ATP. Pour des besoins de 30 mmol O2/g/h pendant la croissance sur le glucose, et en utilisant le rapport phosphate/oxygène, ou le rapport d’ATP produit par molécule d’oxygène respirée (5 molécules d’ATP par molécule d’O2), nous arrivons à environ 150 mmol d’ATP par gramme de masse sèche et par heure, ce qui se traduit par ~107 molécules d’ATP/s par cellule bactérienne. Au cours d’un cycle cellulaire d’environ une heure, nous obtenons 1010–1011 molécules d’ATP produites par une cellule bactérienne de 1 µm3 de volume. En notant qu’une heure est également une période de doublement caractéristique, pendant laquelle chaque cellule produit une nouvelle cellule contenant environ 1010 atomes de carbone (BNID 103010), nous obtenons une règle pratique d’environ 1 ATP consommé par atome de carbone incorporé à la biomasse pendant la croissance cellulaire. Quelle est l’utilité de ces valeurs ? Considérons l’idée d’alimenter une cellule d’E. coli à l’aide de protéorhodopsine bactérienne, une protéine que l’on trouve dans la membrane plasmique de certains types de bactéries et qui pompe des protons en réponse à la lumière 61. On peut imaginer empaqueter de l’ordre de 105 de ces protéines sur le « parc immobilier » disponible d’une membrane bactérienne typique (quoique les valeurs réelles tendent à être très inférieures, BNID 111296). Ainsi, nous pouvons en déduire que pour se diviser une fois toutes les quelques heures (disons 104 s), une période de doublement caractéristique pour des bactéries, chacune de ces protéines membranaires devra pomper un proton au moins plusieurs centaines de fois par seconde (~1011 protons doivent être pompés par 105 protéines en 104 s). Ces protons seront alors employés pour alimenter les machines qui synthétisent l’ATP. Si ces protéines ne peuvent pas maintenir un tel taux de transport, le métabolisme cellulaire est une impasse dès le début (BNID 111295). Quels processus sont alimentés par toute cette consommation d’énergie dans la cellule ? On a essayé dans les années 1970 d’effectuer un « budget comptable » de l’ATP pour les cellules bactériennes, c’est-à-dire d’énumérer tous les processus de la cellule en fonction de la quantité d’ATP qu’ils consomment. Parmi ceux qui ont pu être clairement mesurés (y compris métabolisme et polymérisation), la synthèse de protéines à partir d’acides aminés domine le budget en conditions de croissance rapide et pour des sources de carbone favorites. Ajouter des acides aminés à la chaîne peptidique consomme environ 4 ATP/aa, et avec 2–4 millions de protéines par µm3 et 300 aa par protéine, nous arrivons à une valeur d’environ 4×109 molécules d’ATP dépensées par µm3 de volume cellulaire. Ceci devrait être comparé à la valeur de 1010–1011 du paragraphe précédent, et nous concluons qu’il s’agit d’un important besoin en énergie. Il est plus étonnant qu’une grande fraction, environ la moitié de l’énergie consommée (BNID 102605), n’est expliquée par aucun processus essentiel pour la construction de la cellule, et a généralement été considérée comme perdue par des processus associés à la membrane tels que l’établissement d’une différence de potentiel membranaire et les fuites associées. Il est de grand intérêt de reprendre ces efforts de comptabilité cellulaire, par exemple pour déterminer la fraction perdue

61. Walter et al. (2007)

249

La biologie cellulaire par les nombres

par des cycles métaboliques futiles et par la phosphorylation et la déphosphorylation post-traductionnelles des protéines. Dans le cas des cellules mammifères, la comptabilité dépend encore des conditions de croissance, mais aussi du tissu considéré. Dans le tableau 3‑6 (BNID 107962), nous reproduisons les résultats pour des tissus de souris qui consomment de grandes quantités de dioxygène, notamment pour la synthèse protéique, l’ATPase Na+/K+ (la machine responsable du maintien de la tension électrique cellulaire au repos), l’ATPase de l’actomyosine (qui alimente les cellules musculaires) et la fuite de protons mitochondriale. Dans les neurones, on a pu estimer que le renouvellement de l’actine est responsable d’environ 50 % de la consommation d’ATP (BNID 110642). De nouvelles sondes bioluminescentes permettent mesurer la concentration d’ATP dans des neurones in vivo et de les relier à l’activité synaptique. De telles méthodes promettent des recensements énergétiques détaillés dans les années à venir. Nous terminerons en notant que dans les environnements extrêmes tels que le pergélisol de l’Antarctique, on a pu trouver des bactéries vivantes à 3 000 m de profondeur à des températures inférieures à 0 °C. En raison des impuretés, l’eau ne gèle pas et le rythme métabolique est extrêmement lent, inférieur de ≈6 ordres de grandeur à celui de la croissance rapide (BNID 111454, 111455). On a pu l’appeler métabolisme de survie : les cellules sont dormantes et on pense que l’énergie est vraisemblablement employée pour réparer les dommages aux macromolécules.  Tableau 3‑6   Distribution des processus majeurs de consommation d’oxygène relativement à la consommation totale d’oxygène par des tissus de rat à l’état standard (BNID 107962). Les valeurs sont arrondies à un chiffre significatif. (D’après Rolfe et Brown (1997).) Tissu

250

Synthèse protéique

ATPase Na+/K+

ATPase Ca2+

Autres Glyconéogenèse (15–40 %) Recyclage de susbtrat (20 %) Fuite de proton (20 %) Synthèse d’urée (12 %)

Foie

20 %

5–10 %

5 %

Rein

6 %

40–70 %

_

Cœur

3 %

1–5 %

15–30 %

ATPase actine-myosine (40–50 %) Fuite de proton (max. 15 %)

Cerveau

5 %

50–60 %

Significatif

108–109 ATP pour un potentiel d’action cortical (BNID 111183)

Muscle squelettique

17 %

5–10 %

5 %

Glyconéogenèse (5 %)

Fuite de proton (50 %) Non mitochondriale (14 %)

3. Forces et énergies

Quelle est la relation entre l’activité métabolique et la taille d’une cellule ? Quand on entre dans la biologie en venant de ses disciplines sœurs, la physique ou l’ingénierie, on est fortement tenté de chercher des tendances quantitatives cohérentes et des règles générales. La puissance consommée par différents organismes, ou le taux métabolique de consommation d’énergie, est un exemple de ce genre de quête qui illustre le fonctionnement des arguments en loi d’échelle. Pour de nombreux systèmes inanimés, l’énergie produite est évacuée à travers l’interface qui sépare le système de l’extérieur, et chaque unité d’aire permet un flux d’énergie constant. L’aire, A, varie avec le rayon, R, selon : A ~ R 2. De même, le volume, V, varie comme R 3. En supposant une densité constante, la masse M du système variera de la même manière. La surface varie donc selon : A ~ M 2/3. Que devrait être la loi d’échelle de la production énergétique par unité de masse B/M ? Selon notre hypothèse précédente, l’énergie est évacuée par la surface à vitesse constante, donc l’énergie totale produite devrait être proportionnelle à A, soit B ~ A. En divisant les deux côtés par M, nous obtenons finalement : B/M ~ A/M ~ M 2/3/M ~ M –1/3. Est-ce que cette loi d’échelle fondée sur des considérations simples de transfert d’énergie reste valide pour les systèmes biologiques ? Le rythme métabolique d’un organisme dépend des conditions et devrait être rigoureusement défini si l’on veut faire une comparaison pertinente entre organismes. L’exemple le plus extrême que nous connaissions est le cas des abeilles, dont la consommation d’oxygène, et donc leur consommation d’énergie, est multipliée par un facteur environ 1 000 en vol par rapport au repos (BNID 110031). De même, les humains participant au laborieux Tour de France consomment près de 10 000 kcal par jour, environ cinq fois la valeur au repos. Il est très courant de considérer le taux métabolique au repos, qui signifie pratiquement que l’animal n’est pas particulièrement actif mais bien nourri. Comme le lecteur vif peut imaginer, il n’est pas facile de garantir un état de repos pour tous les animaux – pensons par exemple à l’orque. Les valeurs elles-mêmes sont souvent calculées à partir du taux de consommation d’énergie (qui est approximativement égal au taux de production énergétique) ou, dans d’autres cas, de la consommation de l’oxygène. La loi de Kleiber, obtenue à partir de mesures empiriques sur des animaux, suggère une relation entre le besoin en énergie métabolique au repos par unité de masse (B/M) et la masse corporelle (M) qui varie selon M –1/4. La figure 3‑18 représente un graphe célèbre qui démontre cette relation. Assez proche de la loi d’échelle fondée sur la surface et le transfert d’énergie décrit ci-avant, la loi de Kleiber suggère que des animaux plus lourds exigent moins d’énergie par unité de masse, mais avec un

251

La biologie cellulaire par les nombres

exposant légèrement différent de la valeur de –1/3 trouvée ci-dessus. La différence entre ‑0.33 et ‑0.25 n’est pas grande, mais le graphe suggère que les données expérimentales sont assez précises pour faire cette distinction. De nombreux modèles ont été proposés pour expliquer pourquoi la loi d’échelle est différente de celle prévue par le raisonnement sur la surface. Les principaux modèles discutent le rythme d’approvisionnement énergétique dans des réseaux hiérarchisés, comme les vaisseaux sanguins dans notre corps qui fournissent l’oxygène nécessaire à la production énergétique par la respiration. On peut se faire une idée de ce que cette loi d’échelle prévoit. Si un humain de 100 kg consomme 100 W, c’est-à-dire 1 W/kg, alors une souris de 10 g (4 ordres de grandeur) aurait besoin de (10–4)–1/4=10 fois plus d’énergie par unité de masse, soit 10 W/kg. Et une bactérie de 10–15 kg (17 ordres de grandeur plus légère qu’un humain) nécessiterait (10–17)–1/4~104 fois plus d’énergie, ou 10 000 W/kg. Cette valeur est de 1 à 3 ordres de grandeur plus élevée que les valeurs obtenues dans la rubrique « Quelle est la puissance consommée par la cellule ? » (p. 246) complémentaire de celle-ci. Mais comme on peut le voir sur la figure 3‑18, la courbe qui se rapporte aux organismes unicellulaires est décalée par rapport aux courbes correspondant aux mammifères d’un écart comparable. 103

puissance métabolique B (W)

100 10–3 10–6 10–9

10–12 10–15 –15 10

pente de B = M3/4; B/M = M–1/4 10–12

10–9 10–6 10–3 100 masse corporelle M (kg)

103

 Figure 3‑18  Relation entre le rythme métabolique d’organismes entiers et la masse corporelle. Les rythmes métaboliques sont rapportés pour une température de 20 °C. (D’après Gillooly et al. (2001).)

Les besoins énergétiques au repos des organismes ont récemment été comparés parmi plus de 3 000 organismes différents, couvrant tous les règnes du vivant et plus de 20 ordres de grandeur en masse ! Contrairement à ce que prévoit la loi de Kleiber, ces travaux récents ont trouvé une gamme relativement faible de variation, la grande majorité des organismes ayant des besoins énergétiques entre 0.3 et 9 W/kg de masse humide (voir Figure 3‑19). Notre estimation naïve de 1 W/kg de poids humide pour un humain est quelque part au milieu, mais l’observation

252

3. Forces et énergies

étonnante est que cette gamme semble également valide pour de minuscules bactéries, pour des feuilles de plantes et pour de nombreuses branches distinctes de l’arbre du vivant jusqu’aux éléphants. Est-ce une indication de l’adage de Jacques Monod, selon lequel ce qui est vrai pour E. coli est vrai pour l’éléphant ? D’autres travaux ont pu apporter des observations des écarts à la loi d’échelle de Kleiber pour les unicellaires eucaryotes et procaryotes 62. Mais des études récentes soutiennent la loi de Kleiber et cherchent à l’expliquer. Nous ne sommes pas en mesure de discuter qui a raison dans cette controverse, mais il nous semble qu’une telle vue d’ensemble de l’énergétique de la vie fournit un aperçu très utile sur le budget énergétique global de l’économie de la cellule.

nombre d’espèces

nombre d’espèces

puissance métabolique par unité de masse procaryotes n = 173

protozoaires n = 52

insectes n = 402

invertébrés aquatiques n = 376

150

hétérotrophes

photoautotrophes

vertébrés ectothermes n = 580

vertébrés endothermes n = 946

12

90

20

8

60

40

100

160

10

4

30

20

50

80

0

0

0

0

0

30

6

0.1 1 10 100

2 0

microalgues n = 47

cyanobactéries n = 25

4

0.1 1 10 100

0.1 1 10 100

15 10 5 0

18

0.1 1 10 100 macroalgues n = 88

60

90

0.1 1 10 100

0.1 1 10 100 jeunes arbres n = 119

feuilles vertes n = 271 45

240

0

240

12

60

30

160

6

30

15

80

0

0

0

0

0.1 1 10 100 0.1 1 10 100 0.1 1 10 100 0.1 1 10 100 puissance métabolique par unité de masse (W/kg)

0.1 1 10 100 jeunes plants n = 418

0.1 1 10 100

 Figure 3‑19  Histogrammes de rythme métabolique au repos normalisé par la masse humide. À travers plusieurs ordres de grandeur de taille et de groupes phylogénétiques très différents, le rythme est semblable, de l’ordre de 0.3–9 W/kg de masse humide. (D’après Makarieva et al. (2008).)

62. DeLong et al. (2010)

253

4 Temps et vitesse

Ce chapitre explore un autre concept quantitatif important de la biologie – à savoir, le temps, et son alter ego, la vitesse. L’intuition numérique en biologie s’articule autour des notions de la taille des protagonistes (les macromolécules, les organites, les cellules et les organismes), de la concentration à laquelle ils interviennent et des échelles de temps des divers phénomènes qui sont à l’œuvre chez les organismes vivants. Tant les données expérimentales que les règles pratiques qui parcourent le présent chapitre, et qui sont illustrées sur la figure 4‑1, peuvent servir de base pour développer son intuition à l’égard des vitesses d’un large spectre de processus biologiques. L’un des aspects les plus évidents du monde vivant est son caractère dynamique. Si nous observons un échantillon d’eau d’un étang, ou l’intérieur d’une termitière, à l’aide d’un microscope à faible grossissement, c’est tout un monde grouillant d’activité qui se présente à nous. À un grossissement plus élevé, nous pouvons distinguer à l’intérieur d’une cellule une diversité éblouissante de processus qui se produisent à toutes sortes d’échelles de temps. Cette progression dynamique se poursuit de même jusqu’à l’échelle des ions et des molécules qui constituent comme « l’éther » du milieu intracellulaire. Qu’est-ce qui détermine les échelles de temps de ces différents processus ? Nous entamons ce chapitre en considérant l’un des aspects les plus importants du vivant – en l’occurrence, le fait que les molécules diffusent (de même que des composés plus grands tels que les organites ou les virus). La diffusion est le mouvement inexorable qui résulte des collisions entre la particule qui nous intéresse et les molécules du milieu environnant. Ces mouvements diffusifs signifient, par exemple, que lorsqu’un canal ionique s’ouvre et laisse entrer des ions à l’intérieur de la cellule, ces ions quittent le voisinage du canal et se répandent dans le milieu intracellulaire. Autrement dit, ces mouvements diffusifs engendrent un flux, depuis les régions de forte concentration, vers les régions de faible concentration, ce qui a pour conséquence d’homogénéiser les concentrations sur de longues échelles de temps.

255

La biologie cellulaire par les nombres

déplacement de 1 µm d’un moteur moléculaire diffusion de protéine à travers une cellule HeLa

diffusion pas de d’une protéine l’ADNà travers E. coli polymérase

10–3 (ms)

temps de génération

temps de E. coli demi-vie de S. cerevisiae l’ARNm chez E. coli

100

103 (≈ 20 min)

transfert d’électron photosynthétique transduction du signal visuel séparation de charge photosynthétique

transition de repliement

cellule HeLa

temps (secondes)

repliement protéique liaison d’un ligand renouvellement moyen d’une enzyme catalytique

mouvement d’un exciton passage d’un canal ionique ; diffusion à travers une synapse

vibration de liaisons moléculaires 10–15 (fs)

10–12 (ps)

10–9 (ns)

10–6 (µs)

rotation de flagelle ; ATP synthase 10–3 (ms)

100 temps (secondes)

 Figure 4‑1  Distribution des échelles de temps caractéristiques des principaux processus biologiques. L’axe du haut correspond aux grandes échelles de temps, de la diffusion de protéines dans une cellule bactérienne au temps de division d’une cellule mammifère. L’axe du bas représente les petites échelles de temps, de la vibration des liaisons interatomiques aux durées de repliement de protéines et aux réactions enzymatiques.

Nous explorons ensuite les vitesses associées aux mouvements d’autres petites molécules à l’intérieur de la cellule. Outre la dynamique des mouvements intracellulaires passifs des molécules, l’un des effets les plus intéressants qui puissent arriver à ces molécules est qu’elles changent d’identité chimique à travers un réseau extrêmement complexe de réactions. Les cellules disposent de nombreuses astuces pour accélérer les vitesses de la plupart de ces transformations chimiques (sinon toutes). La principale méthode consiste à employer des enzymes. Plusieurs de nos rubriques se concentrent sur les échelles de temps associées aux réactions enzymatiques et à ce qui détermine ces échelles de temps. Une fois les préliminaires diffusifs et enzymatiques établis, le reste des exemples du chapitre se concentre sur les aspects temporels de certains processus spécifiques de grande importance en biologie cellulaire. Nous considérons ainsi les processus du dogme central – la transcription et la traduction – et comparons leurs vitesses. Nous analysons ensuite d’autres processus cellulaires que nous relions au temps de division cellulaire et au cycle cellulaire, qui définit l’une des échelles de temps clés en biologie moléculaire. Notre leitmotiv consiste à se demander ce qui contrôle

256

4. Temps et vitesse

les durées de ces phénomènes, et pourquoi ils ne vont pas plus vite. Toutes choses égales par ailleurs, des vitesses plus élevées permettraient à la cellule de produire un flux donné avec un investissement plus faible dans ses ressources. On a pu émettre l’hypothèse que la libération de ces ressources conduit à des vitesses de croissance et des probabilités de survie plus élevées, mais nous verrons que ces scénarios ne sont pas dépourvus de subtilités.

Les échelles de temps pour les petites molécules Quelles sont les échelles de temps de la diffusion à l’intérieur d’une cellule ? Parmi les phénomènes cellulaires universels, la diffusion est celui qui sert de référence temporelle à tous les autres processus cellulaires. Les molécules participent à une danse perpétuelle, chaotique, caractérisée en détail par le botaniste Robert Brown dans son article au titre impressionnant : « Un compte-rendu succinct d’observations microscopiques réalisées aux mois de juin, juillet et aout 1827 concernant les particules contenues dans le pollen des plantes et l’existence universelle de molécules actives dans les corps organiques et inorganiques. » L’objet de ces travaux a été baptisé mouvement brownien en hommage aux mesures pionnières et minutieuses réalisées par Brown sur le mouvement du pollen. Conformément à ses observations, la diffusion correspond aux mouvements aléatoires de petits objets qui résultent de leurs collisions avec les molécules qui constituent le milieu environnant. L’étude de la diffusion est l’un des grands carrefours de presque toutes les disciplines de la science moderne. En chimie comme en biologie, la diffusion est souvent le fondement dynamique d’un large spectre de réactions différentes. La description mathématique de ce type de phénomènes, qui a été l’une des thématiques centrales de la physique mathématique pour près de deux siècles, conduit à des règles pratiques simples pour l’évaluation des échelles de temps caractéristiques de phénomènes diffusifs. En particulier, la concentration d’espèces diffusives en fonction de la position et du temps s’exprime mathématiquement à l’aide de l’équation de diffusion. Le paramètre-clé de cette équation est la constante de diffusion, D : une constante de diffusion élevée correspond en effet à un taux plus élevé d’agitation moléculaire. À l’échelle microscopique, la valeur de D est déterminée par la vitesse de la molécule et le temps moyen entre deux collisions. L’un des résultats majeurs dû à l’analyse mathématique des problèmes de diffusion est que le temps moyen τ qu’une particule met pour parcourir une distance x s’écrit :

τ ≈ x2/D, ce qui indique que la constante de diffusion a une dimension longueur2/temps. Cette règle pratique montre que le temps de diffusion varie avec le carré de la distance. Nous allons voir que ce résultat a des conséquences majeures en biologie cellulaire.

257

La biologie cellulaire par les nombres Relation de Stokes-Einstein et constante de diffusion dans l’eau R2



a

D=

kBT 6πηa

4 x 10–21 N x m a Nxs x x 10–9m 6 x 3 x 10–3 1 nm m2

viscosité 10–3

1 10–9m2/s 1012μm2 x x = a 5 m2 1 nm

200 a 1 nm

μm2 s

Nxs m2

 Estimation 4‑1  Relation de Stokes-Einstein et constante de diffusion dans l’eau.

Combien de temps faut-il à une macromolécule pour traverser une cellule donnée ? Comme expliqué à l’estimation 4‑1, la constante de diffusion caractéristique d’une molécule de la taille d’une protéine monomérique vaut ≈100µm2/s dans l’eau et environ 10 fois moins dans une cellule, soit 10 µm2/s. Ces valeurs varient en fonction du contexte cellulaire (voir Tableau 4‑1) ; par exemple la constante de diffusion des protéines les plus grandes est souvent encore inférieure d’un ordre de grandeur, atteignant 1 µm2/s ; BNID 107985). À l’aide de la règle pratique simple introduite ci-avant, nous trouvons qu’il faut environ 0.01 seconde pour qu’une protéine parcoure le diamètre de 1 µm d’une cellule d’E. coli (BNID 103801 ; voir Estimation 4‑2). Un calcul similaire donne une valeur de 10 s pour qu’une protéine parcoure une cellule HeLa (de diamètre 20 µm ; BNID 103788). Pour parcourir un axone de 1 cm de long, qui est 500 fois plus long, par diffusion seule, puisque le temps de diffusion varie comme le carré de la distance, il faudrait 106 secondes, soit deux semaines. Vu la nette augmentation du temps de diffusion dans les cellules de taille macroscopique, le déplacement de protéines sur de longues distances doit nécessairement reposer sur des mécanismes autres que la diffusion. À l’aide d’un moteur moléculaire qui se déplace à la vitesse de ≈1 µm/s (BNID 105241), une protéine mettra 2 à 3 heures pour parcourir la même distance, ce qui constitue une durée « physiologiquement raisonnable ». Pour des neurones extrêmement longs, qui peuvent atteindre 1 m de long chez l’être humain (ou 5 m chez la girafe), de récents travaux de recherche suggèrent que les cellules gliales environnantes permettent de dépasser la limitation temporelle de la diffusion en exportant du matériau cellulaire vers la périphérie du neurone 63. Cela pourrait réduire le temps de transport de plusieurs ordres de grandeur, quoiqu’il faille également tenir compte du temps de transport à travers la membrane plasmique.

63.  Nave (2010)

258

4. Temps et vitesse

 Tableau 4‑1  Liste de constantes de diffusion mesurées expérimentalement, qui montrent l’influence de la taille et du contexte cellulaire. Conditions de mesure

Constante de diffusion (µm2/s)

BNID

H2O

Eau

2000

104087, 106703

H2O

Noyau d’érythrocyte de poulet

200

104645

H+ (H3O+ à H2O)

Eau

7000

106702

O2

Eau

2000

104440

CO2

Eau

2000

102625

ARNt (≈20 kDa)

Eau

100

107933, 107935

Protéine (GFP, ≈30 kDa)

Eau

100

100301

Protéine (GFP, ≈30 kDa)

Cytoplasme de cellule eucaryote (lignée CHO)

30

101997

Protéine (GFP, ≈30 kDa)

Mitochondries de foie de rat

30

100300

Protéine (NLS-EGFP)

Cytoplasme de l’embryon de D. melanogaster

20

109209

Protéine (≈30 kDa)

Cytoplasme de E. coli

7-8

100193, 107985

Protéine (≈40 kDa)

Cytoplasme de E. coli

2-4

107985

Protéine (≈70-250 kDa)

Cytoplasme de E. coli

0.4-2

107985

Protéine (Tar-YFP, ≈140 kDa)

Membrane de E. coli

0.2

107985

Protéine (LacY-YFP, ≈70 kDa)

Membrane de E. coli

0.03

107985

Marqueur fluorescent (carboxyfluorescéine)

Paroi cellulaire de A. thaliana

30

105033

Marqueur fluorescent (carboxyfluorescéine)

Épiderme de racine de A. thaliana

3

105034

Facteur de transcription (LacI)

Déplacement le long de l’ADN (1D, in vitro)

0.04 (4×105 pb2/s)

102036

Cytoplasme de l’embryon de D. melanogaster

7

109199

Disque imaginal d’aile de D. melanogaster

0.05

101072

ARNm

Noyau de cellule HeLa

0.03-0.10

107613

ARNm

Divers

0.005-1

110667

Ribosome

E. coli

0.04

108596

Molécule

Morphogène (bicoid-GFP) Morphogène (wingless)

259

La biologie cellulaire par les nombres Temps de diffusion d’une protéine à travers la cellule temps caractéristique τ pour parcourir une distance L étant donné une constante de diffusion D

τ=?

τ = L2/6D

L

protéine dans le cytoplasme D 10 E. coli, L cellule HeLa, L axone de neurone, L

µm2 s

1 µm

τ 10 ms

20 µm

τ 10 s

1 cm

τ 106 s 10 jours !

 Estimation 4‑2  Temps de diffusion d’une protéine à travers la cellule.

Dans quelle mesure les molécules diffusent-elles moins vite dans le cytoplasme que dans l’eau ? Et quelles sont les raisons fondamentales de cette différence ? Les mesures montrent que le contexte cellulaire affecte la vitesse de diffusion d’un objet par un facteur qui dépend fortement des propriétés biophysiques de l’objet ainsi que de sa taille. Par exemple, la constante de diffusion sera seulement 4 fois plus faible pour de petits métabolites, tandis que la diffusion de l’ADN sera ralentie 10 à 100 fois par rapport à l’eau (voir Figure 4‑2). Les raisons de ces effets peuvent être regroupées en trois catégories, que l’on peut expliquer par analogie à un véhicule 64 : la viscosité (analogue à la résistance de l’air), la liaison à des compartiments intracellulaires (le temps d’arrêt aux feux rouges) et les collisions avec d’autres molécules, c’est-à-dire l’encombrement moléculaire (analogue au fait de serpenter entre d’autres véhicules). Des analyses récentes 65 soulignent l’importance des interactions hydrodynamiques, c’est-à-dire, le fait que des objets en mouvement dans un fluide affectent d’autres objets, de même qu’un bateau en influence un autre par son sillage. À cause de telles interactions, des corps qui s’approchent subissent une répulsion, tandis que des corps qui s’éloignent subissent une attraction. 0.25 0.20 Dcyto/Deau

petite molécule ADN

0.15

dextran

0.10 protéine

0.05 0.00

1

10 100 1000 masse moléculaire (kDa)

longueur de protéine (aa) 250 longueur de l’ADN (pb) 100

10 000

2500 1000

10 000

 Figure 4‑2  Constante de diffusion relative dans le cytoplasme par rapport à l’eau, en fonction de la masse moléculaire. (Adapté de Verkman (2002).) 64.  D’après Verkman (2002). 65.  Ando et Skolnick (2010)

260

4. Temps et vitesse

Ce type de complications rend assez délicate l’étude de la diffusion à l’intérieur de cellules vivantes. Dans la mesure où l’on peut décrire ces phénomènes par un unique paramètre – à savoir la constante de diffusion – il est naturel de se demander comment mesurer ce paramètre. Une technique astucieuse consiste à tirer parti de l’un des inconvénients des protéines fluorescentes. Exposées à la lumière, les molécules fluorescentes perdent progressivement leur faculté de fluorescer : on parle de photoblanchiment. Mais ce problème devient un avantage si on est capable de ne blanchir qu’une partie de la cellule. Après le photoblanchiment, les molécules encore fluorescentes dans le reste de la cellule reflueront dans la région blanchie, augmentant l’intensité de fluorescence. Cette technique de retour de fluorescence après photoblanchiment (ou FRAP 66 ; voir Figure 4‑3) a permis d’étudier comment la constante de diffusion dépend de la taille moléculaire, pour les protéines cytoplasmiques d’E. coli : la figure 4‑4 montre certaines des mesures réalisées à l’aide de cette méthode pour caractériser la diffusion des différentes protéines dans le cytoplasme bactérien. (A)

(B) avant

après région blanchie

lumière bleue (laser)

constante de diffusion (µm2s–1)

 Figure 4‑3   Retour de fluorescence après photoblanchiment dans des bactéries. (A) Schéma du principe de la méthode FRAP. Un laser sert à blanchir les protéines fluorescentes dans une région donnée de la cellule. Du fait de la diffusion, les protéines non blanchies pénètrent progressivement la région blanchie. (B) Schéma du FRAP à l’échelle d’une cellule. 8 7 6 5 4 3 2 1 0 0

50 100 150 200 masse moléculaire (kDa)

250

 Figure 4‑4  Valeurs de la constante de diffusion dans E. coli en fonction de la masse moléculaire, mesurée par FRAP. (Graphique d’après Kumar et al. (2010).) 66.  FRAP : fluorescence recovery after photobleaching

261

La biologie cellulaire par les nombres

Combien de réactions les enzymes effectuent-elles chaque seconde ?

vitesse de formation du produit (en s-1)

Une vision simpliste et anthropomorphe d’une cellule est celle d’une grande usine qui reçoit un flux entrant de matières premières relativement simples telles que des sucres, et les transforme en une biomasse complexe qui comprend un mélange de protéines, lipides, acides nucléiques, et ainsi de suite. Les procédés élémentaires de cette usine sont les transformations métaboliques des composés les uns en les autres. Les protéines catalytiques qui participent à ces réactions métaboliques – les enzymes – constituent presque invariablement la plus grande fraction du protéome de la cellule 67. Elles constituent donc aussi la plus grande contribution à la masse cellulaire sèche totale. En utilisant environ 1 000 de ces réactions, des cellules d’E. coli peuvent se développer à partir d’une source de carbone unique telle que le glucose ainsi que quelques minéraux inorganiques et construire les nombreux constituants moléculaires d’une cellule opérationnelle. Quelle est la cadence, ou l’échelle de temps caractéristique, de ces transformations ? kcat vitesse maximale

régime linéaire

KM

pente = kcat/KM

concentration [S] du substrat (en M)

 Figure 4‑5  Allure caractéristique de la vitesse de catalyse enzymatique en fonction de la concentration en substrat. Les paramètres effectifs majeurs, kcat , KM et leur rapport, la constante de second ordre qui correspond à la pente à de faibles concentrations, sont indiqués sur la figure. Lorsque le substrat est à la concentration KM , la vitesse de réaction vaut la moitié de la vitesse maximale, kcat /2.

Les réactions biochimiques qui se produisent dans la cellule, bien que thermodynamiquement favorables, sont dans la plupart des cas très lentes en l’absence de catalyseur. Par exemple, la rupture spontanée d’une liaison peptidique prendrait 400 ans à température ambiante, et l’hydrolyse du phosphomonoester, qui intervient dans le clivage de l’ATP pour libérer de l’énergie, prendrait environ un million d’années en l’absence des enzymes qui accompagnent cette réaction (BNID 107209). Heureusement, le métabolisme est effectué par des enzymes qui peuvent augmenter les vitesses de réaction jusqu’à 10 ordres de grandeur et plus (BNID 105084, 107178). D’un point de vue phénoménologique, il est commode de caractériser la cinétique des enzymes par une vitesse catalytique, kcat. Concrètement, kcat mesure le nombre de réactions qu’une enzyme peut effectuer par unité de temps. 67. www.proteomaps.net

262

4. Temps et vitesse

La cinétique des enzymes est souvent discutée dans le cadre canonique de MichaelisMenten, mais l’allure concave des courbes qui caractérisent le taux d’accumulation de produit en fonction de la concentration en substrat présente plusieurs aspects génériques qui dépassent le cadre de Michaelis-Menten strict. Par exemple, à de très faibles concentrations de substrat, la vitesse de réaction augmente linéairement avec la concentration du substrat, comme on peut le voir sur la figure 4‑5. En revanche, à des concentrations très élevées, l’enzyme « pond » autant de molécules de produit que possible par seconde à une vitesse kcat, et augmenter la concentration du substrat n’a pratiquement pas d’influence sur la vitesse de réaction. Les vitesses varient immensément. Les enzymes qui détiennent le record de vitesse sont l’anhydrase carbonique, l’enzyme qui transforme le CO2 en bicarbonate et inversement suivant la réaction : CO2  H2O  HCO3  2H et la superoxyde dismutase, une enzyme qui protège les cellules contre la réactivité du superoxyde en le transformant en peroxyde d’hydrogène suivant la réaction : 2O2  2H  H2O2  O2 (A)

(B)

limite de diffusion

(C) RUBISCO

proportion

RUBISCO

CAN médiane 13.7 s–1 10–2

10–1

101 103 kcat (s–1)

SOD TIM CAN 105

médiane 130 µM 10–2

100

102 104 KM (µM)

médiane 125 000 s–1M–1 106

103

105 107 kcat /KM (s–1M–1)

TIM SOD 109

 Figure 4‑6  Distributions des paramètres cinétiques des enzymes d’après la base de données BRENDA : (A) valeurs de kcat (N=1942), (B) valeurs de KM (N=5194) et (C) valeurs de kcat /KM (N=1882). Seules les valeurs relatives à des substrats naturels sont prises en compte dans les distributions. Plusieurs enzymes très étudiées sont indiquées à titre de comparaison : CAN, l’anhydrase carbonique ; SOD, la superoxyde dismutase ; TIM, la triose-phosphate isomérase ; et Rubisco, la ribulose-1,5-bisphosphate carboxylase/oxygénase. (D’après Bar-Even et al. (2011).)

Ces enzymes peuvent effectuer jusqu’à 106–107 réactions par seconde. À l’autre extrême, les enzymes de restriction boitent en queue de peloton en n’exécutant que ≈10–1–10–2 réactions par seconde, soit environ une réaction par minute et par enzyme (BNID 101627, 101635). Pour en déduire à quelle fréquence bat le pouls métabolique de la cellule, il nous faut une idée des vitesses caractéristiques plutôt que des extrêmes. La figure 4‑6A présente la distribution des valeurs de kcat pour

263

La biologie cellulaire par les nombres

les enzymes métaboliques d’après une compilation étendue de la littérature scientifique (BNID 111411). Cette figure indique que la vitesse catalytique médiane est d’environ 10 s–1, inférieure de plusieurs ordres de grandeur aux exemples communs données dans les manuels ; ainsi les enzymes du métabolisme central du carbone, qui entretiennent l’autoroute métabolique de la cellule, sont environ trois fois plus rapides, avec une vitesse médiane d’environ 30 s–1. Comment savons-nous si une enzyme fonctionne à vitesse maximale ? D’après l’allure générale de la courbe de kcat en fonction de la concentration en substrat (Figure 4-5), il y a un niveau de concentration en substrat au-delà duquel l’enzyme opérera à plus de la moitié de sa vitesse maximale potentielle. La concentration de substrat à laquelle la vitesse de réaction est égale à la moitié de la vitesse maximale se note KM. La définition de KM donne une unité de mesure intrinsèque pour déterminer si les concentrations sont « faibles » ou « élevées ». Lorsque la concentration du substrat est très supérieure à KM, la réaction s’opérera pratiquement à vitesse maximale kcat. Pour une concentration de substrat [S] = KM, la réaction opérera à une vitesse de kcat/2. La cinétique enzymatique est en réalité beaucoup plus raffinée que le modèle classique de Michaelis-Menten, de nombreuses enzymes présentant des propriétés de coopération et effectuant des réactions avec plusieurs substrats et selon plusieurs mécanismes, ce qui aboutit à une pléthore de formes fonctionnelles pour la loi de variation de la vitesse. Mais dans la plupart des cas, on peut se faire une idée de l’allure générale par deux paramètres caractéristiques : la vitesse maximale et la concentration du substrat à laquelle la vitesse est la moitié de la vitesse maximale (voir Figure 4‑5). Ainsi, on peut décrire le comportement des enzymes réelles à l’aide du langage de Michaelis-Menten, à l’aide de kcat et KM, bien que le modèle fondamental de Michaelis-Menten puisse ne pas convenir au cas particulier considéré. Nous avons vu que la vitesse réelle dépend de la quantité de substrat présent à travers l’affinité du substrat KM. Quelles sont les valeurs caractéristiques de KM pour les enzymes de la cellule ? Comme le montre la figure 4‑6B, la valeur médiane de KM est de l’ordre de 0.1 mM. À l’aide de notre règle pratique selon laquelle 1 nM correspond environ à 1 molécule par volume d’E. coli, cette valeur correspond à environ 100 000 molécules de substrat par cellule bactérienne. À faible concentration en substrat ([S]KM), nous pouvons approcher la vitesse de réaction par [ET]⋅kcat⋅[S]/KM : cette expression proportionnelle au produit [ET][S] mesure la fréquence de collision de l’enzyme avec le substrat. Le coefficient de proportionnalité de kcat/KM, connu sous le nom de constante de vitesse de second ordre (étant donné qu’il est associé au produit de deux termes de concentration), correspond à la pente du graphe de la figure 4‑5. Ce facteur ne peut être supérieur à la fréquence de collision due à la diffusion, à moins que d’autres interactions n’entrent en jeu. On peut déduire la vitesse d’une réaction contrôlée par la diffusion, aussi appelé taux d’association et noté kon, à partir des lois de la diffusion (voir Estimation 4‑3). L’idée du calcul consiste simplement à estimer le flux diffusif des molécules de substrat arrivant à la protéine « absorbante », puis à faire l’hypothèse que chaque molécule incidente peut subir la réaction considérée. Dans le cas d’une enzyme de la taille d’une protéine typique et d’une petite molécule de substrat, la réaction contrôlée par la diffusion procède à une vitesse de 109 s–1M–1. Une enzyme qui approche de cette limite peut être considérée

264

4. Temps et vitesse

optimale, eu égard à sa capacité d’accomplir une transformation à chaque molécule de substrat qu’elle rencontre au cours de la diffusion aléatoire. En réalité, peu d’enzymes, à des exceptions notables telles que l’enzyme glycolytique appelée triose isomérase, sont optimales en ce sens (BNID 103917). Quelle est la performance d’une enzyme caractéristique ? La figure 4‑6C montre que la valeur médiane de kon est d’environ 105 s–1M–1, environ 4 ordres de grandeur plus faible que la limite de diffusion. Cette différence peut être partiellement expliquée par la simplicité de la limite de diffusion, qui ne tient pas compte de tous les aspects des liaisons, non spécifiques par exemple, et par le fait que beaucoup d’enzymes pourraient ne pas être soumises à une forte pression sélective concernant leurs propriétés cinétiques. De plus, dans de nombreux cas, une vitesse plus faible pourrait résulter d’un compromis permettant la reconnaissance du substrat et donc la spécificité de l’interaction. Vitesse de réaction kon contrôlée par la diffusion

a R flux entrant, j nb. molécules aire x temps

D’après la conservation de la masse, j(R) x 4πR2 doit être indépendant de R, donc j(R) concentration

D’après la loi de Fick, j

– ∂c ∂R

constantes

∂c = – A ∂R R2

Les conditions aux limites entraînent: 1) c(∞) = c∞ = B 2) c(a) = A + c∞ = 0 A = –c∞a a D’après la loi de Fick, j(a) = –D ∂c ∂R

1 R2

R=a

c(R) = A + B R

c(R) = c∞(1–

a ) R

Dc = a∞

vitesse de réaction dn = j(a) 4πa2 = 4πDac∞ = konc∞ dt rayon de protéine

kon = 4π x 100

µm2 molécules 1L x 2x10–3µm x 6 x 1023 x s mol 1015µm3

109 s–1M–1

constante de diffusion caractéristique des métabolites dans le cytoplasme

 Estimation 4‑3  Taux d’association kon pour une réaction contrôlée par la diffusion.

265

La biologie cellulaire par les nombres

À partir de KM et de la vitesse de réaction contrôlée par la diffusion, on peut estimer la vitesse de dissociation entre le substrat et l’enzyme. Le but de cette estimation simple est de déterminer la durée pendant laquelle un substrat qui est lié à une enzyme restera lié avant de retourner à la solution (en général sans réagir), c’est-àdire le taux de dissociation koff. On peut approcher koff par le produit kon⋅KM. L’estimation repose sur une limite idéale pour laquelle kon est contrôlée par des rencontres diffusives entre le substrat et l’enzyme, avec : kon ≈ 109 s–1M–1. Ainsi, si KM a la valeur caractéristique 10–4 M, alors ce produit vaut 105 s–1, de sorte que le substrat se détache en environ 10 µs – ce qui correspond au temps de séjour sur l’enzyme. Pour des liaisons extrêmement fortes, dont l’affinité vaut par exemple 1 nM = 10–9 M, le temps de séjour sera de 1 s. Cela donne seulement un aperçu du cas idéal ; les mesures expérimentales de koff (ou du temps de séjour) sont le travail des enzymologistes, auxquels elles réservent une pléthore de surprises. On peut envisager une estimation analogue pour koff pour des interactions entre les molécules de signalisation, ou des facteurs de transcription qui se lient à l’ADN, avec des échelles de temps caractéristiques allant de la milliseconde à quelques dizaines de secondes ou même plus. On peut avoir un aperçu de la fréquence d’interactions à l’échelle moléculaire à travers une interprétation intelligente de la limite de diffusion 68. Imaginons une molécule de substrat dans un volume de cytoplasme égal à celui d’une cellule bactérienne. Si tout est bien mélangé et s’il n’y a pas de liaison, combien de temps faudra-t-il à la molécule de substrat pour qu’elle rencontre une enzyme spécifique dans la cellule ? La fréquence de collisions enzyme-substrat est dictée par la limite de diffusion et est égale au produit de kon par la concentration du substrat. Utilisons la règle pratique selon laquelle une molécule (notre substrat) dans la cellule a une concentration effective d’environ 1 nM. Le taux de collisions vaut alors : 109 s–1M–1×10–9 M = 1 s–1. Cela nous permet d’estimer que chaque molécule de substrat heurte chaque protéine de la cellule en moyenne environ une fois par seconde. Pour l’illustrer, prenons l’exemple d’une molécule de sucre importée dans la cellule. En une seconde, elle aura l’occasion de se cogner à toutes les différentes molécules de protéine dans la cellule. La fréquence élevée de ces rencontres moléculaires est une image mentale utile à garder en tête lorsque l’on cherche à appréhender le monde microscopique de la cellule.

68.  Goodsell (2010)

266

4. Temps et vitesse

Quel est l’effet de la température sur les vitesses de réaction ? Au début des années 1900, lorsque Harlow Shapley n’était pas occupé à mesurer la taille de notre galaxie à l’aide du télescope de Mount Wilson, il tuait le temps en mesurant à quelle vitesse les fourmis se déplacent, et comment cette vitesse dépend de la température. Ses observations sont présentées sur la figure 4‑7, qui démontre une augmentation rapide de la vitesse avec la température : ainsi, la vitesse double en passant de 15 °C à 25 °C, et double encore après une augmentation de 10 degrés, de 25 °C à 35 °C. Cela correspond à une règle pratique intéressante employée par certains enzymologistes, qui stipule que les vitesses de réaction catalytique des enzymes doublent lorsque la température augmente de 10 °C. Bien qu’il y ait beaucoup d’exceptions à cette « règle », cherchons d’abord le fondement d’une telle affirmation. On peut proposer un modèle simplifié de la catalyse enzymatique en considérant qu’il existe une barrière d’enthalpie libre que le substrat doit surmonter avant de pouvoir être transformé en produit. Pour une barrière de « hauteur » Ea, la vitesse varie suivant la loi empirique d’Arrhenius et est proportionnelle à exp(–Ea /kBT) : Ea est appelée l’énergie d’activation d’Arrhenius. Les soubassements théoriques de ce résultat résultent de la distribution de Boltzmann. Si Ea est très grand, la barrière est haute et la dépendance exponentielle conduit à une vitesse très faible. Pour de nombreuses réactions, Ea est de l’ordre de ≈50 kJ/mol ≈20 kBT (BNID 107803 par exemple). Dans le calcul de coin de table de l’estimation 4‑4, nous montrons comment cela permet de relier une variation de 10 degrés Celsius (c’est-à-dire 10 Kelvin) autour de la température ambiante à un doublement de la vitesse de la réaction. 7 6

vitesse (cm/s)

5 4 3 ≈ augmentation de vitesse de 2×

2 1 0 5

ΔT = 10°C 15 25 température (°C)

35

 Figure 4‑7  Vitesse de déplacement de fourmis en fonction de la température. Mesures effectuées par l’astronome Harlow Shapley à Mount Wilson au-dessus de Los Angeles, pendant qu’il était occupé à mesurer la taille de notre galaxie. Les fourmis Liometopum apiculatum qu’il a étudiées sur la montagne sont actives jour et nuit, ce qui permet d’étudier une plus grande amplitude de température. On a pu vérifier que la masse corporelle des fourmis a un effet négligeable. De même, il n’y avait aucune différence significative entre la direction entrante et sortante sur la vitesse des fourmis. (D’après Shapley (1920).)

267

La biologie cellulaire par les nombres Variation de la vitesse pour une augmentation de température de 10°C vitesse e –Ea/kBT (relation empirique d’Arrhenius) – vitesse (T2) e –Ea/kBT2 = –E /k T = e vitesse (T1) e a B1

1

Ea

T2

kB

1 – T 1

=e

E – ka

B

T1 – T2 T1 T2

=e



–10 K 50 kJ/mol x 8.3 J/mol x K (300 K)2

e

0.7

2

Ea 50 kJ/mol (énergie d’activation caractéristique) T2 = T1 + 10°C T1 300 K (température ambiante) kB 1.38 x 10–23 J/K 8.3 J/mol x K

 Estimation 4‑4  Variation de la vitesse pour une augmentation de température de 10 °C.

Ce terme de vitesse, qui peut être mesuré indépendamment pour différentes réactions, est caractérisé dans la littérature par une quantité appelée Q10. Q10 désigne le facteur par lequel la vitesse change pour une variation de température de 10 °C. Une augmentation de la température devrait-elle augmenter ou diminuer la vitesse à laquelle une certaine réaction se produit ? La distribution de Boltzmann stipule que le nombre de molécules qui disposent d’une énergie suffisante pour surmonter la barrière énergétique varie comme exp(-Ea /kBT ). À des températures élevées, Ea /kBT s’approche de zéro, l’agitation thermique conférant à un plus grand nombre de molécules l’énergie d’activation nécessaire pour passer la barrière, ce qui conduit à une augmentation de la vitesse de réaction. 4.0 3.0 2.0

42°C

39°C

k (h –1, échelle log)

36°C 1.0

45°C 46°C 47°C

37°C 33°C 37°C

30°C 28°C 30°C

0.5 0.4

milieu minimum avec glucose

0.3 48°C

23°C 21°C 23°C 19°C 17°C

0.2

15°C 13.5°C

0.1 3.1

3.2

3.3 1000/T (K)

3.4

3.5

 Figure 4‑8  Influence de la température sur la vitesse de croissance d’E. coli. La vitesse de croissance (en échelle logarithmique) est représentée en fonction de l’inverse de la température (graphe d’Arrhenius). Noter la région centrale, où la dépendance apparaît linéaire, en accord avec la loi d’Arrhenius. (D’après Herendeen et al. (1979).)

268

4. Temps et vitesse

Il est intéressant de noter que la croissance d’une bactérie elle-même tend à varier avec la température suivant une forme fonctionnelle semblable (BNID 100919) – c’est-à-dire, à une température physiologique et au-dessous, le logarithme de la vitesse de croissance varie linéairement avec l’inverse de la température. Par exemple, la vitesse de croissance d’E. coli augmente d’un facteur ≈2.5 quand la température passe de 17 °C à 27 °C et fait de même de 27 °C à 37 °C. On représente cet effet sur un graphe de la vitesse de croissance en fonction de 1/T (voir Figure 4‑8). Dans cette gamme, on peut déduire une valeur apparente de Ea de ≈60 kJ/mol ≈ 25 kBT. On l’appelle une valeur apparente, parce qu’il n’existe pas une unique barrière énergétique que la bactérie doive surmonter afin de se développer et se diviser ; cette valeur apparente agrège l’ensemble des barrières réactionnelles des phénomènes sous-jacents à la croissance. Bien que l’équation d’Arrhenius soit un ingrédient essentiel du cursus de licence dans de nombreuses disciplines, et semble être un choix évident pour caractériser l’influence de la température sur les taux biochimiques, elle n’a pas toujours paru aussi simple. Une myriade de relations fonctionnelles entre vitesse et température a été suggérée au fil des ans (voir Tableau 4‑2). Étant donné que les mesures expérimentales étaient réalisées sur une faible gamme de températures comparée à la température ambiante, la plupart de ces différentes expressions correspondaient assez bien aux mesures. Le célèbre chimiste Wilhelm Ostwald a déclaré que l’influence de la température « est l’un des chapitres les plus obscurs de la cinétique chimique ». On peut tirer de nombreuses leçons sur l’équilibre entre modèles et expériences en suivant ce chapitre de la thermodynamique 69.  Tableau 4‑2  Différentes expressions proposées pour décrire l’influence de la température sur la vitesse d’une réaction chimique. (D’après Laidler (1984).) Forme analytique de k Proposée par k  aT ce



b  dT 2 T

van’t Hoff, 1898 ; Bodenstein, 1899

k  aT ce



b T

Kooij, 1893 ; Trautz, 1909

k  ae



b  dT 2 T

k = aT ce dT k  ae



b T

Schwab, 1883 ; van’t Hoff, 1884 ; Spohr, 1888 ; van’t Hoff & Reicher, 1889 ; Buchbock, 1897 ; Wegscheider, 1899 Inconnu van’t Hoff, 1884 ; Arrhenius, 1889 ; Kooij, 1893

k = aT c

Harcourt & Esson, 1895 ; Veley, 1908 ; Harcourt & Esson, 1912

k = ae dT

Berthelot, 1862 ; Hood, 1885 ; Spring, 1887 ; Veley, 1889 ; Hecht & Conrad, 1889 ; Pendelbury & Seward, 1889 ; Tammann, 1897 ; Remsen & Reid, 1899 ; Bugarszky, 1904 ; Perman & Greaves, 1908

69.  Voir par exemple le soigneux article de revue par Laidler (1984). (NdA)

269

La biologie cellulaire par les nombres

À quelle vitesse fonctionnent les transporteurs membranaires ? Les cellules sont protégées de l’environnement fluctuant qui les entoure par leur membrane plasmique. Ces membranes contrôlent quelles espèces moléculaires, et combien, sont autorisées à traverser la membrane et à entrer dans le milieu intracellulaire. Plus précisément, à moins qu’un composé soit à la fois petit et de charge nulle, le passage à travers la membrane plasmique fait l’objet d’un laisser-passer de la part de vigiles moléculaires. Le transport du contingent impressionnant de toutes les briques moléculaires exige un recensement diversifié des protéines membranaires : celles-ci occupent une fraction significative du « parc immobilier » membranaire, que nous allons maintenant explorer (voir Estimation 4‑5). Proportion de membrane occupée par les transporteurs surface d’un transporteur

sucres 10 nm2; taux de transport 100 s x nb. transporteurs

nb. atomes C par cellule

surface 6 µm2 temps de doublement

nb. de transporteurs nécessaires

fraction surfacique de membrane

1010

nb. sucres par cycle cellulaire

2 x 109

2000 s sucres 2 x 109 cycle cellulaire s 2000 cycle cellulaire

x

1 sucres 100 s x nb. transporteurs

104 transporteurs x 10nm2/transporteur 2 6 µm2 x 106 nm2 µm

104 transporteurs

2%

 Estimation 4‑5  Proportion de membrane occupée par les transporteurs

La vitesse de transport caractéristique pour des transporteurs de sucre saturés de substrat externe, par exemple un transporteur de glucose, vaut ≈100 s–1. Pourquoi ces taux de renouvellement, analogues aux valeurs de kcat des enzymes, présentent-ils en général des valeurs dans la gamme de 30–300 s–1 (BNID 102931, 103159, 101737-9) et pas plus ? Nous pouvons proposer une explication pour un sous-ensemble de transporteurs. De nombreux transporteurs sont couplés aux protons, c’est-à-dire qu’ils emploient la force proton-motrice pour effectuer le transport, souvent en allant contre un gradient de concentration du substrat de sucre. Pour estimer une borne supérieure au taux de renouvellement d’un transporteur couplé aux protons, concentrons-nous sur la fréquence à laquelle des protons se présentent au transporteur, kon. Il s’agit d’une étape nécessaire au changement de conformation qui accomplira réellement le transport. Ce changement de conformation pourrait être plus lent, ce en quoi notre estimation est une borne supérieure. Rappelons que la concentration

270

4. Temps et vitesse

en protons à pH=7 vaut 10–7 M et que la vitesse de collisions contrôlée par la diffusion est d’environ 109 M–1s–1. Cela implique que la fréquence à laquelle les protons heurtent le transporteur (kon) est d’environ ~10–7 M × 109 M–1s–1 = 102 s–1, ce qui est du même ordre de grandeur que le taux de renouvellement mesuré expérimentalement. Autrement dit, un transporteur couplé aux protons fonctionne à peu près aussi rapidement qu’il le peut, étant donné le rythme d’arrivée des protons qui lui servent de source d’énergie, rythme lui-même déterminé par la diffusion. Hélas, pour les transporteurs de sodium, étroitement liés, ou pour de nombreux transporteurs ATP-dépendants, ce raisonnement donnerait des valeurs peu réalistes, avec des vitesses de l’ordre de millions par seconde, ce qui suggère que d’autres facteurs cinétiques jouent un rôle limitant. Le transporteur le plus rapide que nous connaissions, la capnophorine – littéralement, « porteur de fumée » – est un transporteur présent dans les globules rouges et dont le rôle physiologique est de transporter le CO2 des poumons (c’est-à-dire la « fumée » produite par le métabolisme). On a pu suggérer que ce transporteur chlorure-bicarbonate pouvait atteindre des vitesses diaboliques de l’ordre de 100 000 s–1 (BNID 11l368). Étant donné que la concentration des deux substrats est de l’ordre du mM, nous pouvons en déduire qu’il est capable d’augmenter la vitesse des transporteurs couplés aux protons d’au moins un facteur 1 000, car plus la concentration est élevée, plus le taux de collisions contrôlé par la diffusion est élevé. Dans toute cette rubrique, nos valeurs proviennent presque exclusivement des études de transporteurs de glucose et de lactose, faute d’information quantitative sur d’autres transporteurs. Pour se faire une idée des implications des vitesses de transport mesurées sur le nombre de protéines membranaires, estimons le nombre des transporteurs nécessaires pour les principaux métabolites cellulaires. Supposons que la source de carbone soit fournie exclusivement sous forme de glucose ou d’équivalents du glucose. Le taux maximal de division est-il limité par la surface finie de la membrane plasmique permettant d’accueillir des molécules de glucose porteuses de carbone ? La superficie d’une membrane d’E. coli qui se divise toutes les demi-heures est de ≈6 µm2 (BNID 103339, 105026). On a déterminé la structure du transporteur du lactose, qui semble avoir une forme ovale orthogonale à la membrane, avec des dimensions (grand et petit axes) de 6 nm×3 nm (BNID 102929). En supposant que cela corresponde aussi au transporteur du glucose, la surface occupée par un transporteur sur la membrane est de ≈10–20 nm2 (bien qu’on ait pu mesurer, chez d’autres bactéries, une valeur environ quatre fois plus grande pour les molécules impliquées dans le transport d’un autre sucre, le phosphoénolpyruvate). Pour importer les ≈2×109 molécules de glucose nécessaires à la synthèse de la masse cellulaire (chacune comprenant six atomes de carbone) pendant un cycle cellulaire de ≈2 000 s (une estimation prudente), il faudrait au moins 2 % de la surface de membrane totale (voir Estimation 4‑5). Ainsi, une part notable de la membrane doit être occupée simplement pour fournir le carbone nécessaire, même avec des hypothèses prudentes. Est-il possible que la vitesse de croissance maximale (moins de 1 000 s de temps de doublement) soit restreinte par la capacité de transporter le carbone ? On a besoin d’expériences dédiées pour clarifier s’il existe une contrainte

271

La biologie cellulaire par les nombres

qui empêcherait que la fraction surfacique de transporteurs augmente (par exemple jusqu’à 10 % de la surface). Il faut également considérer que le système respiratoire qui alimente la cellule bactérienne doit résider sur la membrane, et qu’un pavage de molécules ovales idéalisées sur la surface bidimensionnelle de la membrane ne peut pas atteindre une couverture de 100 % pour des raisons géométriques. Le transport membranaire n’est pas le seul phénomène qui pourrait limiter la vitesse de croissance maximale. D’autres facteurs pourraient peser sur la vitesse de croissance maximale, et on peut les considérer plutôt comme des co-limitations. Dans la rubrique intitulée « Laquelle est la plus rapide, la transcription ou la traduction ? » (p. 278), nous discutons certaines des astuces utilisées par les bactéries pour atteindre des vitesses de doublement élevées avec une seule origine de réplication. De plus, la rubrique « Combien de ribosomes y a-t-il dans une cellule » (p. 196) démontre que, à des vitesses de croissance élevées, la concentration en ribosome augmente linéairement avec la vitesse de croissance et que la vitesse de traduction peut donc limiter la vitesse de croissance maximale. En effet, un certain nombre d’autres phénomènes que le transport de nutriments à travers la membrane sont capables de restreindre les vitesses de croissance maximales, bien que les estimations fournies ici démontrent la nécessité d’accorder une attention particulière à la gestion du « parc immobilier » de la membrane plasmique. On peut effectuer un calcul semblable pour S. cerevisiae. Le volume, et donc le nombre d’atomes de carbone nécessaires, est ≈50 fois (BNID 100427) plus grand que chez E. coli, tandis que la superficie est ≈10 fois plus grande et le temps de génération le plus rapide est ≈5 fois plus long, de l’ordre de 6 000 s (BNID 100270). Ainsi, la fraction surfacique requise pour le transport des briques de carbone semble être semblable. Notons toutefois qu’en conditions de croissance rapide, la levure utilise la fermentation pour assurer ses besoins énergétiques, ce qui requiert d’importer significativement plus de sucres (en fait E. coli le fait aussi et réémet du carbone dans le cadre du métabolisme oxydatif incomplet). Une mesure expérimentale montre que pour un rythme de croissance à une division toutes les 140 min, approximativement la moitié du carbone est perdue en fermentation (avec une proportion d’autant plus élevée que la croissance est rapide) (BNID 102324). Cela suggère que la fraction surfacique de transporteurs nécessaires est au moins le double de celle des bactéries (c’est-à-dire ≈4 %). Cette estimation suggère un test expérimental : est-ce que l’expression d’une protéine membranaire indépendante du transport peut diminuer le taux de croissance maximal de la levure et d’E. coli en réduisant la surface disponible pour les transporteurs ?

Combien d’ions traversent un canal ionique par seconde ? Les cellules régulent très étroitement leurs concentrations en ions. Aussi bien la nature que l’abondance des différentes espèces d’ions présentes dans la cellule jouent un rôle dans le stockage de l’énergie, le fonctionnement des protéines, la signalisation

272

4. Temps et vitesse

et un grand nombre d’autres processus. De même que beaucoup d’autres paramètres cellulaires majeurs, la distribution des ions dans la cellule est soigneusement contrôlée dans l’espace et dans le temps. En effet, il existe des familles entières de protéines (voir Figure 4‑9) qui ont pour objectif soit d’ouvrir ou de fermer des pores dans la membrane, ce qui permet aux ions (ou à d’autres espèces) d’entrer ou de sortir de la cellule ; soit de pomper activement diverses espèces contre leurs gradients de concentration. L’un des chefs d’œuvre de l’analyse biophysique moderne est l’étude de macromolécules biologiques à l’échelle de la molécule unique. Ce type d’étude provient des premiers travaux visant à découvrir les propriétés de différents canaux ioniques impliqués dans le transport des ions en présence d’une certaine force motrice. Différentes classes de forces motrices peuvent activer des canaux ioniques. Certains canaux s’ouvrent en réponse à la présence d’un ligand soluble, ce qui signifie que la force motrice est la concentration des ligands qui se lient aux canaux et modifient la probabilité de leur état ouvert. Dans d’autres cas, la force motrice est la tension électrique appliquée à travers la membrane qui contient les canaux. Enfin, mentionnons l’ouverture due à des effets mécaniques résultant de la tension de membrane. Ces différents mécanismes de contrôle de l’ouverture sont illustrés sur la figure 4-9, qui schématise chacun de ces types de canal. FERMÉ +++ –

+++ –

CYTOSOL

OUVERT ––– +++

––– +++

tension électrique

CYTOSOL liaison d’un ligand

force mécanique

 Figure 4‑9  Exemples de mécanismes de déclenchement de canaux ioniques. Le canal vert est contrôlé par une tension transmembranaire. Le canal bleu est déclenché par des ligands qui se lient à la protéine et induisent un changement de conformation. Le canal rouge est déclenché par des forces mécaniques.

Que nous révèlent les courants mesurés à l’échelle de la molécule unique sur la dynamique de ces canaux et du nombre d’ions qui les traversent ? Ce genre d’expériences met en évidence que les courants caractéristiques de différents canaux sont de l’ordre du pA (voir Figure 4‑10). Nous pouvons convertir l’intensité du courant en un nombre d’ions qui traversent le canal par seconde (voir Estimation 4‑6). Si nous nous rappelons qu’un Ampère correspond au débit d’une charge de 1 Coulomb par

273

La biologie cellulaire par les nombres

courant électrique (pA)

seconde et, de plus, si nous employons le fait que la charge sur un ion monovalent vaut approximativement 1.6×10–19 Coulombs (c’est-à-dire la charge d’un électron ou d’un proton), alors nous voyons qu’un courant d’intensité 1 pA correspond au passage d’approximativement 107 ions par seconde. Cette valeur est en accord avec les mesures (BNID 103163), bien qu’elle ne le soit pas avec notre intuition quotidienne : nous aurions grand peine à imaginer 10 millions de voitures traverser chaque seconde un pont long de quatre voitures. Les valeurs mesurées expérimentalement peuvent se comprendre en considérant les conséquences diffusives d’un gradient de concentration à travers la membrane et en calculant le nombre d’ions que ce gradient implique (voir Estimation 4‑7).

ouvert

5

fermé

ouvert

fermé

ouvert

fermé

0 5

10

15 temps (ms)

20

25

 Figure 4‑10  L’amplitude caractéristique du courant traversant un canal est de quelques picoampères. Le canal alterne entre un état fermé et un état ouvert. Lorsqu’il est ouvert, le canal permet le passage des ions, qui correspond au courant mesuré. (D’après Phillips et al. (2013).)

Les ions qui traversent des canaux apparentés aux canaux ioniques décrits ici sont impliqués dans le fonctionnement du moteur du flagelle des bactéries, moteur qu’ils couplent au transport de protons contre leur gradient chimiosmotique. La vitesse de transport de proton à travers ces canaux est d’environ trois ordres de grandeur plus faible, à 104 par seconde (BNID 109822) ; c’est l’un des canaux de plus faible conductance. Débit caractéristique d’ions qui traversent un canal ionique

courant caractéristique

1 charge ionique C 1 pA = 10–12 s x 1.6 x 10–19 C

107

ions s

 Estimation 4‑6  Débit caractéristique des ions qui traversent un canal ionique.

274

4. Temps et vitesse Courant caractéristique à travers un canal ionique cout r D’après la loi de Fick, le flux vaut : Jz =–D

∂c ∂z

D

∆c L

L Le profil linéaire de concentration est une solution stationnaire de l’équation de diffusion (cout–cin) z c(z) = cout– L cin

Le flux s’exprime en

nb ; le courant vaut : JxA = J x π r2 = D ∆c π r2 aire x s L

µm2 D 1000 s pour les ions Épaisseur de membrane, L 4nm Rayon du canal ionique, r 1nm Différence de concentration caractéristique des ions : ∆c 10mM 107/µm3 D

∆c

πr2

µm2 JxA 1000 s x 107µm–3 x 3x10–6µm2 / 4x10–3µm

107s–1

L

 Estimation 4‑7  Courant caractéristique à travers un canal ionique.

Quel est le temps de renouvellement des métabolites ? Plus la croissance de la cellule est rapide, plus les flux de métabolites précurseurs sont élevés. Cependant, les concentrations de métabolites intermédiaires doivent être maintenues à quelques mM, afin d’éviter des problèmes qui vont du déséquilibre de la pression osmotique à des interactions non spécifiques. Pour atteindre ces deux objectifs – maintenir des flux élevés avec de faibles concentrations d’intermédiaires – le renouvellement du réservoir de métabolites doit être rapide. Le concept de temps de renouvellement, schématisé dans l’estimation 4‑8, est défini comme le temps moyen au bout duquel le réservoir d’un métabolite donné sera complètement remplacé étant donné les taux de production et d’utilisation (qui sont égaux à l’état d’équilibre). En effet, pour de nombreux métabolites du métabolisme central du carbone, le temps de renouvellement est de l’ordre d’une seconde (voir Figure 4‑11 et Tableau 4‑3 dans le cas de la plante modèle Arabidopsis thaliana ; BNID 107358). De même, chez E. coli, on a pu mesurer que les réservoirs de la plupart des acides aminés se renouvelaient en moins d’une minute (BNID 101622). Le temps de renouvellement inférieur à la seconde chez Arabidopsis se manifestent parfois de manière surprenante : en cherchant à exécuter une expérience de métabolomique pour mesurer la concentration des métabolites du cycle de Calvin, si le chercheur passe brièvement la main au-dessus d’une source lumineuse en se préparant à immerger la plante dans l’azote liquide, le résultat ne sera pas le même que s’il avait fait attention à ne pas bloquer la lumière.

275

La biologie cellulaire par les nombres

 Tableau 4‑3  Temps de renouvellement des métabolites principaux. Pour A. thaliana, les feuilles ont été analysées par spectrométrie de masse pour déterminer le temps de renouvellement des métabolites du cycle de Calvin, et la synthèse d’amidon et de sucrose, en présence de lumière et de 485 ppm de CO2. (Données pour A. thaliana d’après Arrivault et al. (2009). Les données pour E. coli et S. cerevisiae proviennent de BNID 109701.) Temps de renouvellement (s)

Métabolite

Arabidopsis

S. cerevisiae

E. coli

NADP

0.01

_

_

ADP

0.07

0.3

0.8

Intermédiaires du cycle de Calvin (R5P, S6P, X5P, Ru5P, SBP, RuBP)

0.1-1

_

_

DHAP/G3P

0.2

_

_

ATP

0.3

1.4

2

3PGA

0.7

7

3

C inorganique

0.8

_

_

FBP

0.8

7

1.2

Pyruvate

_

1.7

1.5

F6P

3

7

1.2

AMP

_

3

9

UDPG

40

_

_

G6P

40

17

4

Glycérol-3-phosphate

_

60

13

Cycle de Krebs (Suc, Fum, Mal)

_

4-30

0.7-9

réservoir de C inorganique ATP NADP

10–2 10 ms

ADP

10–1

DHAP

FBP G1P 3PGA

100 1s

RUBP

UDPG F6P

G6P

101

102 temps de renouvellement (s) 1 min

 Figure 4‑11  Le temps de renouvellement est défini par le rapport de la taille du réservoir au flux. À l’équilibre, le flux est égal au taux de production, qui est aussi égal au taux d’utilisation.

276

4. Temps et vitesse Définition du temps de renouvellement Consommation (c)

Formation (f)

Taille du réservoir (P) dP =f–c=0 dt

f=c v

à l’état stationnaire

flux

le temps de renouvellement est défini par τ

P v

le rapport de la taille du réservoir au flux

p.ex., P = 10mM; v = 2 mM/s

τ=

10 mM =5s 2 mM/s

 Estimation 4‑8  Définition du temps de renouvellement.

La synthèse de protéines fournit un autre exemple de renouvellement rapide : la dynamique des ARNt conduit à une vitesse élevée de polymérisation des acides aminés monomériques. Pourtant, le nombre total d’ARNt est limité. Pour des cellules d’E. coli avec un temps de doublement de 40 minutes, le nombre total d’ARNt est estimé à ≈200 000 copies par cellule (BNID 100066). Étant donné qu’il y a environ 30 000 ribosomes (BNID 102015), si chacun d’entre eux opère avec une vitesse de polymérisation de ≈20 aa par seconde (BNID 100059), le temps moyen de renouvellement est d’environ 200 000/(20 s–1×30 000)≈0.3 s. C’est le temps qu’il faut pour que l’ARNt-synthétase charge un acide aminé sur l’ARNt, que cet ARNt se lie à un ribosome et y libère l’acide aminé, que l’acide aminé forme la liaison peptidique et que cet ARNt soit rechargé par un nouvel acide aminé. Bien que cette estimation ait pris moins d’un paragraphe, il a été beaucoup plus difficile de réaliser des expériences soigneuses pour obtenir des mesures précises. L’utilisation d’un marquage radioactif corrobore les valeurs de l’estimation ci-dessus, avec pour résultat une échelle de temps de renouvellement de 0.1–1 s pour le réservoir des ARNt (BNID 105275). Chez S. cerevisiae, les valeurs correspondantes sont d’environ 2 millions de molécules d’ARNt (BNID 108197), 200 000 ribosomes (BNID 100267, 108197) et une vitesse de polymérisation de ≈10 aa/s (BNID 107785, 107871), ce qui aboutit également à un temps de renouvellement d’environ 1 s. Notons au passage que le rapport du nombre total d’ARNt au nombre de ribosomes tend à être de l’ordre de 10:1. L’étonnante diversité des valeurs de temps de renouvellement présentés dans cette rubrique donne une image dynamique du tourbillon d’activité chimique qui se produit dans la cellule. Bien que nos descriptions structurales de la biologie tendent à donner une image statique des molécules de la cellule, nous voyons que, tant pour les composants moléculaires des voies métaboliques principales que pour les acteurs majeurs du dogme central (comme l’ARNt qui rend possible la synthèse protéique), ces molécules passent le plus souvent d’un état à un autre plus rapidement que la durée d’un clin d’œil (environ 0.1-0.4 s ; BNID 100706).

277

La biologie cellulaire par les nombres

Les processus du dogme central Laquelle est la plus rapide, la transcription ou la traduction ? La transcription, la synthèse d’ARNm à partir d’ADN, et la traduction, la synthèse de protéine à partir d’ARNm, sont les piliers majeurs du dogme central de la biologie moléculaire. À quelle vitesse opèrent ces deux processus ? Cette question est d’autant plus intéressante que certaines observations de microscopie électronique, comme celles représentées sur la figure 4‑12, révèlent l’existence de belles structures typiques en « sapin de Noël » chez E. coli qui reflètent la transcription et la traduction simultanées d’un même gène. Cela soulève la question de leur vitesse relative et de leur synchronisation. ribosomes initiation de la transcription ARN ADN 0.5 µm

 Figure 4‑12  Transcription et traduction simultanées observées par microscopie électronique. On voit sur l’image l’ADN bactérien, les transcrits d’ARNm correspondants et tous les ribosomes recouvrant chacun de ces ARNm. D’après Miller et al. (1970).

Chez E. coli, la transcription d’ARNm, et des formes plus stables d’ARNr et d’ARNt, est effectuée par ≈1 000-10 000 molécules d’ARN polymérase (BNID 101440), qui opèrent à une vitesse maximale d’environ 40-80 nt/s (voir Tableau 4‑4 ; BNID 104900, 104902, 108488). La traduction de protéines chez E. coli est effectuée par ≈10 000-100 000 ribosomes (BNID 101441) qui fonctionnent à une vitesse maximale d’environ 20 aa/s (voir Tableau 4‑5 ; BNID 100059, 105067, 108490).  Tableau 4‑4  Vitesse de transcription mesurée chez divers organismes et dans différentes conditions. Les valeurs ont été obtenues à 37°C, sauf D. melanogaster à 22°C. Organisme

Vitesse de transcription (nt/s)

BNID

10-100

104900, 104902, 101904, 108488, 108490, 108487, 100060

Lignée de cellules de singe

100

105113

H. sapiens

6-70

105566, 100661, 100662

25

111484

E. coli

D. melanogaster

278

4. Temps et vitesse

 Tableau 4‑5   Vitesse de traduction mesurée chez divers organismes et dans différentes conditions. Les valeurs ont été obtenues à 37°C, sauf S. cerevisiae et N. crassa à 30°C. Organisme

Vitesse de traduction (aa/s)

BNID

E. coli

10-20

100059, 105067, 108490, 108487, 100233

S. cerevisiae

3-10

107871

N. crassa

5-8

107872

6

107952

M. musculus

Laquelle est plus la rapide, la transcription ou la traduction ? ARN polymérase v max poly

nt 40 – 80 s les vitesses sont du même ordre !

v max ribo

nt 20 aa s = 60 s

ribosome

 Estimation 4‑9  Laquelle est la plus rapide, la transcription ou la traduction ?

Il est intéressant de noter que, puisque chaque codon de trois paires de base code un acide aminé, les vitesses des deux processus sont pratiquement assorties, comme expliqué schématiquement dans l’estimation 4‑9 (voir aussi BNID 108487). Si la traduction était plus rapide que la transcription, cela entraînerait la « collision » du ribosome avec l’ARN polymérase chez les procaryotes, où les deux peuvent se produire sur la même séquence. Cette traduction co-transcriptionnelle est devenue fréquente dans les manuels à travers les images telles que la figure 4‑12. Mais de récentes techniques de microscopie à l’échelle de la molécule unique montrent que cela se produit assez rarement, et la plupart du temps la traduction n’est pas couplée à la transcription chez E. coli 70. En revanche, la majeure partie de la traduction a lieu sur l’ARNm qui s’est déjà éloigné du nucléoïde riche en ADN en diffusant dans les régions cytoplasmiques riches en ribosomes. La rubrique « Combien de ribosomes y a-t-il dans une cellule » (p. 196) présente la distribution des ribosomes dans la cellule. Autre coup de théâtre du dogme central, les ribosomes semblent importants pour la transcription rapide chez les bactéries 71 : ils pourraient empêcher l’ARN polymérase de reculer et faire des pauses, ce que ces machines ont par ailleurs tendance à faire, ce qui crée un couplage rétroactif saisissant entre la traduction et la transcription. 70. Bakshi et al. (2012) 71. Proshkin et al. (2010)

279

La biologie cellulaire par les nombres

Quel est l’impact des vitesses relatives de transcription et de traduction étant donné le temps qui s’écoule entre l’initiation de la transcription d’un gène donné et la synthèse de la protéine ? Chez les bactéries, le temps de transcription d’un gène de 1 kpb, à vitesse maximale de transcription, correspond à la durée d’élongation de l’ARNm, c’est-à-dire 1000 nt/80 nt/s ≈ 10 s ; et la durée d’élongation de la protéine est à peu près la même, à vitesse maximale de traduction. Notons que l’échelle de temps totale est la somme de cette durée d’élongation et du temps d’initiation, qui peut être plus long dans certains cas. On a pu observer récemment que le fait d’augmenter la vitesse de traduction en remplaçant les appariements non canoniques, ou bancals 72, par des codons parfaitement assortis, pouvait conduire à des erreurs de repliement protéique. 73 Cela suggère qu’il pourrait exister un compromis : la vitesse de traduction serait limitée par la durée nécessaire pour un repliement correct des domaines de la protéine en cours de formation. Comment fait-on pour mesurer les vitesses de ces processus majeurs du dogme central ? Il s’agit d’une expérience délicate, même avec les technologies de pointe actuelles. Considérons des approches possibles pour aborder ce problème. On pourrait exprimer une molécule de GFP et mesurer le temps avant qu’elle apparaisse. Une telle approche présente des failles du fait de la disparité des échelles de temps entre les processus d’intérêt et ceux de la détection potentielle (brièvement, cela peut prendre entre quelques minutes et une heure ; voir la rubrique « Quel est le temps de maturation des protéines fluorescentes », p. 284). Lorsque des réponses convaincantes ont été obtenues dans les années 1970, l’arsenal expérimental disponible était beaucoup plus limité. Pourtant, une série d’expériences astucieuses utilisant la microscopie électronique et le marquage radioactif, et reposant sur une analyse quantitative subtile, ont permis de déterminer ces vitesses avec précision 74. L’astuce de ces mesures de vitesses de transcription consistait en effet à arrêter l’initiation de la transcription à l’aide de rifampicine. Bien qu’aucun nouvel événement de transcription ne peut commencer, ceux qui sont déjà en cours continuent inchangés – c’est-à-dire que la rifampicine inhibe le déclenchement de la transcription, mais pas l’élongation de transcrits d’ARN. En conséquence, ce traitement chimique revient à lancer un chronomètre à partir du début du dernier événement de transcription. En fixant les cellules et en arrêtant la transcription à différents instants après le traitement chimique, et en réalisant ensuite des images de microscopie électronique (Figure 4‑13), on a pu mesurer la longueur des segments d’ADN dépourvus d’ARN polymérase. En tenant compte du temps écoulé depuis le traitement chimique, on a pu déduire la vitesse à laquelle ces polymérases se déplaçaient. La mesure de vitesses de traduction reposait, de même, sur un chronomètre adapté, mais cette fois pour la synthèse protéique. Le point crucial de la méthode est le suivant : commencer à ajouter des acides aminés marqués à l’instant t0 et suivre la proportion de protéine marquée de masse m en regardant une bande spécifique 72.  En anglais, wobble. 73. Spencer et al. (2012) 74. Miller et al. (1970) ; Young et Bremer (1975)

280

4. Temps et vitesse

sur un gel. Juste après l’impulsion des acides aminés marqués, on commence à voir des protéines de masse m portant des acides aminés radioactifs à leurs extrémités. Avec le temps, la proportion de marquage parmi des protéines de masse donnée augmentera, parce qu’une plus grande proportion des chaînes sera marquée. Après une durée τm qui dépend de la longueur du transcrit, la chaîne entière sera marquée, parce que ce sont des protéines qui ont commencé leur traduction à t0 lorsque le marquage radioactif a été ajouté. On observe alors une variation dans la dynamique d’accumulation (après une normalisation convenable par le marquage global de la cellule). À partir du temps écoulé, τm, et connaissant le nombre d’acides aminés dans une chaîne polypeptidique de masse m, on peut calculer une estimation de la vitesse de traduction. On peut minimiser les incertitudes liées à cette approche en reproduisant l’expérience pour différentes masses de protéine m et en ajustant une courbe de régression sur toutes les valeurs obtenues. Pour approfondir la méthode, le lecteur lira avec profit l’étude originale de Young et Bremer 75. Cette valeur demeure une mesure fiable de la vitesse de traduction chez E. coli à ce jour. Nous n’avons pas connaissance de méthodes nouvelles qui donnent de meilleurs résultats. (A)

0s

16S

(B)

(C)

23S

40 s

70 s

équivalent à ≈ 1 kpb

 Figure 4‑13  Influence de la rifampicine sur l’initiation de la transcription. Images de microscopie électronique d’opérons d’ARNr chez E. coli : (A) avant l’addition de rifampicine, (B) 40 s après traitement, et (C) 70 s après traitement. Après le traitement chimique, aucune nouvelle transcription ne commence, mais celles déjà initiées poursuivent l’élongation. Dans (A), la flèche indique l’emplacement où la RNaseIII clive la molécule d’ARN naissante servant à produire les sous-unités ribosomales 16S et 23S. (D’après Gotta et al. (1991), avec l’aimable autorisation de l’American Society for Microbiology.) 75.  Young et Bremer (1976)

281

La biologie cellulaire par les nombres

(A)

(B)

protéine de fusion GFP

tige-boucles MS2 à l’extrémité 5’

ARNm en formation protéine MS2 de liaison à l’ARNm

t = Δt

t=0 L = 3361 nt

promoteur

séquence tige-boucle de liaison à MS2

tige-boucles MS2 à l’extrémité 3’

ARN polymérase

(C) construction 5’

(D)

première tache 5’

5:20

5:52

6:24 première tache 3’

fréquence

temps (min:s) 4:48

0.3

vitesse de transcription =

5 µm longueur durée

=

L ∆t

=

3361 nt 2.2 min

moyenne 3’ = 7.6 ± 0.7 min

0.2

0.1

0 construction 3’

moyenne 5’ = 5.4 ± 0.7 min

4

5 6 7 8 9 temps après la mitose (min)

≈ 1500 nt/min ≈ 25 nt/s

 Figure 4‑14  Dynamique de la transcription dans l’embryon de drosophile. (A) Schéma de l’expérience, montrant comment une boucle dans la molécule naissante d’ARN sert de site de liaison à une protéine virale fusionnée à la GFP. (B) Suivant que les boucles d’ARN soient placées sur les extrémités 5’ ou 3’ de la molécule d’ARNm, le temps qu’il faut pour commencer à détecter des taches fluorescentes de GFP sera différent. Le délai est égal à la longueur de la région transcrite divisée par la vitesse de la polymérase. (C) Taches de GFP associés à la transcription pour les deux constructions présentées en (B), visualisés par microscopie à fluorescence. (D) Distribution des instants d’apparition des deux constructions, avec un délai de 2.2 min, dont on déduit une vitesse de transcription de 25 nt/s. Les mesures ont été effectuées à la température ambiante de 22°. (D’après Garcia et al. (2013).)

À quelle vitesse la transcription et la traduction opèrent-elles chez les eucaryotes ? La transcription chez les cellules mammifères présente des vitesses semblables à celles mesurées chez E. coli (50-100 nt/s ; BNID 105566, 105113, 100662 ; voir Tableaux 4‑4 et 4‑5). Il a pu être suggéré que ces événements de transcription rapide alternent avec des pauses, ce qui conduit à une vitesse moyenne inférieure d’un ordre de grandeur (≈6 nt/s ; BNID 100661) ; cependant, certaines études n’observent pas ce ralentissement (BNID 105565). Les mesures in vivo récentes dans des embryons de drosophile ont fourni une belle image en temps réel de la transcription, qui

282

4. Temps et vitesse

utilise la fluorescence pour observer la première apparition d’ARNm (Figure 4‑14). Récemment, une autre approche utilisant la puissance du séquençage a permis d’évaluer la distribution des vitesses d’élongation d’ADN dans la lignée cellulaire HeLa (Figure 4‑15) : on trouve des vitesses de 30 à 100 nt/s, avec une médiane de 60 nt/s (BNID 111027). Rappelons que chez les eucaryotes, la transcription et la traduction sont spatialement isolées, la transcription ayant lieu dans le noyau et la traduction dans le cytoplasme. Des introns sont excisés des transcrits d’ARNm avant la traduction, et cet épissage prend environ 5–10 min en moyenne (BNID 105568). Bien que nous nous soyons concentrés ici sur l’élongation d’ADN, dans certains cas le phénomène limitant semble être l’initiation de la transcription. Il s’agit du processus par lequel le complexe d’ARN polymérase s’assemble et les deux brins d’ADN se séparent pour former une bulle permettant la transcription.

nombre de gènes

200 160 120 80 40 0 0

20 40 60 80 100 vitesse d’élongation (nt/s)

 Figure 4‑15  Distribution de la vitesse d’élongation d’ADN mesurée en levant l’inhibition de la transcription et en séquençant tous les transcrits à des instants ultérieurs. (D’après Fuchs et al. (2014).)

Que pouvons-nous dire des taux eucaryotes de traduction ? Chez S. cerevisiae, le taux est inférieur de moitié comparé à celui des bactéries (3–10 aa/s ; BNID 107871), mais notons que la température « physiologique » de la mesure était de 30 °C, tandis que pour E. coli, les mesures ont été réalisées à 37 °C. Comme le discute la rubrique « Quel est l’effet de la température sur les vitesses de réaction » (p. 267), la vitesse plus lente est bien ce à quoi nous nous attendrions suivant la dépendance générale d’un facteur de 2 à 3 pour 10 °C (il s’agit de Q10 ; BNID 100919). En utilisant la méthode de profilage de ribosome par séquençage haut-débit, la vitesse de traduction dans des cellules souches embryonnaires de souris a pu être étudiée pour de nombreux transcrits différents (Figure 4‑16). On a pu observer que la vitesse était assez constante entre protéines, à environ 6 aa/s (BNID 107952). Après plusieurs décennies de recherche intense et de techniques toujours plus raffinées à notre disposition, nous semblons être arrivés au point où la description quantitative des différentes étapes du dogme central peut être intégrée pour révéler ses dépendances temporelles complexes.

283

La biologie cellulaire par les nombres

(A)

(B) ≈ 6 codons/s

inhibiteur d’initiation position

Δτ inhibiteur de traduction

200 codons 30 s temps (Δτ)

position

 Figure 4‑16   Mesure indirecte de la vitesse de traduction dans des cellules souches embryonnaires de souris par profilage de ribosomes. (A) En inhibant l’initiation de la traduction, puis l’élongation, on provoque l’arrêt des ribosomes à une position qui dépend du temps, et de la vitesse de traduction. Les techniques de séquençage modernes permettent de mesurer cette position, et donc la vitesse de traduction, pour chaque transcrit du génome. (B) Mesure de la vitesse de traduction pour un transcrit d’après la méthodologie schématisée en (A). (D’après Ingolia et al. (2011).)

Quel est le temps de maturation des protéines fluorescentes ? Les protéines fluorescentes sont devenues un outil majeur pour l’exploration de la dynamique et de la localisation du contenu macromoléculaire de cellules vivantes. Étant donné combien la palette de protéines fluorescentes différentes s’est diversifiée, avec leurs nombreuses couleurs et propriétés (voir Figure 4‑17), il est incroyable que nous n’ayons vraiment assisté qu’à une seule décennie d’effort concerté avec ces outils révolutionnaires. En effet, il est difficile d’imaginer quelque domaine de la biologie qui n’ait pas été touché d’une manière ou d’une autre (et souvent profondément) par l’usage de protéines rapportrices fluorescentes. (A)

(B)

mCherry

mOrange

mBanana

mHoneydew

YFP (Citrine)

EGFP

ECFP

EBFP

 Figure 4‑17  Illustration d’une partie de la palette des protéines fluorescentes qui ont révolutionné la biologie cellulaire. (A) Protéines fluorescentes couvrant une gamme de longueurs d’onde d’excitation et d’émission. (B) Boîte de Pétri comportant des bactéries exprimant huit protéines fluorescentes de couleurs différentes pour « peindre » une scène idyllique à la plage. (D’après Tsien (2010).)

284

4. Temps et vitesse

Cependant, en tant qu’outil d’exploration des nombreuses facettes de la dynamique cellulaire, les protéines fluorescentes présentent des inconvénients aussi bien que des avantages. Une fois la protéine fluorescente exprimée, elle doit passer par plusieurs étapes avant de devenir fonctionnelle (voir Figure 4‑18) : il s’agit de la maturation. Quoiqu’elle soit déjà synthétisée, la protéine n’est pas encore fluorescente tant que la maturation n’est pas achevée. La conséquence utile pour l’étude de la dynamique cellulaire est qu’il y a une séparation des échelles de temps entre la maturation de la protéine rapportrice (qui de préférence devrait être « rapide ») et la dynamique du processus effectivement étudié (qui devrait être beaucoup plus lent). La première étape (non représentée) de la maturation est la plus intuitive et se rapporte au repliement de la protéine elle-même, qui est relativement rapide et doit prendre moins d’une minute, en supposant qu’il n’y ait pas d’agrégats. L’étape suivante est un réarrangement torsionnel (Figure 4‑18B-C) de ce que l’on peut considérer comme le site actif du fluorophore – les acides aminés où sont situés les électrons conjugués qui émettront la fluorescence. L’étape suivante, connue sous le nom de cyclisation (qui voit la formation d’un cycle entre deux acides aminés – voir Figure 4‑18C-D), est plus longue, mais reste encore rapide par rapport à l’étape finale et limitante de l’oxydation. À cette étape finale, de l’oxygène moléculaire s’empare d’électrons du fluorophore, créant des liaisons conjuguées dans le système final. Toutes ces étapes sont un prérequis pour que le site actif puisse émettre de la fluorescence. (A)

torsions

Thr65

(B)

(C)

Gly67

Gly67 Tyr66

cyclisation et oxydation Gly67 Tyr66

(D) noyau aromatique conjugué Gly67 Tyr66

Thr65 Tyr66 polypeptide étiré

Thr65

Thr65 fluorophore mature

 Figure 4‑18   Schéma de la formation du chromophore par maturation de l’EGFP (enhanced green fluorescent protein). (A) Le tripeptide Thr65-Tyr66-Gly67 est étiré en configuration linéaire avant la maturation. La première étape de la maturation est une série d’ajustements en torsion (B) et (C). Ces torsions permettent une attaque nucléophile qui conduit à la formation d’un cycle (l’étape de cyclisation). (D) La fluorescence se produit après l’oxydation de la tyrosine par de l’oxygène moléculaire. Les atomes du noyau aromatique conjugué sont colorés. (D’après Olenych et al. (2007).)

Il existe quelques mesures fiables du temps de maturation (voir Tableau 4‑6), bien que les valeurs soient encore loin d’être complètement consensuelles. L’une des approches pour quantifier la maturation des fluorophores consiste à faire passer des cellules d’une croissance anaérobie, où le fluorophore est exprimé mais ne peut pas exécuter l’étape la plus lente de l’oxydation, à une croissance aérobie, pour observer alors la vitesse d’apparition du signal fluorescent. Plus généralement, on utilise des

285

La biologie cellulaire par les nombres

promoteurs inductibles, ou alors on arrête la traduction à l’aide de cycloheximide. Nagai et ses collaborateurs (BNID 103780) ont pu mesurer chez E. coli une échelle de temps de maturation de moins de 5 min pour la YFP et de 7 min pour la GFP. En revanche, Gordon et ses collaborateurs (BNID 102974) ont trouvé une échelle de temps de ≈40 min pour la maturation de la YFP et ≈50 min pour la CFP, bien qu’une partie de la différence puisse être expliquée par le fait que, dans ce cas-ci, les mesures ont été effectuées chez la levure à 25 °C. Après avoir induit l’expression de ces protéines, on inhibe la traduction après 30 min en ajoutant du cycloheximide. L’échelle de temps de maturation a été calculée à partir de la dynamique d’accumulation continue de fluorophore, qui se poursuit même après que la dernière protéine a été synthétisée. Notons que pour de nombreux phénomènes qui se produisent au cours d’un cycle cellulaire, comme l’expression des gènes en réponse aux signaux environnementaux, le temps de maturation peut constituer une fraction substantielle de l’échelle de temps du phénomène d’intérêt. Si un coureur de marathon s’arrête pour boire au milieu de sa course, cela affectera à peine la performance globale du coureur. En revanche, si le coureur d’arrête pour un massage, ceci affectera notablement le temps auquel il terminera la course. Comme un coureur s’arrêtant à un restaurant, le temps de maturation peut restreindre sérieusement notre capacité à surveiller précisément la dynamique de plusieurs processus cellulaires. La maturation d’un chromophore suit une cinétique d’ordre 1 dans la plupart des études réalisées. En conséquence, il existera une faible proportion de fluorophores fonctionnels bien avant le temps de maturation. Toutefois, l’échelle de temps caractéristique à laquelle la majorité de la population devient active est de l’ordre du temps de maturation lui-même. Il en résulte un délai intrinsèque dans le système rapporteur, qu’il faudrait garder à l’esprit lorsque l’on utilise des rapporteurs fluorescents pour évaluer un temps de réponse. De même, lorsque l’on arrête la traduction (par l’usage d’un inhibiteur de ribosome tel que le cycloheximide, par exemple), on observe une période transitoire pendant laquelle certaines protéines synthétisées avant l’inhibition s’allument et ajoutent au signal. Cela aussi devrait être pris en compte pour estimer un temps de dégradation. Une autre propriété dynamique de ces protéines les rend délicates pour caractériser avec précision la dynamique cellulaire : le photoblanchiment. Ce phénomène présente une échelle de temps caractéristique de dizaines de secondes aux niveaux standard d’illumination et de grossissement. Cette valeur signifie qu’après une exposition continue à l’illumination pendant plusieurs dizaines de secondes, l’intensité de fluorescence diminuera à 1/e ≈ 0.37 de sa valeur initiale. Bien que parfois gênant, cet inconvénient apparent a pu servir de point d’entrée astucieux pour de nouvelles techniques, par exemple dans le cadre du FRAP, qui permet de quantifier la diffusion (voir Figure 4‑3) ; ainsi que dans certaines approches de microscopie à superrésolution, où le blanchiment de fluorophores individuels permet de localiser ces molécules avec une résolution de l’ordre du nanomètre.

286

4. Temps et vitesse

 Tableau 4‑6   Temps de maturation de protéines fluorescentes usuelles. Puisque différentes approches et conditions donnent toujours des valeurs très différentes, nous devons faire attention aux études dans lesquelles le temps de maturation peut affecter les conclusions. Pour mCherry, deux échelles de temps sont indiquées : la première conduit à la fluorescence et la seconde à un régime de longueur d’onde différent (BNID 110552). Les valeurs sont arrondies à un chiffre significatif. (D’après Iizuka et al. (2011). Pour les mutations qui définissent ces fluorophores relativement à la forme sauvage, voir Shaner et al. (2005).) Fluorophore

Temps de maturation (min)

Type cellulaire

BNID

ECFP

50

S. cerevisiae

106883

GFP sauvage

50

In vitro

106892

sfGFP

6

E. coli

110546

GFPmut3

7

E. coli

102972

GFPmut3

7

In vitro

107004

EGFP

60

E. coli

107001

EGFP

14

In vitro

107000

Emerald

12

In vitro

106893

GFPem

5

In vitro

106887

EYFP

40

S. cerevisiae

102974

EYFP

20

In vitro

106891

Venus

40

In vitro

106890

mCherry

15

E. coli

106877

mCherry

40

E. coli

110551

mCherry

40-100

E. coli

111423

mCherry

17+30

S. cerevisiae

110552

mStrawberry

50

E. coli

106880

tdTomato

60

E. coli

106876

mPlum

100

H. sapiens, lignée de lymphocytes B

106878

On a également pu utiliser les différences de temps de maturation de différents fluorophores pour évaluer les vitesses de dégradation et de translocation, sans effectuer de mesures de cours du temps 76. Dans ces expériences, la protéine d’intérêt est fusionnée à non pas une, mais deux rapporteurs fluorescents, une GFP à maturation

76. Khmelinskii et al. (2012)

287

La biologie cellulaire par les nombres

rapide et une mCherry à maturation lente. La mesure du rapport des intensités peut alors servir de chronomètre intégré. Si la protéine d’intérêt a une courte durée de vie, elle sera dégradée avant que le rapporteur à maturation lente ait eu le temps d’émettre de la fluorescence : l’intensité du rapporteur à maturation rapide dominerait, avec une intensité plus élevée en vert qu’en rouge. Inversement, si la protéine a une longue durée de vie, le rapporteur à maturation lente aura le temps d’émettre de la fluorescence et son rapport au rapporteur rapide serait élevé, avec une couleur dominante plus rouge que verte. La mesure du temps grâce au rapport d’intensités a ainsi permis, par exemple, de prouver que les cellules-filles tendent à recevoir les vieilles copies de certains complexes protéiques, tels que les pôles du fuseau mitotique et les complexes des pores nucléaires, tandis que les cellules-mères conservent les copies nouvellement formées.

À quelle vitesse le protéasome dégrade-t-il les protéines ? Une des manières dont la teneur en protéines est régulée dans la cellule est leur dégradation contrôlée. La principale machine macromoléculaire responsable de la dégradation est le protéasome. On peut le considérer comme le double maléfique du ribosome. La figure 4‑19 présente la taille et la forme de cette machine en forme de tonneau. Quelle fraction du protéome occupent ces machines ? Chez les cellules HeLa, on a rapporté qu’environ 1 % de l’ensemble des protéines correspond au protéasome (BNID 108028, 1087l7). C’est beaucoup moins que la quantité de protéines qui participent aux ribosomes, qui peut atteindre le tiers du protéome chez les bactéries à croissance rapide et souvent 5–10 % chez d’autres cellules 77. Chez les cellules sanguines, la fraction du protéome occupée par le protéasome varie entre 0.01 % et 0.3 % pour différents types cellulaires (BNID 108041). Ces machines ont une demi-vie d’environ 5 jours (BNID 108031). La vitesse de dégradation associée à la dégradation médiée par le protéasome a pu être mesurée in vitro. Cette vitesse présente une forte variabilité, avec des valeurs de ≈0.05, ≈0.2 ou ≈5 chaînes peptidiques « caractéristiques » par minute (BNID 108032, 109854). Étant donné ce large éventail de valeurs, nous sommes confrontés à la question-clé de savoir s’il existe quelque raison de privilégier l’un de ces nombres comme vitesse « caractéristique » par rapport aux autres, au moins pour les vitesses observées dans les lignées cellulaires étudiées au laboratoire. La vitesse de dégradation par le protéasome peut varier en fonction de la protéine-substrat, ce qui limite la fiabilité d’une valeur moyenne « caractéristique ». Étant donné ces maigres informations, nous pouvons effectuer un test de cohérence. Par exemple, nous pouvons nous demander s’il y a assez de machines moléculaires pour dégrader une fraction significative du protéome à chacune de ces vitesses. Le test de cohérence, qui est l’un des leitmotiv de ce livre, montre dans ce cas que l’une de ces valeurs est plus plausible que les autres (voir ci-après).

77. http://www.proteomaps.net.

288

4. Temps et vitesse

chaîne d’ubiquitine (1ubq)

ubiquitine (1f9j)

E1 (1r4n)

ubiquitine-ligase E3 (1ldk+1fqv) protéine (src) E2 (1fxt)

activateur du protéasome (1fnt) protéasome (1fnt)

10 nm

 Figure 4‑19  Protéines impliquées dans la voie ubiquitine-protéasome de dégradation des protéines. Les principales molécules du système de dégradation vont de l’ubiquitine, étiquette moléculaire qui marque une protéine pour la dégradation, aux ligases qui placent ces étiquettes moléculaires sur la protéinecible. Une fois que des protéines sont étiquetées pour la dégradation, c’est le protéasome qui effectue activement cette dégradation. Le protéasome représenté ici provient de la structure déterminée pour la levure à bourgeon. E1 et E2 désignent respectivement les enzymes d’activation et de conjugaison de l’ubiquitine. (Avec l’aimable autorisation de David Goodsell.)

289

La biologie cellulaire par les nombres Temps de renouvellement des protéines par dégradation active Notons Naa le nombre d’acides aminés par cellule. (ainsi, pour une cellule HeLa, Naa 3x106

protéines µm

3

x 3000

µm3 aa x 400 cellule protéine

4x1012

aa ) cellule

1% de la masse du protéome est constituée du protéasome nb. de protéasomes

0.01 x Naa aa 20 000 aa/protéasome

0.5x10–6 Naa protéasomes/cellule

masse moléculaire du protéasome 2.4 MDa 20 000 aa

taux de dégradation par le protéasome 5 protéines/min 0.1 protéines/s 40 aa/s taux de dégradation d’ensemble

40

temps de renouvellement

protéasomes aa x 0.5x10–6 Naa s x protéasome cellule nb d'acides aminés par cellule taux de dégradation d'ensemble

Naa aa Naa x 20x10–6 aa/s

20x10–6 Naa

aa s x cellule

0.5x105s

1 jour

c’est-à-dire que la dégradation du protéome ferait travailler tous les protéasomes de la cellule à cadence maximale pendant un jour environ.

 Estimation 4‑10  Quel est le temps de renouvellement des protéines par dégradation active ?

Supposons que le protéome se compose globalement de Naa acides aminés (voir Estimation 4‑10). Par exemple, si la cellule HeLa considérée a un volume caractéristique de 3 000 µm3, avec 3 millions de protéines par µm3, et si la longueur moyenne d’une protéine est de 400 acides aminés, alors Naa vaut 4×1012 aa. Comme nous le verrons, cependant, la valeur exacte de Naa n’est pas importante car elle s’élimine au cours du calcul. Supposons que les protéasomes forment ≈1 % du protéome, cette machinerie contient alors 0.01 Naa acides aminés. Un protéasome a une masse moléculaire moyenne de ≈2.4×106 Da (BNID 104915) – c’est-à-dire environ 20 000 acides aminés. Ainsi, la cellule contient : (0.01×Naa aa)/(20 000 aa/protéasome) ≈ 0.5×10–6 Naa protéasomes (c’est-à-dire, de l’ordre du million de protéasomes dans cette cellule HeLa). En prenant la vitesse de dégradation la plus élevée évoquée ci-avant, de 5 protéines/min ≈ 0.1 protéine/s, on obtient une vitesse de dégradation équivalente en termes d’acides aminés de ≈40 aa/s. Cependant, la protéine est dégradée par le protéasome en morceaux de 2 à 30 acides aminés chacun (BNID 108111), lesquels morceaux sont dégradés seulement plus tard par des peptidases, de sorte que l’unité aa/s n’est qu’une valeur apparente qui facilite le calcul et la comparaison mais ne décrit pas le phénomène biophysique réel. Notons que la vitesse de synthèse des protéines par le ribosome, de ≈10 aa/s (voir la rubrique « Laquelle est la plus rapide, la transcription ou la traduction ? » p. 278), n’est pas très différente de cette vitesse de dégradation par le protéasome. Ces deux machineries partagent également une masse

290

4. Temps et vitesse

moléculaire semblable. En revenant à notre test de cohérence, nous avons ainsi une vitesse globale de dégradation de : (40 s–1) × (0.5×10–6 Naa aa) = 20×10–6 Naa aa/s. Ainsi, le temps de renouvellement, qui correspond au rapport du nombre total d’acides aminés à la vitesse globale de dégradation, vaut : Naa aa/(20×10–6 Naa aa/s) ≈ 0.5×105 s, ou environ 1 jour. Cette échelle de temps est à peu près la même que la période caractéristique du cycle cellulaire pour une lignée de cellules prolifératives. La valeur de Naa n’a pas d’importance pour cette estimation, comme le montre l’Estimation 4‑10. Cela rejoint les observations détaillées dans la rubrique suivante : dans les lignées cellulaires, le temps de renouvellement des protéines dû à la dégradation est de 1-2 jours (BNID 109937). Si nous avions pris la borne inférieure de la vitesse de dégradation, nous aurions obtenu un temps de renouvellement d’environ un mois : c’est beaucoup plus long que la valeur mesurée pour des cellules en division rapide, mais probablement plus approprié pour les cellules de notre corps qui se renouvellement lentement. Cela incite à considérer la vitesse de 5 chaînes peptidiques par minute comme une mesure plus fiable pour les cellules en division rapide. C’est un exemple de la manière dont un calcul simple peut nous aider à évaluer la plausibilité de différentes mesures.

À quelle vitesse les molécules d’ARN et les protéines se dégradent-elles ? Le dogme central se concentre sur la production des acides nucléiques et des protéines, les grands polymères de la biologie. Cependant, la commande et la régulation des fonctions de la cellule ne reposent pas uniquement sur la synthèse de nouvelles molécules. La dégradation est un autre processus majeur de la vie des macromolécules de la cellule, et elle est elle-même très contrôlée. En effet, dans le modèle le plus simple de la production d’ARNm, la dynamique de la quantité moyenne m d’ARNm peut s’écrire : dm  r  m dt où r désigne la vitesse de production d’ARNm et γ la constante de vitesse qui régit la dégradation d’ARNm. La valeur d’équilibre de cette quantité d’ARNm est donnée par : m

r 

ce qui indique qu’en première approximation, c’est le rapport des vitesses de production et de dégradation qui contrôle l’état stationnaire de ces molécules. Si notre équation concerne le nombre de copies de molécules par cellule, ce nombre présentera un changement brusque à chaque fois que les cellules se divisent, puisque

291

La biologie cellulaire par les nombres

le contenu en ARNm et en protéines est divisé entre les deux cellules-filles. Si, au lieu de cela, notre équation est considérée en termes de concentration, nous évitons ce problème, car pendant que la cellule se développe, le nombre de molécules croît également et la concentration varie sans discontinuité. On peut tenir compte de l’effet de dilution au cours de la croissance cellulaire en l’incluant dans la constante de vitesse de dégradation. C’est une solution fréquente et mathématiquement élégante, mais elle n’est pas immédiatement intuitive et nous essaierons donc de la clarifier ci-après. Mais d’abord, quelles sont les valeurs caractéristiques des vitesses de dégradation des ARNm et des protéines ? La durée de vie des molécules d’ARNm est généralement courte comparée à l’échelle de temps fondamentale de la biologie cellulaire, définie comme la période du cycle cellulaire. Chez E. coli, la majorité des molécules d’ARNm ont des durées de vie de 3 à 8 min (voir Figure 4‑20A). Les expériences conduisant à ces résultats ont été effectuées en inhibant la transcription à l’aide de rifampicine, un produit chimique qui interagit avec l’ARN polymérase. Les quantités d’ARNm dans les cellules ont ensuite été mesurées à des intervalles réguliers de deux minutes après le traitement chimique. En particulier, on a pu obtenir les niveaux d’ARN par hybridation de l’ADN complémentaire sur puce, en mesurant des intensités relatives de fluorescence à différents instants. Ce temps de dégradation n’est pas beaucoup plus long que le temps minimal requis pour l’élongation transcriptionnelle et traductionnelle, comme discuté dans la rubrique « Laquelle est la plus rapide, la transcription ou la traduction ? » (p. 278). Cela reflète l’existence transitoire de certains messages d’ARNm.

fréquence

40% 30% 20% 10%

(B) S. cerevisiae 1000

500

0% 0 1 3 5 7 9 11 13 15 10 20 30 40 50 >60 temps de demi-vie de l’ARNm (min) temps de demi-vie de l’ARNm (min)

(C) M. musculus 1200 nb d’espèces d’ARNm

50%

nb d’espèces d’ARNm

(A) E. coli

900 600 300 0 5 10 15 20 25 >30 temps de demi-vie de l’ARNm (h)

 Figure 4‑20  Demi-vie des ARNm mesurées chez E. coli, S. cerevisiae et des fibroblastes NIH3T3 de souris. (A, d’après Bernstein et al. (2002). B, d’après Wang et al. (2002). C, d’après Schwanhäusser et al. (2011).)

À partir de ces données à l’échelle du génome entier, on peut explorer diverses hypothèses pour les mécanismes sous-jacents aux durées de vie observées. Par exemple, y a-t-il une corrélation entre l’abondance de certains ARN messagers et leur vitesse de dégradation ? Y a-t-il des motifs de structure secondaire ou des motifs de séquence qui influencent les vitesses de dégradation ? Une des grandes surprises des mesures

292

4. Temps et vitesse

menant à la figure 4‑20A est qu’aucune des idées conventionnelles expliquant la durée de vie de l’ARNm ne s’est avérée compatible avec les données, qui n’indiquent aucune corrélation claire avec la structure secondaire, l’abondance du message ou la vitesse de croissance. À quel point l’affirmation de Monod que « ce qui est vrai pour E. coli est vrai pour l’éléphant » (Figure 4‑21) nous permet-elle d’appréhender la durée de vie de l’ARNm chez d’autres organismes ? La réponse courte est « pas beaucoup ». Alors que la demi-vie médiane de l’ARNm vaut environ 5 min chez E. coli, elle est de ≈20 min chez la levure (voir Figure 4‑20B) et 600 min (BNID 106869) pour les cellules humaines. Cette demi-vie présente une corrélation claire avec les durées du cycle cellulaire de ces trois types de cellules, de l’ordre de 30 min (E. coli), 90 min (levure à bourgeon), et 3 000 min (humain), dans les conditions de croissance exponentielle correspondant à ces expériences. Ces résultats suggèrent que la durée de vie de l’ARNm dans ces cas est environ 5 fois plus courte que le cycle cellulaire, en croissance rapide.

 Figure 4‑21  « L’éléphant et l’Escherichia coli » par Jacques Monod, décembre 1972. « Tout ce qui est vrai pour le colibacille est vrai pour l’éléphant. » (Avec l’aimable autorisation des Archives de l’Institut Pasteur.)

L’ARN messager n’est pas la seule cible de la dégradation. Les protéines sont ellesmêmes des cibles de destruction spécifique, bien que leurs durées de vie tendent à être plus longues que les ARNm où elles sont encodées, comme discuté ci-après. En raison de ces longues durées de vie, en croissance cellulaire rapide, le nombre de copies par cellule d’une protéine donnée diminue, non en raison d’un processus actif de dégradation, mais simplement parce que la cellule double tous ses autres constituants et se divise en deux cellules-filles, laissant à chacune des filles la moitié des copies de la protéine d’intérêt présentes dans la cellule-mère. Pour comprendre cet effet de dilution, imaginons que l’ensemble de la synthèse protéique

293

La biologie cellulaire par les nombres

pour une protéine donnée ait été arrêtée, alors que la cellule achève son doublement de volume et se divise. En termes d’effectifs, si le nombre de copies de notre protéine d’intérêt avant la division était de N, il sera de N/2 après. En termes de concentrations, en partant d’une concentration c, la concentration sera diluée à c /2 après doublement du volume, puis reviendra à c après la division. Ce mécanisme est particulièrement approprié pour les bactéries, où les durées de vie des protéines sont souvent dominées par la période de division cellulaire. En conséquence, le taux α de perte de protéine (le terme analogue au paramètre γ pour l’ARNm) est la somme de deux termes, l’un dû à la dégradation active et l’autre à la dilution qui se produit lorsque les cellules se divisent. Nous pouvons écrire le taux de diminution total sous la forme :

α = αactive + αdilution L’affirmation selon laquelle les durées de vie des protéines chez les bactéries en croissance rapide sont plus longues que le cycle cellulaire lui-même repose sur des mesures des années 1960 faites à l’aide d’un marquage radioactif. Dans ce cas, on a pu suivre la dégradation des protéines marquées en notant l’accumulation des acides aminés radioactifs dans un liquide de perfusion. On a pu estimer que seulement 2–7 % du protéome est activement dégradé, avec une demi-vie d’environ une heure (BNID 108404). Des études plus récentes ont fait état de cas spécifiques de dégradation rapide, y compris certains facteurs sigma, des facteurs de transcription, et des protéines de choc thermique ; cependant, l’affirmation générale que la dilution est le mécanisme dominant de diminution de protéine chez les bactéries demeure valide. Tout comme avec les études de durée de vie de l’ARNm à l’échelle du génome entier décrites ci-avant, les protéines ont aussi subi un examen minutieux semblable. Étonnamment, nous n’avons pas trouvé d’informations à l’échelle du génome dans la littérature concernant le temps de dégradation de protéines chez E. coli. Mais chez la levure à bourgeon, on a pu arrêter la synthèse macromoléculaire à l’aide d’une molécule inhibitrice de la traduction (le cycloheximide), et mesurer la teneur en protéines au cours du temps par transfert de protéines. La technique de transfert de protéines, ou Western blot, est un système par lequel les protéines d’intérêt sont repêchées par liaison spécifique à une certaine partie de la protéine (par exemple à l’aide d’anticorps) et la quantité de protéine est lue grâce à l’intensité d’un rapporteur préalablement étalonné sur une échelle standard. L’inhibition de la traduction pourrait causer des artefacts, mais en gardant ce risque à l’esprit, ces mesures indiquent des durées de vie plus longues pour les protéines comparées aux ARNm (Figure 4‑22A), avec une demi-vie moyenne d’approximativement 40 min (BNID 104151). Toutefois, les problèmes de précision de ces résultats incitent à élaborer de nouvelles méthodes qui permettraient d’améliorer ce type de recensement. À l’aide de techniques modernes de fluorescence, il est devenu possible de mesurer le temps de dégradation de protéines humaines dans des cellules vivantes, sans qu’il soit nécessaire de lyser les cellules. La figure 4‑22B montre les longues échelles de temps de dégradation observés dans les cellules humaines. Les mesures ont été

294

4. Temps et vitesse

effectuées en fusionnant la protéine d’intérêt à une protéine fluorescente. Puis, en divisant la population en deux groupes et en photoblanchissant l’un des deux groupes, on peut observer le retour de fluorescence dans la population blanchie et donc de mesurer directement le temps de dégradation. Les cellules humaines présentent une interaction intéressante entre la dégradation et la diminution par dilution (voir Figure 4‑23). Les demi-vies de dégradation active présentent une large distribution, le temps de renouvellement le plus court étant de moins d’une heure et le plus long étant supérieur à plusieurs jours de vidéo-microscopie, pendant lesquels la dégradation observée était négligeable. On peut comparer ces résultats avec ce que prévoit la règle de l’extrémité N-terminale, qui stipule que l’acide aminé à l’extrémité N-terminale d’une protéine donnée influence fortement la dégradation active exécutée par le système d’ubiquitination. Par exemple, dans les systèmes mammifères, cette règle prévoit que l’arginine, le glutamate et la glutamine provoqueront une dégradation après environ une heure, tandis que la valine, la méthionine et la glycine seront stables pendant quelques dizaines d’heures. (B)

H. sapiens, lignée cellulaire HeLa

500

600

400

500 nombre de protéines

nombre de protéines

(A) S. cerevisiae

300 200 100 0

0

1 2 3 temps de demi-vie des protéines (h)

>3

400 300 200 100 0 0

10 20 30 40 50 60 70 >70 temps de demi-vie des protéines (h)

 Figure 4‑22  Demi-vies de protéines, mesurées chez S. cerevisiae et chez la lignée cellulaire cancéreuse humaine HeLa. Dans l’expérience sur la levure, la traduction a été inhibée par un traitement au cycloheximide, qui perturbe la physiologie de la cellule. Les 4 100 protéines analysées dans les cellules HeLa ont un temps médian de demi-vie de 36 h. (A, d’après Belle et al. (2006) ; B, d’après Cambridge et al. (2011).)

Dans l’optique de caractériser les durées de vie des protéines les plus stables, on a nourri des souris à l’aide d’aliments marqués aux isotopes pendant une courte période, pour les analyser un an après. Cette expérience a montré que si la plupart des protéines se renouvellent en quelques jours, certaines présentent une stabilité remarquable. Les histones présentent une demi-vie de ≈200 jours ; plus impressionnant, le pore nucléaire se compose d’un assemblage protéique d’une demi-vie supérieure à 1 an, alors que tous les composants environnants se renouvellent beaucoup plus rapidement.

295

La biologie cellulaire par les nombres

rapport du taux de dégradation au taux de dilution –log2(αdeg/αdil)

mécanisme d’élimination des protéines régime dominé par la dégradation 48%

régime mixte 42%

régime dominé par la dilution 10%

>4 3

T½ court

T½ élevé

2 1 0 –1 –2 –3