75
Le Vide Didier Lauwaert. Copyright © 2013. I. Introduction Le vide est plein de mystères ; Une conception ancienne ; Etude sur le vide II. Le vide en physique classique II.1. Expériences, pression et vide Vide classique ; Expériences ; Pression ; Baromètre II.2. Créer du vide Le vide spatial ; Pompes à vide ; Pompes pneumatiques ; Pompes à palettes ; Pompes à diffusion ; Adsorption ; Absorbeur à ionisation III. L’éther luminifère L’éther ; Propriétés de la lumière ; L’éther luminifère ; Propriétés de l’éther ; Ether statique ou entrainé ? ; L’aberration stellaire ; Expériences de Fizeau ; Expérience de Michelson et Morley ; Un éther bien contradictoire IV. Le champ électromagnétique Champs électriques et magnétiques ; Théorie de Maxwell ; Ondes électromagnétiques ; Permitivité et perméabilité ; Propriétés dans le vide V. La relativité restreinte Repères ; La relativité restreinte ; L’addition des vitesses ; L’espace-temps ; La vitesse de la lumière et le vide ; La valeur de la vitesse de la lumière VI. La relativité générale De la relativité restreinte à la relativité générale ; La courbure de l’espace-temps ; Le champ gravitationnel ; Le vide VII. La mécanique quantique VII.1. Les atomes Les photons ; Structure des atomes ; Le modèle de Bohr ; Défauts du modèle ; La mécanique quantique ; Mécanique quantique ondulatoire ; Principe d’indétermination ; Description par les états ; Evolution et mesure ; Le vide dans les atomes VII.2. Champs quantiques Champs quantique ; Principe d’indétermination énergie – temps ; Particules virtuelles ; Les fluctuations du vide ; Le vide quantique ; Vide quantique vs vide classique ; Stabilité du vide quantique VII.3 L’énergie du vide L’oscillateur harmonique ; L’énergie du vide ; Variation de l’énergie du vide ; L’effet Casimir ; Casimir sans fluctuation du vide VII.4 Le faux vide Les symétries ; Brisure de symétrie ; Comment interpréter cela ? VII.5 Mécanique quantique et relativité générale Le vide quantique avec accélération ; L’effet Unruh ; Le cas de l’espace-temps courbe ; L’effet Hawking ; Le vide dans le cas de Hawking ; L’énergie noire VIII. La gravité quantique Quantification du champ gravitationnel ; Changement dans la géométrie de l’espace-temps ; La théorie des cordes ; Gravité quantique à boucles IX. Références I. Introduction Qu’est-ce que le vide ? Le vide est-il du « rien », une espèce de néant ? Est-ce simplement une absence, l’absence d’autres choses telle que la matière, l’énergie, la lumière ? Ou est-ce quelque chose de plus tangible, remplit d’une substance subtile, de nature étrange et possédant des propriétés mesurables ? Nous avons décidé de dédier cette petite étude à ce sujet. Le vide est plein de mystères Le vide fascine. Il a toujours fasciné et fascinera sans doute encore longtemps.

Le Vide.pdf

Embed Size (px)

Citation preview

Page 1: Le Vide.pdf

Le Vide Didier Lauwaert.

Copyright © 2013.

I. Introduction Le vide est plein de mystères ; Une conception ancienne ; Etude sur le vide

II. Le vide en physique classique II.1. Expériences, pression et vide Vide classique ; Expériences ; Pression ; Baromètre

II.2. Créer du vide Le vide spatial ; Pompes à vide ; Pompes pneumatiques ; Pompes à palettes ; Pompes à diffusion ; Adsorption ; Absorbeur à ionisation

III. L’éther luminifère L’éther ; Propriétés de la lumière ; L’éther luminifère ; Propriétés de l’éther ; Ether statique ou entrainé ? ; L’aberration stellaire ; Expériences de Fizeau ; Expérience de Michelson et Morley ; Un éther bien contradictoire

IV. Le champ électromagnétique Champs électriques et magnétiques ; Théorie de Maxwell ; Ondes électromagnétiques ; Permitivité et perméabilité ; Propriétés dans le vide

V. La relativité restreinte Repères ; La relativité restreinte ; L’addition des vitesses ; L’espace-temps ; La vitesse de la lumière et le vide ; La valeur de la vitesse de la lumière

VI. La relativité générale De la relativité restreinte à la relativité générale ; La courbure de l’espace-temps ; Le champ gravitationnel ; Le vide

VII. La mécanique quantique VII.1. Les atomes Les photons ; Structure des atomes ; Le modèle de Bohr ; Défauts du modèle ; La mécanique quantique ; Mécanique quantique ondulatoire ; Principe d’indétermination ; Description par les états ; Evolution et mesure ; Le vide dans les atomes

VII.2. Champs quantiques Champs quantique ; Principe d’indétermination énergie – temps ; Particules virtuelles ; Les fluctuations du vide ; Le vide quantique ; Vide quantique vs vide classique ; Stabilité du vide quantique

VII.3 L’énergie du vide L’oscillateur harmonique ; L’énergie du vide ; Variation de l’énergie du vide ; L’effet Casimir ; Casimir sans fluctuation du vide

VII.4 Le faux vide Les symétries ; Brisure de symétrie ; Comment interpréter cela ?

VII.5 Mécanique quantique et relativité générale Le vide quantique avec accélération ; L’effet Unruh ; Le cas de l’espace-temps courbe ; L’effet Hawking ; Le vide dans le cas de Hawking ; L’énergie noire

VIII. La gravité quantique Quantification du champ gravitationnel ; Changement dans la géométrie de l’espace-temps ; La théorie des cordes ; Gravité quantique à boucles

IX. Références

I. Introduction Qu’est-ce que le vide ? Le vide est-il du « rien », une espèce de néant ? Est-ce simplement une absence, l’absence d’autres choses telle que la matière, l’énergie, la lumière ? Ou est-ce quelque chose de plus tangible, remplit d’une substance subtile, de nature étrange et possédant des propriétés mesurables ? Nous avons décidé de dédier cette petite étude à ce sujet.

Le vide est plein de mystères Le vide fascine. Il a toujours fasciné et fascinera sans doute encore longtemps.

Page 2: Le Vide.pdf

On a certainement écrit autant sur le sujet que sur bien d’autres choses importantes en physique. Comment quelque chose d’aussi insignifiant que le « rien » peut-il autant faire parler de lui ? C’est que le vide, sous une apparence anodine, est loin d’être quelque chose d’aussi simple à définir que du « rien ». L’histoire du vide, c’est aussi l’histoire de la physique, avec ses découvertes, ses échecs, ses mystères,… La description du vide a beaucoup évolué au cours de l’histoire, autant avec les progrès expérimentaux qu’avec le développement des théories modernes. De fait, le concept de vide en physique dépend aussi du cadre théorique et expérimental. Rien que cela le rend plus complexe qu’on ne pourrait le croire. Les théories modernes, tel que la mécanique quantique, lui ont aussi donné des propriétés qui ne sont pas triviales et qui elles aussi fascinent, tel que les fluctuations du vide, tout autant que les théories qui lui donnent naissance. De plus, le vide est loin d’être quelque chose d’anodin. Il est presque omniprésent et même le grand public n’ignore pas son existence. On le trouve sous forme utile en laboratoire, tout comme on le trouve dans la nature avec le vide spatial. Et qui n’a jamais acheté un aliment « emballé sous vide ».

Une conception ancienne Dans l’antiquité, les philosophes grecs essayaient déjà de comprendre la nature de la matière. Deux écoles dominaient. Celle considérant que les milieux étaient continus et celle considérant que la matière était constituée d’éléments indivisibles : les atomes de Démocrite. Il faut toutefois prendre garde aux anachronismes. Les atomes de Démocrite sont aussi différent des atomes tels que nous les concevons maintenant qu’une mouche d’un éléphant. Dans tous les cas, les anciens avaient beaucoup de mal à imaginer le concept de vide et ils concevaient la matière comme « bien remplie ». Ces difficultés pouvaient avoir des origines philosophiques tout autant que théologiques. Cela a donné la phrase célèbre : La nature a horreur du vide. Cette phrase à laquelle on fait dire à peu près tout et n’importe quoi a une part de vérité : le vide est facilement comblé par la moindre présence de gaz par exemple, et une part de mensonge : le vide existe dans la nature. D’une manière générale, ce vide tant décrié a évolué au fur et à mesure des découvertes. On l’a tour à tour vidé de toute substance et remplit de toutes sortes de choses : éther, fluctuations du vide, champs de toute nature. A tel point que les novices en physique ont bien du mal à se faire une idée de ce que signifie réellement le vide pour un physicien.

Etude sur le vide Nous allons donc essayer de combler ce vide, celui de la connaissance, par cette petite étude. Aucun prérequis n’est nécessaire, nous en resterons à un niveau de vulgarisation qui, s’il ne permet aucunement de maîtriser un sujet et de mener ses propres raisonnements (pour la bonne raison que tout propos vulgarisé est basé sur un substrat plus rigoureux, mathématiques), permet tout de même d’apprendre un certain nombre de choses. Nous donnerons parfois des parties plus techniques pour expliquer ou justifier certaines affirmations. Elles seront rédigées dans ce format. Si vous êtes allergique aux mathématiques, sautez les.

Page 3: Le Vide.pdf

Nous commencerons par le vide en physique classique, puis nous passerons à l’éther luminifère et la relativité pour terminer par la mécanique quantique. En espérant que vous prendrez du plaisir à cette petite excursion dans le vide.

II. Le vide en physique classique

II.1. Expériences, pression et vide

Vide classique En l’absence de vide, on a de l’air, des objets, des liquides, etc… En physique classique, le vide est donc simplement l’absence de matière (vide d’air, etc.)

Expériences Jusqu’au XVIIe siècle, personne ne croyait vraiment à la possibilité du vide. Cela changea à cette époque. Galilée, déjà, avait remarqué l’étrange phénomène avec les pompes servant à élever l’eau. Celles-ci ne pouvaient fonctionner si la hauteur dépassait une dizaine de mètre, et ce quel que soit le débit, le type de pompe…

Ce phénomène difficilement compréhensible (si l’eau ne sortait pas : que pompait la pompe ?) fut repris par Torricelli dans une étude ingénieuse en 1644, reprise et confirmée par Blaise Pascal en 1646. Le principe est le suivant : remplissons un tube de mercure, bouchons sont extrémité en veillant à ne laisser aucune bulle d’air (il suffit pour cela de remplir et bouche le tube dans une cuve à mercure), puis retournons le et plaçant son extrémité inférieur dans une cuve à mercure et, enfin, enlevons le bouchon. Qu’observe-t-on ?

Page 4: Le Vide.pdf

Le mercure descend dans le tube et se stabilise à une hauteur d’environ 70 centimètres. Torricelli remarqua que le poids de la colonne de mercure était identique (pour une section du tube identique) au poids de la colonne d’eau lorsque les pompes ne fonctionnaient plus. La formation d’un espace sans mercure au-dessus expliquait leur dysfonctionnement. Au-dessus d’une certaine hauteur, l’eau ne montait plus et donc les pompes n’avaient tout simplement pas d’eau à aspirer. C’est Pascal qui va comprendre deux significations majeures de cette expérience :

La cavité qui se forme au-dessus du mercure (ou de l’eau) ne pouvant avoir été remplie par de l’air, elle est constituée de vide.

La hauteur du mercure est liée au poids de l’air appuyant sur le mercure de la cuve. Pascal fit entreprendre des expériences de ce type en montagne à diverses altitudes pour confirmer son intuition. Avec l’altitude, la hauteur de la colonne de mercure diminuait, montrant bien que le poids de la masse d’air située au-dessus était moindre puisque l’on effectuait l’expérience à une certaine altitude et donc qu’une partie de la masse d’air était située plus bas. Il publia suite à diverses expériences sur les fluides deux traités en 1651 et 1653 sur la pesanteur et les fluides. Ces traités ont eu une énorme influence. Peu après, en 1654, Otto von Gericke fabriqua la première pompe à vide. C’est simplement une pompe qui aspire l’air au maximum. Nous reparlerons de ces pompes un peu plus loin. L’expérience de la sphère de Magdebourg montra d’une façon frappante la force de la pression exercée par l’air.

Page 5: Le Vide.pdf

Deux coquilles hémisphériques sont placées l’une contre l’autre pour former une sphère. Elles ne sont pas collées, simplement posée. Au plus on graisse légèrement la jonction pour assurer une meilleure étanchéité. Ensuite, grâce à une prise d’air on effectue le vide dans la sphère. Il devient alors très difficile de séparer les deux hémisphères. La simple ouverture du robinet de la prise d’air suffit à séparer les deux hémisphères. Cette expérience fut pratiquée à Magdebourg avec une grande sphère, d’environ un mètre de diamètre. Deux attelages avec des chevaux étaient reliés à la sphère et poussés à tirer de toute leur force. Cela ne suffit pas à écarter les deux hémisphères. A l’époque, cette expérience fut considérée comme très impressionnante.

Pression La pression est la force exercée par un milieu (gaz, liquide, solide) sur une surface. Si la force appliquée est F et la surface S, alors la pression est simplement le rapport P = F / S. Cette force est simplement due à l’agitation moléculaire. Les molécules d’air sont continuellement agitées, se déplaçant et se heurtant en permanence. De même, dans un solide, les molécules sont animées d’incessantes vibrations.

Page 6: Le Vide.pdf

Lors de ces mouvements les molécules se heurtent continuellement ainsi que les parois. Ce sont ces chocs qui communiquent la force de pression à la paroi. La température T est une manifestation de cette agitation et on peut relier les grandeurs entres-elles. Ainsi, la plus part des gaz suivent une loi appelée loi des gaz parfaits qui exprime que la pression est proportionnelle à la température (mesurée en Kelvin) et à la quantité de gaz. La physique statistique qui étudie les comportements collectifs d’un grand nombre de corpuscules en utilisant les lois des probabilités permet de faire le lien entre agitation – pression – température. Pascal a découvert le principe qui porte son nom : la pression exercée par un fluide dans un récipient est uniforme (a condition qu’il ne soit pas trop haut, sinon le poids intervient). Considérons le dispositif suivant :

Un piston de surface S1 applique une force F1 à un fluide. Ce même fluide posse le piston de surface S2 avec une force F2. La pression exercée par le premier piston est simplement P = F1/S1. Mais le principe de Pascal nous dit que la pression de l’autre côté doit aussi être P. Au deuxième piston, la pression exerce donc une force F2 telle que P = F2/S2.

Page 7: Le Vide.pdf

Le bilan est : F2 = F1 * S1/S2. La force est donc amplifiée du rapport des surfaces. C’est le principe des systèmes hydrauliques employés dans toutes sortes d’engins mécaniques. Le système tel qu’il est présenté a même été employé pour presser des balles de cotons. C’est le même dispositif qui sert à écraser des véhicules (presses hydrauliques) dans les casses. Notons que la mécanique nous dit que le travail communiqué par une force (l’énergie fournie) est la force fois le déplacement. Comme il y a plus de fluide à droite, le déplacement sera plus lent qu’à gauche. En fait, avec le même rapport S1/S2. L’énergie est donc conservée. Ce système amplifie les forces, pas l’énergie.

Baromètre Un certain volume de fluide dans un tube exerce un poids au fond du tube, c’est-à-dire une pression. Cela est vrai aussi de l’air atmosphérique. La pression atmosphérique n’est rien d’autre que le poids de l’air. Cette pression est d’environ un kilogramme par centimètre carré. Pour la mesurer on peut employer divers dispositif que les tubes de mercures présentés plus haut. L’équilibre est atteint lorsque le poids de l’air est parfaitement compensé par le poids du mercure. La largeur du tube n’a pas d’importance (si ce n’est qu’il ne doit pas être trop mince pour éviter les phénomènes de capillarité, dû à l’adhérence des fluides sur les parois) car ce qui compte est l’équilibre des pressions et ces pressions ne dépendent pas de la forme du tube (principe de Pascal). D’autres types de baromètres existent. Par exemple, on peut employer une capsule métallique sous vide, la pression de l’air déformant un couvercle élastique permet alors à une aiguille d’indiquer la pression. C’est le principe des baromètres domestiques. Notons que la pression permet de calculer la force exercée sur la sphère de Magdebourg. Si le diamètre de la sphère est de 1 mètre, alors la section principale de la sphère (ou d’un hémisphère) est de 0.785 mètre carré, c’est-à-dire 7850 centimètres carrés. Comme la pression ne dépend pas de la forme, peu importe que l’on ait une sphère, on pourrait avoir tout aussi bien deux disques plaqués l’un contre l’autre (sauf que le glissement des disques et les irrégularités des disques rendraient l’expérience difficile, avec des formes légèrement bombées on a le principe de la ventouse). La force appliquée par l’atmosphère sur la sphère est donc de 7850 kilogramme de chaque côté (pour les puristes, ce sont des kilogrammes forces). Soit presque huit tonnes. On comprend que les chevaux aient été dans l’impossibilité d’écarter les hémisphères.

II.2. Créer du vide Le vide parfait n’existe pas. Il existe toujours certaines traces, quelques molécules résiduelles. On a donc besoin d’une définition opérationnelle du vide. On parlera donc de vide avec une certaine pression résiduelle de gaz. Il existe plusieurs unités pour la mesure de la pression. Ici nous emploierons le torr, correspondant à une hauteur de un millimètre de mercure. La pression atmosphérique étant de l’ordre de sept cent torr. On parle en générale du vide de matière. Mais le lieu concerné peut contenir toute sorte d’autres choses : rayonnements électromagnétiques, champs magnétiques, flux de neutrinos (particules élémentaires particulièrement fantomatiques émises en très grandes quantités par le Soleil et dont plusieurs milliards traversent votre corps et même la planète entière le temps de lire cette phrase).

Page 8: Le Vide.pdf

En général ces divers types de rayonnements ne sont pas comptabilisés quand on parle du vide et il peut être assez difficile de les éliminer. Les champs électromagnétiques peuvent être évités par des blindages appropriés, si cela s’avère utile, mais le flux de neutrinos ne peut jamais être évité tellement leur interaction avec la matière est faible. Ce n’est pas ennuyant où justement ils n’ont aucune influence sur ce qui peut se passer dans une enceinte dans laquelle on a fait le vide, du fait même de leur caractère fantomatique.

Le vide spatial L’exemple type du vide est le vide spatial. En très haute altitude, celle des satellites, on a déjà un excellent vide bien qu’ils reste des traces résiduelles de l’atmosphère. Ces traces finissent même par faire retomber les satellites en orbite basse suite aux frottements qu’elles induisent. Plus loin encore, dans l’espace interplanétaire, intersidéral ou intergalactique, le vide atteint presque la perfection. Il est bien meilleur que tout ce que l’on sait réaliser en laboratoire.

Pompes à vide Pour la réalisation du vide en laboratoire, on dispose de nombreuses méthodes et différentes sortes de pompes à vide. Nous ne présenterons que quelques-unes des techniques utilisées.

Pompes pneumatiques

Les premières pompes à vide étaient pneumatiques. Le même genre de pompe que l’on peut encore trouver dans le commerce pour des souffleries ou divers engins pneumatiques. Le principe consiste à utiliser des pistons dans des cylindres munis de clapets anti-retour.

Le piston dans un sens expulse l’air et dans l’autre sens aspire l’air d’une enceinte dans laquelle on veut faire le vide. Ce genre de pompe n’est pas très efficace mais permet d’atteindre tout de même quelques torrs à quelques dixièmes de torr.

Pompes à palettes

La situation a commencé à s’améliorer au dix-neuvième siècle avec les besoins de l’étude de l’électricité (tubes à vides pour la décharge de gaz, lampes à incandescence).

Page 9: Le Vide.pdf

Au vingtième siècle la construction des pompes à palettes fut un grand succès. Elles sont efficaces, rapides et robustes. Elles permettent d’atteindre facilement un millième de torr.

En tournant, la palette aspire l’air venant de l’ouverture de gauche et le repousse dans l’ouverture de droite.

Pompes à diffusion

La pompe à diffusion est une pompe sans pièce mobiles.

Page 10: Le Vide.pdf

Un gaz chaud condensable (vapeur d’eau, d’huile) est injecté dans un tube coaxial. Ce gaz composé de molécules très rapides entraine les quelques molécules venant du tube à vide (les molécules rapides heurtent les molécules lentes et les entrainent vers le bas). Puis le gaz chaud se condense grâce à un réfrigérant, entrainant en même temps le gaz venant du tube à vide. Ce dispositif est extrêmement rapide et permet d’atteindre des vides relativement bons, à usage industriel par exemple, de l’ordre de torr (un millionième de torr).

Adsorption

Un autre moyen d’éliminer les traces résiduelles de gaz restant dans une enceinte consiste à adsorber les molécules sur un matériau adapté. Les zéolithes, par exemple, peuvent adsorber de grandes quantités de gaz.

Absorbeur à ionisation

Un procédé rapide et efficace permet d’atteindre ce que l’on nomme l’ultravide. Il consiste à envoyer un flux d’électrons (une décharge électrique, comme dans les tubes cathodiques ou les néons). Ces électrons ionisent les molécules résiduelles en leur arrachant les électrons par collision. Les ions ainsi formés peuvent être aisément canalisés par des dispositifs électriques ou magnétiques vers des électrodes constitués de matériau adsorbant, par exemple une anode en titane. Ce procédé permet d’atteindre des pressions de l’ordre de torr (un centième de milliardième).

Page 11: Le Vide.pdf

III. L’éther luminifère

L’éther Dans l’antiquité commença à émerger l’idée d’un milieu subtil emplissant tout. Ce milieu, nommé éther, était généralement associé au vide, ou plutôt à son absence, et à la lumière ou toute forme d’action à distance (comme la chaleur émise par les corps). Cet éther n’a évidemment rien à voir avec celui que l’on peut acheter en bouteille à la pharmacie ! Ces idées, principalement à caractère philosophique, évoluèrent longtemps sans support réellement scientifique. Les choses commencèrent à changer avec la naissance de la science moderne avec Galilée, Newton, Descartes,… Descartes, en particulier, imaginait le vide emplit d’un milieu subtil qui agissait comme une « action », un peu comme lorsque l’on pousse de loin un objet à l’aide d’un bâton.

Propriétés de la lumière La lumière commença à avoir un support scientifique avec les travaux de Newton. Celui-ci la voyait comme un flux de petits corpuscules colorés. Leur mélange donnant le blanc et leur absence le noir. Une découverte importante (Römer) fut que la lumière se propageait à grande vitesse (300000 kilomètres en une seconde), mais pas à une vitesse infinie. Mais c’est avec les travaux de Huygens et ses continuateurs que la lumière acquit ses lettres de noblesse. Ils considéraient que la lumière était une onde. Les ondes sont répandues dans tout l’espace et varient, éventuellement de manière périodique, dans l’espace et le temps. Des exemples typiques d’ondes sont les vagues, les vibrations des instruments à cordes, le son (vibrations de l’air). Les expériences sur la lumière mirent en évidence rapidement ses propriétés indubitablement ondulatoires. La théorie ondulatoire de la lumière vola de succès en succès.

L’éther luminifère A l’époque, les seules ondes connues étaient de nature « vibrations mécaniques », comme pour les cordes, par exemple. Si une grandeur est répandue partout dans l’espace et varie dans l’espace et le temps, c’est qu’un milieu quelconque manifeste cette grandeur. C’est ce milieu qui vibre. Il était difficile de concevoir autre chose à l’époque. Par exemple, pour les vagues, le milieu est l’eau. Pour les vibrations des cordes, c’est les cordes. Pour le son, c’est l’air. Mais quel était le milieu associé aux vibrations de la lumière ? La découverte du vide montra aussi que la lumière se propageait sans difficulté ni la moindre atténuation dans le vide. Il fallait donc imaginer un milieu subtil, indétectable par d’autres moyens, emplissant tout même le vide (qui alors ne l’était plus vraiment !) et qui était le support de ces vibrations : l’éther luminifère.

Page 12: Le Vide.pdf

Propriétés de l’éther Puisque la seule manière de connaitre l’éther est en tant que milieu de propagation des vibrations lumineuses, nous devons essayer d’en déduire les propriétés à partir de celles de la lumière. La première chose que l’on connait, c’est la vitesse de la lumière. La théorie sur les vibrations mécaniques (déformations élastiques des corps) montre que la vitesse de propagation d’une onde est liée à la rigidité du milieu. Plus le milieu est rigide, et plus une déformation de ce milieu se propage rapidement dans le milieu. Il est plus facile de plier une plaque d’acier (la déformation se propageant dans toute l’épaisseur de la plaque) que d’y laisser son empreinte en appuyant avec son doigt, comme on le ferait avec de la plasticine. Ainsi, les vibrations sonores se propagent à 300 mètres par seconde dans l’air. Mais elles se propagent à près d’un kilomètre par seconde dans l’eau, qui n’est pas rigide, mais qui est très difficilement compressible. Et à plusieurs kilomètres par seconde dans les roches, l’acier,… La vitesse de la lumière étant 300000 km/s, cela signifie que l’éther doit avoir une rigidité absolument énorme. Il doit être incroyablement difficile de le déformer. Un autre caractère de la lumière est utile. Il existe deux types d’ondes : les ondes transversales et les ondes longitudinales. Dans les premières, la vibration se produit perpendiculairement à la direction de propagation de l’onde. C’est typiquement le cas des vibrations d’une corde où le mouvement de la corde est perpendiculaire à celle-ci tandis que la vibration se propage le long de la corde. L’autre type d’onde est longitudinal : les vibrations se font dans le même sens que la propagation de l’onde. C’est le cas des ondes sonores ou les vibrations de l’air se font d’avant en arrière dans le sens de la propagation du son (variations de pression). Les vagues sont en fait un troisième type : des ondes de surface (interface eau – air) avec pour moteur la gravité. Ce n’est clairement pas le cas de la lumière qui peut se propager n’importe où et dans n’importe quelle direction. Les ondes transversales ne peuvent se propager que dans les milieux solides car il faut une certaine cohésion de la matière pour que le mouvement latéral de celle-ci entraîne le mouvement de la matière située juste après. Les expériences effectuées avec les ondes lumineuses (en particulier les propriétés de la polarisation) montrent que les vibrations lumineuses sont transversales (la polarisation correspondant en quelque sorte à la direction de la vibration, par exemple pour un rayon lumineux horizontal allant de l’arrière vers l’avant, la vibration peut–être de « gauche à droite » ou de « haut en bas », ou une direction intermédiaire). Cela signifie que l’éther doit être solide, ce qui va d’ailleurs de pair avec son extrême rigidité. Toutefois, l’éther n’interagit pas ou vraiment très peu avec les corps solide. Ainsi, les planètes tournent autour du Soleil, dans le vide, depuis des milliards d’années (la durée était encore mal connue par le passé, mais de toute manière fort importante) sans subir de ralentissement notable. De plus, la lumière se propage dans l’eau et le verre. On pourrait imaginer que le matériau prend le relais de l’éther et que celui-ci n’intervient plus comme milieu de propagation. Mais cela signifierait que les vibrations de l’éther peuvent se communiquer aisément à ces milieux, permettant à la

Page 13: Le Vide.pdf

vibration lumineuse de continuer à se propager. Cela est contradictoire avec l’affirmation précédente. Cela signifie que l’éther doit pénétrer tous les corps, comme si de rien n’était, et continuer à être le siège des vibrations lumineuses. Une absence totale d’interaction est toutefois impossible puisque la lumière se propage moins vite dans l’eau et dans le verre (typiquement à 200000 km/s). Le corps doit donc influencer quelque peu l’éther.

Ether statique ou entrainé ? Si le corps influence l’éther, la question peut se poser. Qu’est-ce qui se passe lorsque le corps est en mouvement dans l’éther. Un exemple typique est peut-être le mouvement de la Terre autour du Soleil. Trois cas sont possibles :

L’éther ne subit aucune influence due au mouvement du corps. Cela n’est pas incompatible avec la remarque que le corps influence la vitesse de la lumière car le corps pourrait avoir une influence sur la vitesse de propagation des vibrations sans nécessairement entraîner l’éther dans son déplacement. Dans ce cas, l’éther est immobile, du moins par rapport à une certaine référence. Il pourrait par exemple être immobile par rapport à la Terre à une certaine époque de l’année, mais pas tout le temps car la Terre n’a pas un mouvement rectiligne : elle tourne autour du Soleil. L’éther pourrait aussi être immobile dans le repère lié au Soleil.

L’éther est totalement entraîné par le corps dans son mouvement. Cela ne semble pas compatible avec l’extrême rigidité de l’éther. Toutefois celui-ci étant un milieu de nature inconnue, on pourrait imaginer que l’éther situé devant le corps en mouvement disparait et que de l’éther « créé spontanément » ou tout autre processus vient combler le vide laissé derrière le corps en mouvement. L’éther situé dans le corps étant entrainé.

Une situation intermédiaire est envisageable ou l’éther ne serait que partiellement entraîné par le corps.

Dans ces deux derniers cas, on peut se demander quelle est l’influence de la nature du corps : est-ce que l’éther est entrainé par l’air en mouvement, l’est-il moins que par du verre en mouvement, etc. ? La seule chose que l’on peut affirmer c’est que la propagation de la lumière doit être influencée par le mouvement de l’éther puisque la lumière est la vibration de ce milieu. Si le milieu se déplace, il entraîne les vibrations avec lui. C’est d’ailleurs ce que l’on constate avec les vibrations sonores (on entend mieux le son face au vent) ou avec les courants d’eau entraînant les vagues. De toute façon, puisque la lumière est le seul vecteur nous permettant de déterminer les propriétés de l’éther, on peut considérer celui-ci comme « la référence par rapport à laquelle se définit la vitesse de la lumière ». Qu’il existe un autre éther inconnu n’influençant pas la vitesse de la lumière ne nous concerne pas ici. Continuons notre promenade avec quelques expériences capitales ayant apporté des informations précieuses sur les mouvement de l’éther.

L’aberration stellaire En 1728, l’astronome Bradley désira observer la parallaxe des étoiles. La parallaxe est le décalage apparent dans la position des objets lorsqu’on les observe de deux points de vue, par exemple avec l’œil gauche ou l’œil droite. Ici, la position de la Terre autour du Soleil à six mois d’intervalle faisait office de changement de point de vue.

Page 14: Le Vide.pdf

Avec le mouvement de la Terre autour du Soleil, la position de l’étoile semble décrire une petite ellipse dans le ciel, ellipse de même forme et orientation que l’orbite terrestre. Cette méthode est actuellement un moyen simple et précis de mesurer la distance des étoiles proches. Mais l’effet est d’autant plus faible que l’objet observé est éloigné. A son époque, les moyens d’observations étaient insuffisant pour mesurer la parallaxe même pour les étoiles les plus proches (située à près de dix mille milliards de kilomètres). Il observa bien une ellipse mais ce qu’il découvrit fut l’aberration stellaire. L’ellipse parcourue par l’étoile se distingue de l’ellipse de parallaxe par son orientation. Qu’est-ce que le phénomène d’aberration ? C’est le changement dans la direction apparente d’un rayon lumineux à cause du mouvement de l’observateur. Vous avez tous observé ce phénomène avec la pluie. Lorsque vous être en voiture à l’arrêt, si la pluie n’est pas trop abondante et tombe bien verticalement, elle mouille modérément le parebrise. Par contre, dès que vous roulez, rapidement, la pluie chasse sur le pare-brise. C’est simplement dû au fait que l’on se déplace à la rencontre de la pluie.

Imaginons une bille tombant verticalement et un tube se déplaçant horizontalement, la bille passant dans le tube sans toucher les parois. Comme on le voit ci-dessus, cela n’est possible que si le tube est incliné. Par rapport au tube, la bille semble suivre une trajectoire inclinée (dans le tube). L’angle du tube est facile à calculer et est directement proportionnel à V/v où V est la vitesse du tube et v la vitesse de la bille. Notons que cela reste vrai avec des ondes ou tout moyen de propager un signal, l’effet observé est purement cinématique, dû aux directions et mouvements. Si la lumière a une vitesse finie, le même phénomène doit se produire. Si la lumière tombe verticalement, le mouvement de la Terre implique que la direction observée est légèrement inclinée. Cela provoque un décalage de la position des étoiles. Bien sûr, si toutes les étoiles sont décalées du même angle à tout instant, on ne pourrait rien constater simplement parce qu’on n’aurait rien à quoi comparer afin de mesurer ce décalage. Mais la Terre ne se déplace pas toujours dans la même direction ! Elle tourne autour du Soleil. Avec un intervalle de six mois, sa direction s’inverse. L’angle d’aberration s’inverse donc aussi.

Page 15: Le Vide.pdf

Le résultat est que l’étoile parcourt une petite ellipse dans le ciel. L’ellipse ne dépend pas de la distance de l’étoile et son orientation est légèrement décalée, ce qui permet de la reconnaitre. La mesure de Bradley donna un angle de 41’’ (un degré est égal à 60 minutes et une minute est égale à 60 secondes, notées 60’’). Connaissant la vitesse de la Terre, cela correspond à une vitesse de la lumière de 300000 km/s. La direction de l’aberration est strictement renversée tous les six mois pour une étoile à la verticale et identique au nord et au sud (étoile polaire et croix du sud). L’éther est donc immobile dans l’espace par rapport au Soleil et la Terre tourne dans cet éther donnant cet angle d’aberration. De plus, on n’observe pas d’autres déviations, de déformations des images, de mouvement apparent des étoiles, comme cela pourrait se produire si on observait à travers de l’eau turbulente. L’éther est donc parfaitement immobile. Il n’est pas entraîné, du moins pas dans l’entourage de la Terre ou par son atmosphère ou pas de manière perceptible.

Expériences de Fizeau Fizeau s’attacha à mesurer la vitesse de la lumière dans toutes sortes de circonstances, en particulier dans les milieux transparents et dans les milieux en mouvement. En particulier, la vitesse de la lumière dans un fluide est c/n où c est la vitesse de la lumière dans le vide et n l’indice de réfraction du fluide (permettant, par exemple, de calculer la déviation de la lumière passant de l’air dans le fluide). Ce que prédit en effet la théorie ondulatoire. Fizeau utilisa le dispositif suivant pour mesurer la vitesse de la lumière dans l’eau en mouvement :

Page 16: Le Vide.pdf

Un rayon lumineux est divisé en deux grâce à un miroir semi-transparent. A l’aide du prisme et du miroir, ces deux rayons lumineux parcourent le trajet dans l’eau dans les deux sens, une fois dans le même sens que le mouvement de l’eau (à vitesse V) une fois dans le sens inverse. Un oculaire permet de comparer les deux rayons et de déduire leurs vitesses (par l’étude des interférences entre les ondes). La formule trouvée par Fizeau pour la vitesse v de la lumière dans l’eau en mouvement à vitesse V montrait que la lumière était partiellement entrainée par le mouvement de l’eau. La formule trouvée était :

(

)

Le coefficient d’entraînement avait une forme curieuse dépendant de l’indice de réfraction. Fizeau n’essaya pas d’interpréter cette formule et se contenta de constater l’entraînement partiel.

Expérience de Michelson et Morley Puisque les expériences montraient que l’éther n’était pas entraîné par la Terre ou l’air (même l’expérience de Fizeau car pour l’air l’indice de réfraction est très proche de 1 donnant un entraînement quasiment nul) et comme la Terre était en mouvement dans l’éther, on devait détecter un « vent d’éther ». Ce mouvement de l’éther, par rapport au laboratoire, devant changer de sens tous les six mois. Cela voulait dire que la mesure de la vitesse de la lumière devait varier selon la direction et selon les saisons. Michelson et Morley s’attaquèrent à ce problème grâce au dispositif suivant.

Page 17: Le Vide.pdf

Un rayon lumineux est divisé en deux et effectue deux aller-retour entre des miroirs disposés à distance L. Si la vitesse de la lumière est légèrement différente selon la direction, la différence dans le temps de parcourt peut être détectée avec l’oculaire. Il est impossible de régler la distance L avec perfection, on effectue donc le réglage de manière à ne plus observer de différence avec l’oculaire puis on fait pivoter l’ensemble de 90° (l’ensemble étant posé sur un bain de mercure) de façon à inverser l’influence du vent d’éther sur les deux trajets. L’expérience peut être effectuée pour différentes directions, à différentes saisons. On a même effectué l’expérience dans des ballons en altitude ou sur des véhicules en mouvement. Dans tous les cas le résultat était négatif : pas de vent d’éther. Ce qui signifie que l’éther est totalement entrainé dans le voisinage de l’appareil.

Un éther bien contradictoire Tous ces résultats sont contradictoires. Plus les expériences s’accumulaient et plus les propriétés de l’éther semblaient paradoxales. L’éther perdait toute substance ! Même si on considère l’éther simplement comme la référence par rapport à laquelle définir la vitesse de la lumière, les résultats étaient contradictoires. Tout cela semblait incompréhensible. L’éther semblait inexistant, le vide reprenait ses droits, mais avant de présenter les solutions à ces résultats, voyons ce que la lumière elle-même peut nous dire.

Page 18: Le Vide.pdf

IV. Le champ électromagnétique

Champs électriques et magnétiques On trouve dans la nature des objets chargés électriquement ainsi que des aimants. Les charges électriques peuvent se classer en charges négatives et en charges positives. Les aimants possèdent un pôle nord et in pôle sud. Les charges électriques de même signe ainsi que les pôles de même nature se repoussent, tandis que ceux de signes opposés s’attirent. Ce phénomène se transmet par l’intermédiaire d’un champ, c’est-à-dire une grandeur prenant des valeurs en tout point de l’espace et pouvant varier autant dans l’espace que le temps. Les charges électriques sont la source du champ électrique et les aimants sont la source d’un champ magnétique. On peut aisément visualiser ces champs avec, par exemple, de la limaille de fer. Ces champs sont caractérisés par une intensité, en chaque point, mais aussi par une direction. Ce qu’on peut représenter par une flèche. A titre d’exemple, voici les champs électriques émis par des charges électriques :

Page 19: Le Vide.pdf

Les charges électriques sont également sensibles aux champs électriques, ce qui explique les propriétés d’attraction et de répulsion. Voici par exemple les champs électriques lorsque l’on a deux charges :

Et voici le champ magnétique émit par un aimant :

Page 20: Le Vide.pdf

L’important est que ces deux champs ne sont pas indépendants. Ainsi, une charge électrique en mouvement peut être déviée par un champ magnétique. De même, une charge électrique en mouvement crée non seulement un champ électrique mais aussi un champ magnétique. Mais il y a mieux. Imaginons une charge électrique immobile par rapport à nous. Ce que nous voyons (par diverses mesures) est un champ électrique émit par la charge et pas de champ magnétique. Maintenant, considérons toujours la même charge dans la même situation, mais c’est nous qui nous déplaçons. Dans ce cas, nous allons observer un champ électrique et un champ magnétique ! La forme du champ électrique ou magnétique dépend autant de sa source que de l’observateur. Cela montre que ces deux champs sont seulement les deux facettes d’un seul et même champ (plus complexe) appelé champ électromagnétique. Notons en passant que l’on obtient le même résultat avec une charge en mouvement ou avec un observateur en mouvement. Ce qui compte est la vitesse relative entre la charge et l’observateur. C’est une manifestation du principe de relativité sur lequel nous reviendrons.

Théorie de Maxwell Maxwell, au dix-neuvième siècle, réussi à réunir l’ensemble des propriétés et lois décrivant les phénomènes électriques et magnétiques en un tout cohérent et élégant. L’ensemble tient en cinq équations (après les remaniements de ses successeurs dont Heaviside). Quatre équations décrivent les comportements des champs en fonction des sources (charges, aimants,…) et donnent leur variation dans l’espace et le temps et une équation décrit comment une charge électrique est influencée par le champ électromagnétique. Ce sont les quatre premières équations qui vont nous intéresser. Inutile d’entrer dans le détail ni même de présenter chacune des équations. Les résultats nous suffirons. Disons juste que ces équations sont très largement validées par l’expérience, dans tous les domaines et avec une très grande précision. Elles sont à la base du fonctionnement des

Page 21: Le Vide.pdf

télécommunications, des moteurs électriques, des dynamos et alternateurs, des transformateurs et de bien d’autres dispositifs.

Ondes électromagnétiques Les équations de Maxwell admettent des solutions sous forme d’ondes électromagnétiques qui se propagent. Dans ces ondes les champs électriques et magnétiques ont cet aspect :

La lumière n’est rien d’autre qu’une onde électromagnétique. Il en est de même de bien d’autres phénomènes tel que les ondes radios et les rayons X. La seule différence entre ces ondes est la longueur d’onde (ou la fréquence d’oscillations).

Page 22: Le Vide.pdf

Un point important est à préciser. Contrairement à ce que pourrait laisser croire le dessin de l’onde électromagnétique, il n’y a aucune oscillation latérale de l’onde. Les flèches transversales représentent seulement la direction des champs électriques et magnétiques sur la ligne de propagation de l’onde et l’oscillation qui est représentée est seulement la variation de l’intensité des champs électriques et magnétiques en ces points. Il n’y a donc aucune vibration. L’onde électromagnétique est un champ électromagnétique qui se propage avec des valeurs variant périodiquement des champs électriques et magnétiques. Cela explique en partie ce que nous avons vu. Nul besoin d’un milieu pour la propagation, pas besoin d’un éther luminifère. La lumière n’est pas la vibration d’un autre milieu.

Permitivité et perméabilité Dans les équations de Maxwell, quatre champs sont importants :

- Le champ électrique, vu plus haut, noté E. - Le champ magnétique, vu également, noté H.

Page 23: Le Vide.pdf

- L’induction électrique, notée D. - L’induction magnétique, notée B.

En effet, dans la matière (par exemple dans du verre, dans de l’eau), les champs électromagnétiques se comportent différemment et ces effets sont traduits par ces champs. Ils dérivent en fait directement des précédents. Le rapport est donné par :

- -

est appelé permitivité électrique et c’est une grandeur caractéristique du milieu considéré. De même pour appelé perméabilité magnétique. Dans le vide on a :

- -

Avec la permitivité électrique du vide et la perméabilité magnétique du vide. On note aussi les permitivités et perméabilités relatives : et . La vitesse des ondes électromagnétiques est donnée directement par la permitivité et la perméabilité. On a √ et √ ..

Ce qui veut dire aussi que d’après cette théorie, la vitesse de la lumière est toujours la même : constante (ne varie pas dans le temps) et invariante (ne dépend pas de l’observateur et de son mouvement), ce que confirme l’expérience (cela peut se déduire en partie des expériences que nous avons vues mais aussi de bien d’autres mesures plus directes de cette vitesse).

Propriétés dans le vide Les résultats précédents laissent entendre que le vide n’est pas un milieu anodin et qu’il présente des propriétés qui lui donnent un caractère « matériel », un peu comme l’éther. Ainsi, il possède une permitivité et une perméabilité. Mais avant de sauter trop vite aux conclusions, il vaut mieux se pencher sur ces deux grandeurs et se demander quel est leur origine physique. Si le champ électrique agit différemment dans un milieu, d’où l’usage de l’induction, c’est à cause de la polarisation du milieu matériel. Sous l’influence du champ électrique, les charges électriques présentes dans le matériau vont se déplacer. Ces charges ayant changé de place elle vont créer leur propre champ électrique P :

Page 24: Le Vide.pdf

On a alors : De même, un champ magnétique va provoquer un mouvement des petits aimants atomiques (chaque atome se comporte comme un petit aimant) provoquant l’apparition d’une aimantation M. Le résultat est : Ce qui importe donc physiquement, ce n’est pas les permitivités et les perméabilités mais la polarisation et l’aimantation. Ce sont les phénomènes qui caractérisent physiquement le milieu. Un peu de travail donne :

- ( ) - ( )

Ce qui caractérise physiquement les propriétés du milieu ce sont ses capacités de polarisation et de magnétisation données par et . Or, pour le vide, ces valeurs valent zéro. Le vide se caractérise, du point de vue électromagnétique, par une absence de propriété physique. Le vide est bien vide. Au moins pour l’électromagnétisme. Pourquoi alors ces valeurs particulières pour la permitivité du vide et la perméabilité magnétique. En fait, ces valeurs résultent de choix des unités de mesure. En particulier la mesure des vitesses (par exemple en mètres par seconde) et les mesures électriques et magnétiques. On peut parfaitement choisir de mesurer les champs et leurs inductions dans les mêmes unités, ce qui donne et , les relations précédentes reviennent alors à dire que dans le vide le champ électrique et le champ magnétique sont inaltérés. Les champs électriques et magnétiques ne sont pas indépendant, nous l’avons vu, et ils sont une manifestation du champ électromagnétique. Si l’on veut faire ce choix d’unités, cela force, étant donné les relations entre les différentes grandeurs, à choisir des unités telles que (par exemple en mesurant les longueurs en « secondes lumières », qui valent 300000 km, la vitesse de la lumière dans le vide est simplement une seconde lumière par seconde).

V. La relativité restreinte

Repères Pour pouvoir faire des mesures, des expériences, des études de phénomènes physiques, il est nécessaire de donner de valeurs numériques précises aux positions et aux instants auxquels se

Page 25: Le Vide.pdf

produisent les phénomènes. Cela se fait en utilisant des repères précis par rapport auquel on détermine la position des objets. Un exemple bien connu est le système des latitudes et longitudes qui repèrent les lieux par rapport à la Terre. En plus de repérer les positions, on détermine les instants à l’aide d’horloges. Considérons deux observateurs A et B, chacun équipés de son horloge. Par facilité, nous

considérerons la situation suivante.

L’observateur A est situé au point O, il utilise trois directions (x, y et z non représenté) pour identifier

la position de chaque objet ou événement auquel il attribue ainsi trois coordonnées x, y et z. Il a aussi

une horloge indiquant le temps t. Ce système de repérage constitue son repère (K) par rapport

auquel il peut donner des coordonnées (position et instant) précis à chaque événement. Nous avons

l’habitude de tels repères quand on dit « la colline est à trois kilomètres de ma maison » ou « l’île se

situe à 45° de longitude ouest avec le méridien de Greenwich », anciennement on utilisait le

méridien de Paris).

De même, l’observateur B est situé au point O’ et utilise les trois directions (axes) x’, y’, et z’ et il

dispose d’une horloge indiquant le temps t’. Le repère sera noté K’. Les axes sont disposés comme

sur la figure.

L’observateur B est en mouvement par rapport à A à la vitesse V, qui est aussi la vitesse de O’ par

rapport à O (ou de O par rapport à O’ avec renversement du sens de la vitesse) ou la vitesse de K’ par

rapport à K. Lorsque les points O et O’ coïncident, on choisit les coordonnées du temps telles qu’à cet

instant t = t’ = 0 (c’est juste une question de facilité).

Par exemple, A pourrait être immobile sur le quai d’une gare et B pourrait être dans un train où il

effectue toutes ses mesures par rapport à sa propre position.

Seule les variables x, t et x’, t’ seront utilisées ci-dessous.

La relativité restreinte La relativité utilise deux postulats :

Principe de relativité restreinte : tous les repères inertiels sont équivalents. Un repère inertiel est un repère en mouvement à vitesse constante où l’on ne ressent aucune accélération et où les lois classiques de la mécanique (les lois de Newton) sont valides.

Page 26: Le Vide.pdf

Ce principe signifie que les lois physiques décrivant les phénomènes doivent garder la même forme quel que soit le repère utilisé pour les formuler. Cela ne signifie évidemment pas que ces repères sont identiques et que tout ce qui s’y passe aussi. Par exemple, notre observateur A sur voit le train en mouvement tandis que B considère que le train ne bouge pas par rapport à lui. Ce principe est en fait assez naturel. Il est difficile d’imaginer un repère absolu, spécial, par rapport auquel repérer les événements. Par exemple, on pourrait dire que A a un « meilleur » repère que B car il est immobile tandis que B est dans un train. Mais le repère de A est-il si bon ? Après tout la Terre n’est pas immobile, elle tourne autour du Soleil. Et l’ensemble Terre – Soleil tourne autour de la Galaxie. En réalité, il n’y a pas de repère absolu. Il n’y a que des choix arbitraires, humains. C’est nous qui choisissons de déterminer les positions par rapport à tel ou tel repère. Ce choix n’influence évidemment pas la manière dont les phénomènes physiques se produisent (un passager sur le quai laisse tomber son billet : ce phénomène se produit autant du point de vue de A que de B). Ce choix n’influence que la manière de décrire le phénomène. On souhaite donc que cette description soit la plus universelle possible et ne dépende pas du repère. Le choix des repères inertiels est un choix restreint, d’où le nom de relativité restreinte. On généralisera plus tard.

La vitesse de la lumière dans le vide, c, est constante et invariante. Cela signifie que cette vitesse ne varie pas au cours du temps et qu’elle est identique pour tout observateur. Cette vitesse a été mesurée dans de nombreuses circonstances et à l’aide de nombreux moyens. Ce postulat est vérifié expérimentalement avec une précision extrêmement grande (à tel point qu’on se sert maintenant de la vitesse de la lumière pour définir le mètre étalon pour la mesure des longueurs). La vitesse de la lumière ne dépend pas du mouvement de l’émetteur ni du récepteur. En physique classique, cela peut sembler étrange. En effet, si l’observateur B émet un rayon lumineux vers l’avant du train et que ce rayon se déplace à la vitesse c par rapport à lui, on s‘attend à ce que la vitesse du rayon lumineux mesurée par A soit V + c. Ce n’est pas ce qui est expérimentalement constaté. De toute évidence, la simple addition des vitesses ne marche pas lorsque l’on envisage des vitesses très élevées comme celle de la lumière. Comme la vitesse n’est rien d’autre qu’une certaine distance parcourue en un certain temps, cela signifie qu’il doit y avoir des changements dans les concepts d’espace et de temps. Ces changements ne nous concernent qu’indirectement, puisque nous nous intéressons au vide. Toutefois, nous allons en dire un peu plus car comprendre le vide en relativité restreinte nécessite tout de même de savoir certaines choses sur la relativité. De plus, ce que nous verrons se généralisera lorsque l’on étudiera le statut du vide en relativité générale.

La mesure de l’espace peut se faire en utilisant des règles étalons disposées de la manière indiquée pour les repères ci-dessus. La mesure du temps peut se faire en utilisant des horloges. Il reste un détail important à régler. Comme on a deux observateurs, on a deux horloges. Comment

les synchroniser ? En fait, comme les observateurs vont noter des phénomènes se produisant à

différents endroits, il faut aussi se poser la question : comment mesurer le temps à un endroit

différent de O ou O’ ?

Page 27: Le Vide.pdf

Pour cette deuxième question on peut, au moins par la pensée, disposer des horloges un peu partout

de façon à en avoir une à chaque endroit où l’on désire mesurer le temps. Il reste donc la question de

synchronisation des horloges. Voici une procédure possible (procédure d’Einstein, plusieurs

procédures sont possibles et elles sont équivalentes au prix, éventuellement, d’une redéfinition des

coordonnées).

Pour A, on dispose un ensemble d’horloges immobiles par rapport à A. C’est-à-dire que les

coordonnées x, y, z de chaque horloge ne varient pas au cours du temps. Ainsi, la distance

entre O et chaque horloge peut être mesurée en utilisant le repère et cette valeur ne change

pas.

A synchronise alors toutes ses horloges avec l’horloge H située en O. Pour ce faire, il envoie

des signaux entre les horloges en tenant compte du temps de propagation du signal entre

chaque horloge. S’il utilise la lumière, connaissant la distance entre les horloges et

connaissant la vitesse de la lumière, le temps de propagation est facile à calculer. Ainsi,

l’ensemble des horloges mesurera un temps t concordant dans l’ensemble du repère K.

B peut faire de même avec des horloges immobiles par rapport à O’ (donc différentes de

celles utilisées par A même si d’aventure elles peuvent se croiser) et il les synchronise par

rapport à son horloge H’ située en O’.

Pour pouvoir comparer les mesures effectuées par A et B, il reste à synchroniser les horloges

H et H’. La définition des repères ci-dessus en donne la clef. Au moment où O et O’ se

croisent, les horloges H et H’ sont situées au même endroit. On peut aisément les

synchroniser en réglant t = t’ = 0, puis A et B synchronisent les autres horloges comme

expliqué ci-dessus.

Avec les conventions précédentes, la théorie de la relativité restreinte donne les règles permettant de relier les variables x, t et les variables

x’, t’ pour un événement donné E mesuré à la fois par A et B. La relation entre les variables est donnée par les transformations de Lorentz :

( )

(

)

Le facteur gamma vaut :

Sans entrer dans les détails techniques, notons deux choses importantes :

Il entre dans les différentes relations en relativité, un facteur, appelé « facteur gamma » ( )

qui est environ égal à un pour des vitesses V faibles et qui diverge lorsque V tend vers c. La

valeur de gamma ne diffère de un que pour des valeurs notables de V par rapport à la vitesse

Page 28: Le Vide.pdf

de la lumière. Ainsi, même à 100000 km/s, gamma vaut seulement 1.06.

En général, pour un événement donné E, on aura , même si l’on a synchronisé les

horloges.

L’addition des vitesses L’utilisation des règles permettant de passer des coordonnées d’un repère à l’autre (les transformations de Lorentz donnée plus haut) on peut trouver les règles à utiliser pour composer des vitesses. Soit v la vitesse d’un objet (se dirigeant le long de l’axe x, pour simplifier) mesurée par A. Si la vitesse mesurée par B est v’, alors la physique classique nous dit que . Mais nous savons que ce n’est pas vrai. Il y a une petite différence. La formule montre que c est invariant. Mais elle permet aussi de retrouver les résultats observés par Fizeau, montrant ainsi qu’il n’est nul besoin de faire appel à un « entrainement partiel ». L’utilisation des transformations de Lorentz donne :

On voit que si ou si , alors . Ce qui est compatible avec l’invariance de c. Supposons que V soit la vitesse de l’eau dans l’expérience de Fizeau. La vitesse de la lumière dans l’eau vaut c/n. L’utilisation de la formule ci-dessus permet d’obtenir le résultat suivant (en effectuant une approximation pour ne garder que les termes proportionnels à V ou à V/c mais pas les termes proportionnels à V/c², trop petits, en tout cas pour la précision des mesures de Fiezau.

(

) (

)

(

)

L’espace-temps Considérons la grandeur s² = c²t² – x². Elle définit ce qu’on appelle un intervalle relativiste. Plus

exactement, elle donne l’intervalle entre l’origine O (à t = 0) et un événement E de coordonnées (x,

t). On peut aisément généraliser cette relation à deux événements quelconques ou lui donner une

forme « infinitésimale ».

Page 29: Le Vide.pdf

Les intervalles peuvent être classés en trois catégories dont l’intérêt en relativité est immédiat :

Intervalle lumière. Dans ce cas s² = 0. On en tire c²t² - x² = 0, c’est-à-dire x² = c²t² ou encore x

= ct (à un signe près). C’est-à-dire que la distance séparant O et E (x) est égale au temps

séparant les deux événements (t) multiplié par la vitesse de la lumière.

O et E peuvent donc représenter deux événements qui seraient reliés par un signal lumineux

(le sens est donné par le signe de ). D’où le nom de l’intervalle.

Intervalle de type espace. Dans ce cas, s² < 0, c’est-à-dire x > ct. Il est clair qu’aucun signal ne

peut lier les événements O et E puisque la distance qui les sépare est supérieure à la distance

que pourrait parcourir la lumière. On parle alors d’intervalles de type espace ou d’intervalle

spatial. Par exemple, deux événements simultanés ont une séparation temporelle de zéro,

par définition. Donc, s’ils ne sont pas situés par au même endroit, ils sont forcément séparés

par un intervalle spatial.

Intervalle de type temps. Il reste le dernier cas s² > 0, c’est-à-dire x < ct. C’est le cas où un

signal lumineux parcoure une distance plus grande que celle qui sépare les deux

événements. On peut donc joindre les deux événements par tout signal plus lent que la

vitesse de la lumière, par des particules ou tout corps matériel suffisamment rapide. Grâce à

cet échange on peut fixer un ordre de succession temporel aux deux événements. Avec le

signe choisi, x < ct, E se produit après O. D’om le nom de l’intervalle. En particulier, pour

deux événements se produisant au même endroit (dans un repère donné), l’intervalle est

simplement la durée s’écoulant entre les deux événements.

Un point très important en relativité restreinte est que l’on peut montrer que :

L’intervalle entre deux événements est invariant.

C’est-à-dire que sa valeur, et dons, la catégorie auquel il appartient, est la même pour tout

observateur, dans tout repère.

On constate aussi un aspect très important dans la notion d’intervalle :

L’espace et le temps sont mêlés ensemble.

Bien qu’il y ait toujours une notion invariante d’ordre de succession temporelle des événements

(séparés par un intervalle de type temps), on ne peut pas considérer le temps seul, indépendamment

de l’espace.

On arrive ainsi au concept d’espace-temps, c’est-à-dire d’un espace (au sens général) où chaque

point représente un événement repéré par des coordonnées spatiales et temporelle. On l’appelle

espace-temps de Minkowski.

On peut aisément tracer un diagramme de l’espace-temps où l’on représente en abscisse la position

(x) et en ordonnée le temps (t). Comme pour les diagrammes tracés plus haut. Considérons un tel

diagramme, tracé pour un repère K donné et en fonction d’un événement E particulier donné , placé

par commodité à l’origine des axes :

Page 30: Le Vide.pdf

Les lignes rouges décrivent les trajectoires de rayons lumineux (dans le vide) issus de l’événement E

(ou aboutissant à l’événement E pour la partie inférieure du diagramme). On les appelle cône

relativiste ou cône de lumière. En effet, si l’on utilise deux directions spatiales (x et y) les trajectoires

des rayons lumineux forment un cône dans un diagramme (x, y, t) (à trois dimensions).

On peut distinguer plusieurs régions, directement données par la valeur de l’intervalle relativiste. Les

régions I et II forment le lieu des événements E’ dont l’intervalle E-E’ est de type temps, c’est-à-dire

que ces événements peuvent être liés à E par un signal moins rapide que la lumière.

La région III forme le lieu des événements séparés de E par un intervalle spatial.

La région I est située dans le futur de E et la région II constitue le passé de E.

En bleu, nous avons tracé une trajectoire possible pour un signal ou un objet passant par E (il passe à

l’endroit où E se produit à l’instant où E se produit). Dans un diagramme espace-temps, on l’appelle

ligne d’univers de l’objet.

Ce qui est important est la structure ci-dessus reste invariante lorsque l’on passe d’un repère K à un

repère K’. Du fait que c est invariant, le cône reste invariant, et même si d’autres points peuvent

changer de place en passant de K à K’ (relativité des positions et du temps), ils restent dans la même

région. Cela simplifie les raisonnements.

La vitesse de la lumière et le vide Revenons au vide. Puisque la vitesse de la lumière est invariante, elle ne peut servir de référence pour identifier un état de repos ou en mouvement du vide. Le vide est invariant, c’est-à-dire identique quel que soit l’état de mouvement.

Page 31: Le Vide.pdf

Même la valeur numérique de c ne constitue pas une information sur le vide. Nous l’avons déjà vu avec l’électromagnétisme et c’est tout aussi flagrant en relativité où les seules grandeurs qui interviennent sont de la forme v/c. Ce qui compte est le rapport entre la vitesse des objets et celle de la lumière, pas la valeur numérique proprement dite de v ou de c qui ne dépend que du choix des unités. La valeur de c est omniprésente et là aussi c’est toujours les rapports v/c qui compte. Les propriétés et les vitesses des corps n’ont de valeur importante que comme « un certain pourcentage de la vitesse de la lumière ».

La valeur de la vitesse de la lumière Notons que ce qui est important en relativité n’est pas la lumière. Ce qui importe est l’existence d’une vitesse c invariante. Le fait que la vitesse de la lumière dans le vide n’est en soit pas l’élément fondamental. La lumière n’a d’importance que :

Comme fait historique. C’est à travers l’histoire de l’étude de la lumière que la relativité est née.

La lumière est un outil expérimental très pratique pour transmettre des signaux, faire des mesures,…

Comme les effets de la relativité se manifestent surtout pour de grandes vitesses, disposer d’un phénomène, la lumière, se propageant à la vitesse c est utile en relativité.

D’ailleurs, dans un milieu matériel (eau, verre) la lumière va moins vite que c, mais la relativité restreinte reste valide et utilise toujours la valeur de c, pas la valeur de la vitesse de la lumière dans ce milieu. Dans un tel milieu, d’ailleurs, la vitesse de la lumière n’est pas invariante et obéit à la loi de composition des vitesses que nous avons vues et cela explique les résultats de Fizeau. Pourquoi la lumière a-t-elle la vitesse c dans le vide ? La relativité permet de montrer qu’un corps sans masse (ce qui est le cas de la lumière) se propage toujours à la vitesse c, si du moins rien ne gêne sa progression. Dans un milieu matériel comme l’eau ou le verre, les interactions électromagnétiques avec les atomes ralentissent la lumière. Mais dans le vide, il n’y a rien qui puisse gêner sa progression. La relativité achève également d’expliquer les effets observés dans la recherche de l’éther. Cette fois, plus besoin du tout d’un éther luminifère que l’on ne détecte de toute façon pas. Le vide est vraiment vide.

VI. La relativité générale La relativité générale est la généralisation de la relativité restreinte à tous les repères, mêmes

accélérés et pour des accélérations quelconques, y compris non uniformes.

Elle inclut les effets de la gravitation.

C’est une théorie assez vaste et difficile, autant d’un point de vue conceptuel que par ses outils

mathématiques. On ne fera que l’esquisser sans entrer dans le détail des déductions. Nous

présenterons juste ce qui permet de comprendre le statut du vide en relativité générale ainsi que

comme introduction aux aspects de la mécanique quantique en présence de la gravité.

Page 32: Le Vide.pdf

De la relativité restreinte à la relativité générale Considérons un point, ou plus exactement un événement. On peut toujours construire un système de

coordonnées tel que dans le voisinage immédiat (autant spatial que temporel) de cet événement, la

relativité restreinte s’applique.

Mais cette propriété ne peut pas s’étendre partout. Il est impossible, en général, de trouver un

système de coordonnées tel que la relativité restreinte garderait sa forme en tout point.

Plus précisément, la géométrie de l’espace-temps n’est plus décrite par un espace de Minkowski où

les droites sont… droites ! L’espace-temps est courbe (pas l’espace tout seul, mais bien l’ensemble).

Comme peut l’être une surface :

Sauf qu’une surface est à deux dimensions (deux coordonnées suffisent pour repérer un point sur la

surface) tandis que l’on parle ici d’espaces à quatre dimensions (trois coordonnées spatiales et une

de temps). Il est clair qu’il est difficile de se représenter de tels objets que l’on appelle aussi des

variétés.

En chaque point de cette variété courbe on peut construire un espace-temps tangent (c’est la

généralisation d’une droite tangente à une courbe ou d’un plan tangent à une surface courbe). Cet

espace-temps tangent n’est autre que l’espace-temps de Minkowski.

Parlons plus physiquement. Le principe d’équivalence affirme que la masse inerte (celle de la loi

d’inertie de Newton) est égale à la masse pesante (celle de la loi sur la gravitation). Par conséquent

tous les corps tombent à la même vitesse (plus exactement avec la même accélération de

pesanteur), pour peu qu’ils soient suffisamment petits (pour avoir une gravité uniforme) et

suffisamment légers (pour ne pas eux-mêmes attirer la Terre !). Si l’on est dans un ascenseur qui en

chute libre (le câble s’est rompu) alors on est en apesanteur (jusqu’au crash final en bas). Si on lâche

son stylo, celui-ci tombant à la même vitesse que nous et l’ascenseur, il va « flotter » à nos côté. Ce

type d’expérience est régulièrement mené avec des avions qui coupent leurs moteurs (vols

balistiques) pour y effectuer des expériences (courtes) en apesanteur ou pour l’entraînement des

astronautes (et même parfois pour filmer des acteurs en apesanteur pour un film).

C’est en utilisant ce type de raisonnement qu’Einstein a montré que le principe d’équivalence

impliquait qu’il y avait équivalence locale entre la gravité et un repère accéléré. Plus précisément, si

on attache un repère à cet objet en chute libre, il décrit localement un espace-temps de Minkowski,

comme expliqué plus haut.

De proche en proche on peut alors construire la variété complète de l’espace-temps, courbe en

général en présence d’une gravité non constante et uniforme.

Page 33: Le Vide.pdf

On montre aisément que les trajectoires suivies par les objets en chute libre, c’est-à-dire sans force

appliquée sur l’objet (autre que la gravité), sont les géodésiques de la variété. Ces géodésiques sont

les généralisations des droites des espaces sans courbure. Les géodésiques sont le chemin le plus

court entre deux points (de l’espace-temps).

On peut l’illustrer dans un cas plus simple. Considérons une sphère :

On peut tracer sur cette sphère des grands cercles, appelés comme ça car ce sont les plus grands

cercles que l’on peut tracer sur la sphère. Chacun sépare la sphère en deux parties égales. Des

exemples sur Terre sont l’équateur ou les méridiens (mais pas les parallèles autres que l’équateur).

Les grands cercles sont les géodésiques de la sphère.

Il est facile de voir que sur une sphère, le chemin le plus court entre deux points est un arc de grand

cercle. C’est le chemin généralement suivi par les navires ou les avions sur de grandes distances (à

des écarts près liés aux vents, aux courants, aux frontières de pays à risque, à la préférence du vol au-

dessus des terres et le respect des couloirs aériens).

Considérons maintenant un observateur de très petite taille placée sur la sphère et observant une

route. Par exemple une fourmi ou même un humain en général tant qu’il ne regarde pas trop loin

vers l’horizon. Le sol lui parait bien plat et la route bien droite. Mais si on prolonge la route, on finit

par faire le tour de la Terre et par tracer un grand cercle. Les géodésiques sont la généralisation

naturelle des droites à des espaces courbes.

La courbure de l’espace-temps La courbure de l’espace-temps est, comme nous l’avons dit, difficile à se représenter.

Nous, humains, qui sommes habitué à l’espace qui nous entoure et qui se représente avec une très

bonne approximation par un espace euclidien (l’espace habituel, sans courbure et avec la géométrie

que l’on apprend à l’école), nous avons tendance à nous représenter les variétés courbes comme

Page 34: Le Vide.pdf

étant plongées dans l’espace ordinaire (ou tout espace avec plus de dimensions que la variété). Par

exemple, une courbe tracée sur une feuille, un ballon ou un cylindre posé sur la table devant nous.

Malheureusement, plonger une surface courbe dans un espace plus grand est trompeur, car ce qui

nous importe ici est la courbure intrinsèque et non la courbure extrinsèque. Voyons ça d’un peu plus

près.

Considérons une ligne droite graduée. Si on la tord, sans l’étirer ni la contracter, par exemple comme

avec une ficelle ou un mètre ruban, voici ce qu’on obtient :

La courbure ainsi obtenue de la ligne est une courbure extrinsèque. Elle est liée non pas à la ligne

elle-même mais à son parcourt dans l’espace où on l’a dessinée. Toute la structure de la ligne elle-

même, indépendamment du reste de l’espace, est donnée par les graduations tracées sur la ligne et

qui donnent, par exemple, la distance entre deux points en suivant la ligne. Cette distance est

indépendante de la manière d’enrouler la ligne. Une ligne n’a jamais de courbure intrinsèque, elle

est, de ce point de vue, équivalente à une droite.

Un bon moyen d’étudier la géométrie d’une surface est d’y tracer un triangle (dont les côtés sont des

géodésiques). Nous avons tous appris à l’école que la somme des angles aux sommets du triangle est

égale à 180°. Traçons un tel triangle à la surface d’une sphère.

Ici nous avons tracé un triangle assez grand, obtenu par exemple avec l’équateur et deux méridiens à

90°. Les angles au sommet du triangle sont tous des angles droits et la somme des angles vaut 270°.

Page 35: Le Vide.pdf

La différence avec 180° est appelée excès sphérique. Si l’on divise l’excès sphérique par la surface du

triangle, on obtient le rayon de courbure qui n’est autre que le rayon de la sphère. Si la courbure

n’est pas constante (forme irrégulière) on fait le calcul en prenant des triangles de plus en plus petits

pour obtenir la courbure en un point.

Il existe aussi le cas de la géométrie hyperbolique où la courbure est négative (typiquement, le col

d’une selle de cheval). Ici on dit que la sphère a une courbure intrinsèque liée à sa géométrie

sphérique.

Si l’on fait le même exercice avec la surface arrondie d’un cylindre, on constate que la somme des

angles d’un triangle fait toujours 180°. Donc le cylindre n’a pas de courbure intrinsèque ! Il a une

courbure extrinsèque et on peut voir qu’il est équivalent à un plan simplement en fendant le cylindre

(dans le sens de la longueur) et en le déroulant comme une feuille. Cette opération n’est pas

réalisable avec la sphère qui ne peut pas être aplatie sans être déformée ou déchirée en tout point.

En relativité générale, on parle de la courbure intrinsèque de la variété à quatre dimensions. C’est

évidemment difficile à visualiser. On peut et on doit faire abstraction d’un hypothétique espace

contenant la variété courbe.

A quatre dimensions, la situation est plus complexe et au lieu d’avoir une seule valeur pour la

courbure comme pour la sphère, il faut 20 valeurs de courbure. L’objet mathématique rassemblant

ces 20 paramètres est appelé tenseur de courbure de Riemann-Christoffel et on en déduit d’autres

objets mathématiques tel que le tenseur de Ricci ou la courbure scalaire (analogue au rayon de

courbure).

Les paramètres de la courbure peuvent être identifiées avec la déviation géodésique (le fait que

deux géodésiques qui se côtoient vont s’écarter progressivement) ou avec les forces de marrées.

Inutile d’entrer trop dans les détails. Donnons juste les éléments principaux de la théorie.

La variété est une variété riemannienne à quatre dimensions de signature (+---). On choisit un système de coordonnées { } sur la variété ou

sur une carte d’un atlas recouvrant la variété.

L’intervalle relativiste est donné par l’élément de ligne :

Où est le tenseur métrique (ici donné en composantes). Il peut servir à lever ou abaisser les indices covariants et contravariants.

Symboles de Christoffel :

(

).

Equation des géodésiques :

où est un paramètre curviligne le long de la géodésique.

Tenseur de courbure Riemann –Christoffel :

.

Tenseur de Ricci :

.

Courbure scalaire :

.

Tenseur d’Einstein : (

).

Equation d’Einstein : où G est la constante de gravitation universelle et est le tenseur énergie-impulsion de la matière.

La forme exacte de la variété dépend de la distribution de matière et énergie à l’origine de la force

gravitationnelle. La relation est donnée par l’équation d’Einstein qui relie la courbure de l’espace-

temps à la densité de matière et d’énergie.

Page 36: Le Vide.pdf

Selon la distribution de matière, on obtient des solutions différentes. Par exemple, pour une

distribution de matière concentrée et à symétrie sphérique, des solutions possibles sont la géométrie

de Schwartzchild (décrivant une variété décrite par une métrique de Schwartzchild, la métrique est

la description des relations entre coordonnées) ou la géométrie de Kerr.

Le champ gravitationnel autour du Soleil est assez proche de ce genre de solution.

Le champ gravitationnel On peut voir le champ gravitationnel comme ce qui permet à un corps d’attirer un autre, tout comme les champs électriques et magnétiques. Ici, le champ gravitationnel peut être vu comme un champ de courbure de l’espace-temps. Ce champ gravitationnel remplit le vide comme le ferait n’importe que champ électromagnétique.

Le vide L’espace-temps courbe a parfois été qualifié de « nouvel éther ». Mais il ne faut pas confondre le vide et le champ gravitationnel, même si le lien intime avec l’espace-temps complique les choses. Il y a deux possibilités :

Ou on considère le vide comme étant vide de matière mais éventuellement remplit de divers champs comme le champ gravitationnel.

Ou on considère un « vide parfait », sans aucun rayonnement d’aucune sorte et dans ce cas il ne peut y a voir de gravité. En l’absence de gravité (ou d’ondes gravitationnelles qui sont aussi des solutions des équations d’Einstein), pas de courbure de l’espace-temps. Le vide est vraiment vide.

En l’absence totale de gravité, l’espace-temps est celui de Minkowski. Bien sûr, il n’y a jamais absence totale de gravité car elle ne s’annule pas mais son influence diminue comme le carré de la distance. Mais on peut considérer ce cas comme celui où la gravité a des effets si faibles qu’elle en devient totalement indétectable. Peut-on encore qualifier l’espace ou le temps d’éther, même dans le cas du vide de Minkowski ? Cela ne correspond en tout cas pas à la définition de l’éther tel que nous l’avons vu et l’appellation serait trompeuse. On pourrait toutefois encore dire « le vide contient l’espace et le temps ». Nous pensons toutefois qu’il serait erroné de voir les choses ainsi. Toute mesure de l’espace et du temps se fait par comparaison. On mesure la longueur d’un objet en posant à ses côtés un mètre étalon. On mesure la durée d’un phénomène en mettant en correspondance ses états avec ceux d’une horloge. La nature de l’espace et du temps est purement relationnelle. Ce sont les relations entre les objets et phénomènes, via l’existence d’interactions (électromagnétiques, gravitationnelles), qui définissent la nature du temps et de l’espace. Et ces relations, soumises aux lois propres à ces interactions, peuvent se décrire éventuellement de manière géométrique. Le vide étant une absence de tout (du moins le vide parfait tel qu’indiqué plus haut), il ne peut avoir de relation avec d’autres choses. Nous avons d’ailleurs vu qu’il ne pouvait servir de référence et l’absence de courbure l’empêche également. Pour mesurer l’espace et le temps dans le vide il faut forcément y introduire quelque chose (un appareil de mesure) ou y faire passer quelque chose (un

Page 37: Le Vide.pdf

rayonnement) qui ne feront que traduire les relations avec d’autres corps matériels. Même de se point de vue spatial et temporel, le vide est vraiment vide.

VII. La mécanique quantique La mécanique quantique est la théorie de l’infiniment petit, des atomes et des particules élémentaires. C’est un monde mystérieux et une théorie difficile. Nous allons entamer une longue excursion qui va nous emmener assez loin. A nouveau, nous n’expliquerons que ce dont nous avons besoin ou juste un peu plus.

VII.1. Les atomes

Les photons Une des premières découvertes importante (Planck et Einstein) fut que la lumière ne pouvait être échangée que par petits paquets dont l’énergie est donnée par (la constante de Planck fois la fréquence). Ces paquets furent appelés photons.

Structure des atomes Quelle est la structure des atomes ? La découverte des électrons par Thomson à la fin du dix-neuvième siècle montra que les atomes devaient être constitués d’une partie lourde et chargée positivement (on sait maintenant qu’elle est composée de protons et de neutrons) et de particules très légères chargées négativement, les électrons. Restait la question de savoir quelle était la structure des atomes : étaient-ils comme un pudding, avec une masse positive fourrée d’électrons, comme le pensait Thomson, ou comme un petit système solaire ? Pour Rutherford, l'atome devait plutôt ressembler à un petit système solaire.

Page 38: Le Vide.pdf

Un noyau très petit, très massif, constitué des protons, se situe au centre. Les électrons, petits et légers tournent autour. La force d'attraction entre charges électriques permettant à ces électrons de rester à une distance constante, cette force agissant comme la gravité pour les planètes. Ce modèle a de nombreux avantages. Tout d'abord, les électrons loin du noyau sont aussi plus faiblement attirés par le noyau. Il devient aisé de les arracher pour produire un courant électrique. Ensuite, les électrons sur des orbites différentes ont des énergies différentes et le passage d'une orbite à l'autre pourrait résulter de l'absorption ou de la libération d'énergie sous forme lumineuse et sous formes de raies lumineuses avec une fréquence bien précise, comme cela est observé (chaque type d’atome ayant ainsi une « signature » bien particulière, son spectre). Ensuite, lors de contacts entre atomes, des électrons pourraient être échangés ou mis en communs ouvrant une voie sur l'explication de la chimie et de la valence des atomes (le nombre de liaisons que chaque atome peut établir avec ses voisins pour former une molécule). De plus, ce modèle a une base expérimentale solide. Rutherford envoya sur des atomes un flux de particules alphas. Les particules alphas sont juste des noyaux d'hélium composés de deux protons et deux neutrons. Evidemment, on ne connaissait par leur composition à l'époque, on savait juste que les particules alpha étaient petites, massives (4000 fois la masse d'un électron) et chargées positivement. Les particules alpha étaient émises par la matière radioactive.

Page 39: Le Vide.pdf

Les électrons, trop légers, n'influencent pas les particules alphas qui se contentent de les bousculer comme des quilles. Nous n'avons pas dessiné les électrons ci-dessus. Par contre, les noyaux, beaucoup plus massifs, dévient fortement les particules alphas. Ce que découvrit Rutherford c'est que les particules alphas sont rarement déviées. La plus part passent à travers une fine couche de matière sans être affectées. Grâce à ces expériences très précises, Rutherford put déterminer que l'atome est constitué d'un noyau positif, très massif et très petit, très compact. Chaque noyau est séparé des autres noyaux d'atomes par beaucoup de vide. Remplir ce vide avec des électrons tournant autour des noyaux était alors tout à fait logique (ne fut-ce que pour expliquer ce qui maintient les noyaux loin les uns des autres). En fait, Rutherford n'a établi son modèle qu'après ses expériences. C'est sur une base expérimentale qu'il a conçu son modèle. Celui-ci était le meilleur modèle rendant compte de l'ensemble des mesures effectuées. Une telle approche, lorsqu'elle est possible, garantit que le modèle conçu correspond effectivement à la réalité. Le seul problème du noyau de Rutherford c'est qu'il n'est pas stable ! Du moins pour la théorie. Le théorie électromagnétique, et l’expérience, montre qu'une charge électrique qui est accélérée émet un rayonnement électromagnétique. Or, un corps qui tourne subit une accélération centripète. Donc, des électrons qui tournent émettent des ondes électromagnétiques. C'est d'ailleurs sur ce principe que fonctionnent les antennes émettrices : des électrons tournant dans des boucles de fil électrique émettent une onde radio. Selon le modèle de Rutherford, les électrons tournent autour du noyau et les atomes devraient donc émettre un rayonnement électromagnétique continu, ce qui n'est évidemment pas observé. Plus grave, les électrons, en émettant du rayonnement, devraient perdre de l'énergie et tomber en spirale sur le noyau. L'atome de Rutherford est instable et devrait se transformer en atome de Thomson !

Page 40: Le Vide.pdf

Or, force est de constater que la matière est stable. Elle ne s'effondre pas comme dans la figure ci-dessus. Mais pourquoi ? Voyons maintenant la première approche tentée pour résoudre ce problème. Mais notons en passant un point important pour nous : les atomes semblent surtout constitué de vide. Nous y reviendrons.

Le modèle de Bohr Où en sommes-nous ? Nous avons maintenant deux problèmes. D'abord comment les électrons peuvent-ils "tenir" en l'air sans tomber sur le noyau en rayonnant des ondes électromagnétiques ? Ensuite, pourquoi l'énergie est-elle échangée par des quantités précises, toujours les mêmes (ce qui donne son spectre unique) ? Une solution fut apportée par Bohr dans les années 1920. Si les lois physiques connues semblent en contradiction avec les données expérimentales, alors c'est que ces lois physiques sont incorrectes. L'expérience dicte la physique, pas l'inverse. En particulier, nous savons, grâce à l'expérience, que l'atome à bien la structure imaginée par Rutherford. Mais la physique prédit une émission d'ondes électromagnétiques qui n'est pas observée. Donc, Bohr affirma qu'à l'échelle de l'atome les lois de l'électromagnétisme ne sont plus valables. Bohr postula alors trois lois décrivant l'atome de Rutherford.

Les électrons tournent autour du noyau de manière stable, sans émettre de rayonnement électromagnétique. On ne donne pas d'explication et on se contente de l'admettre.

Les électrons ne peuvent tourner que sur certaines orbites. La règle fait intervenir la vitesse et le rayon de l'orbite et un nombre entier n. Ce nombre est maintenant appelé nombre quantique principal et vient du fait que les orbites sont "quantifiées" (ce mot vient de "compter") : il y a l'orbite 0, l'orbite 1, l'orbite 2, etc. Chaque orbite étant un peu plus grande que la précédente. Les électrons ne sont que sur ces orbites et jamais entre deux orbites. La région entre deux orbites est un no mans land. La règle choisie par Bohr n'est pas aléatoire et a été choisie pour que les résultats

Page 41: Le Vide.pdf

correspondent aux données expérimentales ! Mais la règle ainsi obtenue est simple. Elle dit que le moment angulaire (l'équivalent de l'impulsion masse fois vitesse, mais pour les rotations, c'est-à-dire l'impulsion fois le rayon de l'orbite) est un nombre entier de fois une quantité minimale donnée (la constante de Planck divisée par deux pi).

Lorsqu'un électron change d'orbite, pour une raison quelconque, l'énergie acquise ou libérée se fait par l'absorption ou l'émission d'un photon de lumière ayant la même énergie.

L'énergie d'un électron sur une orbite se calculant selon les lois classiques de la mécanique et de l'électricité.

Son modèle marchait très bien … au premier abord ! Le modèle de Bohr donne l'énergie des électrons dans un atome. Cette énergie se mesure facilement en regardant combien d'énergie il faut pour arracher un électron d'un atome. De plus, du fait que les orbites sont quantifiées, l'émission de la lumière l'est aussi. Imaginons par exemple que l'on a seulement trois orbites 0, 1 et 2. Les électrons ayant les énergies respectives sur ces orbites de , , . Alors, en changeant d'orbite, les électrons peuvent émettre des photons d'énergie , et . Ce qui correspond à trois ondes lumineuses de longueur d'onde différente. Bien entendu, si l'électron passe d'une orbite basse à une orbite haute, il gagne de l'énergie et donc absorbe un photon. S'il descend sur une orbite plus basse, il émet un photon. Ce qui correspond aux spectres d'absorption et d'émission. De plus, on constate avec l'exemple ci-dessus, que l'énergie du premier photon plus l'énergie du deuxième photon est égale à l'énergie du troisième. C'est une simple conséquence de l'addition d'énergie en passant d'une orbite à l'autre. Et traduit en fréquence (selon la règle découverte par Planck et Einstein que l'énergie d'un photon est proportionnelle à sa fréquence), cela redonne une règle découverte par Balmer sur l’additivité des fréquences des raies émises par les atomes.

Page 42: Le Vide.pdf

Grâce à ce modèle, Bohr put calculer le spectre complet de l'hydrogène. Un résultat extraordinaire. On venait enfin de découvrir un de ces fameux secrets de l'atome. Enfin, puisque les électrons ont une énergie précise, leur échange ou leur interaction entre atomes permet de calculer certaines règles de la chimie.

Défauts du modèle Ils sont très nombreux ! La théorie évolua d'ailleurs tellement vite à cette époque que le modèle de Bohr fut pratiquement mort avant même d'arriver à maturité ! Mais on le conserve au moins pour sa simplicité et son caractère pédagogique et intuitif. On peut classer ses défauts en trois parties :

Théoriques. o La théorie ne s'applique que si on a un seul électron. Elle est incapable de prendre en

compte les interactions entre deux électrons. Elle traite donc des atomes appelés hydrogénoïdes qui sont des atomes dont on a arraché tous les électrons sauf un. On découvrit rapidement que lorsque l'on a plusieurs électrons, ceux-ci se disposent sur les orbites selon certaines règles : deux sur la première, six sur la suivante, etc. Ce qui conduit à la classification de tous les atomes. Mais la raison de cette ségrégation est assez mystérieuse à ce stade. En outre, comme signalé, les interactions entre électrons et avec le noyau modifie les orbites pour des atomes plus complexes que l'hydrogène.

o La théorie donne des résultats absurdes pour des hydrogénoïdes dont la charge du noyau dépasse une certaine valeur et ne peut donc s'appliquer, par exemple, à l'uranium.

o La théorie ne dit rien du noyau. Les protons sont tous chargés positivement. Ils devraient se repousser fortement. Qu'est-ce qui les maintient ensemble ?

Expérimentaux. o Lorsque l'on regarde attentivement le spectre d'un atome, on constate que chaque

raie du spectre est en fait composée de plusieurs raies plus fines. On appelle d'ailleurs cela les structures fines et hyper fines. Le modèle de Bohr ne l'explique pas.

o Lorsqu'on applique un champ magnétique à l'atome, les raies se dédoublent ou se triplent,… C'est l'effet Zeeman. Le modèle de Bohr ne peut l'expliquer.

o Lorsqu'on applique un champ électrique à un atome, les raies se multiplient de manière considérable rendant le spectre très touffu. C'est l'effet Stark. Le modèle de Bohr ne peut l'expliquer.

o On observe également de nombreuses raies, principalement dans l'infrarouge et les ondes radios, non prédites par le modèle de Bohr et produites par les molécules.

o Enfin, les raies n'ont pas toutes la même intensité. Certaines sont très brillantes, d'autres sombres. Certaines sont même parfois manquantes. De toute évidence, certains changement d'orbites sont plus faciles ou plus probables que d'autres. Le modèle de Bohr n'en dit rien.

Conceptuels. o Les lois ont un caractère très artificiel. On impose un certain nombre de règles sans

explication. La loi sur la stabilité, en particulier, est barbare. On ne sait pas pourquoi c'est stable ? Et bien décrétons que c'est stable, point final ! Eh bien, non, on pouvait difficilement admettre qu'il s'agisse d'un point final. Il s'agit plus d'un modèle, crée spécialement pour coller aux données expérimentales, plutôt qu'une théorie de l'atome ou des particules élémentaires.

o Le modèle est semi-classique. Ainsi les électrons qui tournent autour de l'atome sont "quantifié" et les lois de l'électromagnétisme ne s'appliquent pas. Mais pour calculer

Page 43: Le Vide.pdf

l'énergie d'un électron on utilise ces mêmes lois. Pourquoi dans un cas et pas dans l'autre ? A partir de quand les lois classiques deviennent-elles applicables ? Choisir d'appliquer la physique classique, un petit peu au bonheur la chance, quand ça nous chante, est un procédé assez bancal qui rend difficile toute prédiction nouvelle. Supposons que je perfectionne un peu le modèle en ajoutant un ingrédient quelconque. Dois-je appliquer les lois de l'électromagnétisme à cet ingrédient ou pas ?

o Lorsqu'un électron change d'orbite : par où passe-t-il puisque la zone entre les deux orbites est interdite ?

o Quel est le mécanisme d'émission de la lumière ? Le modèle de Bohr ne donnant qu'un bilan énergétique. Y a-t-il des directions privilégiées pour l'émission des photons ? La polarisation intervient-elle ? Toutes des questions sans réponse.

Sommerfeld améliora un peu le modèle en utilisant quelques raffinements :

L'effet de recul : sous l'effet de l'attraction de l'électron, le noyau doit lui-même avoir une légère rotation (légère car sa masse est beaucoup plus grande).

La relativité. En plus des orbites circulaires, la possibilité (comme pour les planètes) d'avoir des orbites

elliptiques caractérisées par un nouveau nombre entier (toutes les ellipses ne sont pas permises) l appelé nombre quantique orbital. En prenant en compte ce nouveau nombre l la règle disant que le nombre d'électrons pouvant se placer sur une orbite est limité devenait simple. Deux électrons maximums pour un nombre n et un nombre l donné. Pourquoi deux et pas un (ou trois) ? Mystère. Bien qu'on devine qu'il doit exister un troisième nombre, lié à un mécanisme inconnu (il s'agit du "spin", équivalent à la rotation de l'électron sur lui-même, comme une toupie), prenant uniquement deux valeurs.

Avec ces améliorations, cela permit quelques améliorations notables mais mineures au vu de la pléthore de problèmes.

La mécanique quantique Pendant que le modèle de Bohr subissait ses succès et ses avatars, la théorie quantique telle que nous la connaissons maintenant prenait naissance. La mécanique quantique est la théorie qui s’applique aux atomes et aux particules élémentaires. En

toute rigueur, elle s’applique à toutes les situations, y compris par exemple le lancer d’une balle de

golf. Mais les corrections infimes apportées par la mécanique quantique à ce genre de cas et la

difficulté des équations rendent inutile son usage et l’on préfère alors utiliser les théories

« classiques » (mécanique classique, hydrodynamique, etc.) Elle est malgré tout utilisée dans certains

cas complexes tel que la chimie ou des objets macroscopiques (superfluides, supraconducteurs,

ferromagnétisme, …) à l’aide de la physique statistique ou d’outils mathématiques particuliers.

La mécanique quantique est une théorie très puissante. C’est la théorie la mieux vérifiée de toutes

les théories, dans tous les domaines (sauf la gravité) et toutes les expériences, avec une précision

exceptionnelle. Elle explique nombre de phénomènes : les atomes, le magnétisme, la chimie, le laser,

etc. La liste est longue.

Page 44: Le Vide.pdf

On ne va pas tout présenter en détail, loin de là. On va expliquer un minimum pour comprendre

l’essentiel des bases (ce sera déjà assez costaud comme ça). De même, on ne verra pas toutes les

subtilités, propriétés, mystères et aspects parfois intriguant. C’est intéressant mais trop vaste pour

cette petite étude sur le vide.

Rappelons brièvement les bases mathématiques de la mécanique quantique.

Un système a un état décrit par un vecteur dans un espace de Hilbert H complexe, il sera noté typiquement comme .

Les variables physiques sont des opérateurs agissant sur les vecteurs d’état.

Les variables mesurables (les observables) sont des opérateurs hermitiques, c’est-à-dire tel que .

Les valeurs prises par les variables sont le spectre des valeurs propres de l’opérateur (ces valeurs sont réelles pour les observables). Les

seules valeurs mesurables sont ces valeurs.

L’espace de Hilbert étant un espace vectoriel, on peut définir différentes bases, totalement équivalentes. Par exemple les bases (ou bases

d’un sous-espace) positions, impulsions, spins, énergie, etc.

Le passage d’une base à l’autre s’effectue par une transformation unitaire U (avec ).

Le commutateur de deux opérateurs est : [ ] .

Pour la quantification, on part de l’hamiltonien classique (au moins quand il existe) et on obtient l’hamiltonien quantique après

symétrisation (du type ab+ba) et remplacement des variables par des opérateurs. On impose entre valeurs conjuguées la relation

[ ] où est la constante de Planck divisée par .C’est suffisant pour résoudre tout problème typique.

L’évolution dans le temps peut adopter plusieurs point de vue : ce sont les états qui varient (Schrödinger), ou les observables (Heisenberg)

ou des cas mixtes (représentation interaction). On passe de l’un à l’autre par une transformation unitaire (qui ne correspond pas à un

changement de base). Par exemple, dans le point de vue de Heisenberg, l’équation d’évolution d’un opérateur O est donné par :

[ ]

Qui a l’avantage de mettre clairement en évidence les grandeurs constantes et le rapport à la physique classique (équation d’évolution dans

l’espace des phases utilisant les crochets de Poisson).

Dans le point de vue de Schrödinger, on a :

On travaille souvent dans la base position, dans ce cas les composantes d’un état s’obtiennent par le produit scalaire (complexe) ⟨ ⟩ où

est la base position. On peut écrire ce produit scalaire comme une fonction de la position : ( ) appelé fonction d’onde. Pour

une particule de masse m soumise à un potentiel V, l’équation de Schrödinger prend la forme :

Elle peut être utilisée, par exemple, pour calculer les fonctions d’ondes et les niveaux d’énergie (valeurs propres de l’hamiltonien) d’un

électron dans le potentiel coulombien d’un noyau (cas typique de l’hydrogène).

Mécanique quantique ondulatoire Une représentation typique des particules quantiques (électrons, photons,…) est sous forme d’ondes.

Cela peut sembler étrange aux néophytes, qui auraient tendance à voir un électron comme une

petite bille, mais la représentation sous forme d’ondes est bien plus proche de la réalité.

Comme exemple, citons juste l’expérience de Young :

Page 45: Le Vide.pdf

Dans cette expérience, on envoie des vagues à travers deux ouvertures. Lorsque le creux d’une vague

passant par une ouverture rencontre la basse d’une vague passant par l’autre ouverture, on obtient

ce qu’on appelle une interférence : le niveau de l’eau s’égalise. On observe ainsi une figure

d’interférences typique qui peut servir, par exemple, à calculer la longueur d’onde.

Cette expérience peut être réalisée avec de la lumière (ayant une longueur d’onde bien précise, avec

un laser), le résultat est semblable. Cela montre le caractère ondulatoire indubitable des ondes

électromagnétiques.

Mais l’expérience peut aussi être réalisée avec des électrons.

Page 46: Le Vide.pdf

Une figure d’interférences est aussi observée. Cela montre que les électrons ont un caractère

ondulatoire.

Il y a tout de même une différence typique par rapport aux vagues. Les impacts sur la cible sont

ponctuels. Les électrons se comportent aussi, tout au moins lors de l’interaction avec la cible, comme

de petits corpuscules. Mais cela ne concerne que l’interaction, pour l’essentiel l’électron se

comportant bien comme une onde.

Notons que ces impacts ponctuels s’observent aussi avec la lumière si on utilise une lumière

suffisamment faible pour avoir un photon à la fois.

L’expérience montre aussi qu’il y a une correspondance univoque entre l’énergie de la particule et sa

fréquence : où est la fréquence et h la constante de Planck. C’est Planck avec l’émission du

corps noir puis Einstein avec l’effet photoélectrique (électrons arrachés d’un métal par de la lumière

ultraviolette) qui ont découvert cette relation avec la lumière, montrant son caractère corpusculaire

(petits paquets d’ondes d’énergie bien définie).

Il existe aussi une relation univoque entre la longueur d’onde et l’impulsion de la particule (pour une

particule massive comme l’électron, c’est la masse fois la vitesse). C’est Louis de Broglie qui a

découvert cette relation.

Page 47: Le Vide.pdf

Notons que ces relations ainsi que le caractère ondulatoire des électrons sont utilisés couramment

dans divers dispositifs comme, par exemple, les microscopes électroniques.

Principe d’indétermination L’onde correspondant à l’électron est généralement appelée fonction d’onde. Une représentation

d’un électron localisé dans une petite région de l’espace peut être le paquet d’ondes :

La particule (le paquet d’ondes) a une certaine largeur que l’on peut noter qui représente aussi

une certaine incertitude sur la position de la particule puisque cette position n’est pas tout à fait

précise.

De plus, il ne s’agit pas d’une onde sinusoïdale. Les lois mathématiques sur les ondes montrent que la

longueur d’onde a aussi une certaine incertitude . Les deux étant lié par :

Et ce quel que soit la forme du paquet d’ondes.

Puisque l’on peut relier la longueur d’onde à l’impulsion, la masse fois la vitesse, on trouve :

Où h est la constante de Planck.

On voit que la position et la vitesse ne peuvent pas être infiniment précis simultanément. Il y a

forcément une certaine incertitude. Notons aussi que cette incertitude minimale est fort petite car la

constante de Planck est minuscule. Ce n’est que pour des objets ayant une masse m très petite que

cette incertitude devient appréciable (des électrons, par exemple).

Page 48: Le Vide.pdf

Cette relation est appelée relation d’indetermination de Heisenberg. On peut la vérifier

expérimentalement de toutes sortes de manière. Elle est parfois vue comme un effet de la mesure,

les particules quantiques étant tellement légère que la moindre perturbation modifie leur position et

leur vitesse. Il est vrai que des expériences de pensée impliquant toutes sortes de dispositifs

ingénieux et tenant compte de ces perturbations conduisent à ces relations. Mais en réalité cette

indétermination est plus fondamentale qu’une simple incertitude de mesure et est liée à la nature

ondulatoire des particules.

Ce phénomène a fait couler beaucoup d’encre et il a même semblé insupportable à certains (dont

Einstein) au début de la mécanique quantique, et même encore maintenant pour quelques

irréductibles. Les débats sur ce « principe d’incertitude » sont souvent interminables. Pourtant, vu

sous l’angle ondulatoire, il n’est pas si mystérieux.

On peut montrer qu’il existe d’autres principes d’indétermination. L’un fort important pour nous est le suivant. Considérons un processus changeant d’énergie, E, en un temps t. Il y a là aussi une certaine incertitude sur les valeurs que l’on notre et . Alors on doit avoir :

Cette relation peut aussi se démontrer avec les propriétés ondulatoires du paquet d’ondes, avec le rapport entre fréquence de l’onde et durée du paquet.

Description par les états L’explication ondulatoire a toutefois ses limites car les particules quantiques ne sont pas des ondes

classiques. Plusieurs aspects les en distinguent. Citons les deux principaux :

On l’a vu plus haut, les interactions entre particules (électrons et cibles ci-dessus) sont

ponctuelles. Ce n’est pas du tout comme ça que réagissent des ondes classiques comme les

vagues ou le son où l’effet de l’onde est répartit tout le long du front d’onde (par exemple la

trace mouillée très étendue d’une vague sur le sable).

Lorsque l’on a deux particules, la théorie nécessite de les décrire comme un tout. Il faut donc

une onde décrite par sept paramètres : six variables positions (trois par particules) plus le

temps. Alors qu’une onde classique a une valeur qui ne dépend que de quatre paramètres

(trois de position et une de temps). En règle générale, il n’est pas possible de décomposer

l’onde quantique totale en une somme ou un produit ou une quelconque relation

mathématique générale de deux ondes classiques.

Il est donc utile d’introduire un autre formalisme. Nous allons le présenter ici mais sans entrer dans

les aspects mathématiques qui ne seront pas nécessaires. Ce formalisme a l’avantage aussi d’être

fort parlant et intuitif.

Considérons un système physique quelconque : une particule, un atome, un caillou, … Celui-ci peut

être dans différents états que l’on peut caractériser par un certain nombre de variables tel que

position, vitesse, etc. Nous représenterons l’ensemble de ces variables par α. L’état physique du

système s’écrit symboliquement : appelé un ket. Peu importe sa signification mathématique,

c’est avant tout une représentation simple et commode.

Page 49: Le Vide.pdf

Parfois, seules certaines variables nous intéressent. Par exemple, si la particule est à la position x, on

écrira son état , en ignorant volontairement le détail des autres variables comme la vitesse, par

exemple.

Une particularité de ces états est qu’ils sont soumis au principe de superposition. Par exemple, si

l’état est une solution possible pour l’état d’un système dans une situation donnée, et si

est une autre possibilité, alors la somme est aussi une solution possible.

Comment interpréter cette solution ? Prenons un exemple. Soit une particule qui peut se trouver en

ou bien en , alors elle peut être dans les états ou indiquant que la particule est à la

position précise concernée. Mais l’état est aussi une possibilité. Cet état signifie que la

particule peut être aussi bien en qu’en . Cela ne signifie pas que sa position est précise mais

inconnue. C’est plutôt comme si la particule était aux deux endroits en même temps !

Ce caractère ubiquitaire des particules peut sembler extrêmement étrange. Il l’est beaucoup moins

après ce que nous avons vu ci-dessus. Nous savons que la position peut être imprécise et qu’il s’agit

d’une caractéristique fondamentale de la particule. Si on la représente comme une onde, on aurait

une représentation pour cet état comme suit :

Notons que les ondes aussi sont soumises au principe de superposition. Quand deux ondes sont deux

solutions possibles d’une équation des ondes, leur somme est aussi une solution possible.

Supposons que l’on ait une particule dans l’état , on aimerait savoir si dans cet état on peut la

trouver à la position x ou bien si on peut la trouver avec une vitesse v. On écrira ça comme, par

exemple :

⟨ ⟩

Peu importe sa signification mathématique. On peut le traduire par « c’est la possibilité que la

particule dans l’état soit aussi dans l’état », c’est-à-dire que la particule avec les propriétés

α soit à la position x. On traduit cela par le terme amplitude, c’est l’amplitude que la particule soit

dans l’état demandé.

L’ensemble de tous les états possibles forme un espace mathématique aux propriétés assez simples.

Il permet en particulier de choisir des bases d’états qui d’une certaine manière couvrent toutes les

possibilités.

Un exemple est la base position : c’est l’ensemble des états pour toutes les positions x

possibles.

Notons que, puisque ces états décrivent des situations de « position x précise », alors :

⟨ ⟩

Page 50: Le Vide.pdf

La particule ayant une position x précise est évidemment trouvée en x.

Et :

⟨ ⟩

(pour des positions différentes)

La particule ayant une position x précise ne sera évidemment pas à un autre endroit.

Revenons à notre particule décrite par . On aura, pour toute position x, une

valeur ⟨ ⟩ sauf dans deux cas :

⟨ ⟩ ⟨ ⟩ ⟨ ⟩

Et

⟨ ⟩

C’est-à-dire que la particule a autant de chance d’être dans une des deux positions. En fait, pour être

exact on devrait écrire ½ (une chance sur deux) mais nous ferons le lien avec les probabilités plus

bas. D’ailleurs mathématiquement on n’a ni 1 ni ½, mais peu importe. Ce qui compte ici c’est que les

deux positions donnent des résultats identiques.

Tout état peut se décrire comme une superposition des états de base :

En disant qu’elle peut être en x, en y, en z, etc… C’est dans ce sens que la base couvre toute les

possibilités.

Notons que cette gymnastique n’est pas inutile. Il est plus facile de travailler uniquement avec les

états de base, bien définis et peu nombreux, que sur l’infinie possibilité de tous les états possibles.

Il est également possible de choisir d’autres bases, par exemple la base des vitesses précises .

Toutes les bases sont équivalentes d’un point de vue mathématique. On passe aisément de l’une à

l’autre par des opérations mathématiques élémentaires. On peut choisir toute base qui s’avère

pratique pour les raisonnements. Notons juste que ⟨ ⟩ ne peut pas être non nul pour une seule

position précise, à cause du principe d’indétermination.

Pour terminer cette petite excursion élémentaire dans les notations et leur usage, notons que l’on

notre traditionnellement :

( ) ⟨ ⟩

Qui est juste une autre notation. On l’appelle fonction d’onde, un terme que vous avez sûrement

déjà entendu.

On peut aussi montrer qu’il y a une équivalence mathématique totale entre la représentation sous

forme de ket (aussi appelés vecteurs d’état) et la représentation ondulatoire (non classique) avec la

fonction d’onde.

Pour les explications, les deux sont parfois utiles. On peut aisément passer de l’une à l’autre.

Mais attention en raisonnant, car sans connaitre le formalisme mathématique rigoureux caché

derrière il peut être impossible de voir pourquoi tel ou tel raisonnement est correct et tel autre

complètement erroné. Une connaissance vulgarisée permet de comprendre certain aspects mais

Page 51: Le Vide.pdf

n’offre pas la moindre aide pour bâtir ses propres raisonnements, ce n’est qu’une traduction

grossière d’un raisonnement mathématique rigoureux. C’est une faute très fréquente chez le

néophyte qui, en plus, n’est même pas armé pour découvrir par lui-même qu’il commet une telle

faute. Vous voilà prévenu, aussi décevant que cela puisse être. Aller au-delà d’une simple

compréhension « superficielle » nécessite un travail certain impliquant d’absorber des connaissances

mathématiques.

Evolution et mesure On peut écrire une équation d’évolution pour la particule qui n’est autre qu’une équation d’ondes.

Quoi d’étonnant ? Ecrivons là sous une forme simplifiée :

Ici représente la variation de l’état au cours du temps. H est appelé hamiltonien du système. Il

contient sa description physique permettant de calculer son évolution et il a même un lien important

avec l’énergie.

La seule chose qui nous importe ici est que cette équation est linéaire (on dit même unitaire qui a

une signification plus forte mais dont nous n’avons pas vraiment besoin ici). Cela signifie qu’elle

respecte le principe de superposition. Si on a une autre solution de la même équation :

Alors on a aussi :

( ) ( )

Cette propriété que l’on prouve mathématiquement (ce qui est élémentaire) est à mettre en

parallèle avec ce que nous avons dit sur le principe de superposition.

Supposons que notre particule soit dans l’état avec diverses possibilités pour sa position : x, y,

z,… Que se passe-t-il si on mesure sa position ? Dans ce cas, le postulat de probabilité de Born dit

que l’on aura une certaine probabilité de la trouver en x, en y ou en z. Cette probabilité est reliée à

l’amplitude (peu importe comment, le lien n’est pas trivial, ce qui compte c’est que si l’amplitude est

grande, la probabilité aussi).

De plus, la somme des probabilités pour toutes les possibilités doit être égale à un (cent pour cent de

chance de la trouver quelque part). Par exemple, avec notre particule à deux endroits, on aura une

chance sur deux (1/2) de la trouver en l’une ou l’autre position. D’autres valeurs sont évidemment

possibles, par exemple 1/4 et 3/4.

Supposons maintenant que je mesure la position de la particule dans l’état et que je la trouve à

la position x. Dans ce cas, nous savons maintenant avec certitude qu’elle est en x : c’est là que nous

l’avons trouvé. Son état peut donc être décrit par . On dit que l’état de la particule s’est réduit à

un état plus précis (pour la variable concernée). On parle de réduction du vecteur d’état ou de

réduction de la fonction d’onde. C’est le postulat de réduction.

Bien qu’il semble que nous ayons déduit clairement ce résultat, il s’agit en fait bien d’une hypothèse supplémentaire. Après tout, le fait de savoir que la position est x n’exclut nullement d’autres possibilités.

Page 52: Le Vide.pdf

Le vide dans les atomes Pour un atome, l’électron a une fonction d’onde répartie autour du noyau. Il est exclu de dire qu’il a une position précise mais inconnue. Il est vraiment comme « étalé » (bien qu’on ne puisse en aucun cas comparer ça à un fluide). De plus, l’électron se déplace dans le champ électrique émis par le noyau. Il serait donc absurde d’affirmer que l’atome est plein de vide. Il est au contraire plutôt bien remplit ! Comment concilier ça avec les résultats de Rutherford ? Tout dépend en fait des projectiles. Comme nous l’avons dit, les particules alpha sont lourdes. Si d‘aventure elles interagissent avec l’électron, celui-ci est simplement éjecté (ce qui est à l’origine des dégâts de la radioactivité) et elles passent sans problème. De même, si on envoie des neutrons, ceux-ci n’ayant pas de charge électrique, ils passent sans difficulté. Par contre, des électrons envoyé sur l’atome vont être facile dévié par les électrons tournant autour de l’atome. Il est difficile de parler de la taille des particules et même des atomes à cause des incertitudes dans la position. On parle donc plus volontiers de section efficace qui traduit l’efficacité d’une collision entre particules (traduite en unité équivalentes à la surface d’une cible en dur). Pour des électrons, l’atome a une grande section efficace, pour des particules alpha l’atome a une petite section efficace. Mais en tout cas, que l’on parle de tailles ou de sections efficace, l’électron n’est pas du tout vide.

VII.2. Champs quantiques

Champs quantique Une des difficultés dans la formulation en mécanique quantique de théories physique est le problème du nombre variable de particules. L’expérience montre que lorsque l’énergie est suffisante, des particules peuvent être créées. Cela est particulièrement frappant avec les photons puisque la lumière est créée, par exemple, par un corps chaud (lampe à incandescence) et absorbée par, par exemple, une plaque photographique. Le photon ne réside pas à l’intérieur des corps mais apparait et disparait bel et bien. Une solution est d’adopter le point de vue des champs. Le champ prend une valeur en tout point. Une représentation intuitive est celle d’une chaine de ressorts (du moins si on ne considère qu’une seule direction :

Une telle chaine de ressort obéit à une équation du type équation d’ondes, et nous avons vu que cela est le cas des particules quantiques. La valeur du champ en chaque point est représentée par la

Page 53: Le Vide.pdf

longueur d’un ressort (idéalement on fait tendre la longueur de chaque ressort vers zéro de façon à avoir une chaine d’une infinité de ressorts infinitésimaux). Les solutions sont des vibrations de la chaine de ressort sous forme d’ondes se propageant le long de la chaine. Et toute solution est somme de ces solutions ondulatoires. On applique ensuite les règles permettant de passer à une formulation en mécanique quantique. Ces excitations sont alors quantifiées : elles ne peuvent avoir n’importe quelles valeurs. Par exemple, pour le photon, on a obligatoirement une énergie de l’onde égale à . Et comme les solutions peuvent être des sommes de ces solutions simples, on peut avoir des solutions d’énergie , , etc. Soit deux, trois photons,… Ces solutions décrivent donc un nombre quelconque de particules associées au champ (la description idéale de ces particules reste ondulatoire). Donnons deux exemples :

- Cette méthode appliquée au champ électromagnétique conduit aux photons. - Les électrons en mécanique quantique traditionnelle peuvent être décrit par l’équation de

Schrödinger ou de Dirac (dans le cas relativiste). L’équation de Dirac est l’équation d’une fonction d’onde dont on peut changer l’interprétation et la considérer non pas comme une onde de probabilité mais comme un champ. Les excitations de ce champ donnent alors des électrons (en nombre quelconque) et des positrons (des particules identiques aux électrons, mais de charge électrique positive, c’est l’antimatière).

Principe d’indétermination énergie – temps Rappelons ce principe :

Qui dit que dans un processus qui n’est pas infiniment précis dans le temps, de durée instantanée, mais prend une « certaine durée » , la variation d’énergie durant ce processus est incertaine de la valeur . En particulier, pour des processus extrêmement court, l’incertitude sur l’énergie peut être extrêmement grande. Si l’on considère l’interaction entre particules de faible énergie, leur fréquence est très faible, les oscillations durent longtemps et donc est naturellement grand. Par contre, si les particules sont extrêmement énergétiques (comme le montre la relation pour le photon) la fréquence est extrêmement élevée, un processus de collision peut être extrêmement court. L’énergie de ce processus peut donc fortement varier, ce qui est compatible avec la grande énergie disponible. Cette grande énergie variable peut correspondre à la masse de particules selon la relation célèbre en relativité restreinte . On peut donc avoir création de particules dans la collision. Ce qui est effectivement observé. Notons que l’énergie totale sur l’ensemble du processus, bien avant la collision et bien après la collision, donc sur une grande durée, est conservée, ce qui est compatible avec cette durée plus grande. Ce n’est que pendant le bref instant de la collision elle-même que d’étranges choses peuvent se produire. Des calculs théoriques (mathématiques) plus précis et rigoureux permettent de formaliser tout ça et de le décrire avec exactitude.

Page 54: Le Vide.pdf

Particules virtuelles Considérons deux particules qui se rencontrent et interagissent, par exemple lors d’une collision. Ca peut-être deux électrons (diffusion d’électrons sur des électrons), un photon sur un électron (diffusion Compton), etc. Lors de la collision on peut donc avoir une interaction de ce type :

Où un photon se décompose en un électron et un positron puis redevient un photon. Ou, dans une collision entre un photon et un électron :

L’électron absorbe le photon puis le réémet. L’ordre peut être inversé :

Ou plus complexe :

Les particules internes aux diagrammes, comme le photon qui est créé puis détruit dans ce dernier diagramme, sont appelées particules virtuelles. Ce sont des particules comme les autres mais :

- Elles ne sont pas présente au début et à la fin du processus et donc elles ne sont pas directement observées (d’où leur nom).

- Leur énergie est mal définie car leur existence est très courte. De tels processus s’appellent diagrammes de Feynman. On ne les crée pas au hasard. La construction rigoureuse de la théorie permet d’obtenir les règles permettant de créer les diagrammes. Pour calculer un processus physique donné, on doit prendre tous les diagrammes possibles (il n’y en a une infinité, donc on se limite aux plus simples) et on fait la somme. Notons que cela est équivalent à une

Page 55: Le Vide.pdf

superposition quantique. La collision entre le photon et l’électron est une superposition quantique de tous les processus indiqués ci-dessus et de bien d’autres. Un exemple typique est le champ électrique. Si l’on considère deux charges électriques statiques, elles échangent en permanence des photons virtuels qui correspondent au champ électrique.

Les fluctuations du vide Mais en plus de ces processus d’interactions entre « particules réelles », on peut avoir des processus avec uniquement des particules virtuelles. Par exemple :

Ou

Ces processus sont appelés diagrammes vide – vide ou fluctuations du vide. Notons que dans un processus normal, comme la collision d’un électron et un photon, le calcul montre que l’on doit soustraire tous les diagrammes comportant des parties vide – vide, c’est-à-dire les ignorer. Elles n’ont donc pas d’influence sur le processus considéré.

Le vide quantique La définition exacte du vide quantique est assez simple. Pour un champ (ou un ensemble de champs) c’est l’état d’énergie la plus basse. Il est possible de définir certains opérateurs très utiles. Prenons un état du champ quelconque. On définit l’opérateur de création l’opérateur qui agit sur cet état et donne un état avec une énergie plus grande égale à . Il est noté . Cet opérateur ajoute un quantum au champ. On définit de même l’opérateur de destruction comme l’opérateur qui enlève un quantum à l’état du champ. Il est noté a. Ces opérateurs sont très utiles et interviennent dans beaucoup de calculs. La plus part des grandeurs physiques (énergie, impulsion) peuvent s’exprimer à partir de ces opérateurs. On peut aussi les utiliser pour construire un opérateur de nombre noté N et qui « compte » le nombre de quantum dans un état. Par exemple, si le nombre de quantum est bien défini et n, on aura : Evidemment, on peut avoir des superpositions quantiques compliquées avec plusieurs nombre de quantum de champs. On montre que l’on peut définir l’état du vide comme :

Page 56: Le Vide.pdf

C’est-à-dire que si l’on essaie d’enlever un quantum du vide on obtient… rien ! Ou plus exactement, cela ne donne pas un nouvel état du champ. On peut donc l’identifier à l’état « sans particule ». Si on utilise l’opérateur de création, on peut également définir : , , etc. Avec : , , , etc. On identifie donc ces états comme étant à zéro, une, deux particules, etc… Et tous les états du champ peuvent s’obtenir comme des superpositions quantiques de ces états.

Vide quantique vs vide classique Le vide classique n’est pas tout à fait un vide quantique sans fluctuation. C’est un peu plus subtil que ça. On peut d’ailleurs avoir des fluctuations du vide (des diagrammes vide – vide) même dans le cas d’une interaction entre particules réelles et donc quand… ce n’est pas du vide ! Toutefois, si on considère une certaine zone de l’espace où on a un vide classique, sans particule, on peut considérer qu’avec une certaine approximation cela correspond bien au vide quantique sans particule (et sans fluctuation pour le vide classique). Evitons donc de trop compliquer les choses, cela suffira pour la compréhension.

Stabilité du vide quantique Rien n’est plus stable que le vide quantique. Par définition, il correspond à l’état d’énergie minimale du système. Il n’y a pas d’état d’énergie plus faible et les états d’énergie plus élevée contiennent au moins une particule réelle. L’image populaire du vide quantique bouillonnant avec des particules apparaissent puis disparaissant de ci de là est totalement trompeuse. En fait, elle est même fausse. Cette image classique est beaucoup trop grossière. Il faut plutôt voir ces fluctuations comme une indétermination de l’énergie minimale lorsque l’on considère de très courtes durées, ce qui peut avoir des effets sur des processus courts, donc invoquant des particules réelles. Le vide quantique est invariant relativiste. Cela signifie en particulier qu’il est totalement identique pour tout observateur. Si j’observais une particule apparaissant dans le vide devant moi, alors cela signifie que n’importe quel observateur doit aussi voir une telle particule apparaissant dans le vide devant lui. Bref, on doit avoir une telle particule en tout point, sans exception. Ca fait beaucoup. Comme expliqué plus haut, un processus quantique est obtenu en faisant la somme de tous les diagrammes de Feynman valides. Le vide quantique est alors une superposition quantique de toutes les fluctuations possibles et imaginables en tout point et à tout instant. C’est très difficile de se représenter ça. Mais c’est comme couvrir une surface de peinture au lieu de n’avoir que des gouttes ici et là. Le résultat est simple : un vide « lisse », sans perturbation, identique et stable et tout point et tout instant. Rappelons-nous d’ailleurs que les diagrammes vide – vide n’influencent pas les processus observables. Les seules fluctuations à prendre en compte sont les particules virtuelles au sein des processus eux-mêmes. Il ne faut surtout pas confondre ces particules virtuelles échangées avec les fluctuations vide – vide.

Page 57: Le Vide.pdf

Nous aurons l’occasion de revenir sur tout cela et d’en voir bien des subtilités. Pour le moment retenons que le vide quantique c’est… du vide ! Une absence de particule réelle. Un lieu sans granularité, sans irrégularité, sans ce bouillonnement qu’en donne l’image trop souvent vulgarisée.

VII.3 L’énergie du vide

L’oscillateur harmonique Un oscillateur harmonique est un oscillateur qui oscille à une fréquence précise appelée fréquence propre. Des exemples sont des ressorts ou des pendules avec de petites oscillations. Lorsque l’on quantifie un tel système, on peut calculer les différents états qu’il peut prendre et l’énergie est donnée par une formule très simple :

(

)

Où n est un nombre entier qui peut prendre les valeurs 0, 1, 2, 3… On retrouve là l’existence de quantums d’énergie et c’est normal car un champ décrit par une équation d’ondes est équivalent à une infinité de petits oscillateurs couplés les uns aux autres et les solutions sont identiques à l’oscillateur harmonique si ce n’est que toutes les fréquences sont possibles. Une question peut se poser : d’où vient le 1/2 présent dans la formule ? En particulier, l’état de plus faible énergie est pour n = 0 (aucun quantum d’énergie, aucune particule pour un champ) et cette énergie minimale vaut . Cette énergie minimale n’est pas nulle. En fait, la raison est très simple et liée au principe d’indétermination. Par exemple, si l’oscillateur est une petite masse reliée à un ressort, les variables dites conjuguées reliées par le principe d’indétermination sont la longueur du ressort, c’est-à-dire la position de la petite masse, et la vitesse de cette petite masse, comme pour une particule. Si l’oscillateur était au repos parfait, le ressort n’aurait aucune oscillation. La variation de longueur du ressort au court du temps serait zéro ainsi que la vitesse de la masse. Le produit des deux est alors parfaitement précis et vaut zéro. Or, c’est impossible selon le principe d’indétermination. On comprend donc que le calcul conduise à une situation où l’état minimum d’énergie est encore une toute petite vibration. L’oscillateur n’est jamais parfaitement au repos. Cette énergie résiduelle dans le cas quantique est parfois appelée énergie de point zéro ou énergie du vide plus particulièrement dans le cas des champs.

L’énergie du vide L’énergie d’un système quantique est associée à un opérateur noté H (appelé hamiltonien). Il a la forme : , plus exactement une somme sur toutes les fréquences possibles (on a un opérateur de création et un opérateur de destruction associé à chaque fréquence que l’on peut créer ou détruire). Le problème est que pour le vide, on obtient une énergie , c’est l’énergie de point zéro. Si on fait une somme infinie sur toutes les fréquences possibles, on obtient évidemment l’infini. Ce qui est assez gênant. L’énergie du vide est à proprement parler, selon la théorie quantique des champs, infinie ! On utilise alors une astuce mathématique. On réécrit la formule de manière à faire apparaitre l’opérateur de destruction à droite de la formule et on escamote un terme constant. L’opérateur H

Page 58: Le Vide.pdf

prend alors la forme (plus exactement la somme infinie de ces termes), ce qu’on appelle ordre normal. Le fait d’avoir escamoté un terme constant peut sembler étrange. Mais en réalité, c’est tout à fait justifié. En effet, dans tout processus physique, ce n’est pas l’énergie d’un système qui est mesurée mais les variations d’énergie entre avant et après (rappelez-vous, par exemple, l’émission de photons par les électrons changeant d’état dans un atome). Donc, peu importe à partir de quelle valeur on commence à compter l’énergie, du moment que les différences d’énergie entre deux états sont inchangées. Après tout, l’énergie de point zéro est l’énergie du vide et il est difficile de la mesurer car cela reviendrait à détruire le vide pour récupérer l’énergie et le vide est un système physique qui est, inutile d’insister là-dessus, plutôt difficile à détruire ! Que devient alors l’énergie après cette astuce ? Si on l’applique à l’état du vide , l’opérateur de destruction agissant sur cet état donne, comme nous l’avons vu, zéro. Et donc l’énergie du vide est une somme infinie de zéro, c’est-à-dire zéro. Dans la plupart des cas, cette astuce simple est tout à fait satisfaisante.

Variation de l’énergie du vide Mais si l’énergie du vide, en soit, est sans importance, on pourrait aussi se demander s’il est possible d’observer des variations de cette énergie dans diverses situations, tout comme pour le changement d’énergie d’un atome par exemple. La réponse est oui. Dans ce cas, escamoter l’énergie du vide n’est plus satisfaisant puisque l’on force sa valeur exprès à zéro. Plus de variation possible. Il faut donc s’accommoder de sa valeur infinie. C’est ennuyant car il est plutôt difficile de donner un sens à une telle valeur infinie. Voyons comment on procède dans un cas concret et assez célèbre.

L’effet Casimir Considérons le système suivant :

Page 59: Le Vide.pdf

On a deux plaques métalliques, parfaitement conductrice, séparées par une distance L. On considère cette distance très petite par rapport à la taille des plaques. La théorie électromagnétique montre que les ondes électromagnétiques s’annulent à la surface d’un conducteur si elles arrivent perpendiculairement (on peut vérifier que c’est les seules que l’on doit prendre en compte ici).

Cela signifie que les ondes électromagnétiques ne peuvent plus prendre n’importe quelles valeurs. Il faut que le nombre de « bosses » soit un nombre entier :

Les ondes électromagnétiques correspondant aux fréquences du vide quantique, entre les plaques, ne peuvent donc plus prendre que des valeurs multiples d’une fréquence minimale (liée à la valeur de L). La valeur de l’énergie du vide prend alors une forme comme : Somme de avec n gal à 1, 2, 3, etc… (le nombre de bosses).

Page 60: Le Vide.pdf

Malheureusement cette valeur est encore infinie. Mais ce n’est pas grave. Ce que nous voulons, c’est la variation de cette énergie lorsque la distance L varie (c’est-à-dire lorsque varie). On peut calculer rigoureusement cette variation (on ne fait évidemment pas l’infini moins l’infini, il y a des méthodes précises et mathématiquement rigoureuses). Chose surprenante : le résultat est cette fois fini ! De plus, la mécanique montre qu’une variation d’énergie avec la distance correspond à une force appliquée aux plaques. En l’occurrence le calcul de la variation d’énergie montre qu’il s’agit d’une force d’attraction, ce qu’il aurait été très difficile de deviner sans un calcul exact ! Nous ne donnerons pas le calcul complet ici mais le résultat. La valeur de la force vaut :

Cette force est très faible et diminue très vite avec la distance (lorsque la distance double, la force est divisée par seize). Mais elle a été mesurée et depuis les expériences initiales, l’effet a été calculé et mesuré pour toutes sortes de systèmes (par exemple une boule métallique face à un plan, ou deux boules face à face).

Casimir sans fluctuation du vide Il semble cette fois qu’on ne puisse plus dire que le vide est vraiment vide. Pourtant l’analyse précédente est trompeuse ! La méthode ci-dessus expliquant comment calculer des énergies finies avec l’ordre normal est tout à fait correct et sans cela l’énergie de tout système serait infinie (pas seulement le vide). Alors, pourquoi ne peut-on pas le faire avec l’effet Casimir. La raison est simple : cette description est une approximation. En réalité, on a deux systèmes face à face contenant des charges électriques (ce sont des conducteurs, même si les charges des deux signes, électrons et protons, donnent un bilan total égal à zéro). Ces charges échangent donc des particules virtuelles. Et dans tout processus de ce type, nous l’avons vu, les diagrammes vide – vide sont à ignorer. Mais alors pourquoi prendre en compte ces fluctuations du vide (et rien qu’elles !) ci-dessus marche-t-il ? La raison est purement mathématique ! La raison qui fait que l’on peut soustraire ces contributions du vide dans les calculs habituels est aussi la même qui montre que, dans un cas comme celui-ci, un calcul complet sans les fluctuations du vide donne le même résultat que les fluctuations du vide seules. Alors, pourquoi procéder comme ci-dessus ? Simplement parce que le calcul est beaucoup plus facile ! Tenir compte des échanges de particules virtuelles et commencer à calculer les sommes de tous les diagrammes de Feynman est affreusement compliqué. Mais il n’empêche. Physique, c’est un échange de particules virtuelles qui agit sur les plaques (comme d’ailleurs des fluctuations vide – vide, non reliées aux plaques, pourraient-elles les influencer ?) Ce sont les interactions électromagnétiques entre plaques, en tenant compte des effets quantiques, qui produisent cet effet. Un autre exemple de ce type est l’existence des forces de van der Waals entre molécules non chargées électriquement. Ces forces sont due au fait que la position moyenne des électrons est

Page 61: Le Vide.pdf

influencée par les électrons de l’autre molécule. Le calcul peut se faire en n’utilisant que la théorie électromagnétique ce qui donne un résultat analogue à celui obtenu avec un calcul du même type que l’effet Casimir. Une fois correctement interprété, cet effet montre donc que notre vide, bien vide, reste désespérément vide.

VII.4 Le faux vide Pour introduire ce sujet, faisons un petit détour par les symétries en physique des particules.

Les symétries Le mot symétrie a un sens beaucoup plus large en physique que dans le langage courant. Si l’on a

une transformation (mathématique) quelconque agissant sur les grandeurs d’un système physique

(positions et autres grandeurs) et si cette transformation laisse le système invariant (il continue à

évoluer de la même manière et être décrit par les mêmes équations) ont dit qu’il s’agit d’une

transformation de symétrie.

Un exemple est le déplacement. Si je déplace une horloge, les conditions extérieures restant les

mêmes, l’horloge continuera à fonctionner à son nouvel emplacement comme elle l’aurait fait de

l’ancien. On parle de symétrie par translation dans l’espace et plus généralement de

transformations géométriques.

On parle de symétries discrètes lorsque la transformation correspond à seulement un nombre fini de

cas. Par exemple, deux cas avec la symétrie gauche - droite.

Enfin, la transformation peut agir sur une grandeur interne au système, une grandeur qui caractérise

l’état du système mais qui n’est pas géométrique. On parle alors de symétries internes. En physique

des particules, les symétries internes ont une grande importance. Ainsi, l’électromagnétisme est

invariant sous une transformation de la phase des ondes, notées « symétrie U(1) » et l’interaction

faible est invariante sous une symétrie de ses paramètres internes, plus complexe, appelée

« symétrie SU(2) ».

Brisure de symétrie Les symétries ne sont pas toujours respectées. On dit alors que la symétrie est brisée.

Une symétrie n’est pas nécessairement brisée en permanence. Lors de l’évolution du système, la

symétrie peut être respectée puis, dans certaines circonstances, être brisée. La rupture de symétrie

peut être imposée de l’extérieure mais cas le plus intéressant est celui où cette rupture est

spontanée (brisure spontanée de symétrie).

Donnons quelques exemples.

Soit une colonne verticale, un piquet. Pressons dessus verticalement. Même si le piquet est bien

droit et même si l’on appuie le plus verticalement possible, le piquet va plier au lieu de se tasser sur

lui-même. D’autant plus facilement qu’il est long et mince. La raison en est que la situation où le

Page 62: Le Vide.pdf

piquet se comprime sur lui-même est fortement instable. La moindre perturbation, aussi infime soit-

elle, et le piquet se plie comme un arc. On dit qu’il flambe.

Initialement, il y a une symétrie à la rotation (avec l’axe comme piquet). Peu importe les directions

considérées dans le plan horizontal puisque tout est vertical. Mais dès que le piquet se plie, il y a une

direction horizontale privilégiée : c’est la direction dans laquelle se déplace le piquet en pliant. Cette

direction est aléatoire. Elle dépend en fait de minuscules détails microscopiques du piquet et de la

perturbation qui a rompu l’équilibre.

Avec le flambage, une partie de la symétrie de la situation a été perdue.

Un autre exemple est la solidification d’un liquide. La plupart des matériaux se solidifient en formant

une structure cristalline (même les métaux, bien que la taille des cristaux soit généralement petite et

ces derniers orientés de toutes sortes de manière dans le métal, donnant une apparence homogène).

Au départ, dans le liquide, chaque molécule se balade n’importe où. Le milieu est totalement

invariant sous une translation quelconque, dans n’importe quel sens (si l’on ignore la position des

parois). Par contre, une fois cristallisées, les molécules ne sont plus disposées au hasard. Elles sont

arrangées dans une structure géométrique bien ordonnée. Si l’on déplace l’ensemble d’une distance

inférieure à la maille cristalline (de l’ordre de la distance entre les molécules) on obtient une

structure qui n’est pas la même (les molécules ne sont pas au même endroit).

Page 63: Le Vide.pdf

De même il existe des directions privilégiées, ce qui se voit par les facettes d’un gros cristal (par

exemple une pierre précieuse comme un saphir ou un rubis). Là aussi il y a perte de symétrie. La

structure cristalline, lors de la solidification, va dépendre de la position des premières molécules qui

se disposent au hasard (éventuellement sur des centres de nucléations, tel que des poussières dans

le récipient). Il y a brisure spontanée de la symétrie.

Notons que lors de la rupture de symétrie, une certaine quantité d’énergie est libérée. Par exemple,

la solidification libère la chaleur latente de solidification. En se liant entres-elles, les molécules

perdent un peu d’énergie (ce qui rend la liaison stable car pour la briser il faut apporter de l’énergie)

qui est libérée sous forme de vibrations. C’est d’ailleurs parce que le système passe dans un état

d’énergie plus faible que l’état avec symétrie brisée est plus table et que la symétrie se brise

spontanément en libérant l’excès d’énergie. Pour revenir à l’état symétrique, il faut fournir de

l’énergie.

Un autre cas de brisure spontanée de symétrie est donné par le ferromagnétisme (le magnétisme des

aimants que l’on trouve dans le commerce). Chaque atome se comporte, dans certains matériaux

comme le fer, comme un petit aimant qui tend à s’aligner avec ses voisins. Lorsque l’on se situe à

haute température, l’agitation thermique perturbe ces atomes et empêche tout alignement. Mais

dès que l’on descend en dessous d’une température critique appelée température de Curie, les

aimants atomiques s’alignent donnant une aimantation globale au matériau (aimant). Là aussi il y a

rupture de la symétrie car initialement il n’y a aucune direction privilégiée, mais dès que

l’aimantation apparait, il y a une direction privilégiée donnée par la direction d’alignement des

aimants atomiques.

Page 64: Le Vide.pdf

Dans la terminologie en physique, on parle aussi de transition de phase. On passe d’une phase

liquide à une phase solide, ou d’une phase sans aimantation à une phase aimantée. Selon le type de

transition on parle de transition de phase du premier ordre (comme la solidification qui a la

particularité de faire cohabiter les deux phases en même temps, par exemple un glaçon qui flotte

dans de l’eau) ou de transition de phase du second ordre (comme le magnétisme, où tout le

matériau change en même temps). Les transitions de phase du second ordre jouent un rôle

important dans beaucoup de phénomènes physiques.

Un autre exemple important est celui des interactions faibles et le champ électromagnétique. La

théorie et l’expérience montrent qu’elles dérivent d’une seule interaction plus générale appelée

interaction électrofaible obéissant à des symétries plus importantes (on parle d’unification des

interactions). On définit habituellement le vide comme l’état d’énergie la plus basse (état sans

particule). Habituellement, cet état est unique et totalement symétrie (sous le groupe des symétries

auquel obéit l’interaction). C’est le cas du champ électromagnétique, par exemple, dont le groupe de

symétrie est noté U(1) et correspond à un changement dans la phase des ondes électromagnétiques.

Mais l’interaction électrofaible a une particularité : l’état unique le plus symétrique n’est pas l’état d’énergie minimale. On l’appelle parfois faux vide. L’état d’énergie la plus basse n’est pas unique mais un seul de ces états doit être sélectionné. On considère donc qu’il y a rupture spontanée de la symétrie, passant du faux vide (avec libération d’énergie) à un des vides réels possibles, avec une diminution des symétries.

Page 65: Le Vide.pdf

La conséquence pour l’interaction électrofaible est la séparation des interactions faibles et

électromagnétiques qui, à partir de là, se comportent très différemment.

Il est intéressant de noter deux points concernant ce mécanisme :

Il est lié au fait que les particules transmettant l’interaction électromagnétique, les photons,

sont sans masse, alors que celles transmettant l’interaction faible, les bosons W et Z, sont

massifs. D’une manière générale, ce mécanisme est lié au mécanisme de Higgs et à la masse

des particules. Nous n’approfondirons pas ce point ici.

A très haute énergie (forte densité, très haute température, collisions fréquentes et violentes

entre particules) on doit être dans l’état fortement symétrique. A faible énergie (les

Page 66: Le Vide.pdf

conditions dans lesquelles nous vivons), on doit être dans l’état avec rupture spontanée de la

symétrie.

Notons qu’on rencontre sans doute ce genre de phénomène dans d’autres cas, comme pour

l’unification avec l’interaction forte et avec la gravité. Mais cela reste spéculatif car une telle théorie

unifiée (dite grande unifiée ou théorie de tout si elle inclut la gravitation, ce qui ne signifie pas

qu’elle explique tout, c’est juste son nom, c’est « théorie de toutes les interactions ») n’a pas encore

été trouvée. Ou, plus précisément, on en a plusieurs (théories de super symétries, supergravité,

théories des cordes, gravitation quantique à boucles, pour ne citer que les plus avancées et les plus

étudiées) et on ne sait pas laquelle est la bonne (ni même si la bonne théorie est l’une d’entre elles).

C’est-à-dire que ces théories ne sont pas assez avancées pour avoir fourni des moyens fiables de les

valider par l’expérience ou, tout simplement, ces expériences sont hors de notre portée.

Comment interpréter cela ? Nous avons donc deux sortes de vide, le vrai vide et le faux vide. Comment l’interpréter ? Et y a-t-il réellement un vide vraiment vide ? La réponse est oui. Le vrai vide, celui avec l’énergie minimale, est le vide quantique que nous avions étudié précédemment. C’est un état sans aucune particule ne contenant vraiment rien de rien. Et le faux vide ? Cette fois, nous voilà avec quelque chose de vraiment nouveau. Cet état a une énergie plus grande que l’état du vrai vide, comme pour les états à plusieurs particules. C’est un état excité qui manifestement n’est pas du rien du tout. Toutefois, il est faux de dire que le faux vide contient des particules réelles. C’est aussi un vide qui répond à la définition . Ce vide est parfaitement homogène, isotrope et même hautement symétrique. Placé dedans, nous serions bien en peine de dire que les champs de ce vide sont dans un état excité. Mais cela est seulement dû au caractère « lisse » de ce vide. Est-ce que l’on pourrait avoir une situation avec du faux vide quelque part ? Non, pas sans particules réelles. La raison en est qu’il est instable. Il se brise spontanément en vrai vide. Il ne peut donc exister que si une grande énergie est disponible, comme dans le cas de la cristallisation où l’état liquide n’existe que si on chauffe le cristal (par exemple la glace pour la faire fondre). Cette énergie ne peut être fournie que par des multitudes de particules se déplaçant à très grande vitesse et se heurtant violemment, c’est-à-dire à très haute température (pour l’interaction faible on parle de milliards de milliards de degrés). Ce vide est particulièrement bien remplit ! Retirons les particules. A-t-on alors un faux vide ? Non, car alors il se brise spontanément en vrai vide. Le faux vide porte bien son nom : impossible d’avoir une zone de faux vide sans rien dedans quelque part. En se transformant en vrai vide, l’excès d’énergie va être libéré. Cette libération peut prendre plusieurs formes : augmentation de l’énergie de particules présentes, création spontanée d’un flot de particules ou, peut-être (cela reste spéculatif), une violente augmentation de la taille de l’univers (inflation).

VII.5 Mécanique quantique et relativité générale L’étape suivante est l’application de la mécanique quantique à la gravité. Mais c’est aussi une étape difficile. Heureusement, il existe une étape intermédiaire plus abordable est particulièrement intéressante. C’est la théorie quantique des champs en espace-temps courbe.

Page 67: Le Vide.pdf

L’idée est de formuler la théorie quantique des champs, non pas dans l’espace-temps de la relativité restreinte, mais dans l’espace-temps de la relativité générale. Donc, on prend un espace-temps décrit de manière classique, imposé, et on étudie comment se comportent les champs quantiques dans ce genre de situation. C’est un domaine fort pointu et très difficile, même en vulgarisation. En effet, la mécanique quantique (et les champs quantique) est pleine d’aspects peu intuitifs. Il en est de même de la relativité générale. Et ces aspects parfois très éloignés du quotidien sont différents dans les deux cas : le contenu (matière, énergie,…) pour la mécanique quantique, le contenant (l’espace et le temps) pour la relativité générale. Les deux ensembles combinent donc tout ce qu’il faut pour rendre la théorie particulièrement exotique et difficile à appréhender. Nous n’en présenterons que les aspects principaux, ceux qui nous intéressent ici, et sans entrer dans le détails.

Le vide quantique avec accélération Nous avons dit plus tôt que l’état du vide quantique était invariant sous certaines transformations. C’est vrai des transformations de la relativité restreinte : translations dans l’espace et le temps (vide identique en tout point et tout instant), par rotations (vide isotrope) et lorsque l’on considère des observateurs se déplaçant à vitesse constante (vide invariant relativiste). Mais ce n’est plus vrai dans le cas des accélérations ! Ce résultat, montré par le calcul, est d’ailleurs un peu surprenant puisque à chaque instant on peut donner la vitesse instantanée de l’observateur et se dire « c’est comme s’il se déplaçait à cette vitesse, constante, mais pendant un intervalle de temps très court. Et donc là aussi le vide doit être identique. » Mais c’est faux ! Considérons donc notre vide quantique habituel , dit vide de Minkowski. Considérons ensuite un observateur accéléré. Lui aussi peut observer les champs quantiques et définir, par les méthodes habituelles, un vide quantique que nous notons . Le fait remarquable ici est que . Une chose qui est habituellement ignorée en théorie quantique des champs sont les états d’énergie négative. C’est de bon aloi puisque ces états ne sont jamais observés pour des particules réelles (mais possibles pour des particules virtuelles). On peut calculer comment les composantes des champs d’énergie positive et négative pour un observateur « immobile » (voyant le vide de Minkowsi) sont reliées aux composantes d’énergie positive et négative de l’observateur accéléré. Cela donne quatre coefficients (reliant 2 composantes à 2 autres, soit 2x2 coefficients) appelés coefficients de Bogoliubov. Fait remarquable dans le cas des accélérations, le coefficient reliant la composante d’énergie négative à la composante d’énergie positive, notée généralement , est non nulle (elle est nulle s’il n’y a pas d’accélération).

L’effet Unruh Que va voir notre observateur accéléré ? Donc, supposons que l’on aie le vide de Minkowski . Quel est l’état du système physique (les champs de l’espace environnant) pour l’observateur accéléré ? Est-ce le vide . Non puisque nous savons que l’état est différent. Ce qu’il va observer c’est bien le vide de Minkowski. Mais pour lui, ce qu’il appelle vide est différent. A quoi correspond, pour lui, cet état ? Exprimé dans son état accéléré, cet état n’est pas le vide mais un état, notons le (avec une apostrophe pour bien indiqué que c’est par rapport à l’observateur accéléré), différent. C’est-à-dire un état avec des particules !

Page 68: Le Vide.pdf

Chose remarquable, le nombre de particules dans cet état est relié au coefficient . On peut calculer exactement cet état et on montre que, par rapport à la définition du vide accéléré, c’est un état contenu un nombre de particules variant avec la fréquence et que c’est un état identique à un rayonnement thermique de température calculable. C’est ce qu’on appelle l’effet Unruh et la température est appelée température de Unruh. Pour l’observateur accéléré, l’espace vide (pour nous), est en réalité baigné par un rayonnement thermique, un flux de particules. Comment interpréter ça ? Est-ce que ce fameux vide « sans rien de rien » contiendrait finalement quelque chose ? Un rayonnement uniquement perçu par un observateur accéléré ? Non. La situation est en fait analogue à ce que nous avons vu avec l’effet Casimir. Si l’observateur peut détecter des particules, alors il ne s’agit pas de fluctuations du vide mais d’un échange de particules virtuelles. Un échange entre un éventuel détecteur porté par l’observateur et… quoi ? L’observateur est accéléré. Cela ne peut pas se produire tout seul. Il faut forcément appliquer une force à l’objet pour pouvoir lui communiquer l’énergie nécessaire à son accélération. Pour des raisons simples liées à la conservation de l’énergie, l’observateur doit subir une force de freinage, analogue à la force de Casimir, qui permet de compenser l’énergie qu’il pourrait éventuellement capter à partir du rayonnement de Unruh. L’énergie fournie pour accélérer le corps se retrouve donc en réalité sous forme de rayonnement perçu. Il s’agit d’un échange de particules virtuelles, c’est-à-dire d’interactions, complexes entre mécanisme servant à accélérer l’observateur et l’observateur, en présence des champs quantiques considérés. Le détail peut être plus ou moins complexe mais le bilan simple (plus facile à calculer sous forme de bilan avec le vide comme dans le cas de l’effet Casimir). Donc, le vide quantique reste vide, même si on a l’a un effet bien curieux.

Le cas de l’espace-temps courbe Considérons maintenant un espace-temps courbe, comme en relativité générale. Ici aussi il est possible de définir différentes sortes de vide suivant les observateurs. Mais une difficulté importante se pose. Dans le cas de l’effet Unruh on compare la situation de l’observateur accéléré par rapport à une situation sans accélération décrite par l’espace-temps de Minkowski et son vide. Mais ici, ce n’est pas possible. L’espace-temps n’est pas celui de Minkowski. Il n’est même pas possible de définir un système de référence inertiel global, c’est-à-dire où tout objet ne subissant aucune force, autre que la gravité, peut être immobile. C’est impossible car suivant la gravité (c’est-à-dire suivant la courbure de l’espace-temps), les objets vont avoir des mouvements différents. Or un tel repère global, c’est-à-dire en fait un espace-temps de Minkowski, est nécessaire pour définir un vide. Il est encore possible de définir différentes sortes de vides selon divers critères et méthodes, mais toutes ces procédures sont ambigües ou posent divers problèmes. Il n’y a pas de méthode parfaite. C’est une difficulté considérable qui rend la théorie quantique des champs en espace-temps courbe très compliquée. On manque de repères intuitifs auxquels se raccrocher.

Page 69: Le Vide.pdf

Cela ne veut pas dire qu’il n’y a aucun espoir. Il existe en particulier des situations abordables et qui peuvent être résolues, ne fut-ce que par le calcul, de manière rigoureuse puis interprétées. Voyons une telle situation.

L’effet Hawking Un trou noir est un corps tellement massif que rien ne peut s’en échapper. Plus exactement, l’espace-temps est tellement déformé qu’il se forme une zone appelée horizon du trou noir où toutes les trajectoires (géodésiques) vont de l’extérieur vers l’intérieur. On l’appelle aussi horizon des événements car tout événement se produisant sous l’horizon ne peut être connu de l’extérieur. Il y a une coupure causale entre l’extérieur et l’intérieur. Ce cas est abordable car :

Il présente des symétries facilitant le calcul (corps sphérique, espace sans matière sauf au cœur du trou noir).

Très loin du trou noir, la gravité y est très faible et donc l’espace-temps très peu courbé. On peut considérer que très loin l’espace-temps est très proche de l’espace-temps de Minkowski. On a donc un moyen naturel de définir le vide quantique dans cette situation.

Le calcul, effectué par première fois par Stephen Hawking, montre que dans ces circonstances, le trou noir émet un rayonnement. Ce phénomène est analogue au cas de Unruh bien que plus compliqué à traiter. Le rayonnement est appelé rayonnement de Hawking. On peut se demander comment un rayonnement peut être émis par un trou noir puisque rien ne peut en sortir. En réalité, le rayonnement prend naissance juste au-dessus de l’horizon, ce qu’on appelle la surface du trou noir (bien qu’en principe il n’y ait pas de matière juste en dessous : celle-ci tombe inéluctablement vers le centre). On peut représenter la situation intuitivement comme suit :

Page 70: Le Vide.pdf

Dans le voisinage de l’horizon, des fluctuations du vide se produisent. Pour des raisons de conservation de l’énergie et de l’impulsion, les fluctuations du vide sont toujours des paires de particules virtuelles. Près de l’horizon, il se peut très bien qu’une franchisse l’horizon, elle est alors irrémédiablement perdue, tandis que l’autre s’échappe (si elle a suffisamment d’énergie). Pour des raisons liées à la conservation de l’énergie, une des particules a une énergie positive et l’autre une énergie négative. Le calcul montre que c’est la particule d’énergie négative qui est absorbée par le trou noir. Notons que ce faisant, cette particule va diminuer la quantité d’énergie du trou noir et celui-ci va rétrécir (en relativité générale, il ne peut que grandir, mais la relativité générale ne prend habituellement pas en compte l’énergie négative). La particule qui s’échappe fait partie du rayonnement de Hawking. Ce rayonnement, comme dans le cas Unruh, est un rayonnement thermique auquel on peut associer une température appelée température de Bekenstein-Hawking (Bekenstein avait initialement trouvé cette température en raisonnant par analogie avec la thermodynamique). Notons que cette température est infime, le rayonnement trop faible pour avoir une chance d’être détecté et la diminution du trou noir minuscule, du moins pour des trous noirs de la masse d’une étoile (de manière étonnante, plus la masse est grande, plus le rayonnement est faible). Cette faiblesse s’explique aisément. La partie pour échapper à l’attraction colossale du trou noir doit avoir une énergie gigantesque. Or les fluctuations du vide ayant une énergie grande sont aussi les plus rares.

Le vide dans le cas de Hawking Notons que ce rayonnement est perçu par l’observateur lointain et pourrait être capté (au moins en théorie ou pour un rayonnement plus fort, par exemple créé par un tout petit trou noir). Peut-on cette fois dire que le vide est remplit de particules ? Qu’il n’est pas vraiment vide ? Non, encore une fois. Voyons de plus près pourquoi. Le calcul montre que les effets de la théorie quantique des champs en espace-temps courbe sont analogues, du point de vue de la gravité, à la quantification de la gravitation dit « à une boucle ». C’est-à-dire que l’on considère le champ gravitationnel comme un champ quelconque et on lui applique la quantification, comme on le fait pour d’autres champs. Les particules transmettant la gravité sont alors appelées gravitons (analogue des photons pour le champ électromagnétique). Et les diagrammes de Feynman sont limités aux cas où le diagramme des gravitons ne contient qu’une seule boucle au maximum. Et le rayonnement de Hawking est alors une conséquence des interactions quantiques entre le champ gravitationnel et les champs associés aux particules émises. N’oublions pas qu’en présence de la gravité, il y a quelque chose : le champ gravitationnel (très intense pour un trou noir). Le vide autour du trou noir n’est pas vraiment vide, contrairement au vide de Minkowski très loin du trou noir. Il n’est donc pas si étrange d’observer un rayonnement issu de cette région. Il y a de fortes analogies entre le rayonnement de Hawking et de Unruh. Localement (dans une toute petite zone près du trou noir) les deux sont mêmes indentiques. Nous avons dit plus haut que le

Page 71: Le Vide.pdf

rayonnement de Unruh avait pour origine des interactions complexes entre le mécanisme accélérateur, l’observateur et les champs quantiques. Dans ce cas-ci, le mécanisme accélérateur est le champ gravitationnel. Et le rayonnement observé est un échange de particules virtuelles entre le détecteur (l’observateur lointain) et le champ gravitationnel (rappelons qu’une particule virtuelle est une particule comme une autre, son statut de virtuel ou réel dépend respectivement du fait qu’elle est échangée entre deux particules ou deux systèmes ou bien qu’elle est considérée comme un stade final « observé »). Le vide ordinaire, de Minkowski, reste un vrai vide « sans rien de rien ».

L’énergie noire L’univers est en expansion. Les galaxies s’éloignent les unes des autres. Ce phénomène est à la fois bien observé et prédit par la relativité générale. Mais, celle-ci, prédit également que cette expansion doit ralentir progressivement. Ce ralentissement est dû à l’effet de la gravité qui tend à rapprocher les objets. Ce phénomène est analogue à une pierre jetée vers le haut. Lorsqu’on la jette (équivalent à la naissance de l’univers, le big bang, d’origine inconnue), la pierre monte de plus en plus haut (équivalent à l’expansion des galaxies), mais elle ralentit de plus en plus (le ralentissement de l’expansion) et soit qu’elle finit par retomber (pour l’univers on appelle cela le big crunch), soit elle s’éloigne indéfiniment dans l’espace si on l’a lancé assez fort (les observations semblent conforter ce scénario pour l’univers, une expansion éternelle). Mais, cette fois, les observations donnent tort à cette vision. Si l’expansion s’est bien ralentie pendant une partie de l’histoire de l’univers, on observe actuellement l’inverse : l’expansion s’accélère (heureusement fort peu). La cause de cette accélération est totalement inconnue. Il est possible de modéliser ce phénomène avec la relativité générale. Quand on examine les équations d’Einstein on constate que leur forme la plus générale inclut une constante appelée constante cosmologique notée . Pendant longtemps, les physiciens l’ont posée égale à zéro, d’une part parce qu’elle semblait inutile, d’autre part on ne savait pas la relier à une quelconque cause physique (comme la matière donnent un des termes dans l’équation d’Einstein, ou la courbure de l’espace-temps). Mais si cette constante est non nulle, elle peut entraîner ce qui est observé. On ignore toutefois si cette modélisation est la bonne. Il faudra d’abord affiner les mesures de l’accélération observée. Il se fait que cette constante a les mêmes unités qu’une énergie. Comme elle est invisible, on lui a donné naturellement le nom poétique d’énergie noire. C’est une énergie assez particulière car le calcul montre que, contrairement à la matière / énergie habituelle, elle est répulsive du point de vue de la gravité. Une possibilité est que cette énergie ne soit rien d’autre que l’énergie du vide, appelée parfois dans ce cadre la quintessence. C’est tout à fait possible d’autant que, à nouveau, il ne s’agit pas d’un vide parfait puisqu’il contient des choses : de la matière, le champ gravitationnel,… Mais personne ne sait comment le calculer (un calcul simple donne un résultat pour qui est des milliards de milliards de milliards de … etc… fois trop grand, cent ordre de grandeur trop grand. Difficile de faire pire que ça !) Et on ne sait même pas si c’est la bonne approche. Notons qu’un phénomène du type rayonnement de Hawking peut aussi se produire avec l’expansion de l’univers. Il n’est d’ailleurs pas exclu, pour certains modèles, qu’une partie de la matière vienne de là (produite pendant une phrase très brève au début de l’univers, appelée inflation, pendant laquelle

Page 72: Le Vide.pdf

l’expansion était extrêmement violente). Il n’est pas exclu qu’il y ait là aussi un lien avec l’énergie noire (l’effet étant la réaction en retour dû à l’émission du rayonnement, tout comme le rayonnement de Hawking produit un amaigrissement du trou noir par injection d’une énergie exotique, négative). Malheureusement, les calculs notoirement difficiles dans ce domaine et certaines difficultés techniques n’ont pas permis jusqu’ici de dévoiler entièrement le mystère.

VIII. La gravité quantique Il est indispensable d’arriver à une théorie qui permet la quantification de la gravité. En effet, en relativité générale, la courbure de l’espace-temps est donnée par la quantité de matière et d’énergie à travers l’équation d’Einstein. Or c’est la mécanique quantique qui décrit les propriétés de la matière. En particulier, la matière peut se trouver dans des états de superposition quantique. Par exemple, une particule peut être à deux endroits. Par conséquent, la courbure de l’espace-temps, qui en découle, devrait aussi pouvoir se retrouver dans un état de superposition quantique. Cette question est extrêmement difficile, pour toute une raison de difficultés techniques. L’une d’entre-elles est la cadre conceptuel extrêmement différent de la relativité générale et de la mécanique quantique, une autre est le fait que la théorie des champs utilise des outils mathématiques faisant jouer un rôle spécial au temps, un rôle de paramètre extérieur, alors que cela est interdit en relativité générale ou espace et temps se conjuguent et deviennent des grandeurs dynamiques comme les autres. De plus, pour valider une telle théorie il faudrait pouvoir la tester dans des domaines où les manifestations de la gravité et de la mécanique quantique se conjuguent intimement. Or, ces domaines n’existent qu’à des échelles submicroscopiques ou à des énergies fabuleuses telles que celles rencontrées au centre des trous noirs ou lors de la naissance de l’univers. Ces domaines nous sont totalement inaccessible autant par l’observation que par l’expérience. Il n’est toutefois pas exclu que des effets exotiques ou des traces résiduelles des effets de la gravité quantique puissent être observées. Jusqu’ici la quête a été vaine. Ceci explique qu’il existe plusieurs approches théoriques pour essayer de résoudre le problème de la gravité quantique et que l’on n’ait pas encore pu les départager. Plus encore, les difficultés mathématiques sont telles que ces théories ne sont pas encore arrivées à maturité malgré des efforts déjà importants.

Quantification du champ gravitationnel La première idée est la suivante. On considère un espace-temps donné, imposé initialement. Ca peut-être l’espace-temps de Minkowski ou celui d’un trou noir ou tout autre. Ensuite, on considère de petites perturbations de cet espace-temps de base. La gravité est considérée comme un effet de ces petites perturbations. Jusqu’ici, on est toujours en relativité générale, c’est juste une formulation différente parfois appelée gravité linéarisée si on se limite aux plus petites déformations et utilisée dans l’étude, par exemple, des ondes gravitationnelles. On considère ensuite ce champ de déformations comme un champ quelconque. On peut alors lui appliquer les mêmes techniques de quantification que pour les autres champs. Comme nous l’avons vu. On obtient alors des particules appelées gravitons qui sont au champ gravitationnel ce que le

Page 73: Le Vide.pdf

photon est au champ électromagnétique. Et on peut décrire les interactions avec des diagrammes de Feynman. Cette approche a cependant deux défauts majeurs :

On impose arbitrairement un espace-temps de base. Cela limite la théorie et empêche de considérer des déformations majeures (par exemple, le passage d’un espace-temps de Minkowski à celui d’un trou noir par l’ajout d’une déformation n’est pas possible).

La théorie est infestée de valeurs infinies. C’est quelque chose de courant en théorie quantique des champs et nous avons vu une des techniques utilisées pour éliminer de tels infinis. Une autre technique, indispensable, consiste à remplacer certaines valeurs infinies (tel que masse, charge électrique, etc.) par des valeurs finies obtenues par la mesure (la masse de l’électron, etc.). C’est la technique de renormalisation. Lorsque les infinis peuvent être tous éliminés par quelques constantes, on dit que la théorie est renormalisable. C’est le cas de la théorie quantique de l’électromagnétisme ou de l’interaction faible. Malheureusement, ici, ce n’est pas possible car le nombre de type d’infinités est lui-même infini et il faudrait ajouter une infinité de constantes, toutes obtenues par la mesure. La théorie ne peut (presque) plus rien prédire car presque tout doit être mesuré. Elle a quand même quelles possibilités, nous avons vu qu’avec des diagrammes à une boucle, on a un résultat équivalent à la théorie quantique des champs dans un espace-temps classique ce qui aboutit à certaines prédictions comme le rayonnement de Hawking. Mais ces possibilités sont beaucoup trop limitées.

Quelles sont les solutions ? Plusieurs ont été explorées. Voyons trois des solutions les plus élaborées. Notons que nous n’en présentons que quelques éléments, juste ce qui est nécessaire pour aborder la problématique du vide.

Changement dans la géométrie de l’espace-temps Une idée est de traiter la géométrie de l’espace et du temps comme on le fait en mécanique quantique en remplaçant les grandeurs mesurables par des opérateurs. On obtient ainsi une géométrie très étrange ou, par exemple, multiplier la longueur et la largeur d’un rectangle (sa surface) ne donne pas le même résultat que de multiplier sa largeur fois la longueur ! Cette approche est appelée géométries non commutatives, particulièrement développées par Alain Cones. Cette approche est extrêmement difficile et abstraite. Du point de vue du vide, elle ne change pas grand-chose. Seules les règles géométriques de l’espace et du temps sont modifiées.

La théorie des cordes Une autre idée est de remplacer les particules ponctuelles par des lignes, appelées cordes. Plus exactement, on a un « champ de cordes » comme on pourrait avoir un « champ de photons » (le champ électromagnétique). Tous les infinis disparaissent de la théorie. Cette théorie s’est avérée extrêmement riche et féconde. Peut-être même trop riche (il y a trop de possibilités).

Page 74: Le Vide.pdf

Dans cette théorie les cordes peuvent vibrer et ces états de vibration leur donnent diverses propriétés. En particulier elles donnent des types de particules différentes. Un des succès de la théorie est que de cette manière, le graviton émerge naturellement (c’est l’état de plus faible vibration) sans devoir l’introduire exprès dans la théorie. La théorie devient alors analogue à la théorie quantique des champs en espace-temps courbe. En particulier, elle est semblable à la première approche présentée plus haut mais sans les infinis qui nous gênaient. Le vide reste donc un vide quantique analogue à ceux que nous avons vu.

Gravité quantique à boucles Une autre idée encore est de quantifier directement les équations de la relativité générale en leurs appliquant les méthodes de la mécanique quantique. Cette approche s’est heurtée à des difficultés techniques difficiles mais qui ont pu en partie être surmontés. Cela conduit à un espace-temps étrange dont voici par exemple une des représentations.

Une telle structure appelée mousse de spins est un réseau avec des valeurs aux nœuds (obéissant à diverses règles). Ces valeurs représentent les divers champs quantiques. Ce réseau obéit à certaines règles que l’on peut calculer. Par exemple, la longueur des lignes entre deux nœuds ne peut pas être quelconque. Cette longueur est quantifiée (comme l’énergie ou d’autres grandeurs). La plus petite longueur possible n’est pas zéro mais une longueur extrêmement petite appelée longueur de Planck. L’espace-temps est une superposition quantique d’états comme celui-ci-dessus.

Page 75: Le Vide.pdf

Tous les résultats théoriques de cette approche n’ont pas encore pu être obtenus. Par exemple, one ne connait même pas la structure du réseau correspondant au vide de Minkowski (calculs encore trop difficiles) ! Mais quel qu’il soit, ce vide n’est pas un vide traditionnel. Ce n’est plus un vide « sans rien de rien » car même sans matière, sans énergie, il possède une « granularité » à l’échelle de Planck. Il reste donc cette fois un petit quelque chose, qu’on ne comprend pas encore vraiment et, bien entendu, seulement si cette théorie est juste. Ue possibilité de test expérimental est que des photons à très haute énergie, donc une longueur d’onde très petite, devraient « sentir » la granularité de l’espace-temps (comme une petite roulette sur des graviers goudron alors que les gros pneus ne sentent pas ces irrégularités). Leur vitesse devrait être légèrement plus faible que la vitesse de la lumière dans le vide que l’on connait. Cette observation n’a pas encore pu être menée à bien (il faut des photons d’énergie vraiment très grande et les différences sont minuscules).

IX. Références - Georges Albert Boutry, Vide (technique du), Encycopedia Universalis.

- Henri Gouhier, François Russo, Pascal (Blaise), Encycopedia Universalis.

- Marie-Antoinette Tonnelat, Ether, Encycopedia Universalis.

- Charles W. Misner, Kip S. Thorne, John Archibald Wheeler, Gravitation, W. H. Freeman and

Comany, New York.

- V. Ougarov, Théorie de la relativité restreinte, Editions Mir, Moscou.

- Feynman, Leigthon, Sands, Le cours de physique de Feynman, Mécanique quantique,

InterEditions, Paris.

- Claude Itzykson, Jean-Bernard Zuber, Quantum Field Theory, McGraw-Hill International

Editions, Physics Series.