Centre de simulation climatique de la NASA

Satellites, course à l'espace et calcul intensif :
Comment l'ordinateur du cluster Beowulf de la NASA Goddard
est devenu une technologie spatiale primée


Le 7 avril 2022, Beowulf Cluster Computing a été intronisé au Space Technology Hall of Fame lors du 37e Space Symposium annuel organisé par Space Foundation à Colorado Springs, Colorado. L'objectif déclaré du temple de la renommée est de « reconnaître les technologies qui changent la vie et qui émergent des programmes spatiaux mondiaux ; honorer les scientifiques, ingénieurs et innovateurs responsables ; et communiquer au public l'importance de ces technologies en tant que retour sur investissement dans l'exploration spatiale.

Au cours de la cérémonie d'intronisation, les informaticiens James Fischer, ancien chef de projet du projet Earth and Space Sciences (ESS) de la NASA, et Thomas Sterling, ancien coordinateur de l'évaluation ESS, ont tous deux été reconnus et honorés pour leur rôle clé dans le développement du premier Beowulf cluster informatique au Goddard Space Flight Center de la NASA en 1994. Le projet ESS de la NASA faisait partie du programme de calcul et de communications haute performance (HPCC) de la NASA. Fischer a été impliqué dans la recherche sur l'architecture informatique haute performance de la NASA Goddard pendant des décennies, et Sterling a rejoint l'équipe en 1992 pour aider les scientifiques de la NASA à mieux utiliser les architectures informatiques parallèles innovantes du projet. Le cluster d'ordinateurs Beowulf a été une percée majeure pour l'équipe du projet ESS : il a établi une nouvelle norme pour l'informatique parallèle évolutive utilisant des réseaux d'ordinateurs personnels en réseau peu coûteux.

Mike Little, un expert de longue date des systèmes informatiques de la NASA qui a travaillé au siège de la NASA (HQ) dans les années 1990, gérant une autre partie du programme de calcul intensif de l'agence dans Code R (l'ancienne direction de la recherche et de l'ingénierie), a rappelé qu'il avait connu le travail de Fischer et Sterling et avait assisté aux examens du programme HPCC au siège de la NASA. Little se souvient : « J'étais très conscient et enthousiasmé par ce qu'ils faisaient dans le cadre du projet ESS. »

Remarquant l'impact bouleversant du projet ESS, Little a observé : "Le cluster d'ordinateurs Beowulf a été une percée à la NASA qui a permis de nombreuses autres innovations, y compris des prévisions météorologiques numériques précises et basées sur des données et l'évolution de la conception des avions sans le l'utilisation des souffleries. Pratiquement tous les autres domaines des sciences, des mathématiques et de la biologie continuent de bénéficier directement de ce travail révolutionnaire. »

Cependant, qu'est-ce qui a poussé la NASA à développer des ordinateurs plus rapides ? Quels ont été les environnements techniques et sociétaux qui ont suscité ces innovations ? Selon Jim Fischer, c'est une histoire qui remonte à la course à l'espace au milieu des années 1950, lorsque les États-Unis et l'ex-Union soviétique se disputaient la domination de la technologie des missiles et des capacités de vol spatial pendant la guerre froide historique.

NASA Center for Climate Simulation

En 1955, l'administration Eisenhower avait annoncé publiquement son intention de lancer un satellite scientifique américain en orbite pendant l'Année géophysique internationale (AGI), qui s'étendait de juillet 1957 à décembre 1958. Cet effort de recherche scientifique mondial collaboratif visait à étudier plusieurs phénomènes des sciences de la Terre, collecter des données et partager les résultats de la recherche entre les dizaines de pays participants. Plusieurs centres de données mondiaux ont également été créés pour stocker les données IGY partagées. Les résultats notables des explorations IGY incluent la confirmation de la théorie de la tectonique des plaques, l'exploration polaire, la découverte des ceintures de rayonnement de Van Allen dans la magnétosphère terrestre et le développement de satellites scientifiques.

Après que l'Union soviétique a lancé avec succès le premier satellite Spoutnik en octobre 1957, franchissant cette étape importante du vol spatial avant les États-Unis, la soi-disant « crise Spoutnik » a commencé, avec la perception choquante que les États-Unis étaient à la traîne de l'Union soviétique dans l'enseignement de la technologie et des sciences. En réponse, le gouvernement américain a redoublé d'efforts pour faire progresser les vols spatiaux.

Le Congrès américain a rapidement adopté le National Aeronautics and Space Act de 1958, et deux nouvelles agences gouvernementales sont nées de la crise Spoutnik : la National Aeronautics and Space Administration (NASA) à vocation civile et la Defense Advanced Research à vocation militaire. Agence des projets (DARPA). La NASA est devenue le successeur de son prédécesseur, l'ancien Comité consultatif national pour l'aéronautique (NACA), un groupe civil fondé en 1915 pour rattraper la technologie aéronautique européenne alors supérieure pendant la Première Guerre mondiale. Le comité de nominations présidentielles de la NACA, qui comprenait l'aviateur pionnier Orville Wright, a créé le Langley Research Center (LaRC) à Hampton, en Virginie, en 1920 et a commencé à construire une série de souffleries pour tester de nouveaux avions, un exemple classique des avantages commerciaux et publics. des technologies dérivées de la NASA.

En mai 1959, la NASA a établi sa première installation de vol spatial à Greenbelt, dans le Maryland, le Goddard Space Flight Center. Le laboratoire de recherche navale des États-Unis avait développé le projet Vanguard dans le but de lancer un satellite scientifique pendant l'AGI à l'aide d'une fusée Vanguard à 3 étages et de suivre le vaisseau spatial. Après le lancement de Spoutnik, le personnel de la LNR du projet Vanguard a été transféré du laboratoire de Washington, DC à NASA Goddard. Le projet Vanguard a ensuite été géré par la NASA et le personnel du satellite est devenu les premiers occupants de la nouvelle installation de la NASA.

Trois des onze lancements de satellites Vanguard ont réussi, dont le dernier satellite lancé en septembre 1959, Vanguard III. À bord se trouvaient quatre expériences distinctes, mesurant le champ magnétique terrestre ; les émissions de rayons X du Soleil ; densités atmosphériques supérieures; et l'impact des micrométéorites sur la coque extérieure du petit vaisseau spatial (50,8 cm de diamètre). Le satellite Vanguard III est toujours en orbite terrestre après 62 ans et pourrait continuer à orbiter pendant encore 200 ans.

Les premières recherches informatiques à la NASA Goddard étaient une réponse à la course à l'espace du milieu du XXe siècle. L'ancien directeur du projet Vanguard de la NRL, Jack Townsend, est devenu directeur adjoint des sciences spatiales et des applications satellitaires à la NASA Goddard, et David Schaefer, un physicien qui faisait partie de l'équipe originale de la NRL qui a travaillé sur le système de télémétrie des satellites Vanguard, est passé de la NRL à la NASA. en même temps.

Schaefer était un expert des amplificateurs magnétiques. Au NRL, il a développé la radiotélémétrie pour les satellites du projet Vanguard, permettant la transmission du nombre de frappes de micrométéorites en temps réel vers des récepteurs sur Terre. À la NASA Goddard, Schaefer a assumé le rôle de développer l'informatique pour l'espace.

Avec chaque nouveau satellite développé à la NASA Goddard, davantage d'informatique embarquée a été progressivement ajoutée, Schaefer pilotant le premier transistor et le premier circuit intégré dans l'espace. Fischer a rappelé que "l'ajout de l'informatique embarquée est devenu quelque chose que les scientifiques ont apprécié, car s'ils avaient une sorte d'intelligence à bord, ils pourraient récupérer plus de données scientifiques en travaillant avec les informaticiens". Au fil du temps, l'attention de Schaefer s'est étendue à l'amélioration de la capacité des ordinateurs au sol de l'époque à capturer les données scientifiques transmises par chaque nouveau satellite.

Le premier débit de données était d'un bit par seconde, mais lorsque le débit de données a augmenté dans les années 1970, les données ont commencé à s'accumuler à la NASA Goddard dans d'immenses salles remplies de bandes de stockage rondes qui devaient être indexées, montées et demandées pour y accéder. . L'ensemble du processus était inefficace, long et coûteux. Dans les années 1970, les responsables de la NASA ont anticipé la nécessité d'augmenter considérablement les vitesses de liaison descendante pour les nouveaux satellites Landsat d'observation de la Terre. Étant donné que les satellites Landsat produisent une image complète de la surface terrestre de la Terre en un peu plus de deux semaines, l'augmentation de la quantité de données a exigé un transfert de données plus efficace ainsi que des capacités de calcul plus rapides et plus puissantes. La NASA devait trouver une nouvelle façon d'effectuer davantage de traitement de données à bord ou de réduire d'une manière ou d'une autre le volume des données collectées par satellite.

Avec ces besoins à l'esprit et avec un flux de financement pour répondre aux exigences de la mission Landsat, Dave Schaefer a dirigé son équipe pour développer un processeur massivement parallèle (MPP), le premier du genre. Il a embauché Jim Fischer en 1974 pour travailler sur des idées de mise en œuvre du MPP. En 1978, George Rumney, maintenant au Centre de simulation climatique de la NASA (NCCS), est venu à bord pour travailler sur le logiciel du MPP. Lorsque Schaefer a pris sa retraite en 1981, Fischer est devenu le chef d'équipe. L'informatique massivement parallèle a séduit la communauté scientifique de la NASA et a été commercialisée par des sociétés telles que Digital Equipment Corporation et MasPar Computer Corporation. L'utilisation réussie par Goddard de l'ordinateur MasPar a positionné l'équipe pour jouer le rôle principal dans le projet ESS du programme HPCC à partir de 1992.

L'un des objectifs techniques d'ESS était de développer une station de travail massivement parallèle à l'usage des scientifiques de Goddard. Avec cet objectif à l'esprit, Sterling a eu l'idée de combiner le nouveau système d'exploitation Linux open source avec des ordinateurs personnels et des câbles Ethernet de pointe pour la mise en réseau, en intégrant ces technologies dans des grappes d'ordinateurs appelées Beowulf. Sterling a fait venir Don Becker à bord pour l'aider dans le projet, car Becker était un gourou de Linux qui avait développé des pilotes Ethernet utiles et pouvait intégrer le prototype Beowulf. Le responsable de l'ESS pour les logiciels système, John Dorband, a adopté cette nouvelle idée et il a commencé à en trouver des applications au sein du réseau de chercheurs scientifiques de l'ESS.

Mike Little, ingénieur en systèmes informatiques de la NASA, qui, comme Fischer et Schaefer, est impliqué dans l'informatique haut de gamme depuis plusieurs décennies, a souligné l'impact du premier cluster informatique Beowulf et l'importance de ces technologies en tant que retour sur investissement. dans l'exploration spatiale, "Au début des années 1990, alors que la NASA devenait de plus en plus dépendante du supercalcul pour créer des modèles basés sur la physique, la résolution devenait de plus en plus importante." Pour faire fonctionner ces modèles, des supercalculateurs vectoriels plus grands étaient nécessaires, mais leur coût élevé limitait ce que l'agence pouvait se permettre. L'approche Beowulf offrait des performances comparables, mais elle était dix fois moins chère.

Le cluster informatique Beowulf, inventé par l'équipe du projet ESS de la NASA Goddard, est à la base des systèmes informatiques haut de gamme d'aujourd'hui. Le Beowulf original était un nouveau modèle permettant le stockage et la récupération efficaces d'ensembles de données massifs et d'un calcul parallèle évolutif et a établi une nouvelle norme à la NASA pour l'intégration expérimentale de nouvelles technologies afin d'accélérer la recherche informatique et de s'adapter à l'échelle en constante évolution des ensembles de données scientifiques. Avec relativement peu de financement de projet et beaucoup d'ingéniosité, de passion et de créativité, le projet primé de l'équipe Goddard de la NASA, désormais intronisé au Temple de la renommée des technologies spatiales, a accéléré l'abandon mondial des systèmes de superordinateurs propriétaires coûteux et vers l'adoption de grappes de PC et de logiciels open source par la communauté scientifique.

Au-delà de l'impact sur la recherche scientifique, les avantages de cette révolution de l'informatique en cluster à la NASA Goddard ont un impact direct et quotidien sur la vie de la Terre et de ses habitants, alors que l'informatique haut de gamme continue d'expérimenter, d'évoluer et de permettre des , modèles complexes et détaillés du système terrestre utilisés pour comprendre et prédire des phénomènes importants tels que l'amplification de l'Arctique, les systèmes de tempêtes, la climatologie de l'ozone, les éruptions solaires et la science du climat.

Liens connexes


Sean Keefe, NASA Goddard Space Flight Center
13 mai 2022

Articles populaires