Digital Sufficiency in Data Centers : Studying the Impact of User Behaviors
Étude de comportements de sobriété dans les centres de calculs
Résumé
The Information Technologies (IT) industry has an increasing carbon footprint (2.1-3.9% of global greenhouse gas emissions in 2020), incompatible with the rapid decarbonization needed to mitigate climate change. Data centers hold a significant share due to their electricity consumption amounting to 1% of the global electricity consumption in 2018. To reduce this footprint, research has mainly focused on energy efficiency measures and use of renewable energy. While these works are needed, they also convey the risk of rebound effects, i.e., a growth in demand as a result of the efficiency gains. For this reason, it appears essential to accompany them with sufficiency measures, i.e., a conscious use of these technologies with the aim to decrease the total energy and resource consumption. In this thesis, we introduce a model for data centers and their users. In the first part, we focus on direct users, interacting with the infrastructure by submitting jobs. We define five sufficiency behaviors they can adopt to reduce their stress on the infrastructure, namely Delay, Reconfig, Space Degrad, Time Degrad and Renounce. We characterize these behaviors through simulation on real-world inputs. The results allow us to classify them according to their energy saving potential, impact on scheduling metrics and effort required from users. One drawback of sufficiency behaviors is their inertia, that we explain with appropriate metrics. We investigate thereafter the behaviors' usefulness in the context of renewable energy management. A three-state energy feedback mechanism informs the users on the status of electricity production. We show that adopting the sufficiency behaviors when renewable energy is scarce leads to brown energy savings. Savings are proportional to the efforts made by users. In the second part, we build upon our user model and implementation to tackle an open issue in distributed system simulation. Most works use recorded traces to simulate workloads, by replaying jobs of the same characteristics and same submission time. However, this model is problematic when the performance of the simulated infrastructure differs from that of the original infrastructure. We model and implement "replay with feedback", a way of using recorded traces, preserving the think time between jobs rather than the original dates of submission. We provide an in-depth analysis of our method's impact with the help of novel metrics. In the last part, we shift our focus to indirect users of data centers by studying professional cloud users. We design and conduct a qualitative study to investigate what a sufficient use of the cloud would mean, in practice. The study involves three focus groups analyzed through thematic analysis. The results provide a preliminary picture of the nature of our digital professional needs, along with a list of "tactics towards sufficiency", concrete actions to focus on the essential while limiting environmental footprint. This manuscript offers an insight into digital sufficiency in data centers, involving both simulation and social sciences. We hope that our open-source code and reproducible simulation campaigns will be useful for future works in that direction.
L'industrie des technologies de l'information a une empreinte carbone croissante (2,1 à 3,9 % des émissions mondiales de gaz à effet de serre en 2020), incompatible avec la décarbonation rapide nécessaire pour atténuer le changement climatique. Les centres de calculs y contribuent significativement en raison de leur consommation d'électricité : 1 % de la consommation mondiale en 2018. Pour réduire cette empreinte, les travaux de recherche se sont principalement concentrés sur des mesures d'efficacité énergétique et l'utilisation d'énergies renouvelables. Si ces travaux sont nécessaires, ils entraînent également des effets rebond, à savoir une augmentation de la demande en réponse aux gains d'efficacité. Pour cette raison, il apparaît essentiel de les accompagner de mesures de sobriété, c'est-à-dire d'une utilisation raisonnée des technologies du numérique, afin de diminuer la quantité globale d'énergie et de ressources consommée. Dans cette thèse, nous présentons un modèle de centre de calculs et de ses utilisateurices. Dans la première partie, nous nous concentrons sur les utilisateurices directes, qui interagissent avec l'infrastructure en soumettant des tâches. Nous définissons cinq leviers de sobriété qu'iels peuvent adopter pour réduire leur impact sur l'infrastructure, à savoir Délai, Reconfiguration, Dégradation Spatiale, Dégradation Temporelle et Renoncement. Nous caractérisons ces leviers à l'aide de simulations sur des données réelles. Les résultats nous permettent de les classer en fonction de leur potentiel d'économie d'énergie, de leur impact sur les métriques d'ordonnancement et de l'effort requis de la part des utilisateurices. L'un des inconvénients des leviers de sobriété est leur inertie, que nous expliquons à l'aide de métriques ad hoc. Nous étudions ensuite le potentiel des leviers dans un contexte de gestion des énergies renouvelables. Nous montrons que l'adoption des leviers de sobriété en période de faible production renouvelable conduit à des économies d'énergie non renouvelable. Les économies sont proportionnelles aux efforts fournis par les utilisateurices. Dans la deuxième partie, nous nous appuyons sur notre modèle d'utilisateurices et son implémentation pour aborder un problème ouvert dans la simulation de systèmes distribués. La plupart des travaux utilisent des traces réelles pour simuler les soumissions dans l'infrastructure, en rejouant des tâches ayant les mêmes caractéristiques et les mêmes temps de soumission. Toutefois, ce modèle pose problème lorsque les performances simulées diffèrent de celles de l'infrastructure d'origine. Nous modélisons et mettons en œuvre le <<~rejeu avec feedback~>>, une façon d'utiliser les traces réelles, en préservant le temps de réflexion entre les tâches plutôt que les temps de soumission originaux. Nous fournissons une analyse approfondie de l'impact de notre méthode à l'aide de nouvelles métriques. Dans la dernière partie, nous nous concentrons sur l'utilisation indirecte des centres de calculs, en étudiant des utilisateurices de cloud professionnel. Nous menons une étude qualitative afin d'examiner ce que signifierait, en pratique, un usage sobre du cloud. L'étude comprend trois focus groups analysés par le biais d'une analyse thématique. Les résultats dressent une image préliminaire de la nature de nos besoins professionnels numériques, ainsi qu'une liste de "tactiques vers la sobriété", c'est-à-dire d'actions concrètes pour se concentrer sur l'essentiel tout en limitant son empreinte environnementale. Ce manuscrit offre un aperçu de la sobriété numérique dans les centres de calculs, impliquant à la fois simulation et sciences sociales. Nous espérons que nos codes libres et nos campagnes de simulation reproductibles seront utiles pour de futurs travaux dans cette direction.
Origine | Version validée par le jury (STAR) |
---|