Titre
ClimSim: An open large-scale dataset for training high-resolution physics emulators in hybrid multi-scale climate simulators
Type
autre
Institution
UNIL/CHUV/Unisanté + institutions partenaires
Auteur(s)
Sungduk, Yu
Auteure/Auteur
Walter M., Hannah
Auteure/Auteur
Liran, Peng
Auteure/Auteur
Jerry, Lin
Auteure/Auteur
Mohamed Aziz, Bhouri
Auteure/Auteur
Ritwik, Gupta
Auteure/Auteur
Björn, Lütjens
Auteure/Auteur
Justus C., Will
Auteure/Auteur
Gunnar, Behrens
Auteure/Auteur
Julius J. M., Busecke
Auteure/Auteur
Nora, Loose
Auteure/Auteur
Charles, Stern
Auteure/Auteur
Tom, Beucler
Auteure/Auteur
Bryce E., Harrop
Auteure/Auteur
Benjamin R., Hilman
Auteure/Auteur
Andrea M., Jenney
Auteure/Auteur
Savannah L., Ferretti
Auteure/Auteur
Nana, Liu
Auteure/Auteur
Anima, Anandkumar
Auteure/Auteur
Noah D., Brenowitz
Auteure/Auteur
Veronika, Eyring
Auteure/Auteur
Nicholas, Geneva
Auteure/Auteur
Pierre, Gentine
Auteure/Auteur
Stephan, Mandt
Auteure/Auteur
Jaideep, Pathak
Auteure/Auteur
Akshay, Subramaniam
Auteure/Auteur
Carl, Vondrick
Auteure/Auteur
Rose, Yu
Auteure/Auteur
Laure, Zanna
Auteure/Auteur
Tian, Zheng
Auteure/Auteur
Ryan P., Abernathey
Auteure/Auteur
Fiaz, Ahmed
Auteure/Auteur
David C., Bader
Auteure/Auteur
Pierre, Baldi
Auteure/Auteur
Elizabeth A., Barnes
Auteure/Auteur
Christopher S., Bretherton
Auteure/Auteur
Peter M., Caldwell
Auteure/Auteur
Wayne, Chuang
Auteure/Auteur
Yilun, Han
Auteure/Auteur
Yu, Huang
Auteure/Auteur
Fernando, Iglesias-Suarez
Auteure/Auteur
Sanket, Jantre
Auteure/Auteur
Karthik, Kashinath
Auteure/Auteur
Marat, Khairoutdinov
Auteure/Auteur
Thorsten, Kurth
Auteure/Auteur
Nicholas J., Lutsko
Auteure/Auteur
Po-Lun, Ma
Auteure/Auteur
Griffin, Mooers
Auteure/Auteur
J. David, Neelin
Auteure/Auteur
David A., Randall
Auteure/Auteur
Sara, Shamekh
Auteure/Auteur
Liens vers les personnes
Liens vers les unités
Date de publication
2023
Langue
anglais
Résumé
Modern climate projections lack adequate spatial and temporal resolution due to computational constraints. A consequence is inaccurate and imprecise predictions of critical processes such as storms. Hybrid methods that combine physics with machine learning (ML) have introduced a new generation of higher fidelity climate simulators that can sidestep Moore's Law by outsourcing compute-hungry, short, high-resolution simulations to ML emulators. However, this hybrid ML-physics simulation approach requires domain-specific treatment and has been inaccessible to ML experts because of lack of training data and relevant, easy-to-use workflows. We present ClimSim, the largest-ever dataset designed for hybrid ML-physics research. It comprises multi-scale climate simulations, developed by a consortium of climate scientists and ML researchers. It consists of 5.7 billion pairs of multivariate input and output vectors that isolate the influence of locally-nested, high-resolution, high-fidelity physics on a host climate simulator's macro-scale physical state. The dataset is global in coverage, spans multiple years at high sampling frequency, and is designed such that resulting emulators are compatible with downstream coupling into operational climate simulators. We implement a range of deterministic and stochastic regression baselines to highlight the ML challenges and their scoring. The data (https://huggingface.co/datasets/LEAP/ClimSim_high-res, https://huggingface.co/datasets/LEAP/ClimSim_low-res, and https://huggingface.co/datasets/LEAP/ClimSim_low-res_aqua-planet) and code (https://leap-stc.github.io/ClimSim) are released openly to support the development of hybrid ML-physics and high-fidelity climate simulations for the benefit of science and society.
PID Serval
serval:BIB_A51EF14CFD95
URL éditeur
Date de création
2023-10-13T11:46:45.051Z
Date de création dans IRIS
2025-05-21T04:51:20Z