索引数据
xarray使用小结
Python实现的简单线性回归算法实例分析
aa=GLEAM_NC.sel(lat=j,lon=z).fillna(-9999)
问题内容: Xarray是否支持numpy计算功能(例如polyfit)?还是有一种有效的方法将这些函数应用于数据集? 示例:我想计算拟合两个变量(温度和高度)的直线的斜率,以计算失效率。我有一个数据集(下面),具有这两个变量,维度为(垂直,时间,xgrid_0,ygrid_0)。 如果我提取给定时间的温度和高度,则xgrid_0,ygrid_0; 我可以使用numpy.polyfit函数。 但这
我有一个363个netcdf文件的目录,对应不同的时间(所有文件都有类似的内部结构,“时间”维度为1),每个270MB,总共大约100GB。我想在一个xarray中上传所有这些数据(使用dask数组和块)。似乎open_mfdataset是合适的解决方案,但我似乎没有正确地使用它,因为它非常慢。 执行此操作所需的时间为:。为什么这么慢? 请注意,如果我没有将和放在一起,它不会显著改变时间,因此我有
我已经从多个源hdf5文件构建了一个巨大的dask阵列。 假设数据仅来自一个hdf5文件: 然后,我将dask数组中的(惰性)片段排列到一个xarray数据集中 现在我想序列化xr_data对象,所以我不需要每次都计算它。 xArray DataArray中的数据通过dask懒惰地映射到hdf5文件。我怎么连载(咸菜?Netcdf?...)能够在“懒惰映射”持续存在的情况下重新加载x数组对象? 谢
使用xarray的open_mfdataset打开一系列大约90个netCDF文件,每个文件大约27MB,加载一个小的时空选择需要很长时间。 分块维度产生边际收益。decode_cf=True在函数内部或单独都没有区别。这里还有一个建议https://groups.google.com/forum/#!topic/xarray/11lDGSeza78让我将所选内容另存为一个单独的netCdf并重新
学习如何使用xarray从DFs生成netCDF文件。在几个教程和SO问题之后,我向xarray数据集添加了“常量”维度,并向xarray数据集添加了“常量”维度,但仍然存在一些问题,因为我无法将日期、时间、纬度和经度作为维度。当我进行nc转储时,它们是不正确的。 最初的方法是将txt文件导入熊猫df,然后将xr导入netCDF: 其中df2= 这工作正常,但尺寸不正确(见下文): 如果我将日期或
我正在尝试创建符合cf的netcdf文件。我可以让它与xarray兼容98%的cf,但我遇到了一个问题。当我对正在创建的文件执行ncdump时,我会看到以下内容: 我的数据集的坐标是lat、lon和time。当我通过ds.to_netcdf()转换为netcdf时,所有坐标变量都会自动应用填充值,因为它们是浮点数。应用填充值的坐标变量违反cf标准(http://cfconventions.org/
我有一个需要一个数据帧作为输入的计算。我想对存储在扩展到51GB的netCDF文件中的数据运行此计算-目前,我一直在使用打开文件,并使用块(我的理解是,此打开的文件实际上是一个dask数组,因此一次只能将数据块加载到内存中)。但是,我似乎无法利用这种延迟加载,因为我必须将xarray数据转换为pandas数据帧才能运行我的计算——我的理解是,在这一点上,所有数据都加载到内存中(这是不好的)。 所以
使用xarray open_数据集或open_mfdataset加载NARR netcdf数据集时(例如。ftp://ftp.cdc.noaa.gov/Datasets/NARR/monolevel/air.2m.2010.nc),xarray返回关于“冲突的_FillValue和缺少的_值”的错误。 进入: xarray.open_datasetair.2m.2010.nc 产生以下错误: 发现