我有一个如下所示的数据帧:
LAT LON YEAR MO DY PREC T_MAX T_MIN WS
30.75 76.25 1981 1 3 5.40 22.08 11.22 3.95
30.75 76.75 1981 1 3 3.94 19.25 9.29 3.69
30.75 77.25 1981 1 3 3.28 14.25 6.29 2.87
30.75 77.75 1981 1 3 2.96 10.57 3.23 2.10
30.75 78.25 1981 1 3 2.78 7.62 -0.41 1.51
30.75 78.75 1981 1 3 2.77 1.02 -6.66 1.22
30.75 79.25 1981 1 3 2.47 -3.92 -12.18 1.74
31.25 76.25 1981 1 3 5.97 20.72 10.59 3.77
31.25 76.75 1981 1 3 4.17 15.05 6.70 3.22
31.25 77.25 1981 1 3 3.64 7.47 1.62 2.31
我需要提取lat=30.75和lon 76.25的行,对于我使用的行:
data.where(data.LAT==30.75 & data.LON==76.25)
但这表明了这个错误:
cannot compare a dtyped [float64] array with a scalar of type [bool]
您不需要where
:
data[(data.LAT==30.75) & (data.LON==76.25)]
LAT LON YEAR MO DY PREC T_MAX T_MIN WS
0 30.75 76.25 1981 1 3 5.4 22.08 11.22 3.95
我正在使用: Python 3.6.8 火花2.4.4 我在spark类路径中有以下JAR: http://repo1.maven.org/maven2/com/databricks/spark-redshift_2.11/2.0.1/spark-redshift_2.11-2.0.1.jar http://repo1.maven.org/maven2/com/databricks/spark-a
我有一个数据框,比如说一些投资数据。我需要根据某些条件(比如说,U类型)从这个数据帧中提取数据。有许多可用的基金类型,我只需要提取与特定基金类型匹配的数据。 funding_type有风险、种子、天使、股权等价值。我只需要数据匹配资金类型比如种子和天使 我试着跟着 这里MF1是我的数据帧。这将提供与种子基金类型相关的所有数据 我需要的条件有点像 MF1[MF1['funding_round_typ
问题内容: 我知道它是一个数组,但是我对JSON完全陌生,需要帮助理解它的结构,这是我提取数据的尝试: 我拥有的JSON数据如下所示: 我对这些东西的掌握并不强,因此感谢所有帮助。 问题答案: 这是个主意: 它应该可以工作(如果有编译错误,请随时投诉)
我必须根据特定条件过滤数据帧。如果解决方案考虑使用dplyr,效果更好。 我有这样的数据帧结构 如果列标签包含特定值(例如,3.),不仅要收集该行,还要收集与前一行具有相同sentID和partner值的所有行。 预期结果如下: