我尝试了这个,但是我有一个混乱的前景
from io import StringIO, BytesIO
Trial ='https://data.cityofnewyork.us/resource/t7ny-aygi.geojson?vendorid=VTS&payment_type=CRD&$limit=500'
trialck = requests.get(Trial).content
final = pd.read_csv(StringIO(trialck.decode('utf-8')), sep = '\t')
final.head()
{“类型”:“特征集合”,“特征”:[{“类型”:“特征”,“几何”:{“类型”:“点”,“坐标”:[-73.87057,40.773757]},“属性”:{“tpep_dropoff_datetime”:“2013-04-02T16:00:00.000”,“行程距离”:“11.279999999999999”,“dropoff_经度”:“-73.87057000000001”,“拾取纬度”:“40.73289700000001”,“通行费金额”:“0”,“小费金额”:“0”,“付款类型”:“CRD”、“车费金额”:“37”、“取货经度”:“-73.991167000004”、“乘客计数”:“6”、“商店和前进标志”:“空”、“额外”:“0”、“卖方ID”:“VTS”、“取货地点”:{“类型”:“点”、“坐标”:[-73.991167,40.732897]},“总金额”:“37.5”、“tpep取货日期时间”:“2013-04-02T15:22:00.000”、“落货纬度”:“40.775700000003”ratecodeid:“1”,“mta_tax:“0.5”},{“类型”:“特征”;“几何”:{“类型”:“点”;“坐标”:[-74.00296,40.722112]},“属性”:{“tpep_dropoff_datetime:“2013-07-19T07:52:00.000”,“行程距离”:“5.5”;“dropoff_经度”;“74.0029600000002”;“皮卡经度”;“40.7661050000003”;“过路费金额”;“0”;“小费金额”;“3.899999”,“付款类型”;“支付类型”“:”CRD“,”票价金额“:”19.5“,”收货经度“:”-73.95440700000003“,”乘客计数“:”1“,”商店和前进标志“:空“,”额外“:”0“,”卖方“:”VTS“,”收货地点“:{”类型“:”点“,”坐标“:[-73.954407,40.766105],”总金额“:”23.89999999999999“,”tpep收货日期时间“:”2013-07-19T07:33:00.000“,”收货纬度“:”40.72210003”,“ratecodeid”:“1”,“mta_税”:“0.5”},{“类型”:“特征”,“几何体”:
您可以尝试pandas.io.json.json\u规范化
。在这种情况下,它无法处理完整的json返回,但是如果在json中指定
'features'
键,pandas可以将其转换为数据帧。
import requests
url = 'https://data.cityofnewyork.us/resource/t7ny-aygi.geojson?vendorid=VTS&payment_type=CRD&$limit=500'
response = requests.get(url)
data = response.json()
df = pd.io.json.json_normalize(data['features'])
假设熊猫数据帧如下所示: 如何将第三行(如row3)提取为pd数据帧?换句话说,row3.shape应该是(1,5),row3.head()应该是:
问题内容: 我正在查询一个SQL数据库,我想使用熊猫来处理数据。但是,我不确定如何移动数据。以下是我的输入和输出。 问题答案: 答案更简短
我在Python中使用一个视频游戏的熊猫DataFrame,每个游戏都有一种类型。我正在尝试删除任何在DataFrame中出现次数少于一定次数的类型的视频游戏,但我不知道该怎么做。我确实发现了一个StackOverflow问题,这个问题似乎是相关的,但我根本无法破译这个解决方案(可能是因为我从未听说过R,而且我对函数编程的记忆充其量也很生疏)。 帮助?
我有这个熊猫数据框 这就给了我: 我该怎么办 做一个新的人物, 将标题添加到图"标题这里" 以某种方式创建一个映射,这样标签不是29,30等,而是“29周”,“30周”等。 将图表的较大版本保存到我的计算机(例如10 x 10英寸) 这件事我已经琢磨了一个小时了!
我正在尝试连接到数据帧。它们看起来像这样 期望的最终目标是: 我一直试图使用pd.merge和。连接函数与on='外'设置不成功
我有点被困在提取一个变量的值和另一个变量的条件上。例如,以下数据帧: 当时,如何获取的值?每次提取的值时,都会得到一个对象,而不是字符串。