问题内容: Hy 我是python的新手,我想使用此简单查询将一些数据从Oracle数据库导入python(pandas数据框) 我做了什么 但是我有这个错误 我做错了什么? 谢谢 问题答案: 您需要正确引用SQL查询。如果您查看问题(或IDE)中突出显示的语法,则会注意到单引号没有按预期工作。 将最外面的引号更改为双引号-如果要在一行上全部使用-或将三引号更改为多行:
问题内容: 我有一个很大的时间序列数据帧(称为 df ),前5条记录如下所示: 目标: 我正在尝试删除 “ stn” 列中存在列表中 任何 字符串 的 行。因此,我基本上是在尝试过滤此数据集,以使其不包含以下列表中包含任何字符串的行。 尝试: 返回值: 出[78]: 没有! 我尝试了一些引号,方括号甚至是lambda函数的组合;尽管我还很新,所以可能没有正确使用语法。 问题答案: 使用isin:
问题内容: 我试图在Python熊猫中做一些数据工作,但写出我的结果时遇到麻烦。我将数据读取为CSV文件,并一直将每个脚本导出为自己的CSV文件,效果很好。最近,尽管我尝试使用工作表将所有内容导出到1个Excel文件中,但其中一些工作表给我一个错误 “’utf8’编解码器无法解码位置1的字节0xe9:无效的继续字节” 我什至不知道如何开始寻找任何可能导致导出到Excel的问题的字符。不知道为什么导
问题内容: 最近开始从我的安全位置(R)分支到Python,并且对中的单元格定位/选择感到有些困惑。我已经阅读了文档,但仍在努力了解各种本地化/选择选项的实际含义。 我为什么应该使用或超过最一般的选择? 我的理解是,,,和可以提供一些保证正确性是不能提供的,但我也看到了在那里往往是一刀切最快的解决方案。 请说明使用除?以外的任何东西背后的现实世界中的最佳实践推理。 问题答案: loc: 仅适用于索
问题内容: 如何找到特定列的值 最大的行 ? 将为我提供每一列的最大值,我不知道如何获取对应的行。 问题答案: 使用熊猫功能。很简单: 或者,您也可以使用,例如-它提供相同的功能,并且至少与粗略观察中的显示速度一样快。 返回索引标签,而不是整数。 示例”:如果您将字符串值作为索引标签,例如行“ a”至“ e”,则可能想知道最大值出现在第4行(而不是“ d”行)。 如果您希望该标签在其中的整数位置,
问题内容: 我想使用该函数在滚动窗口的基础上应用自己的自定义函数。 但是我的函数需要两个参数,并且还具有两个输出。这可能吗? 下面是一个最小的可复制示例… 导致错误…因为gm需要两个参数… 任何帮助将不胜感激… 编辑 按照Jeff的评论,我已经取得了进步,但仍在为两个或多个列输出而苦苦挣扎,因此,如果我改为创建一个新函数(如下),该函数仅返回两个随机数(与上一个计算无关),而不是v的最后一行,出现
问题内容: 可以说我有以下内容 : 看起来像: 第一选择 我知道一种检查特定值是否为的方法,如下所示: 第二种选择(不起作用) 我认为下面的选项using可以正常工作,但事实并非如此: 我也尝试了相同的结果: 但是,如果我使用或检查这些值,则会得到: 那么, 为什么第二种选择不起作用? 是否可以使用或检查值? 问题答案: 尝试这个: 更新: 在较新的Pandas版本中,使用pd.isna():
问题内容: 我用一个列表来计算此变量: 最终印刷品给出: 现在,我想转换为Pandas ,但是在执行操作时: 但我有一个错误。 我猜final不是正确的字典,那么如何转换成字典?还是转换为的另一种方式? 问题答案: 您可以使用并传递param进行构造,然后调用以获取2列df: 您可以将列重命名为更有意义的名称:
问题内容: 我正在尝试使用特定的索引名称向DataFrame添加新行。 我已经尝试了以下方法,但是它正在创建一个新列而不是一个新行。 仍然不了解如何插入具有特定索引的行。将不胜感激任何建议。 问题答案: 您可以使用。 演示: 使用这种方法的PS,您不能添加具有现有(重复)索引值(标签)的行-在这种情况下,具有此索引标签的行将被 更新 。 更新: 如果索引是DateTimeIndex并且新行的索引不
问题内容: 我有一个由不同子组组成的熊猫数据框。 我想在其组中找到每个ID的排名,值越低越好。在上面的示例中,在组A中,Id 1的排名为1,Id 2的排名为4。在组B中,Id 5的排名为2,在ID 8中的排名为1,因此上。 现在,我通过以下方式评估排名: 按值排序。 创建一个等级函数(假定变量已经排序) 将排名函数分别应用于每个组: 此过程有效,但是当我对数百万行的数据运行时,它确实很慢。是否有人
问题内容: 我正在尝试使用以下代码在pandas数据框中按索引号删除多列(数据集中的第2列和第70列,分别索引为1和69): 我收到以下错误: 在我的代码中,[1,69]突出显示并说: 下面的代码完成了我希望它成功完成的工作,但是在两行重复的代码上(首先删除col索引69,然后删除1,顺序很重要,因为删除之前的列会更改后面的列的索引)。我以为我可以简单地将多个列索引指定为一个列表,但是上面我可能有
问题内容: 我有一个我希望导出到CSV文件的文件。但是,pandas似乎将某些值而不是类型写为。我找不到如何更改此行为。 建立数据框: 查看: 导出它: 为什么十位数有一个零点? 当然,我可以将此函数粘贴到管道中以重新转换整个CSV文件,但似乎没有必要: 问题答案: 我正在寻找的答案与@Jeff在答案中提出的内容略有不同。功劳归于他。最终解决了我的问题,以供参考:
问题内容: 我正在尝试打开已保存到桌面的mdf sql数据库文件。如何将其作为熊猫数据框打开?到目前为止,我所拥有的是: 它给我错误信息 OperationalError :(“ 08001”,“ [08001] [Microsoft] [ODBC SQL Server驱动程序]既不提供DSN也不提供SERVER关键字(0)(SQLDriverConnect)”) 我发现了另一个类似的问题,但仍未
问题内容: 我有按日期索引的熊猫。有许多列,但仅在部分时间序列中填充了许多列。我想找到非值第一个和最后一个值的位置,以便提取日期并查看特定列的时间序列有多长时间。 有人能指出我正确的方向,如何去做这样的事情吗?提前致谢。 问题答案: @ behzad.nouri的解决方案完美工作,返回第一个和最后不使用Series.first_valid_index和Series.last_valid_index
问题内容: 我想将数据框的几组列融合为多个目标列。与问题类似,Python Pandas将初始列的组融为多个目标列,并将pandas数据框重塑/将多个值变量堆叠为单独的列。但是,我需要通过列名而不是索引位置来明确地执行此操作。 原始数据框: 目标数据框 对此方法的建议深表感谢。 问题答案: 有一种更有效的方法来解决涉及熔化多组不同色谱柱的这类问题。专为这些确切情况而设计。