当前位置: 首页 > 知识库问答 >
问题:

将熊猫系列转换为numpy数组[重复]

姬昀
2023-03-14

我不熟悉熊猫和蟒蛇。我的输入数据如下

category   text
1   hello iam fine. how are you
1   iam good. how are you doing.

inputData= pd.read_csv(Input', sep='\t', names=['category','text'])
X = inputData["text"]
Y = inputData["category"]

这里Y是panda系列对象,我想将其转换为numpy数组。所以我试过了,就像矩阵一样

YArray= Y.as_matrix(columns=None)
print YArray

但是我得到的输出是[1,1](这是错误的,因为我只有一个列类别和两行)。我希望结果是2x1矩阵。

共有3个答案

束阳旭
2023-03-14

如果df是您的数据帧,那么数据帧的一列是一个系列,并将其转换为一个数组,

df = pd.DataFrame()
x = df.values
print(x.type)

以下指纹,

<class 'numpy.ndarray'>

成功将其转换为数组。

袁恩
2023-03-14

试试这个:
在你的系列对象上应用.as_matrix之后

Y.reshape((2,1))

因为.as_matrix()只返回numpy数组,而不是numpy矩阵。链接此处

左仰岳
2023-03-14

要获得numpy阵列,您需要

Y.values
 类似资料:
  • 问题内容: 您是否知道如何以NumPy数组或python列表的形式获取DataFrame的索引或列? 问题答案: 要获取NumPy数组,应使用以下属性: 这样可以访问数据的存储方式,因此无需进行转换。 注意:此属性也可用于其他许多熊猫的对象。 要将索引作为列表获取,请致电: 同样,对于列。

  • 如何将pandas数据帧(21 x 31)转换为numpy数组? 例如: 数组_1(n_1,n_2,n_3,…,n31) 数组_2(n_1,n_2,n_3,…,n31) 数组21(n_1,n_2,n_3,…,n31) 我尝试了以下代码段: .. 并得到如下结果: 问题是第二个方括号太多了。我该如何解决这个问题?

  • 我使用熊猫数据框来清理和处理数据。但是,我需要将其转换为numpy ndarray,以便使用利用矩阵乘法。我将数据框转换为具有以下内容的列表列表: 这将返回以下结构: 然后我将其转换为如下所示的numpy数组: 然而,以下打印: 给出这个结果: 但是,我需要它们都是numpy数组。如果它不是来自熊猫数据帧,我只是转换一个硬编码列表,那么它们都是Ndarray。当列表是从数据帧生成的时,如何获取该列

  • 我对熊猫有些陌生。我有一个熊猫数据框,是一行23列。 我想把它转换成一个系列?我想知道做这件事最像蟒蛇的方式是什么? 我试过pd。系列(我的结果),但它抱怨。它还没有聪明到意识到它仍然是数学术语中的“向量”。 谢谢!

  • 我有一个字段在熊猫DataFrame被导入为字符串格式。它应该是日期时间变量。如何将其转换为日期时间列,然后根据日期进行筛选。 示例: 数据帧名称:原始数据

  • 我有以下布尔值表: 我想创建一个具有相同索引的新数据帧,但每行都有前一列的前三个 True 列名。 如果一行少于三个真值,则新数据帧将具有空值。