当前位置: 首页 > 知识库问答 >
问题:

在Python熊猫中用印地语读取Excel数据

轩辕啸
2023-03-14

我是新的Python熊猫和工作在一个小的应用程序,在那里我想读我的excel文件有数据在印地语。

我面临的问题是,熊猫不能阅读印地语单词,正在放置一些任意的“?”符号。

我曾尝试将编码添加到utf-8,但也不起作用。

我的Excel数据:

Python代码:

df = pd.read_csv("Vegaretable_List.csv", encoding='utf-8')

输出:

['?? ' '??? ' '???? ' '????? ' '????']

任何帮助都是值得赞赏的。提前感谢。

共有3个答案

罗绪
2023-03-14

假设Excel/CSV文件的内容与此类似:

मिशल
बहादुर
मेरी
जेन
जॉन
स्मिथ

编码类型正确。只是你必须迭代数据才能得到它。

对于CSV

import csv

with open('customers.csv', 'r', encoding='utf-8') as file:
    data = csv.reader(file)
    for row in data:
        print(row)

对于XLSX

with open('customers.xlsx', 'r', encoding='utf-8') as file:
    data = file.readlines()
    for row in data:
        print(row.strip())
韩晋
2023-03-14

不要创建csv文件,而是在中使用excel文件。xlsx格式。Python将读取印地语文本。我这样做了,它成功了。

dataset = pd.read_excel("Data.xlsx") 

这里的Data.xlsx包含您提供的所有印地语文本。

祝你好运

傅丁雷
2023-03-14

如果使用创建文件时使用的相同编码读取文件,则不会出现问题。

如果您得到“??” ,表示csv或excel文件以不同的编码保存。

下面是标准编码表。

此外,您可以在适当的程序中打开您的文件,并将其保存为UTF-8,以便与您的代码一起阅读。

  • SO:熊猫read_csv中的编码错误

 类似资料:
  • 问题内容: 我正在查询一个SQL数据库,我想使用熊猫来处理数据。但是,我不确定如何移动数据。以下是我的输入和输出。 问题答案: 答案更简短

  • 问题内容: 这个问题已经在这里有了答案 : Python中的Windows路径 (5个答案) 4年前关闭。 追溯(最近一次通话): 产品中的文件“”,第1行= pd.read_csv(’C:\ amazon_baby.csv’) 在parser_f中的第562行的文件“ C:\ Users \ kvsn \ Anaconda3 \ lib \ site-packages \ pandas \ io

  • 问题内容: 我需要一些帮助。所以我有这样的事情 所以基本上这个程序将(ejemplo是西班牙语的例子,只是文件名)加载到(a )中,然后检查特定列中的重复值。它将删除重复项并再次保存文件。该部分正常工作。问题在于,除了删除重复项之外,我还需要用不同的颜色(例如黄色)突出显示包含它们的单元格。 问题答案: 您可以创建一个函数来突出显示… 然后将突出显示功能应用于数据框…

  • 问题内容: 我在终端上经常使用和。系列的默认值返回精简的样本,具有一些头和尾值,但其余部分丢失。 有没有一种内置方法可以漂亮地打印整个?理想情况下,它将支持适当的对齐方式,可能会支持列之间的边界,甚至可能会为不同的列进行颜色编 问题答案: 你也可以将,与一个或多个选项一起使用: 这将使选项自动返回其先前的值。 如果你正在使用,则使用代替将使用丰富的显示逻辑(像这样)。

  • 我有一个在线链接,每天更新一个zip文件。zip文件包含一个文件夹,在其中我想读取到熊猫的xls文件 我尝试使用zipfile模块。 但它给出了一个错误: 错误:无效模式(rb)或文件名:超文本传输协议://xxxxx/xxxx/xxxxx/xxxxx.zip 也只读csv似乎有压缩属性 我如何做到这一点?

  • 我尝试将xlsx读入数据帧: 我收到这个: 回溯(最近一次调用last):文件“C:\Users\Administrator\eclipse workspace\Reports\GOW\Report.py”,第44行,df=pd。读取excel('C:\Users\Administrator\Downloads\reportdata.xlsx') 文件“C:\Users\Administrator