我是新的Python熊猫和工作在一个小的应用程序,在那里我想读我的excel文件有数据在印地语。
我面临的问题是,熊猫不能阅读印地语单词,正在放置一些任意的“?”符号。
我曾尝试将编码添加到utf-8,但也不起作用。
我的Excel数据:
Python代码:
df = pd.read_csv("Vegaretable_List.csv", encoding='utf-8')
输出:
['?? ' '??? ' '???? ' '????? ' '????']
任何帮助都是值得赞赏的。提前感谢。
假设Excel/CSV文件的内容与此类似:
मिशल
बहादुर
मेरी
जेन
जॉन
स्मिथ
编码类型正确。只是你必须迭代数据才能得到它。
对于CSV
import csv
with open('customers.csv', 'r', encoding='utf-8') as file:
data = csv.reader(file)
for row in data:
print(row)
对于XLSX
with open('customers.xlsx', 'r', encoding='utf-8') as file:
data = file.readlines()
for row in data:
print(row.strip())
不要创建csv文件,而是在中使用excel文件。xlsx
格式。Python将读取印地语文本。我这样做了,它成功了。
dataset = pd.read_excel("Data.xlsx")
这里的Data.xlsx
包含您提供的所有印地语文本。
祝你好运
如果使用创建文件时使用的相同编码读取文件,则不会出现问题。
如果您得到“??”
,表示csv或excel文件以不同的编码保存。
下面是标准编码表。
此外,您可以在适当的程序中打开您的文件,并将其保存为UTF-8,以便与您的代码一起阅读。
SO:熊猫read_csv中的编码错误
问题内容: 我正在查询一个SQL数据库,我想使用熊猫来处理数据。但是,我不确定如何移动数据。以下是我的输入和输出。 问题答案: 答案更简短
问题内容: 这个问题已经在这里有了答案 : Python中的Windows路径 (5个答案) 4年前关闭。 追溯(最近一次通话): 产品中的文件“”,第1行= pd.read_csv(’C:\ amazon_baby.csv’) 在parser_f中的第562行的文件“ C:\ Users \ kvsn \ Anaconda3 \ lib \ site-packages \ pandas \ io
问题内容: 我需要一些帮助。所以我有这样的事情 所以基本上这个程序将(ejemplo是西班牙语的例子,只是文件名)加载到(a )中,然后检查特定列中的重复值。它将删除重复项并再次保存文件。该部分正常工作。问题在于,除了删除重复项之外,我还需要用不同的颜色(例如黄色)突出显示包含它们的单元格。 问题答案: 您可以创建一个函数来突出显示… 然后将突出显示功能应用于数据框…
问题内容: 我在终端上经常使用和。系列的默认值返回精简的样本,具有一些头和尾值,但其余部分丢失。 有没有一种内置方法可以漂亮地打印整个?理想情况下,它将支持适当的对齐方式,可能会支持列之间的边界,甚至可能会为不同的列进行颜色编 问题答案: 你也可以将,与一个或多个选项一起使用: 这将使选项自动返回其先前的值。 如果你正在使用,则使用代替将使用丰富的显示逻辑(像这样)。
我有一个在线链接,每天更新一个zip文件。zip文件包含一个文件夹,在其中我想读取到熊猫的xls文件 我尝试使用zipfile模块。 但它给出了一个错误: 错误:无效模式(rb)或文件名:超文本传输协议://xxxxx/xxxx/xxxxx/xxxxx.zip 也只读csv似乎有压缩属性 我如何做到这一点?
我尝试将xlsx读入数据帧: 我收到这个: 回溯(最近一次调用last):文件“C:\Users\Administrator\eclipse workspace\Reports\GOW\Report.py”,第44行,df=pd。读取excel('C:\Users\Administrator\Downloads\reportdata.xlsx') 文件“C:\Users\Administrator