当前位置：首页 > 面试题库 >

如何从Unicode（UTF-8）CSV文件导入numpy数组

晁璞

2023-03-14

问题内容：

即时通讯不是要聪明或快速地做到这一点，而只是想做到这一点。

我有一个文件看起来像这样：

$ cat all_user_token_counts.csv  
@5raphaels,in,15
@5raphaels,for,15
@5raphaels,unless,11
@5raphaels,you,11

我知道它的未编码utf-8编码是因为我创建了它，就像这样

    debug('opening ' + ALL_USER_TOKEN_COUNTS_FILE)
    file = codecs.open(ALL_USER_TOKEN_COUNTS_FILE, encoding="utf-8",mode= "w")
    for (user, token) in tokenizer.get_tokens_from_all_files():
        #... count tokens ..
        file.write(unicode(username +","+ token +","+ str(count) +"\r\n"))

我想将其读取到一个numpy数组中，所以它看起来像这样或其他内容。

   array([[u'@5raphaels', u'in', 15],
          [u'@5raphaels', u'for', 11],
          [u'@5raphaels', u'unless', 11]], 
          dtype=('<U10', '<U10', int))

在我尝试编写此问题的过程中，我想到可能甚至不可能？如果是这样，我很想知道！

提前致谢！

问题答案：

这可以通过np.loadtxt轻松完成：

import numpy as np
arr=np.loadtxt('all_user_token_counts.csv',delimiter=',',
                  dtype = '|U10,<U10,int')
print(arr)

# [(u'@5raphaels', u'in', 15) (u'@5raphaels', u'for', 15)
#  (u'@5raphaels', u'unless', 11) (u'@5raphaels', u'you', 11)]

类似资料：

如何将numpy数组写入csv文件？

问题内容：我想打开一个新的文本文件，然后将numpy数组保存到该文件。我写了这段代码：我收到此错误：有人知道怎么了吗？另外，我在终端中找到了一个名为file_2的空文件，但是里面没有任何内容。编辑：我正在使用Python3.4 问题答案：看来您正在使用Python3。因此，请以二进制模式（）而非文本模式（）打开文件：另外，关闭文件句柄，以确保将所有内容都写入磁盘。您可以使用-stat
从 CSV 文件导入数据

想要知道更多东西吗？当你需要从表中查找某些值时，可以使用冗长的 case 语句或 selectors 实现，但更整洁的方式是使用 extlookup 函数实现。在 puppetmaster 上可以使用 extlookup 函数查询外部的 CSV 文件，并返回匹配的数据片段。将所有数据组织到一个单一的文件并将它从 Puppet 配置清单中分离出来，可以使维护工作变得更简单，也便于与其他人分享：
PHP-UTF-8转中文ANSI（GB2312？）-导出CSV文件

我在几个小时的研究后发布了这个（几次...）。我还找不到任何答案。我的目标是使用PHP编写一个CSV文件。这个文件必须有中文ANSI编码（我想简体中文是GB2312，在记事本中我只看到ANSI编码）。必须导入到另一个工具。【重要提示】我们目前正在转换一个带有记事本的文件和一台默认语言为中文的PC。这个过程是：从web-app获取UTF8 CSV 保存为CSV与Excel 2003在中国PC
Python-Unicode（UTF-8）用Python读写文件

问题内容：我在理解将文本写入文件和将文件写入文件时遇到了大脑故障（Python 2.4）。因此，我在文件f2 中输入我最喜欢的编辑器。然后：我在这里不明白什么？显然，我缺少一些至关重要的魔术（或理性）。一种类型的文本文件可以正确转换？在这里，我真正无法理解的是UTF-8表示法的意义所在，如果你实际上无法让Python识别它的话（如果它来自外部）。也许我应该只将JSON转储字符串，然后使用
如何在R中从Github导入CSV文件数据？

本文向大家介绍如何在R中从Github导入CSV文件数据？，包括了如何在R中从Github导入CSV文件数据？的使用技巧和注意事项，需要的朋友参考一下如果您在Github上有一个csv文件，则可以通过使用其URL直接将其导入R中，但是请确保在存储数据的Github页面上单击Raw选项。许多人没有单击Raw选项，因此他们阅读HTML而不是CSV并感到困惑。在这里，我正在共享一个包含数据集列表的公共
如何以UTF-8格式写入文件？

问题内容：我有一堆不是UTF-8编码的文件，我正在将网站转换为UTF-8编码。我对要保存在utf-8中的文件使用了简单的脚本，但是文件以旧编码保存：如何以utf-8编码保存文件？问题答案： file_get_contents / file_put_contents不会神奇地转换编码。您必须显式转换字符串。例如使用或。尝试这个：或者，使用PHP的流过滤器：
2. Unicode 和 UTF-8

2. Unicode和UTF-8 为了统一全世界各国语言文字和专业领域符号（例如数学符号、乐谱符号）的编码，ISO制定了ISO 10646标准，也称为UCS（Universal Character Set）。UCS编码的长度是31位，可以表示231个字符。如果两个字符编码的高位相同，只有低16位不同，则它们属于一个平面（Plane），所以一个平面由216个字符组成。目前常用的大部分字符都位于第一个
jsonickle/json函数输入utf-8，输出unicode？

编写了以下两个函数，用于存储和检索任何Python（内置或用户定义）对象，并结合使用json和jsonickle（在2.7中）我还没有用用户定义的对象测试过这两个函数，但是当我试图保存()一个内置的字符串字典时，(即。{'Adam': 'Age 19 '，' Bill '，' Age 32'})，并且我检索相同的文件，我得到相同的unicode字典，{u'Adam': u'Age 19 '，u'

相关阅读

如何将不同类型的数据从文件导入Python Numpy数组？如何将数据从CSV导入MySQL？用Python写入UTF-8文件在Java和CSV文件中设置UTF-8 R导入.csv文件

相关文章

Numpy创建数组 NumPy数组属性 NumPy数学函数导入Oracle示例数据库 NumPy线性代数

相关问答

将UTF-8 csv文件转换为Excel可读csv 导入。csv转换为R，UTF-8编码错误？使用java将UTF-8文本文件转换为UNICODE Javascript导出CSV编码utf-8问题如何一次导入多个.csv文件？

相关工具

UTF-8 CPP NumPy TNT Unicode Controls Openerp PyChart Unicode Report jQuery CSV

相关文档

Numpy 入门教程 NumPy 中文教程 Perl6 入门指导数据采集从入门到放弃 NumPy 教程