似乎pandas read_csv 函数仅允许使用单个字符定界符/分隔符。有没有办法允许使用字符串“ * | *”或“ %%”代替?
解决方案是使用read_table而不是read_csv:
1*|*2*|*3*|*4*|*5
12*|*12*|*13*|*14*|*15
21*|*22*|*23*|*24*|*25
因此,我们可以阅读以下内容:
pd.read_table('file.csv', header=None, sep='\*\|\*')
问题内容: 我在网上找到了一些答案,但是我没有使用正则表达式的经验,我相信这里是需要的。 我有一个字符串,需要用分隔 或也就是说,它必须是分号或逗号后跟一个空格。没有尾随空格的单个逗号应保持不变 示例字符串: 应该拆分为包含以下内容的列表: 问题答案: 幸运的是,Python内置了:) 更新: 在你的评论之后:
如何将过滤器列表拆分为单个过滤器元件?split2String在线程“main”java.util.regex中导致:异常。PatternSyntaxException:索引10或(|和)附近的未闭合组(
我有一个包含以下行的文件: 在上面的输出中,我想提取3个字段(数字2,4和最后一个)。我得到以下输出: 如何提取域名位于之后的最后一个字段?如何使用提取字段?
问题内容: 如何在JavaScript中使用多个分隔符拆分字符串?我正在尝试在逗号和空格上进行拆分,但是AFAIK,JS的拆分功能仅支持一个分隔符。 问题答案: 传递正则表达式作为参数: 编辑添加: 您可以通过选择数组的长度减去1来获得最后一个元素: …,如果模式不匹配:
问题内容: 我需要定界包含新行的字符串。我将如何实现?请参考下面的代码。 输入: 所需的输出: 我尝试了以下方法: 问题答案: 方法应该为您提供确切的信息。
问题内容: 我有一些看起来像这样的数据: 我想将其导入3列数据框,例如 我一直试图读取数据,因为2列在’:’上分割,然后在’‘上分割了第一列。但是我发现它令人讨厌。是否有更好的方法可以直接在导入时对其进行分类? 目前: 但是,由于我的数据处于领先地位,这使情况更加复杂。 我觉得这应该是一个简单的任务,但是目前我正在考虑逐行读取它,并在导入之前使用一些find replace清理数据。 问题答案: