当前位置: 首页 > 面试题库 >

Python split()函数如何工作

孙凌龙
2023-03-14
问题内容
def loadTest(filename): 
    f=open(filename,'r')
    k=0
    line=f.readline()
    labels=[]
    vectors=[]
    while line and k<4:
        k=k+1
        l=line[:-1].split(r'","')
        s=float(l[0][1:])
        tweet=l[5][:-1]
        print(l)
        line=f.readline()
     f.close()
     return

split(r'","')python split方法内部实际上有什么作用?


问题答案:

原始字符串与Python字符串

r'","'

[R表明 它是一个 原始字符串

原始字符串与常规python字符串有何不同?

特殊字符失去内部特殊的意义 一个 原始字符串
。例如,\npython字符串中的换行符将在原始字符串中失去其含义,仅表示反斜杠后跟n。

string.split()将中断和拆分string传递的参数,并返回列表中的所有部分。该列表将不包含分割字符。

string.split('","') 将在每个字符串上进行分割和拆分,","并返回列表中所有不完整的部分,但不包括","

例如:

print 'Hello world","there you are'.split(r'","')

输出:

['Hello world', 'there you are']

split() 可以做更多…

您可以通过传入一个额外的参数来指定希望字符串分成多少部分。

让我们考虑以下字符串: 'hello,world,there,you,are'

  1. 对所有逗号进行拆分,并分成n + 1个部分,其中n是逗号数:

    print ‘hello,world,there,you,are’.split(‘,’)
    [‘hello’, ‘world’, ‘there’, ‘you’, ‘are’]

  2. 在第一个逗号处分割,并且仅分成两部分。

    ‘hello,world,there,you,are’.split(‘,’,1)
    [‘hello’, ‘world,there,you,are’]

  3. 在第一个和第二个逗号处拆分,分为三个部分。等等…

    ‘hello,world,there,you,are’.split(‘,’,2)
    [‘hello’, ‘world’, ‘there,you,are’]

甚至更多…

从文档:

如果未指定拆分字符(即,分隔符)或将其指定为None,则将应用不同的拆分算法:连续空格的运行将被视为单个分隔符,并且如果字符串中包含空格,则结果将不包含空字符串前导或尾随空格。因此,使用空分隔符分割空字符串或仅包含空格的字符串将返回[]。

例如,

>>>' 1  2   3  '.split()
['1', '2', '3']

>>>'  1  2   3  '.split(None, 1)
['1', '2   3  ']

>>>''.split()
[]

>>>'    '.split()
[]


>>>'      '.split(None)
[]

乃至…

什么?

您是否正在寻找更多?别那么贪心:P。只是问问自己?,这会使您变得不贪心:D(如果您知道正则表达式,就会开玩笑)



 类似资料:
  • 问题内容: 所以我正在尝试使用Python(Pyspark)学习Spark。我想知道该功能的工作原理。那就是它所需要的输入和它所提供的输出。我在互联网上找不到任何合适的例子。可以说,我有一个包含列表的RDD对象,如下所示。 我想从所有列表中删除元素2,如何使用来实现。 问题答案: 应该将mapPartition视为对分区而不是对分区元素的映射操作。它的输入是当前分区的集合,其输出将是另一分区的集合

  • 问题内容: 如果我写 然后给出0、1、2、3、4,这 是否意味着Python同时向i分配了0、1、2、3、4? 但是,如果我写了: 然后我叫a,它只给出5, 但是如果我加上“ print a”,它得到1、2、3、4、5。 所以我的问题是,这有什么区别? 是字符串还是列表还是其他? 也许有人可以帮助我进行梳理: 如果运行此类代码,则仅当l = 5时才能得到答案。 如何使它们开始循环? 即l = 0获

  • 问题内容: 试图了解和内置函数的工作方式。 我正在尝试比较元组,以便如果任何值不同,则它将返回,如果它们都相同,则将返回。在这种情况下,他们如何工作以返回[False,False,False]? 是一个。 据我所知,这应该输出 因为相同,不同,并且相同。 为什么对所有元组求值为False? 问题答案: 你可以粗略地认为和作为系列的逻辑和分别运营。 任何 当至少一个元素是 时将返回。阅读有关真值测试

  • 问题内容: 为什么即使调用时返回并退出,嵌套函数仍会记住第一个值? 问题答案: 您可以看到它,因为所有源自父函数的变量都被子函数内的实际值替换。这样,无需跟踪父函数的范围即可使子函数正确运行。 将其视为“动态创建函数”。 这是python中的基本行为,对多个分配也是如此。 Python将其读取为 基本上,在对它们执行任何操作之前会先插入值。

  • 我觉得我的知识的函数式编程是有点缺乏所以我决定看看网上并按照教程得到更好的当我凸轮通过它的状态在第一页 “假设您有一个不可变的数字列表xs=[1,2,3,4,5,6,7,8]和一个函数doubleMe,该函数将每个元素乘以2,然后返回一个新列表。如果我们想用命令式语言将列表乘以8,并执行doubleMe(doubleMe(xs)))),它可能会通过列表一次,复制一份,然后返回。然后,它将再次通过列

  • 当模拟对象中具有相同参数列表的方法返回值时,如果存在冲突语句,我观察到将返回最近的When/thenReturn。因此,下面的陈述将是正确的。 当有冲突语句抛出异常时,行为与上面不一样。例如, 这个测试用例失败了。任何解释都会有帮助。