我有一段文本数据要预处理,该数据的形式如下:
[num|num|<String>]
但是,有空格,逗号和"|"
中
以下类似的想法来自jay。sf的回答(并从中借用数据):
read.table(
text = gsub(
"(?<=\\d)\\|", "\t",
readLines("tmp.txt"),
perl = TRUE
),
sep = "\t"
)
给
V1 V2 V3
1 123 1234 foo, bar | baz
2 21 3874 foo, bar | baz
3 123 1234 foo, bar | baz
4 123 1234 foo, bar | baz
你可能有类似的东西。
123|1234|foo, bar | baz
021|3874|foo, bar | baz
123|1234|foo, bar | baz
123|1234|foo, bar | baz
如果有一个数字(?
readLines('tmp.txt') |>
strsplit('(?<=\\d)\\|', perl=TRUE)
# [[1]]
# [1] "123" "1234" "foo, bar | baz"
#
# [[2]]
# [1] "021" "3874" "foo, bar | baz"
#
# [[3]]
# [1] "123" "1234" "foo, bar | baz"
#
# [[4]]
# [1] "123" "1234" "foo, bar | baz"
注:R
数据:
write(file='tmp.txt',
'123|1234|foo, bar | baz
021|3874|foo, bar | baz
123|1234|foo, bar | baz
123|1234|foo, bar | baz'
)
问题内容: 如标题所述,会话变量是否有限制(如果有),或者它们被视为 常规 变量并且可以存储相等数量的数据? 我在寻找是否存在除最大长度,最大值等变量类型之外的其他限制。 附注:如果问题不清楚,请告诉我。 提前致谢! 问题答案: 正如@Thariama所说,变量的数量没有限制。此外,会话中可以存储的数据量没有限制(我看到会话的大小为几十MB)。 随着会话的大小变大,您会遇到各种奇怪的问题:PHP
问题内容: 具体说说(服务器端)V8,并假设我不担心准确性,因为我可以检测和补偿它,那么我可以使用setTimeout 逐字 间隔设置几千个相对简单的超时,而无需面对任何其他限制除了RAM以外?如果我要使用一个在任何给定时间可能有数千个计划的超时的系统,我应该注意什么吗? 作为记录,我已经阅读了John’s Resig关于Javascript计时器如何工作的出色文章,因此无需指出那里已经介绍的内容
当将MongoDB的$in子句与Aggregate一起使用时,That在参数数量上有任何最大限制吗? 例如 在id数组中,我可以传递多少id? 目前,我没有遇到任何问题的ids长度达到50,000...但是为了安全起见,我想知道最大限度。 我试着在Mongo doc上搜索,但是什么也没找到。 先谢谢你。
本文向大家介绍VC判断进程是否具有administrator权限的方法,包括了VC判断进程是否具有administrator权限的方法的使用技巧和注意事项,需要的朋友参考一下 本文实例讲述了VC判断进程是否具有admin权限的方法。是的话返回TRUE,否则为FALSE。分享给大家供大家参考。具体实现方法如下: 希望本文所述对大家的VC程序设计有所帮助。
问题内容: 我在嵌入式Linux设备上使用Java 1.5,并且希望读取具有2MB int值的二进制文件。(现在是4字节的Big Endian,但我可以决定格式) 使用via 使用),这500 000个调用需要17秒才能读取,但是读入一个大字节缓冲区的文件需要5秒。 我如何更快地将该文件读入一个巨大的int []? 读取过程不应使用额外的512 kb。 下面使用的这段代码并不比java io中的r
问题内容: 无论如何在运行时重写方法?即使需要从该实例动态创建子类? 问题答案: 使用纯Java,否。 使用ByteBuddy(首选),asm,cglib或Aspectj时,可以。 在纯Java中,在这种情况下要做的事情是创建一个基于接口的代理,该代理处理方法调用并委托给原始对象(或不委托)。