问题：

用sparklyr将字符串转换为R中的逻辑字符串

谷梁波

2023-03-14

当我试图将这些值转换为逻辑值时，“ ”值将转换为false和“false”值。对如何克服这一点有什么想法吗？

test_lgl <- 
  tibble(a = c(TRUE, TRUE, NA, NA, FALSE, FALSE),
         b = c("true", "true", "na", "<na>", "false", "f"))

test_lgl %>% mutate_if(is.character, as.logical)

# this works
   a     b
  <lgl> <lgl>
1  TRUE  TRUE
2  TRUE  TRUE
3    NA    NA
4    NA    NA
5 FALSE FALSE
6 FALSE    NA

sc <- spark_connect(master = "local")
spark_lgl <- copy_to(sc, test_lgl)

spark_lgl %>% mutate_if(is.character, as.logical)

# this does not
      a     b
  <lgl> <lgl>
1  TRUE  TRUE
2  TRUE  TRUE
3 FALSE FALSE
4 FALSE FALSE
5 FALSE FALSE
6 FALSE FALSE

共有1个答案

乐正光誉

2023-03-14

当我试图将值转换为逻辑值时，“ ”值将转换为false

令人惊讶的是没有。如果进一步检查结果：

spark_lgl_boolean <- spark_lgl %>% mutate_if(is.character, as.logical)
spark_lgl_boolean %>% mutate_all(is.na)

Applying predicate on the first 100 rows
# Source:   lazy query [?? x 2]
# Database: spark_connection
      a     b
  <lgl> <lgl>
1 FALSE FALSE
2 FALSE FALSE
3  TRUE  TRUE
4  TRUE  TRUE
5 FALSE FALSE
6 FALSE FALSE

这与NA计数一致：

spark_lgl_boolean %>%
  mutate_all(is.na) %>% 
  mutate_all(as.numeric) %>%
  summarize_all(sum)

# Source:   lazy query [?? x 2]
# Database: spark_connection
      a     b
  <dbl> <dbl>
1     2     2

spark_lgl %>% mutate_if(is.character, as.logical) %>% optimizedPlan

Applying predicate on the first 100 rows
<jobj[1074]>
  org.apache.spark.sql.catalyst.plans.logical.Project
  Project [a#10, cast(b#11 as boolean) AS b#2037]
+- InMemoryRelation [a#10, b#11], true, 10000, StorageLevel(disk, memory, deserialized, 1 replicas), `test_lgl`
      +- *FileScan csv [a#10,b#11] Batched: false, Format: CSV, Location: InMemoryFileIndex[file:/tmp/..., PartitionFilters: [], PushedFilters: [], ReadSchema: struct<a:boolean,b:string>

null

scala> Seq("tRUE", "FALSE", "f", "<na>", "NA", "1", "0").toDF("x").select($"x".cast("boolean")).show
+-----+
|    x|
+-----+
| true|
|false|
|false|
| null|
| null|
| true|
|false|
+-----+

但是，如果您坚持使用基于Spark的逻辑，而不将数据提取到R，事情应该会很好地工作（例如，如果您将数据写入文件）。

我正在使用spark_read_csv()加载数据

在这种情况下，您可以查看CSV阅读器的nullvalue和nanvalue选项。例如：

spark_read_csv(..., options=list(nullValue="<na>"))

spark_read_csv(..., options=list(nanValue="<na>"))

类似资料：

将字符串转换为f字符串

问题内容：如何将经典字符串转换为f字符串？输出：所需的输出：问题答案： f字符串是语法，而不是对象类型。您不能将任意字符串转换为该语法，该语法会创建一个字符串对象，而不是相反。我假设您想用作模板，因此只需在对象上使用方法：如果要提供可配置的模板服务，请创建一个包含所有可以插值的字段的名称空间字典，并与调用语法一起使用以应用名称空间：然后，用户可以在字段中的名称空间中使用任何键（或
为什么将字符串转换为字符串？

问题内容： Oracle Java Community网站上的一篇文章提供了以下方法作为示例（对于JPA Converter，但这并不相关）：将String y强制转换为String val有什么用？有正当的理由吗？原始文章：JPA的新增功能问题答案：这样的转换是完全没有必要的。我可以想象那是以前但是后来参数类型更改为，而作者只是忘了删除强制类型转换。
将字符串转换为模板字符串

问题内容：是否可以将模板字符串创建为常规字符串然后将其转换为模板字符串没有，以及其他动态代码生成方式？问题答案：由于您的模板字符串必须动态地（在运行时）引用该变量，因此答案是：否，没有动态代码生成是不可能的。但这很简单：
将字符串转换为字符数组，然后再转换为字符串

我正在使用Schembuf在带有套接字的计算机之间更改数据。要传输数据，我使用以下内容：然而，我注意到Protobuf无法读取任何非int类型的接收数据（它将其分配给0）。果不其然，如果我不使用套接字，但试图用相同的代码片段返回消息，则会发生相同的情况：我还指出：那么，为什么我不能正确地将数据转换回字符串呢？如果这是一个参考问题，为什么protobuf不能读取字符数组数据或从字符数组转换的字
将[]字符串转换为[]字节

问题内容：我想在GO中将字符串数组转换为字节数组，以便可以将其写到磁盘上。将字符串数组（）解码为字节数组（）的最佳解决方案是什么？我正在考虑对字符串数组进行两次迭代，第一个迭代以获得字节数组所需的实际大小，然后第二个迭代写入每个元素的长度和实际字符串（）。解决方案必须能够以其他方式进行转换；从一个到一个。问题答案：让我们忽略一个事实，那就是走一秒钟。您需要做的第一件事是将序列化格式编组为
如何将包含转义字符的字符串转换为字符串

我有一个字符串返回给我，其中包含转义字符。这是一个示例字符串 " test\40gmail.com " 如您所见，它包含转义字符。我需要将其转换为其实际值，即 " test@gmail.com " 我该怎么做？

用sparklyr将字符串转换为R中的逻辑字符串

共有1个答案

相关问答

相关文章

相关阅读

相关工具

相关文档