问题：

将聚类分析结果转换为数据。R中的帧格式

裴卓君

2023-03-14

这篇文章来自于这个主题，使用R对单词中的相同模式进行分类。解决方案很好，但是我需要数据帧格式。数据是相同的

text<-structure(list(ID_C_REGCODES_CASH_VOUCHER = c(3941L, 3941L, 3941L, 
3945L, 3945L, 3945L, 3945L, 3945L, 3945L, 3945L, 3953L, 3953L, 
3953L, 3953L, 3953L, 3953L, 3960L, 3960L, 3960L, 3960L, 3960L, 
3960L, 3967L, 3967L, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, 
NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, 
NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA), GOODS_NAME = structure(c(19L, 
17L, 15L, 18L, 16L, 23L, 21L, 14L, 22L, 20L, 6L, 2L, 10L, 8L, 
7L, 13L, 5L, 11L, 7L, 12L, 4L, 3L, 9L, 9L, 1L, 1L, 1L, 1L, 1L, 
1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 
1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L
), .Label = c("", "* 2108609 SLOB.Mayon.OLIVK.67% 400ml", "* 3014084 D.Dym.Spikachki DEREVEN.MINI 1kg", 
"* 3398012 DD Kolb.SERV.OKHOTN in / to v / y0.35", "* 3426789 WH.The corn rav guava / yagn.d / CAT seed 85g", 
"197 Onion 1 kg", "2013077 MAKFA Makar.RAKERS 450g", "2030918 MARIA TRADITIONAL Biscuit 180g", 
"2049750 MAKFA Makar.SHIGHTS 450g", "3420159 LEBED.Mol.past.3,4-4,5% 900g", 
"3491144 LIP.NAP.ICE TEA green yellow 0.5 liter", "6788 MAKFA Makar.perya 450g", 
"809 Bananas 1kg", "FetaXa Cheese product 60% 400g (", "Lemons 55+", 
"MAKFA Macaroni feathers like. in / with", "Napkins paper color 100pcs PL", 
"Package \"Magnet\" white (Plastiktre)", "Pasta Makfa snail flow-pack 450 g.", 
"SHEBEKINSKIE Macaroni Butterfly №40", "SOFT Cotton sticks 100 PE (BELL", 
"TENDER AGE Cottage cheese 10", "TOBUS steering-wheel 0.5kg flow"
), class = "factor")), .Names = c("ID_C_REGCODES_CASH_VOUCHER", 
"GOODS_NAME"), class = "data.frame", row.names = c(NA, -61L))

我们来进行聚类分析

text <- text[1:24,]
library(quanteda)
library(tidyverse)
hc <- text %>% 
  pull(GOODS_NAME) %>% 
  as.character %>% 
  quanteda::tokens(
    remove_numbers = T,  
    remove_punct = T,
    remove_symbols = T, 
    remove_separators = T
  ) %>% 
  quanteda::tokens_tolower() %>% 
  quanteda::tokens_remove(valuetype="regex", pattern = c("^\\d.*")) %>% 
  quanteda::dfm() %>% 
  textstat_simil(method = "jaccard") %>% 
  magrittr::multiply_by(-1) %>% 
  `attr<-`("Labels", text$GOODS_NAME) %>% 
  hclust(method = "average") 


clusters <- cutree(hc, h = -0.1)
split(text, clusters)

代码完成后，如何将结果转换为data.frame?

预期产出

s=as。数据（函数（…，row.names=NULL，check.rows=FALSE，check.names=TRUE）中的frame（拆分（文本，集群））错误：参数表示行数不同：7,1,2

所以理想的输出

clust   ID_C_REGCODES_CASH_VOUCHER   GOODS_NAME
1       3941    Pasta Makfa snail flow-pack 450 g.
1       3945     MAKFA Macaroni feathers like. in / with
1       3953    2013077 MAKFA Makar.RAKERS 450g
1       3960    2013077 MAKFA Makar.RAKERS 450g
1       3960    6788 MAKFA Makar.perya 450g
1       3967    2049750 MAKFA Makar.SHIGHTS 450g
1       3967    2049750 MAKFA Makar.SHIGHTS 450g
2       3941    Napkins paper color 100pcs PL

共有1个答案

孔建柏

2023-03-14

library( data.table )
dt <- data.table::rbindlist( split(text, clusters) )[, clust := clusters]

类似资料：

R将数据帧转换为JSON

问题内容：我有一个要转换为json格式的数据框：我的数据帧称为res1：当我做：我得到这个：我需要这个json输出像这样，有什么想法吗？问题答案：怎么样通过使用，我们实际上将大的data.frame分解为每一行的单独的data.frame。通过从结果列表中删除名称，该函数将结果包装在数组中，而不是命名对象中。
如何在R中将数据帧转换为data.table？

本文向大家介绍如何在R中将数据帧转换为data.table？，包括了如何在R中将数据帧转换为data.table？的使用技巧和注意事项，需要的朋友参考一下由于对data.table的操作有时比数据帧快，因此我们可能希望将数据帧转换为data.table对象。数据框和data.table之间的主要区别在于，数据框可在基础R中使用，但是要使用data.table，我们必须安装软件包data.tabl
如何将R数据帧中的字符串转换为NA？

本文向大家介绍如何将R数据帧中的字符串转换为NA？，包括了如何将R数据帧中的字符串转换为NA？的使用技巧和注意事项，需要的朋友参考一下我们经常会在数据收集过程中发现错误，这些错误可能会导致研究结果不正确。当错误地收集数据时，将使分析师的工作变得困难。显示数据有错误的一种情况是获取字符串代替数字值。因此，我们需要将这些字符串转换为R中的NA，以便我们可以进行预期的分析。示例请看以下数据帧- 将
如何在R数据帧中将空值转换为NA？

本文向大家介绍如何在R数据帧中将空值转换为NA？，包括了如何在R数据帧中将空值转换为NA？的使用技巧和注意事项，需要的朋友参考一下当我们的数据包含空值时，很难执行分析，我们可能会将这些空值转换为NA，以便我们了解不可用的值的数量。这可以通过使用单个方括号来完成。示例请看以下具有一些空值的数据框- 将空值转换为NA-
将数据库结果转换为数组

问题内容：我刚刚为组织此表中第70页上显示的查询层次结构数据的“关闭表”方法做了“更新/添加/删除”部分：http ://www.slideshare.net/billkarwin/sql-antipatterns- strike -背部我的数据库如下所示：表类别：表类别树：但是，从单个查询获取整棵树作为多维数组时，我遇到了一个问题。这是我想回来的东西：更新：找到了此链接，但是我仍
如何通过R中的行将数据帧值转换为向量？

本文向大家介绍如何通过R中的行将数据帧值转换为向量？，包括了如何通过R中的行将数据帧值转换为向量？的使用技巧和注意事项，需要的朋友参考一下数据可以任何形式提供给我们，但有可能不适合用于分析。有时数据记录在数据框中，但我们可能需要将其作为向量。在这种情况下，我们必须更改向量中数据帧的值。这可以通过在将数据帧与t换位后将它们读取为矢量来读取数据帧值来完成。示例请看以下数据帧- 让我们看另一个例子

将聚类分析结果转换为数据。R中的帧格式

共有1个答案

相关问答

相关文章

相关阅读

相关工具

相关文档