问题：

为什么all.equal在向量列表中找不到向量？

符俊材

2023-03-14

我正在尝试编写一些代码，以在一个庞大的向量数组中找到一个特定的向量，并返回该向量副本出现的位置的索引。在尝试调试时，我试图学习＜code＞all的行为。equal（此处推荐，类型不匹配似乎排除了相同的）。我现在编写了以下代码：

data<-replicate(100000,sample(4)) 
which( apply(data, 2, function(x) all.equal(c(1:4),data)) == TRUE)

据我了解，我所写的第一行生成了大量从 1 到 4 的整数排列，第二行搜索它们以查找精确排列 1、2、3、4 的任何场合。从统计学上讲，我非常有信心这种排列应该出现在这个列表中的某个地方，在我的特殊情况下，它是第九个条目。但是，每次我运行此代码或其任何变体时，我都被告知所需的排列永远不会出现。

我做错了什么？坦率地说，当我不得不查找如何在向量列表中查找向量并且我必须使用两个函数来执行此操作时，我开始怀疑我犯了一个重大错误。有没有更简单的方法？

共有2个答案

段志

2023-03-14

请尝试以下操作：

which( apply(data, 2, function(x) all.equal(c(1:4),x)) == TRUE)

不同之处在于，在您的代码中，您是将名为< code>data的整个结构与1:4进行比较，由于大小不匹配，这将永远不会是< code>TRUE。我在应用的函数中用< code>x替换了< code>data,所以现在每个单独的列都以1:4进行比较。

您的代码中也有一些冗余，c（1:4）与1:4相同。在这种情况下，all.equal可能有些多余，因为它所做的不仅仅是比较（它与模糊因子进行比较，并告诉您事物的不同之处）。您使用它的方式是将TRUE转换为字符。不提前简化会更有效率。这是一个快速比较（较小的模拟数据）：

> library(microbenchmark)
> 
> microbenchmark(
+   ae = {
+     data<-replicate(100,sample(4)) 
+     which( apply(data, 2, function(x) all.equal(c(1:4),x)) == TRUE)
+   },
+   e = {
+     data <- replicate(100, sample(4), simplify=FALSE)
+     which(sapply(data, function(x)all(x==(1:4))))
+   }
+ )
Unit: microseconds
 expr      min        lq      mean    median       uq       max neval cld
   ae 4063.205 4303.3370 4940.2126 4501.5080 4951.623 10953.339   100   b
    e  455.934  493.3115  578.4828  523.4605  562.601  2013.444   100  a

简化的代码运行时间约为九分之一（平均）。

巢靖

2023-03-14

事实上，你就快到了，只是一个小小的错别字。正确的代码是

which(apply(data, 2, function(x) all.equal(x, c(1, 2, 3, 4))) == TRUE)

因为您需要提供用于比较的数据，而所需的数据是列，而不是整个数据集。按照您的方法，它永远不会找到匹配项，因为整个数组永远不会匹配一个向量。

为什么all.equal在向量列表中找不到向量？

共有2个答案

相关问答

相关文章

相关阅读

相关工具

相关文档