问题：

如何将一个多索引数据集与另一个多索引数据集分割

邓阳炎

2023-03-14

ix = pd.MultiIndex.from_product([[1, 2, 3], ['foo', 'bar'], ['baz', 'can']], names=['a', 'b', 'c'])
data = np.arange(len(ix))
df = pd.DataFrame(data, index=ix, columns=['hi'])
print(df)

           hi
a b   c      
1 foo baz   0
      can   1
  bar baz   2
      can   3
2 foo baz   4
      can   5
  bar baz   6
      can   7
3 foo baz   8
      can   9
  bar baz  10
      can  11

ix_use = pd.MultiIndex.from_tuples([('foo', 'can'), ('bar', 'baz')], names=['b', 'c'])

最初，我认为将一个多索引对象传递给。loc可以提取出我想要的值/级别，但这是行不通的。做这样的事情最好的方法是什么？

共有1个答案

彭琛

2023-03-14

以下是获取此切片的一种方法：

df.sort_index(inplace=True)
idx = pd.IndexSlice
df.loc[idx[:, ('foo','bar'), 'can'], :]

屈服

           hi
a b   c      
1 bar can   3
  foo can   1
2 bar can   7
  foo can   5
3 bar can  11
  foo can   9

请注意，在对MultiIndex进行切片之前，可能需要对其进行排序。嗯，如果你需要这样做，熊猫会好心地警告你：

KeyError: 'MultiIndex Slicing requires the index to be fully lexsorted tuple len (3), lexsort depth (1)'

df[df.index.get_level_values('b').isin(ix_use.get_level_values(0)) & df.index.get_level_values('c').isin(ix_use.get_level_values(1))]

显然不是那么简洁。

更新：

对于您在这里更新的条件，有一种方法可以做到这一点：

cond1 = (df.index.get_level_values('b').isin(['foo'])) & (df.index.get_level_values('c').isin(['can']))
cond2 = (df.index.get_level_values('b').isin(['bar'])) & (df.index.get_level_values('c').isin(['baz']))
df[cond1 | cond2]

生产：

           hi
a b   c      
1 foo can   1
  bar baz   2
2 foo can   5
  bar baz   6
3 foo can   9
  bar baz  10

类似资料：

elasticsearch，多个索引与一个索引和不同数据集的类型？

问题内容：我有一个使用MVC模式开发的应用程序，我现在希望为其建立多个模型的索引，这意味着每个模型具有不同的数据结构。使用多个索引（每个模型一个索引还是在每个模型的相同索引中使用一个类型）是更好的选择吗？我认为这两种方式都需要不同的搜索查询。我刚刚开始。如果数据集很小或很大，这两个概念在性能上是否存在差异？如果有人可以为我推荐一些好的样本数据，我自己会测试第二个问题。问题答案：两种方法
弹性搜索，多个索引vs一个索引和不同数据集的类型？

我有一个使用MVC模式开发的应用程序，现在我想对它的多个模型进行索引，这意味着每个模型都有不同的数据结构。 > 是使用多个索引更好，每个模型使用一个索引，还是在每个模型的同一索引中使用一个类型？我认为，这两种方法都需要不同的搜索查询。我刚开始做这个。如果数据集是小的还是大的，这两个概念在性能上是否存在差异？如果有人能为我推荐一些好的样本数据，我会自己测试第二个问题。
仅选择多索引数据帧的一个索引

我正在尝试从多索引数据帧中仅使用一个索引来创建新的数据帧。理想情况下，我想要这样的东西：和：基本上，我想删除除level之外的多索引的所有其他索引。有没有一个简单的方法可以做到这一点？
MongoDB如何将索引定义从一个集合复制到另一个集合？

我知道有一种方法可以实现db。收集getIndexes（），它将列出为集合定义的所有索引。有没有办法将这些索引定义复制并创建到另一个集合？有很多，我不想一个接一个地做。关于重复的问题评论：我不希望复制收藏。我希望以可以应用于另一个集合的格式导出索引。
用另一个数据框的索引创建一个空的数据框

问题内容：我有一个具有多个列和行的数据框 df1 。简单的例子：我想创建一个空的数据框 df2，然后再添加带有计算结果的新列。目前，我的代码如下所示： …添加两个新列：有没有更好/更安全/更快的方法呢？是否可以创建一个空的数据帧df2并仅从df1复制索引？问题答案：这将创建一个没有列但只有一个索引的DataFrame，并且它将与df1中的索引相同。
MongoDB-具有两个多键索引的索引交集

我的集合中有两个数组（一个是嵌入式文档，另一个只是字符串的简单集合）。文档，例如：由于一些查询将仅包含策略，而一些查询将包含标签和参与者数组，并且考虑到我无法创建具有两个数组的多键索引这一事实，我认为使用索引交叉点将是一个经典场景。我正在执行一个查询，但我看不到交叉点。以下是索引：以下是查询：这是解释的结果：查询中的每个标记（tag1、tag-2和tag-3）都有10K个文档。每个策略

如何将一个多索引数据集与另一个多索引数据集分割

共有1个答案

相关问答

相关文章

相关阅读

相关工具

相关文档