我有一张表,其中列出了分布在五个不同列中的名称。我正在尝试获得6个最常见的不同名称。每个名称只会在每个记录中出现一次。这五列是name_1,name_2
… name_5。仅出于名称的缘故,将表称为“ mytable”。
任何帮助将非常感激。
这是一种方法:
SELECT name, COUNT(1)
FROM ( SELECT name_1 AS name FROM mytable
UNION ALL SELECT name_2 AS name FROM mytable
UNION ALL SELECT name_3 AS name FROM mytable
UNION ALL SELECT name_4 AS name FROM mytable
UNION ALL SELECT name_5 AS name FROM mytable
) AS myunion
GROUP BY name
ORDER BY COUNT(1) DESC LIMIT 6
;
表格中有几行?
问题:发现2件事 给定未排序整数数组中出现的最高值 出现率最高的元素,如果有多个元素满足(出现率相同),则结果为最小的元素。 请尽可能简单地解决问题,不要使用指针或任何高级容器,如哈希表、对或映射(我是一个初学者) 答案是2和2(元素和都出现两次,但是最小的) 这里是代码,但它只找到最高出现的权利。
问题内容: 我有一个数据集 我希望能够返回类似的信息(显示唯一的值和频率) 问题答案: 使用和: 请参阅在线文档:http : //pandas.pydata.org/pandas-docs/stable/groupby.html 另外,正如所说,这里有很多方法可以给猫皮 如果要向原始数据帧添加频率,请使用transform返回对齐的索引:
我有一个数据集 我希望能够返回像(显示独特的值和频率)这样的东西
我有一个有83列4000行的pandas数据帧。我打算使用这些数据进行logistic回归,因此希望将我的列缩小到那些丢失数据最少的列。 乔希
问题内容: 我有三个SQL选择,需要将它们的结果加在一起。这三个中的两个使用相当复杂的联接。 我需要的是所有三个值的总和。 。无论如何,是否可以在单个语句中执行此操作? 问题答案: 你可以的。 请勿使用,因为它会忽略重复的值(会导致)。
问题内容: 我想知道是否可以运行这样的请求: 这个想法是用t1的一些数据填充t2,但是我在语法上一定是错误的。 谢谢你的帮助 问题答案: 从语句插入时不使用关键字。