当前位置: 首页 > 面试题库 >

如何在MySQL中找到最流行的单词出现?

缪远
2023-03-14
问题内容

我有一个名为results5列的表格。

我想使用该title列查找要说的行:WHERE title like '%for sale%'然后在该列中列出最受欢迎的单词。一个会是for,另一个会是,sale但是我想看看与此相关的其他词。

样本数据:

title
cheap cars for sale
house for sale
cats and dogs for sale
iphones and androids for sale
cheap phones for sale
house furniture for sale

结果(单字):

for    6
sale    6
cheap    2
and    2
house    2
furniture 1
cars    1
etc...

问题答案:

您可以通过一些字符串操作来提取单词。假设您有一个数字表,并且单词之间用单个空格分隔:

select substring_index(substring_index(r.title, ' ', n.n), ' ', -1) as word,
       count(*)
from results r join
     numbers n
     on n.n <= length(title) - length(replace(title, ' ', '')) + 1
group by word;

如果没有数字表,则可以使用子查询手动构造一个表:

from results r join
     (select 1 as n union all select 2 union all select 3 union all . . .
     ) n
     . . .

SQL小提琴(由@GrzegorzAdamKowalski提供)在这里。



 类似资料:
  • 如果我正确地看到了这一点,那么trie中的所有叶节点都将拼写出整个单词,所有父节点都包含最终叶节点之前的字符。因此,如果我有一个名为DigitalTreeNode的类,其定义为 如果我想实现一个返回trie中最长单词的方法,是否只需要在每个叶节点查找最长单词?如何实现方法,例如: 我猜它涉及到设置一个最长的字符串变量,递归地遍历每个节点,并检查它是否是一个单词,如果它是一个单词,并且它的长度大于最

  • 问题内容: 我有一个词表 我想将每个列表项与一个字符串进行比较,并且输出应该是最相似的词。示例:如果是,则是最相似的词。如何在python中执行此操作?通常,我在清单中所用的单词可以很好地区分。 问题答案: 使用difflib: 正如您从仔细阅读源代码可以看到的那样,“接近”匹配项的排序从最佳到最差。

  • 你好,我需要找到文件中最长的单词出现的行号。如果有两个或两个以上长度相同的单词,那么只跟踪第一个。我已经跟踪了最长的单词,但我需要帮助找出最长的单词在哪里。这是我找到最长单词的代码:

  • 问题内容: 我有一列包含街道清单的列。我需要将“街道”替换为“圣”。可以使用所需格式的地址在当前列或新列中进行替换。以下是示例数据。“列1”包含当前格式的数据。“第2列”包含所需格式的数据。 我该怎么做呢? 编辑: 此查询适用于以下情况: 是否可以为此列设置规则。这样添加到此的所有数据会自动以这种方式格式化吗?还是我每次都需要重复此查询? 问题答案: 运行这样的查询以在 同一 列中进行更新:

  • 我是 PyCharm(和 Python)的新手,但找不到一种方法在我的 PyCharm 项目中的所有文件中完整搜索单词。每次我做编辑—— 当我选择查找用法时,它告诉我将插入符号定位到一个特定的单词。

  • 所以基本上我创建了一个代码来导入一个包含单词的文本文件,当我在代码中输入一个单词时,程序会发现这个单词是否在我导入的文本文件中。 “在第4441行的索引26处匹配” 你知道我怎么做吗..我真的没有主意了。