当前位置: 首页 > 面试题库 >

用于电子邮件的ElasticSearch Analyzer和Tokenizer

翟弘
2023-03-14
问题内容

对于以下情况,我在Google或ES中都找不到完美的解决方案,希望有人可以在此提供帮助。

假设在“电子邮件”字段下存储了五个电子邮件地址:

1. {"email": "john.doe@gmail.com"}
2. {"email": "john.doe@gmail.com, john.doe@outlook.com"}
3. {"email": "hello-john.doe@outlook.com"}
4. {"email": "john.doe@outlook.com}
5. {"email": "john@yahoo.com"}

我要满足以下搜索方案:

[搜索->接收]

“ john.doe@gmail.com”-> 1,2

“ john.doe@outlook.com”-> 2,4

“ john@yahoo.com”-> 5

“ john.doe”-> 1,2,3,4

“约翰”-> 1,2,3,4,5

“ gmail.com”-> 1,2

“ outlook.com”-> 2,3,4

前三个匹配项是必须的,对于其他匹配项,越精确越好。已经尝试了索引/搜索分析器,标记器和过滤器的不同组合。还尝试在匹配查询的条件下工作,但是没有找到理想的解决方案,欢迎任何想法,并且对映射,分析器或使用哪种查询没有限制,谢谢。


问题答案:

映射

PUT /test
{
  "settings": {
    "analysis": {
      "filter": {
        "email": {
          "type": "pattern_capture",
          "preserve_original": 1,
          "patterns": [
            "([^@]+)",
            "(\\p{L}+)",
            "(\\d+)",
            "@(.+)",
            "([^-@]+)"
          ]
        }
      },
      "analyzer": {
        "email": {
          "tokenizer": "uax_url_email",
          "filter": [
            "email",
            "lowercase",
            "unique"
          ]
        }
      }
    }
  },
  "mappings": {
    "emails": {
      "properties": {
        "email": {
          "type": "string",
          "analyzer": "email"
        }
      }
    }
  }
}

测试数据

POST /test/emails/_bulk
{"index":{"_id":"1"}}
{"email": "john.doe@gmail.com"}
{"index":{"_id":"2"}}
{"email": "john.doe@gmail.com, john.doe@outlook.com"}
{"index":{"_id":"3"}}
{"email": "hello-john.doe@outlook.com"}
{"index":{"_id":"4"}}
{"email": "john.doe@outlook.com"}
{"index":{"_id":"5"}}
{"email": "john@yahoo.com"}

要使用的查询

GET /test/emails/_search
{
  "query": {
    "term": {
      "email": "john.doe@gmail.com"
    }
  }
}


 类似资料:
  • 我已使用 firebase-ui 成功设置 Firebase 电子邮件/密码身份验证。 但出于安全原因,我希望用户确认她/他的电子邮件。但从上面的代码来看,它并没有向用户发送验证邮件。所以,我使用以下方法向用户发送验证邮件,如果他/她没有验证他的/她的帐户邮件。 但当我使用这个代码时,它会为同一个帐户发送多封验证邮件。这意味着每次用户重新加载页面时都会运行此方法。如果有人能帮助我识别是否使用fir

  • 我有一个联系人表格,有人提供他的姓名和电子邮件。我现在想给他发一封拉威尔的电子邮件。 我在文件里找到的 要发送消息,请使用Mail facade上的To方法。to方法接受电子邮件地址、用户实例或用户集合。 事实上 \邮件::('example@gmail.com')- 作品。但是也可以提供电子邮件收据的名称吗? 我想在邮件Facade的LaravelAPI中查找它,但令我惊讶的是,Facade没有

  • 查看以下,详细了解如何处理与 iPhone 手机配对的 M600 上的电子邮件。 阅读您的 M600 上的电子邮件 如果您在手机上使用电子邮件通知,那么在您收到新邮件时会在您的 M600 看到通知。 阅读电子邮件 轻触通知。 利用您的 M600 回复电子邮件 您可以利用您的手腕表回复邮件。 回复电子邮件 轻触通知查看所有邮件 从屏幕底部向上滑动,查看您可以执行的操作。 轻触 Reply(回复),并

  • Email的历史比Web还要久远,直到现在,Email也是互联网上应用非常广泛的服务。 几乎所有的编程语言都支持发送和接收电子邮件,但是,先等等,在我们开始编写代码之前,有必要搞清楚电子邮件是如何在互联网上运作的。 我们来看看传统邮件是如何运作的。假设你现在在北京,要给一个香港的朋友发一封信,怎么做呢? 首先你得写好信,装进信封,写上地址,贴上邮票,然后就近找个邮局,把信仍进去。 信件会从就近的小

  • Email的历史比Web还要久远,直到现在,Email也是互联网上应用非常广泛的服务。 几乎所有的编程语言都支持发送和接收电子邮件,但是,先等等,在我们开始编写代码之前,有必要搞清楚电子邮件是如何在互联网上运作的。 我们来看看传统邮件是如何运作的。假设你现在在北京,要给一个香港的朋友发一封信,怎么做呢? 首先你得写好信,装进信封,写上地址,贴上邮票,然后就近找个邮局,把信仍进去。 信件会从就近的小

  • 问题内容: 我在linux机器上,我监视进程使用情况。大多数时候,我将离开系统,并且可以在设备上访问Internet。因此,我计划编写一个shell脚本,该脚本可以向我发送该过程的输出。 可能吗? 如果是的话,如何制作一个shell脚本给我发邮件? 请提供摘要以开始使用。 问题答案: 是的,它可以正常工作,并且通常用于: