当前位置: 首页 > 软件库 > 程序开发 > OCR开发包 >

FuzzyOcr

反垃圾邮件插件
授权协议 Apache Licene 2.0
开发语言 C/C++
所属分类 程序开发、 OCR开发包
软件类型 开源软件
地区 不详
投 递 者 华泽语
操作系统 Linux
开源组织
适用人群 未知
 软件概览

FuzzyOCR,是一套修改自OcrPlugin的Spamassassin plugin。同样是利用光学字符辨认(OCR)的方式,来识别图像式邮件所包含的「文字讯息」,并利用Fuzzy word matching算法判断辨识出来的文字。

主要具备了下列的功能:

Optical Character Recognition using different engines and settings

Fuzzy word matching algorithm applied to OCR results

Image hashing system to learn unique properties of known spam images

Dimension, size and integrity checking of images

Content-Type verification for the containing email

Matching and learning techniques

可弹性支持不同的OCR interface,并利用fuzzy word matching算法来处理辨识的结果。

支持DB,可将处理过的图片,以 feature vectors的形态储存在数据库。因此相同或是类似的图片,便可以利用储存在DB的特征向量来处理。

能检测不同维 度、size与整合性的测试。

邮件内容检测。

Resource saving techniques

仅扫描邮件,而非辨认该封信件是否为垃圾信件。信件的分类仍交由spamassassin所判别的分数高低来决定。

对于已达到 spam分数门坎的邮件,FuzzyOCR在处理该封邮件时会忽略该封信件而不进行扫描,进而减轻系统负载。(3.5版之后提供)

藉 由比对储存于DB的feature vectors(dimensions and file size)。若比对成功,则忽略该封信件,而不再进行OCR辨识与处理。

 相关资料
  • 1. 注重双向选择 当客户在你的网站提交表单或者订阅的情况下再去发送邮件,注意尽量避免向未注册过的用户邮箱发送邮件,垃圾举报、取消订阅率、无效地址邮件等均会使信誉度降低; 2. 明确的邮件主题 邮件一定要有主题,并且主题要与邮件内容相符; 避免使用过短或过长的邮件主题,尽量简短清晰; 避免重复使用重复的主题,尽量让每封邮件不完全一样; 避免在主题中使用问候语、特殊符号(如:惊叹号,问号等标点符号以

  • 本文向大家介绍Drupal 8:自动垃圾邮件防护,包括了Drupal 8:自动垃圾邮件防护的使用技巧和注意事项,需要的朋友参考一下 对于互联网上具有公开可用形式的任何网站,垃圾邮件都是一个长期存在的问题,但是自动阻止垃圾邮件可能很棘手。这样做的目的是防止自动垃圾邮件bot能够将数据提交到您的站点,但不会损害用户。在防止垃圾邮件和阻止真实用户提交真实内容之间要有一个谨慎的平衡。手动审核博客评论通常是

  • 问题内容: 我在向我的收件箱(Gmail帐户)发送邮件时遇到问题,但是每次都转到垃圾邮件文件夹时。这是代码片段 我尝试过很多类似将标头设置为Reply-To,Return-Path等的方法,但是每次都将其转为垃圾邮件时。你能找出问题所在吗? 问题答案: 问题很简单,PHP-Mail功能没有使用配置良好的SMTP服务器。 如今,电子邮件客户端和服务器会对电子邮件发送服务器进行大量检查,例如反向DNS

  • 本文向大家介绍垃圾邮件和网络钓鱼邮件之间的区别,包括了垃圾邮件和网络钓鱼邮件之间的区别的使用技巧和注意事项,需要的朋友参考一下 垃圾邮件 垃圾邮件是垃圾邮件。它可能包含广告/促销详细信息。垃圾邮件通常是从受病毒或蠕虫感染的受感染计算机发送的。这样的计算机批量发送电子邮件。某些垃圾邮件中可能包含有害链接,恶意软件或内容,这些内容看起来真实可信但有意滥用。例如,发邮件说明您是大彩票的赢家,并要求提供银

  • 问题内容: 这是我发送邮件的代码: 每次我发送邮件时,它都会进入垃圾邮件。有人知道为什么会这样吗? 问题答案: 根据您的代码,我注意到您是直接从您所在域的网页发送电子邮件。 例如,您使用了@ hotmail.com地址。 当收件人收到电子邮件时,收件人的邮件服务可能会测试邮件发件人的反向DNS。因此,发件人来自,但邮件来自您的域,当然这不是 **hotmail.com** 。 因此,我从某个地址收

  • 我正在尝试使用Yandex从我的NodeJs服务器发送电子邮件。下面是创建传输器的过程 但它总是无法显示以下信息: {错误:消息失败:554 5.7.1[2]消息因涉嫌垃圾邮件而被拒绝;https://ya.cc/1IrBc157899406-wC5neov7vv-ui00GIiO 是Yandex的问题还是我这边的问题?

  • 问题内容: 我正在使用PHP的mail()函数发送电子邮件(sendmail进程正在运行)。但是所有邮件都将变成垃圾邮件(如果是gmail)。我尝试了很多在网上找到的技巧,但没有用,请告诉我任何确定的技巧。 问题答案: 您必须添加针头: 样例代码: