本文实例讲述了高效.NET脏字过滤算法。分享给大家供大家参考,具体如下:
BadWordsFilter.cs类
using System; using System.Collections.Generic; using System.Linq; using System.Web; using System.Collections; using System.Data; namespace WNF { public class BadWordsFilter { private HashSet<string> hash = new HashSet<string>(); //关键字 private byte[] fastCheck = new byte[char.MaxValue]; private byte[] fastLength = new byte[char.MaxValue]; private BitArray charCheck = new BitArray(char.MaxValue); private BitArray endCheck = new BitArray(char.MaxValue); private int maxWordLength = 0; private int minWordLength = int.MaxValue; public BadWordsFilter() { } //初始化关键字 public void Init(DataTable badwords) { for (int j = 0; j < badwords.Rows.Count; j++) { string word = badwords.Rows[j][0].ToString(); maxWordLength = Math.Max(maxWordLength, word.Length); minWordLength = Math.Min(minWordLength, word.Length); for (int i = 0; i < 7 && i < word.Length; i++) { fastCheck[word[i]] |= (byte)(1 << i); } for (int i = 7; i < word.Length; i++) { fastCheck[word[i]] |= 0x80; } if (word.Length == 1) { charCheck[word[0]] = true; } else { fastLength[word[0]] |= (byte)(1 << (Math.Min(7, word.Length - 2))); endCheck[word[word.Length - 1]] = true; hash.Add(word); } } } public string Filter(string text, string mask) { throw new NotImplementedException(); } //检查是否有关键字 public bool HasBadWord(string text) { int index = 0; while (index < text.Length) { int count = 1; if (index > 0 || (fastCheck[text[index]] & 1) == 0) { while (index < text.Length - 1 && (fastCheck[text[++index]] & 1) == 0) ; } char begin = text[index]; if (minWordLength == 1 && charCheck[begin]) { return true; } for (int j = 1; j <= Math.Min(maxWordLength, text.Length - index - 1); j++) { char current = text[index + j]; if ((fastCheck[current] & 1) == 0) { ++count; } if ((fastCheck[current] & (1 << Math.Min(j, 7))) == 0) { break; } if (j + 1 >= minWordLength) { if ((fastLength[begin] & (1 << Math.Min(j - 1, 7))) > 0 && endCheck[current]) { string sub = text.Substring(index, j + 1); if (hash.Contains(sub)) { return true; } } } } index += count; } return false; } } }
引用:
string sql = "select keywords from tb_keyword"; BadWordsFilter badwordfilter = new BadWordsFilter(); //初始化关键字 badwordfilter.Init(oEtb.GetDataSet(sql).Tables[0]); //检查是否有存在关键字 bool a = badwordfilter.HasBadWord(TextBox1.Text); if (a == true) { Page.RegisterClientScriptBlock("a", "<script>alert('该评论含有不合法文字!')</script>"); } else { PingLun();//写入评论表 }
更多关于asp.net相关内容感兴趣的读者可查看本站专题:《asp.net字符串操作技巧汇总》、《asp.net操作json技巧总结》、《asp.net操作XML技巧总结》、《asp.net文件操作技巧汇总》、《asp.net ajax技巧总结专题》及《asp.net缓存操作技巧总结》。
希望本文所述对大家asp.net程序设计有所帮助。
我运行在MongoDB 3.6,与mongo驱动程序3.4.3和Spring数据mongo 1.5.10。下面是我文档的结构 我正在尝试对数据进行批量更新,如下所示 现在并尝试将此代码转换为java。下面是我能够实现批量更新的代码。正如预期的那样,由于使用$[],下面的查询正在更新所有文档。我试图找出如何在这里使用位置数组更新运算符(如$[one])应用数组过滤器。 此外,我也找不到足够的教程或文
本文向大家介绍C#实现简单过滤非法字符实例,包括了C#实现简单过滤非法字符实例的使用技巧和注意事项,需要的朋友参考一下 本文实例讲述了C#实现简单过滤非法字符的方法。分享给大家供大家参考,具体如下: 希望本文所述对大家C#程序设计有所帮助。
问题内容: 我需要过滤一个数组以删除低于某个阈值的元素。我当前的代码是这样的: 问题在于,这会使用带有lambda函数(慢速)的过滤器来创建一个临时列表。 由于这是一个非常简单的操作,因此也许有一个numpy函数可以高效地完成此操作,但是我一直找不到它。 我以为实现此目的的另一种方法可能是对数组进行排序,找到阈值的索引并从该索引开始返回一个切片,但是即使对于较小的输入这会更快(而且无论如何也不会引
本文向大家介绍.NET Framework 哪里(过滤器),包括了.NET Framework 哪里(过滤器)的使用技巧和注意事项,需要的朋友参考一下 示例 此方法返回一个IEnumerable,其中包含所有满足lambda表达式的元素 例 输出: 狐狸 观看演示
本文向大家介绍java利用DFA算法实现敏感词过滤功能,包括了java利用DFA算法实现敏感词过滤功能的使用技巧和注意事项,需要的朋友参考一下 前言 敏感词过滤应该是不用给大家过多的解释吧?讲白了就是你在项目中输入某些字(比如输入xxoo相关的文字时)时要能检 测出来,很多项目中都会有一个敏感词管理模块,在敏感词管理模块中你可以加入敏感词,然后根据加入的敏感词去过滤输 入内容中的敏感词并进行相应的
主要内容:检测一个数字是否在一个范围内,实例,检测 IPv6 地址,实例,检测 URL - 必须包含QUERY_STRING(查询字符串),实例,移除 ASCII 值大于 127 的字符,实例,PHP 过滤器参考手册检测一个数字是否在一个范围内 以下实例使用了 filter_var() 函数来检测一个 INT 型的变量是否在 1 到 200 内: 实例 <?php $int = 122; $min = 1; $max = 200; if (filter_var($int, FILTER_VALI