当前位置: 首页 > 编程笔记 >

C#和SQL实现的字符串相似度计算代码分享

苏淇
2023-03-14
本文向大家介绍C#和SQL实现的字符串相似度计算代码分享,包括了C#和SQL实现的字符串相似度计算代码分享的使用技巧和注意事项,需要的朋友参考一下

C#实现:


#region 计算字符串相似度

        /// <summary>

        /// 计算字符串相似度

        /// </summary>

        /// <param name="str1">字符串1</param>

        /// <param name="str2">字符串2</param>

        /// <returns>相似度</returns>

        public static float Levenshtein(string str1, string str2)

        {

            //计算两个字符串的长度。  

            int len1 = str1.Length;

            int len2 = str2.Length;

            //比字符长度大一个空间  

            int[,] dif = new int[len1 + 1, len2 + 1];

            //赋初值,步骤B。  

            for (int a = 0; a <= len1; a++)

            {

                dif[a, 0] = a;

            }

            for (int a = 0; a <= len2; a++)

            {

                dif[0, a] = a;

            }

            //计算两个字符是否一样,计算左上的值  

            int temp;

            for (int i = 1; i <= len1; i++)

            {

                for (int j = 1; j <= len2; j++)

                {

                    if (str1.Substring(i - 1, 1) == str2.Substring(j - 1, 1))

                    {

                        temp = 0;

                    }

                    else

                    {

                        temp = 1;

                    }

                    //取三个值中最小的  

                    dif[i, j] = Min(dif[i - 1, j - 1] + temp, dif[i, j - 1] + 1, dif[i - 1, j] + 1);

                }

            }

            return 1 - (float)dif[len1, len2] / Math.Max(str1.Length, str2.Length);

        }

        #endregion

        //比较3个数字得到最小值          private static int Min(int i, int j, int k)         {             return i < j ? (i < k ? i : k) : (j < k ? j : k);         }

SQL实现:


CREATE   function get_semblance_By_2words 

( 

@word1 varchar(50), 

@word2 varchar(50)   

) 

returns nvarchar(4000) 

as 

begin 

declare @re int 

declare @maxLenth int 

declare @i int,@l int 

declare @tb1 table(child varchar(50)) 

declare @tb2 table(child varchar(50)) 

set @i=1 

set @l=2 

set @maxLenth=len(@word1) 

if len(@word1)<len(@word2)  

begin 

set @maxLenth=len(@word2) 

end 

while @l<=len(@word1)  

begin 

while @i<len(@word1)-1 

begin 

insert @tb1 (child) values( SUBSTRING(@word1,@i,@l) )  

set @i=@i+1 

end 

set @i=1 

set @l=@l+1 

end 

set @i=1 

set @l=2 

while @l<=len(@word2)  

begin 

while @i<len(@word2)-1 

begin 

insert @tb2 (child) values( SUBSTRING(@word2,@i,@l) )  

set @i=@i+1 

end 

set @i=1 

set @l=@l+1 

end   

select @re=isnull(max( len(a.child)*100/  @maxLenth ) ,0) from @tb1 a, @tb2 b where a.child=b.child 

return @re 

end 

GO 

  

--测试 

--select dbo.get_semblance_By_2words('我是谁','我是谁啊')  

--75 

--相似度

 类似资料:
  • 本文向大家介绍C#计算2个字符串的相似度,包括了C#计算2个字符串的相似度的使用技巧和注意事项,需要的朋友参考一下 计算字符串相似度,直接来C#代码 返回结果就是相似度了,验证码识别上用的到 爱给模板网提供 以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持呐喊教程。

  • 问题内容: 假设您在数据库中按以下方式构造了一个表: 为了清楚起见,应输出: 请注意,由于向量存储在数据库中,因此我们仅需要存储非零条目。在此示例中,我们只有两个向量$ v_ {99} =(4,3,4,0)$和$ v_ {1234} =(0,5,2,3)$都在$ \ mathbb {R}中^ 4 $。 这些向量的余弦相似度应为$ \ displaystyle \ frac {23} {\ sqrt

  • 问题内容: 是否有用于计算一对句子的语义相似性评分的库? 我知道WordNet的语义数据库,以及如何生成2个单词的分数,但是我正在寻找可以对整个句子和输出执行所有预处理任务(例如端口阻止,停止单词删除等)的库两个句子之间的相关程度得分。 我发现使用.NET框架编写的工作正在进行中,该框架使用一系列预处理步骤来计算分数。有没有在python中执行此操作的项目? 我不是在寻找可以帮助我找到分数的操作序

  • 本文向大家介绍C ++中的相似字符串组,包括了C ++中的相似字符串组的使用技巧和注意事项,需要的朋友参考一下 假设我们有两个字符串X和Y,如果可以交换X的两个字母,它们是相似的,因此等于Y。另外,如果两个字符串X和Y相等,则它们相似。例如,考虑两个字符串,例如“ tars”和“ rats”相似,如果我们交换t和r,则可以找到另一个,现在“ rats”和“ arts”相似,但是“ star”不同类

  • 本文向大家介绍C ++中的K相似字符串,包括了C ++中的K相似字符串的使用技巧和注意事项,需要的朋友参考一下 假设我们有两个字符串A和B。如果我们可以将A中的两个字母的位置恰好交换K次,使得结果字符串为B,那么这两个字符串是K相似的(其中K是一个非负整数)。在两个字谜A和B之间,我们必须找到与A和B类似的最小K。 因此,如果输入类似于A =“ abc”,B =“ bac”,则输出将为2。 为了解

  • 本文向大家介绍C# 格式化字符串的实现代码,包括了C# 格式化字符串的实现代码的使用技巧和注意事项,需要的朋友参考一下 1 前言    如果你熟悉Microsoft Foundation Classes(MFC)的CString,Windows Template Library(WTL)的CString或者Standard Template Library(STL)的字符串类,那么你对String