• linkedu视频
  • 平面设计
  • 电脑入门
  • 操作系统
  • 办公应用
  • 电脑硬件
  • 动画设计
  • 3D设计
  • 网页设计
  • CAD设计
  • 影音处理
  • 数据库
  • 程序设计
  • 认证考试
  • 信息管理
  • 信息安全
菜单
linkedu.com
  • 网页制作
  • 数据库
  • 程序设计
  • 操作系统
  • CMS教程
  • 游戏攻略
  • 脚本语言
  • 平面设计
  • 软件教程
  • 网络安全
  • 电脑知识
  • 服务器
  • 视频教程
  • JavaScript
  • ASP.NET
  • PHP
  • 正则表达式
  • AJAX
  • JSP
  • ASP
  • Flex
  • XML
  • 编程技巧
  • Android
  • swift
  • C#教程
  • vb
  • vb.net
  • C语言
  • Java
  • Delphi
  • 易语言
  • vc/mfc
  • 嵌入式开发
  • 游戏开发
  • ios
  • 编程问答
  • 汇编语言
  • 微信小程序
  • 数据结构
  • OpenGL
  • 架构设计
  • qt
  • 微信公众号
您的位置:首页 > 程序设计 >C#教程 > C#计算字符串相似性的方法

C#计算字符串相似性的方法

作者:kevin0216 字体:[增加 减小] 来源:互联网 时间:2017-05-28

kevin0216 通过本文主要向大家介绍了马桶c的个人空间,c语言,欲情 c max,维生素c,crh2c等相关知识,希望对您有所帮助,也希望大家支持linkedu.com www.linkedu.com

本文实例讲述了C#计算字符串相似性的方法。分享给大家供大家参考。具体如下:

计算字符串相似性的办法很多,甚至最笨的办法可以挨个匹配,这里要讲的是使用莱文史特距离来计算字符串相似性。
莱文史特距离概念:假设函数名是LD

用于计算两个字符串之间的相似度。 譬如有两个字符串A和B。假设以A为基准,那么该算法就是计算把B通过(替换、删除、加字符)等方法变成A需要多少步。

例如:
A=”abcd”, B=”abc”, 那么 LD(A,B)=1,只需在B字符串中插入一个字符那么就完全等于A
 A=”abcd”, B=”abcd”, 那么 LD(A,B)= ,因为这两个货完全相同
 A=”abcd”, B=”abdc”, 那么 LD(A,B)= 1,因为只需把B中”dc”互换位置就等于A了。
A=”fwegwegweg@#2″, B=”ddd*&&%^&”, 那么 LD(A,B)= ????,这个叔真不知道了,要用程序算了。
莱文史特距离计算出来的值越大代表步骤越多,说明两个字符串的相似程度越低。

譬如大家要做个简易的“文章抄袭”判定功能,那么用这个莱文史特距离完全可以实现个初步方法。

算法注释:
1、假设字符串str1的长度为 n,str2 的长度为 m。
   如果 n = 0,则返回 m并退出;(这是句废话)
2、如果 m=0,则返回 n 并退出。(这依然是句废话)
3、如果上述都不是则要开始进行计算,

构建一个数组 d[0..m, 0..n]。
将第0行初始化为 0..n,第0列初始化为0..m。
依次检查 str1 的每个字母(i=1..n)。
依次检查 str2 的每个字母(j=1..m)。
如果 str1[i]=str2[j],则 sign=0;(sign仅仅是个标记,没有任何意思,为了记录相等还是不相等)
如果 str1[i]!=str12[j],则 sign=1。
将 d[i,j] 设置为以下三个值中的最小值:
紧邻当前格上方的格的值加一,即 d[i-1,j]+1
紧邻当前格左方的格的值加一,即 d[i,j-1]+1
当前格左上方的格的值加sign,即 d[i-1,j-1]+sign
重复上述几步直到循环结束。d[n,m]既为最终的值

接下来是用c#写的一款莱文史特距离的实现。

public class LDMaker//搞成一个类看起来专业,
 //实际上就是脱裤子放屁,这里使用来文史特距离算法
 //用于计算字符串之间的相似性
  {
    char[] str1;
    char[] str2;
    public LDMaker(string s1, string s2)
    {
  //替换掉 所有 数字 为固定数字 数字干扰 太严重
  //这里因人而异,在中文文章的匹配中,数字是干扰很严重
  //的,所以我在某些应用中把数字替换掉了。
  //原因是有的文章之间实际上相似性很高,但是故意在里面加一些数字
  //干扰该函数的执行,让机器看出来两篇文章很不同。一般不需要做如下
  // 步骤
  s1=System.Text.RegularExpressions.Regex.Replace(s1,@"(\d+)","1");
  s2 = System.Text.RegularExpressions.Regex.Replace(s2, @"(\d+)", "1");
  str1 = s1.ToCharArray();
  str2 = s2.ToCharArray();
}
public int GetLD()//这是莱文史特距离的算法实现
{
  try
  {
    int m=str1.Length;
    int n=str2.Length;
    int[,] d = new int[m+1, n+1];
    for (int i = 0; i <= m ; i++)
      d[i, 0] = i;
    for (int i = 0; i <= n ; i++)
      d[0, i] = i;
    for (int i = 1; i <= m; i++)
    {
      for (int j = 1; j <= n; j++)
      {
      d[i,j] = d[i - 1,j - 1] + (str1[i - 1] == str2[j - 1] ? 0 : 1);
      //修改一个字符
       d[i,j] = Math.Min(d[i,j], d[i - 1,j] + 1);
      // 插入一个字符串 
      d[i,j] = Math.Min(d[i,j], d[i,j - 1] + 1); 
      //删除一个字符 
      } 
    } 
    return d[m, n];
    } catch(//出错返回一个很大值
    { 
      return 10000;
    }
   } 
}

</div>

希望本文所述对大家的C#程序设计有所帮助。

</div>
分享到:QQ空间新浪微博腾讯微博微信百度贴吧QQ好友复制网址打印

您可能想查找下面的文章:

  • C#利用ReportViewer生成报表
  • C#基于正则去掉注释的方法示例
  • C#中new的用法及与override的区别分析
  • C#实现两个richtextbox控件滚动条同步滚动的简单方法
  • C# for循环的经典案例集锦
  • C#操作word的方法示例
  • C#使用WebClient登录网站并抓取登录后的网页信息实现方法
  • C# WinForm制作异形窗体与控件的方法
  • C#实现Excel表数据导入Sql Server数据库中的方法
  • C#使用NPOI上传excel

相关文章

  • 2017-05-28C# 装箱和拆箱的知识回顾
  • 2017-05-28Winform中GridView分组排序功能实现方法
  • 2017-05-28C#正则表达式Regex类的常用匹配
  • 2017-05-28c#反射表达式树模糊搜索示例
  • 2017-05-28C#自动生成漂亮的水晶效果头像的实现代码
  • 2017-05-28C# Oracle数据库操作类实例详解
  • 2017-05-28共享锁using范围的实现方法
  • 2017-05-28C#之WinForm WebBrowser实用技巧汇总
  • 2017-05-28c#实现sqlserver事务处理示例
  • 2017-05-28c# 中文转拼音without CJK

文章分类

  • JavaScript
  • ASP.NET
  • PHP
  • 正则表达式
  • AJAX
  • JSP
  • ASP
  • Flex
  • XML
  • 编程技巧
  • Android
  • swift
  • C#教程
  • vb
  • vb.net
  • C语言
  • Java
  • Delphi
  • 易语言
  • vc/mfc
  • 嵌入式开发
  • 游戏开发
  • ios
  • 编程问答
  • 汇编语言
  • 微信小程序
  • 数据结构
  • OpenGL
  • 架构设计
  • qt
  • 微信公众号

最近更新的内容

    • C#串口通信实现方法
    • C#中var关键字用法分析
    • C#计算文件MD5校验的方法
    • C#环形队列的实现方法详解
    • 浅谈C#各种数组直接的数据复制/转换
    • C# Winform 实现屏蔽键盘的win和alt+F4的实现代码
    • spreadsheetgear插件屏蔽鼠标右键的方法
    • C#窗体传值实例汇总
    • C#调用SQL语句时乘号的用法
    • 详解C# 托管资源和非托管资源

关于我们 - 联系我们 - 免责声明 - 网站地图

©2020-2025 All Rights Reserved. linkedu.com 版权所有