C# TrieTree介绍及实现方法

作者：字体：[增加减小] 来源：互联网时间：2017-05-28

通过本文主要向大家介绍了trietree,c#未实现该方法或操作,c#get set方法,c#invoke方法,c#方法等相关知识,希望对您有所帮助,也希望大家支持linkedu.com www.linkedu.com

在自然语言处理（NLP）研究中，NGram是最基本但也是最有用的一种比对方式，这里的N是需要比对的字符串的长度，而今天我介绍的TrieTree，正是和NGram密切相关的一种数据结构，有人称之为字典树。TrieTree简单的说是一种多叉树，每个节点保存一个字符，这么做的好处是当我们要做NGram比对时，只需要直接从树的根节点开始沿着某个树叉遍历下去，就能完成比对；如果没找到，停止本次遍历。这话讲得有些抽象，我们来看一个实际的例子。

假设我们现在词库里面有以下一些词：

上海市
上海滩
上海人
上海公司
北京
北斗星
杨柳
杨浦区

如图所示：挂在根节点上的字有上、北、杨，

如果我们现在对“上海市杨浦区”这个词做3gram就有上海市、海市杨、市杨浦、杨浦区，现在我们要知道哪些词是能够被这个字典识别的，通常我们可以用NGram来做分词。有了这颗树，我们只需要依次取每个字符，从根开始进行比对，比如上海市，我们能够匹配上->海->市，这个路径，所以匹配；比如海市杨，由于没有“海”字挂在根节点上，所以停止；市杨浦也无法匹配；最终匹配杨浦区，得到杨->浦->区这个路径，匹配。

最终我们可以把“上海市杨浦区”切分为上海市|杨浦区。

尽管TrieTree要比普通字符串数组节省很多时间，但这并不是没有代价的，因为你要先根据字典构建这棵树，这个代价并不低，当然对于某个应用来说一旦TrieTree构建完成就可以重复使用，所以针对大规模比对来说，性能提升还是很客观的。

下面是TrieTree的C#实现。

{

分享到：QQ空间新浪微博腾讯微博微信百度贴吧 QQ好友复制网址打印

您可能想查找下面的文章:

C# TrieTree介绍及实现方法

2017-05-28C#中TextBox实现输入提示功能的方法
2017-05-28C#词法分析器之正则表达式的使用
2017-05-28C#设计模式之外观模式介绍
2017-05-28C# FileStream读写的文本操作代码分析
2017-05-28C#生成Word文档代码示例
2017-05-28深入Unix时间戳与C# DateTime时间类型互换的详解
2017-05-28c#利用Grahics进行图片裁剪
2017-05-28C# DataGridView添加新行的2个方法
2017-05-28深入C#字符串和享元(Flyweight)模式的使用分析
2017-05-28C#常用GDI+文字操作汇总

C# TrieTree介绍及实现方法

您可能想查找下面的文章:

相关文章

文章分类

最近更新的内容