• linkedu视频
  • 平面设计
  • 电脑入门
  • 操作系统
  • 办公应用
  • 电脑硬件
  • 动画设计
  • 3D设计
  • 网页设计
  • CAD设计
  • 影音处理
  • 数据库
  • 程序设计
  • 认证考试
  • 信息管理
  • 信息安全
菜单
linkedu.com
  • 网页制作
  • 数据库
  • 程序设计
  • 操作系统
  • CMS教程
  • 游戏攻略
  • 脚本语言
  • 平面设计
  • 软件教程
  • 网络安全
  • 电脑知识
  • 服务器
  • 视频教程
  • JavaScript
  • ASP.NET
  • PHP
  • 正则表达式
  • AJAX
  • JSP
  • ASP
  • Flex
  • XML
  • 编程技巧
  • Android
  • swift
  • C#教程
  • vb
  • vb.net
  • C语言
  • Java
  • Delphi
  • 易语言
  • vc/mfc
  • 嵌入式开发
  • 游戏开发
  • ios
  • 编程问答
  • 汇编语言
  • 微信小程序
  • 数据结构
  • OpenGL
  • 架构设计
  • qt
  • 微信公众号
您的位置:首页 > 程序设计 >编程问答 > 一个关键词分组的问题

一个关键词分组的问题

作者:佚名 字体:[增加 减小] 来源:互联网 时间:2017-06-07

佚名通过本文主要向大家介绍了问题关键词,南海问题关键词,输入问题关键词 订单,南海问题论文关键词,请输入问题关键词等相关知识,希望对您有所帮助,也希望大家支持linkedu.com www.linkedu.com
问题:一个关键词分组的问题
描述:

现有一组关键词表,如下:

会计一个月工资多少钱
挖掘机一个月工资多少钱
化妆师一个月工资多少钱
美容师工资多少钱
育婴师工资多少钱
化妆师工资多少钱
咖啡师工资多少钱
理财工资分配
会计工资分配
银行工资分配
如何进行工资分配
......

同类关键词的最长后缀是一样的,想根据关键词后缀来进行分组,最终效果如下:

会计一个月工资多少钱 >> 一个月工资多少钱
挖掘机一个月工资多少钱 >> 一个月工资多少钱
化妆师一个月工资多少钱 >> 一个月工资多少钱
美容师工资多少钱 >> 工资多少钱
育婴师工资多少钱 >> 工资多少钱
化妆师工资多少钱 >> 工资多少钱
咖啡师工资多少钱 >> 工资多少钱
理财工资分配 >> 工资分配
会计工资分配 >> 工资分配
银行工资分配 >> 工资分配
如何进行工资分配 >> 工资分配
......

关键词总共有4w个,咋实现...


解决方案1:

不知道题主现在想出什么好方法来了没有。在这里我给一个我的想法。

4万个记录其实并不算多,我认为可以参考Trie树的思路,只不过不是找前缀而是后缀,所以要从关键词的最后一个位置向前搜索。

因为英语的基本构成只有26个字母,所以如果关键词是英语的话使用Trie树的变种来解决这个问题应该很容易。但是汉语的常用汉字至少有几千个,就不得不考虑一个空间效率的问题。

解决空间效率的问题还是要使用到中文分词,将对比对象由汉字转变为词。这只是一个想法,是否具有可行性不清楚

解决方案2:

  1. 分词
    使用中文分词后再提取
    https://github.com/fxsjy/jieba


分享到:QQ空间新浪微博腾讯微博微信百度贴吧QQ好友复制网址打印

您可能想查找下面的文章:

  • 一个关键词分组的问题

相关文章

  • 2017-06-07 利用python的scrapy框架中的css选择器获取不到元素内容
  • 2017-06-07 [[1,2,3],[1,2,3]]includes[1,2,3]返回false
  • 2017-06-07 库什库什http:文件上传背后发生了什么?
  • 2017-06-07 用Nginx代理Gunicorn启动的flask应用时,redirect忽略了端口?
  • 2017-06-07 二级缓存和三级缓存浏览器是否会缓存html页面
  • 2017-06-07 (python)Restful设计风格Token-basedAuthentication疑问请教
  • 2017-06-07 关于多表联合查询返回值的问题
  • 2017-06-07 (python)QWebEngineView如何爬angular的动态数据?
  • 2017-06-07 求算法,重新排列数组
  • 2017-06-07 (python)pycharm能够同时运行多个程序么?

文章分类

  • JavaScript
  • ASP.NET
  • PHP
  • 正则表达式
  • AJAX
  • JSP
  • ASP
  • Flex
  • XML
  • 编程技巧
  • Android
  • swift
  • C#教程
  • vb
  • vb.net
  • C语言
  • Java
  • Delphi
  • 易语言
  • vc/mfc
  • 嵌入式开发
  • 游戏开发
  • ios
  • 编程问答
  • 汇编语言
  • 微信小程序
  • 数据结构
  • OpenGL
  • 架构设计
  • qt
  • 微信公众号

最近更新的内容

    • 关于fops中的saveas的疑问
    • VFP9,如何写入网站的数据库
    • 还是正则表达式,有点疑惑
    • 88分求JBOSSSEAM操作数据库,保存数据
    • apache+python访问报错
    • javasocket编程JAVASocket长连接
    • 七牛支持直播的上传吗?如果支持,有相关的android,iosapi吗?
    • 如何使用brew安装某软件的特定小版本
    • 求:七牛的云存储的插件。
    • python中paramiko模块引入问题

关于我们 - 联系我们 - 免责声明 - 网站地图

©2020-2025 All Rights Reserved. linkedu.com 版权所有