• linkedu视频
  • 平面设计
  • 电脑入门
  • 操作系统
  • 办公应用
  • 电脑硬件
  • 动画设计
  • 3D设计
  • 网页设计
  • CAD设计
  • 影音处理
  • 数据库
  • 程序设计
  • 认证考试
  • 信息管理
  • 信息安全
菜单
linkedu.com
  • 网页制作
  • 数据库
  • 程序设计
  • 操作系统
  • CMS教程
  • 游戏攻略
  • 脚本语言
  • 平面设计
  • 软件教程
  • 网络安全
  • 电脑知识
  • 服务器
  • 视频教程
  • JavaScript
  • ASP.NET
  • PHP
  • 正则表达式
  • AJAX
  • JSP
  • ASP
  • Flex
  • XML
  • 编程技巧
  • Android
  • swift
  • C#教程
  • vb
  • vb.net
  • C语言
  • Java
  • Delphi
  • 易语言
  • vc/mfc
  • 嵌入式开发
  • 游戏开发
  • ios
  • 编程问答
  • 汇编语言
  • 微信小程序
  • 数据结构
  • OpenGL
  • 架构设计
  • qt
  • 微信公众号
您的位置:首页 > 程序设计 >编程问答 > 商品匹配算法

商品匹配算法

作者:佚名 字体:[增加 减小] 来源:互联网 时间:2017-06-07

佚名通过本文主要向大家介绍了商品评分算法,商品毛利算法,商品推荐算法,商品期货手续费算法,淘宝商品推荐算法等相关知识,希望对您有所帮助,也希望大家支持linkedu.com www.linkedu.com
问题:商品匹配算法
描述:

对于一种商品:http://product.dangdang.com/23477630.html
用什么算法能知道他和另一家网站的http://www.amazon.cn/gp/product/B00KFM43CO/ref=s9_wish_gw_d66_g14_i1_gs9w?ie=UTF8&colid=39NFRLNN4TZIE&coliid=I8RBEPEFXAQE3&pf_rd_m=A1AJ19PSB66TGU&pf_rd_s=center-2&pf_rd_r=123EVCKD7936886JAY79&pf_rd_t=101&pf_rd_p=212028152&pf_rd_i=899254051
是同一种商品呢?


解决方案1:

正好接触过这方面的东西. 这个问题属于Record linkage范畴. 可以参考一下Stanford Entity Resolution Framework. 这里有个文档比较好, 可以看看.

解决方案2:

虽然没做过 但是以我很水的想法 大概是这样的
首先,我们保证几个前提:
(1)没人会在乎那种特别商品的比价,比如你不会在意在5173上买张点卡是比淘宝上便宜还是贵,换句话说越是热门商品,比如服装、电器越惹人关注
(2)电商网站,热门的就那么几个,这使得我们可以针对每个网站做特殊的抓取和处理
(3)考虑到seo,一个商品在一段时间内会被静态化为一个页面,这样只要拿到url就不需要分析他是什么商品(云的功劳~服务器存所有数据)
(4)你的工程师能力足够写出爬虫抓取所有的数据并分析出关键字段,这个就不讲了

说这么多废话,你认为真的可以通过比较页面来筛选同样的商品么,当然不能,但是有一些特征可以用:

(1)标题,最重要的,里面有商品名称和型号,当然你得写出一些算法来去掉宣传的语句,比如惊爆价,之类
(2)对于图书其实更简单,去找ISBN就是了,境内合法出版的图书只要比这个就行了

接下来就是对标题的一些处理,通过分词、命名实体识别,拿到商品型号之类,最后和页面URL关联起来就完了,当然,如果你认为标题的内容足够纯净,直接比编辑距离也未尝不可。

以上纯脑补,各位大哥大姐手下留情。


分享到:QQ空间新浪微博腾讯微博微信百度贴吧QQ好友复制网址打印

您可能想查找下面的文章:

  • 商品匹配算法

相关文章

  • 2017-06-07 jboss启动报错了,调了好久,高手帮帮我啊
  • 2017-06-07 web应用如何防多次提交?
  • 2017-06-07 mac下bash_profile文件修改后出错
  • 2017-06-07 怎么用python处理log文档里的隐藏乱码?
  • 2017-06-07 jboss710添加virtualserver
  • 2017-06-07 mac上装php扩展mongo成功,但是连接不成功
  • 2017-06-07 求给定数组中和为最大的连续子数组
  • 2017-06-07 java开发工具
  • 2017-06-07 (golang)go没有trycatch,那怎么统一处理底层的异常呢?
  • 2017-06-07 紧急:上传的androidapk被识别成了zip

文章分类

  • JavaScript
  • ASP.NET
  • PHP
  • 正则表达式
  • AJAX
  • JSP
  • ASP
  • Flex
  • XML
  • 编程技巧
  • Android
  • swift
  • C#教程
  • vb
  • vb.net
  • C语言
  • Java
  • Delphi
  • 易语言
  • vc/mfc
  • 嵌入式开发
  • 游戏开发
  • ios
  • 编程问答
  • 汇编语言
  • 微信小程序
  • 数据结构
  • OpenGL
  • 架构设计
  • qt
  • 微信公众号

最近更新的内容

    • 汇编如何将十六进制数转换成十进制数输出显示出来。
    • 刚学python的小白请教一个求素数的编程题,谢谢大家
    • (python)DjangoHttpResponse为什么不能返回字典?
    • 关于Jboss脚本启动和关闭的问题
    • PHPCURL如何支持传多维数组?
    • 请教在JBoss下如何实现反盗链呢?
    • c代码有没有列出当先空间下的文件的函数
    • spark统计字符出现次数
    • 学习JAVA的几个问题。
    • (ruby)geminstallsqlite3-v'139'权限被拒绝是怎么回事?

关于我们 - 联系我们 - 免责声明 - 网站地图

©2020-2025 All Rights Reserved. linkedu.com 版权所有