佚名通过本文主要向大家介绍了ccrun,ccrun老妖,网页信息采集器,网页信息采集,网页信息采集工具等相关知识,希望对您有所帮助,也希望大家支持linkedu.com www.linkedu.com
问题: 网页信息采集CCRUN
描述:
是识别特定的字符串还是要“广谱的”? 解决方案5:
描述:
妖哥
看过你以前一个帖子,回答的是采集网站上的表格内容。
不知你是否有关于网站投票这样的实例(或类似的),如果不涉及商业秘密,是否可以在你的网站发布一下,供大家学习。
对于
<input type="submit" name="提交" value="登录">
这很容易找到,并且触发
但对于
<a href="javascript:void(0);" >引用楼主 ydlchina 的回复:
妖哥
看过你以前一个帖子,回答的是采集网站上的表格内容。
不知你是否有关于网站投票这样的实例(或类似的),如果不涉及商业秘密,是否可以在你的网站发布一下,供大家学习。
对于
<input type="submit" name="提交" value="登录">
这很容易找到,并且触发
但对于
<a href="javascript:void(0);" /a>
(在做测试时搜到个网站http://news.cctv.com/special/daode/12/index.shtml)
是如何找到并且触发。
是识别特定的字符串还是要“广谱的”? 解决方案5:
先挂个号.最近比较忙,可能稍晚再回答你.
解决方案6: CB的人跑到VC版来讨论,这是怎么回事?
还有,CSDN的论坛页面是FRAMESET,采集时跟普通页面有些区别。
模式匹配也要有个模式,没有非常通用的模式这回事,根据web开发人员的偏好、开发工具、用户的选项和权限,每个网页的结构都可以不同。
做这种东西最费时间的是分析网页结构,分析完了自动化就是写几句脚本的事情。