佚名通过本文主要向大家介绍了如何截取网页内容,怎么截取网页内容,网页内容截取,网页视频截取,网页截取源码等相关知识,希望对您有所帮助,也希望大家支持linkedu.com www.linkedu.com
问题: 如何截取并分析网页内容
描述:
解决方案1:
描述:
各位兄弟:
小弟最近碰见这个一个问题.
如大家所知,浏览器的主要功能是解析并呈现在网络上传送的各个数据包的内容.我不太熟悉网络上数据包的传送路线,数据包中的数据在进入客户机(即本地主机)以后,是如何从二进制数字信息一步一步地转化为浏览器所呈现的各种各种的信息,如文本,图画,声音等信息.还有,这些数据包在进入本地客户端主机以后,它所走过的所有地方是哪些,它所驻留的所有文件有哪些,它在游览器中是如何被解析和呈现的(是浏览器一边解析一边呈现,还是先缓存全部数据包信息,等全部解析完再呈现呢?).
我不想在传输层或网络层拦截数据包,想在会话层或应用层拦截数据包(想在
靠浏览器最近的地方拦住它,解析并屏蔽掉一些我不想看到的内容或信息.
我应该怎么办?请各位侠士指点,十万分感谢!!
解决方案1:
服务器首先向ie发送的是整个网页框架的html代码,然后ie根据这些代码再发出新的请求,例如遇到html代码里面说明这里有图片,它就向服务器发送一个新的Get请求.图片下载会在保存在internet临时文件夹里面,然后再显示出来.看看http协议,这方面有详细的例子.
网页内容过滤一般都是bho做的,你的思路好像不是主流的做法.
你用bho做关键字搜索,有很多例子.例如http://www.codeguru.com上面也有现成的例子.