• linkedu视频
  • 平面设计
  • 电脑入门
  • 操作系统
  • 办公应用
  • 电脑硬件
  • 动画设计
  • 3D设计
  • 网页设计
  • CAD设计
  • 影音处理
  • 数据库
  • 程序设计
  • 认证考试
  • 信息管理
  • 信息安全
菜单
linkedu.com
  • 网页制作
  • 数据库
  • 程序设计
  • 操作系统
  • CMS教程
  • 游戏攻略
  • 脚本语言
  • 平面设计
  • 软件教程
  • 网络安全
  • 电脑知识
  • 服务器
  • 视频教程
  • JavaScript
  • ASP.NET
  • PHP
  • 正则表达式
  • AJAX
  • JSP
  • ASP
  • Flex
  • XML
  • 编程技巧
  • Android
  • swift
  • C#教程
  • vb
  • vb.net
  • C语言
  • Java
  • Delphi
  • 易语言
  • vc/mfc
  • 嵌入式开发
  • 游戏开发
  • ios
  • 编程问答
  • 汇编语言
  • 微信小程序
  • 数据结构
  • OpenGL
  • 架构设计
  • qt
  • 微信公众号
您的位置:首页 > 程序设计 >ASP > 实例讲解实现抓取网上房产信息的ASP程序

实例讲解实现抓取网上房产信息的ASP程序

作者: 字体:[增加 减小] 来源:互联网 时间:2017-05-11

通过本文主要向大家介绍了asp抓取网页,房产抓取软件,asp导出excel实例,asp图片上传实例,asp ajax实例等相关知识,希望对您有所帮助,也希望大家支持linkedu.com www.linkedu.com
<%@LANGUAGE="VBSCRIPT" CODEPAGE="936"%>
<!-- #include file="conn.asp" -->

<!-- #include file="inc/function.asp" -->
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" "http://www.w3.org/TR/html4/loose.dtd">
<html>
<head>
<title>Untitled Document</title>
<meta http-equiv="Content-Type" content="text/html; charset=gb2312">
<meta http-equiv="refresh" content="300;URL=steal_house.asp">
</head>

<body>
<%
on error resume next
'
Server.ScriptTimeout = 999999
'========================================================
'字符编码函数
'====================================================
Function BytesToBstr(body,code)
        dim objstream
        set objstream = Server.CreateObject("adodb.stream")
        objstream.Type = 1
        objstream.Mode =3
        objstream.Open
        objstream.Write body
        objstream.Position = 0
        objstream.Type = 2
        objstream.Charset =code
        BytesToBstr = objstream.ReadText 
        objstream.Close
        set objstream = nothing
End Function

'取行字符串在另一字符串中的出现位置
Function Newstring(wstr,strng)
        Newstring=Instr(lcase(wstr),lcase(strng))
        if Newstring<=0 then Newstring=Len(wstr)
End Function
'替换字符串函数
function ReplaceStr(ori,str1,str2)
ReplaceStr=replace(ori,str1,str2)
end function
'====================================================
function ReadXml(url,code,start,ends)
set oSend=createobject("Microsoft.XMLHTTP")
SourceCode = oSend.open ("GET",url,false)
oSend.send()
ReadXml=BytesToBstr(oSend.responseBody,code )
start=Instr(ReadXml,start)
ReadXml=mid(ReadXml,start)
ends=Instr(ReadXml,ends)
ReadXml=left(ReadXml,ends-1)
end function

function SubStr(body,start,ends)
start=Instr(body,start)
SubStr=mid(body,start+len(start)+1)
ends=Instr(SubStr,ends)
SubStr=left(SubStr,ends-1)
end function

dim getcont,NewsContent
dim url,title
url="http://www.***.com"'新闻网址knowsky.com
getcont=ReadXml(url,"gb2312","<table class=k2 border=""0""","</table>")
getcont=RegexHtml(getcont)
dim KeyId,NewsClass,City,Position,HouseType,Level,Area,Price,Demostra

dim ContactMan,Contact
for i=2 to ubound(getcont)
 response.Write(getcont(i)&"__<br>")

 tempLink=mid(getcont(i),instr(getcont(i),"href=""")+6,instr(getcont(i),""" onClick")-10)
 tempLink=replace(tempLink,"../","")

 response.Write(i&":"&tempLink&"<br>")
 NewsContent=ReadXml(tempLink,"gb2312","<td valign=""bottom"" width=""400"">","<hr width=""760"" noshade size=""1"" color=""#808080""> ")
 NewsContent=RemoveHtml(NewsContent)
 NewsContent=replace(NewsContent,VbCrLf,"")
 NewsContent=replace(NewsContent,vbNewLine,"")
 NewsContent=replace(NewsContent," ","")
 NewsContent=replace(NewsContent," ","")
 NewsContent=replace(NewsContent," ","")
 NewsContent=replace(NewsContent,"\n","")
 NewsContent=replace(NewsContent,chr(10),"")
 NewsContent=replace(NewsContent,chr(13),"")
 '===============get Content=======================
 response.Write(NewsContent)
 KeyId=SubStr(NewsContent,"列号:","信息类别:")
 NewsClass=SubStr(NewsContent,"类别:","所在城市:")
 City=SubStr(NewsContent,"城市:","房屋具体位置:")
 Position=SubStr(NewsContent,"位置:","房屋类型:")
 HouseType=SubStr(NewsContent,"类型:","楼层:")
 Level=SubStr(NewsContent,"楼层:","使用面积:")
 Area=SubStr(NewsContent,"面积:","房价:")
 Price=SubStr(NewsContent,"房价:","其他说明:")
 Demostra=SubStr(NewsContent,"说明:","联系人:")
 ContactMan=SubStr(NewsContent,"联系人:","联系方式:")
 Contact=SubStr(NewsContent,"联系方式:","信息来源:")
 response.Write("总序列号:"&KeyId&"<br>")
 response.Write("信息类别:"&NewsClass&"<br>")
 response.Write("所在城市:"&City&"<br>")
 response.Write("房屋具体位置:"&Position&"<br>")
 response.Write("房屋类型:"&HouseType&"<br>")
 response.Write("楼层:"&Level&"<br>")
 response.Write("使用面积:"&Area&"<br>")
 response.Write("房价:"&Price&"<br>")
 response.Write("其他说明:"&Demostra&"<br>")
 response.Write("联系人:"&ContactMan&"<br>")
 response.Write("联系方式:"&Contact&"<br>")
 'title=RemoveHTML(aa(i))
 'response.Write("title:"&title)
 for n=0 to application.Contents.count
   if(application.Contents(n)=KeyId) then
    ifexit=true    
   end if  
 next 
 if not ifexit then
   application(time&i)=KeyId
 '添加到数据库
 '====================================================
 set rs=server.CreateObject("adodb.recordset")
 rs.open "select top 1 * from news order by id desc",conn,3,3
 rs.addnew
 rs("NewsClass")=NewsClass
 rs("City")=City
 rs("Position")=Position
 rs("HouseType")=HouseType
 rs("Level")=Level
 rs("Area")=Area
 rs("Price")=Price
 rs("Demostra")=Demostra
 rs("ContactMan")=ContactMan
 rs("Contact")=Contact
 rs.update
 rs.close
 set rs=nothing
 end if
 '==================================================

next
function RemoveTag(body)

 Set regEx = New RegExp
 regEx.Pattern = "<[a].*?<\/[a]>"
 regEx.IgnoreCase = True
 regEx.Global = True
 Set Matches = regEx.Execute(body)
 dim i,arr(15),ifexit
 i=0
 j=0
 For Each Match in Matches
  TempStr = Match.Value 
  TempStr=replace(TempStr,"<td>","")
  TempStr=replace(TempStr,"</td>","")
  TempStr=replace(TempStr,"<tr>","")
  TempStr=replace(TempStr,"</tr>","") 
  arr(i)=TempStr 
  i=i+1
  if(i>=15) then
   exit for
  end if
 Next
 Set regEx=nothing
 Set Matches =nothing
 RemoveTag=arr

end function
function RegexHtml(body)
 dim r_arr(47),r_temp
 Set regEx2 = New RegExp
 regEx2.Pattern ="<a.*?<\/a>"
 regEx2.IgnoreCase = True
 regEx2.Global = True
 Set Matches2 = regEx2.Execute(body)
 iii=0
 For Each Match in Matches2

  r_arr(iii)=Match.Value

  iii=iii+1 
 Next
 RegexHtml=r_arr
 set regEx2=nothing
 set Matches2=nothing
end function
'======================================================

conn.close
set conn=nothing
%>
</body>
</html>

 


  function.asp

 <%
'**************************************************
'函数名:gotTopic
'作  用:截字符串,汉字

分享到:QQ空间新浪微博腾讯微博微信百度贴吧QQ好友复制网址打印

您可能想查找下面的文章:

  • asp采集抓取网上房产信息的代码
  • 实例讲解实现抓取网上房产信息的ASP程序

相关文章

  • 2017-05-11登陆asp class
  • 2017-05-11有效防止ASP木马上传运行—小知识[网络安全技术]
  • 2017-05-11asp中用insert into语句向数据库插入记录(添加信息)的方法
  • 2017-05-11ASP里面令人震撼地Debug类(VBScript)
  • 2017-05-11asp实现截取字符串函数
  • 2017-05-11ASP常用源代码的总结(上)
  • 2017-05-11asp连接SQL和Access数据代码(asp里的随机函数)
  • 2017-05-11ASP+JS三级联动下拉菜单[调用数据库数据]
  • 2017-05-11asp 一些支付接口
  • 2017-05-11使用ODBC数据库管理Serv-U的FTP用户及相关ASP编程[附源码示例下载]

文章分类

  • JavaScript
  • ASP.NET
  • PHP
  • 正则表达式
  • AJAX
  • JSP
  • ASP
  • Flex
  • XML
  • 编程技巧
  • Android
  • swift
  • C#教程
  • vb
  • vb.net
  • C语言
  • Java
  • Delphi
  • 易语言
  • vc/mfc
  • 嵌入式开发
  • 游戏开发
  • ios
  • 编程问答
  • 汇编语言
  • 微信小程序
  • 数据结构
  • OpenGL
  • 架构设计
  • qt
  • 微信公众号

最近更新的内容

    • asp去除html的函数代码分析附实例说明
    • 有效防止ASP木马上传运行—小知识[网络安全技术]
    • input 中空格截段的问题解决方法
    • 详细讲解ASP脚本循环语句
    • ASP 三层架构 Error处理类
    • 【先锋海盗类】Ver2005 最终版
    • 聊天室实现私聊第1/4页
    • FSO操作示例(给初学者)
    • asp 去除最后一个逗号为空字符串的代码
    • asp dictionary对象的用法

关于我们 - 联系我们 - 免责声明 - 网站地图

©2020-2025 All Rights Reserved. linkedu.com 版权所有