ASP采集中获取网页html代码
以下代码最精简的介绍了如何利用来XMLHTTP组件来获取一个网页文件中的HTML源码。
以后可以根据需要,分析出你想要得到的内容,最后将得到的内容保存到自己的数据库中等等。
function.asp
<% Function getHTTPPage(url) On Error Resume Next dim http set http=Server.createobject("Microsoft.XMLHTTP") Http.open "GET",url,false Http.send() if Http.readystate<>4 then exit function end if getHTTPPage=bytesToBSTR(Http.responseBody,"GB2312") set http=nothing If Err.number<>0 then Response.Write "<p align='center'><font color='red'> <b>服务器获取文件内容出错</b></font></p>" Err.Clear End If End Function Function BytesToBstr(body,Cset) dim objstream set objstream = Server.CreateObject("adodb.stream") objstream.Type = 1 objstream.Mode =3 objstream.Open objstream.Write body objstream.Position = 0 objstream.Type = 2 objstream.Charset = Cset BytesToBstr = objstream.ReadText objstream.Close set objstream = nothing End Function %> |
index.asp
<!--#include file="function.asp"--> <% url="http://www.google.cn" response.write getHTTPPage(url) %> |
来自中国站长网 http://www.chinaz.com/Program/Asp/09123OH2008.html

