也谈采集入库的技术
落伍的贴也看了很多了,发现了很多讲小偷技术的,如精华贴里的--小偷程序原理和简单示例: [url]http://www.im286.com/viewthread.php?tid=407182&extra=page%3D1[/url] 等等,也有提供采集程序下载的,但我还没看到一篇完整的入库的文章,或许是我看的贴少吧。虽然不是很深奥,我还是讲讲吧,希望高手别见笑啦,以前发了个原创的影视系 统,却没落伍,这次再求落伍啦,希望大家帮顶下,也希望我能落伍!! 入库也和小偷一样,要先得到需入库的部分,我这里以[url]http://www.skycn.com/article/77.html[/url] 为例了 <% dim url,mydate url="http://www.skycn.com/article/77.html" '定义url地址 Set OXML = server.CreateObject("Microsoft.XMLHTTP") '下面定义两个函数,得到数据 Private Function BytesToBstr(body) '利用流进行中文编码 Set ADOS = Server.CreateObject("ADODB.Stream") Dim Bdat Bdat=Body ADOS.Type = 1 ADOS.Mode =3 ADOS.Open ADOS.Write Bdat ADOS.Position = 0 ADOS.Type = 2 ADOS.Charset = "GB2312" BytesToBstr = ADOS.ReadText ADOS.Close End Function Public Function GetData(byref url) '利用OXML得到数据 'on error resume next SourceCode = OXML.open ("GET",url,false) OXML.send() if OXML.readystate<>4 then exit function GetData = BytesToBstr(OXML.responseBody)' if err.number<>0 then err.Clear End Function mydate=getdata(url) mydate=Replace(mydate,chr(34),"") '去掉一些特殊字符,如双引号等,看自己情况定 mydate=Replace(mydate,chr(16),"") response.write mydate %> 我们就得到了以下的数据: '''''''''''''''''''''''''code start'''''''''''' 省列去部分.............. href='../article/1034.html'>宽带用户需注意的七大安全