中文源码网
欢迎您!
会员登录
会员注册
发布自媒体
发布模版
发布源码
发布模版
发布酷站
推荐源码
常用源码
帮助中心
栏目导航
热门搜索:
网站首页
免费源码
精品源码
html模版
精品模版
酷站大全
技术文档
方案大全
网络教程
站长自媒体
新闻动态
帮助中心
免费源码下载
asp源码
php源码
python源码
.net源码
jsp源码
JS特效
安卓源码
IOS源码
微信小程序下载
毕业设计源码下载
模版下载
商城模版
手机wap模版
网络教程
html5教程
asp教程
php教程
jsp教程
Python语言技术文档
python入门
Python编程技巧
Python网站web
Python网络爬虫
Python自动化运维
数据挖掘/机器学习
Python人工智能
Python多媒体
Python科学计算
Python游戏开发
Python图形界面
Python数据库相关
Python与其他语言
Python库/模块大全
Python报错处理大全
微信小程序技术文档
微信小程序开发入门
微信小程序开发技巧
微信游戏开发
微信公众号开发
微信常用源码
php语言技术文档
php入门教程
php技巧
php函数/类库
php框架
php+AJAX技巧
开源系统及二次开发
PHP内核
jsp语言技术文档
jsp入门教程
jsp技巧
jsp框架
asp语言技术文档
asp入门教程
asp技巧
asp函数/类库
C#/.NET语言技术文档
C#/.NET入门教程
C#/.NET技巧
MVC/.NET框架
C#/.NET微信开发
程序报错解决方法
html5/css技术文档
html5
CSS
javascript
javascript技巧
jquery
json
ajax
js框架/js库
点击排行
总结PHP中初始化空数组的最佳方法
在PHP中输出JS语句以及乱码问题的解决方案
原生PHP实现导出csv格式Excel文件的方法示例【附源码下载】
用PHP的反射实现委托模式的讲解
详解提高使用Java反射的效率方法
详解关于php的xdebug配置(编辑器vscode)
详解php中生成标准uuid(guid)的方法
详解php中curl返回false的解决办法
详解php用static方法的原因
详解php伪造Referer请求反盗链资源
详解PHP素材图片上传、下载功能
详解PHP实现支付宝小程序用户授权的工具类
详解PHP神奇又有用的Trait
详解PHP队列的实现
详解PHP的抽象类和抽象方法以及接口总结
您现在的位置:
首页
>
技术文档
>
asp技巧
我要投稿
也谈采集入库的技术
来源:
中文源码网
浏览:176 次 日期:2024-04-27 12:26:46
【下载文档:
也谈采集入库的技术.txt
】
也谈采集入库的技术
落伍的贴也看了很多了,发现了很多讲小偷技术的,如精华贴里的--小偷程序原理和简单示例: [url]http://www.im286.com/viewthread.php?tid=407182&extra=page%3D1[/url] 等等,也有提供采集程序下载的,但我还没看到一篇完整的入库的文章,或许是我看的贴少吧。虽然不是很深奥,我还是讲讲吧,希望高手别见笑啦,以前发了个原创的影视系 统,却没落伍,这次再求落伍啦,希望大家帮顶下,也希望我能落伍!! 入库也和小偷一样,要先得到需入库的部分,我这里以[url]http://www.skycn.com/article/77.html[/url] 为例了 <% dim url,mydate url="http://www.skycn.com/article/77.html" '定义url地址 Set OXML = server.CreateObject("Microsoft.XMLHTTP") '下面定义两个函数,得到数据 Private Function BytesToBstr(body) '利用流进行中文编码 Set ADOS = Server.CreateObject("ADODB.Stream") Dim Bdat Bdat=Body ADOS.Type = 1 ADOS.Mode =3 ADOS.Open ADOS.Write Bdat ADOS.Position = 0 ADOS.Type = 2 ADOS.Charset = "GB2312" BytesToBstr = ADOS.ReadText ADOS.Close End Function Public Function GetData(byref url) '利用OXML得到数据 'on error resume next SourceCode = OXML.open ("GET",url,false) OXML.send() if OXML.readystate<>4 then exit function GetData = BytesToBstr(OXML.responseBody)' if err.number<>0 then err.Clear End Function mydate=getdata(url) mydate=Replace(mydate,chr(34),"") '去掉一些特殊字符,如双引号等,看自己情况定 mydate=Replace(mydate,chr(16),"") response.write mydate %> 我们就得到了以下的数据: '''''''''''''''''''''''''code start'''''''''''' 省列去部分.............. href='../article/1034.html'>宽带用户需注意的七大安全
03月10日值得注意病毒列表
访问次数:
24345
作者:
瑞星
来源:
瑞星
加入时间:
2006-03-10
据瑞星全球反病毒监测 网介绍,今日有一个病毒特别值得注意,它是:“hotmail蠕虫(Worm.Hotmatom)”病毒。该病毒是全球 第一个专门针对Hotmail编写的蠕虫病毒,当用户登陆到MSN Hotmail发送邮件的时候,会被偷偷插入带毒 链接,收信人点击后就可能中毒。
本日热门病毒:
“hotmail蠕虫(Worm.Hotmatom)”病毒:警惕程度★★★☆,蠕虫 病毒,通过MSN Hotmail传播,依赖系统:WIN9X/NT/2000/XP。
病毒 感染计算机后,会把自己复制到“windows”目录下,病毒文件名为“dho.exe”。病毒会修改注册表,每 次打开计算机后都自动运行,然后在后台监视用户的IE浏览器。当用户登陆到MSN Hotmail发送邮件时, 病毒会在发送的邮件后插入病毒文字和链接:“Hi, Happy San Valentin Day Download you Postcards from http://***.miarroba.com(情人节到了,去**网站下载贺卡吧)”,用户点击该链接后就会中毒。
反病毒专家建议电脑用户采取以下措施预防该病毒:建立良好的安全 习惯,不打开可疑邮件和可疑网站;关闭或删除系统中不需要的服务;很多病毒利用漏洞传播,一定要及 时给系统打补丁;安装专业的防毒软件进行实时监控,平时上网的时候一定要打开防病毒软件的实时监控 功能。
相关文章:
QQ又带新病毒:恐怖的智能流氓软件
03月08日 值得注意病毒列表
失恋日记实为电脑病毒 疑为学生失恋 后制造
黑客盯上“血馒头”!6成论坛含病毒链接
病毒总结:狗年春节间木马和QQ病毒多发
四类病毒可能在春节发作 专家提醒应及时防范
专家表示:BT下载不会耗费硬盘 更不会带来病毒
千万QQ表情暗藏病毒:背后另有惊人秘密
微软live遭钓鱼网站仿冒 病毒伪装MSN测试版传播
上网不用防火墙!一招克死所有病毒
相关软件:
金山毒霸引擎病毒库升级包(2006.03.09)
0 then select case n case 0 '左右都截取(都取前面)(去处关键字) finddate=Right(str,Len(str)-Instr(lcase(str),lcase(start))-Len(start)+1) finddate=Left(finddate,Instr(lcase(finddate),lcase(last))-1) case 1 '左右都截取(都取前面)(保留关键字) finddate=Right(str,Len(str)-Instr(lcase(str),lcase(start))+1) finddate=Left(finddate,Instr(lcase(finddate),lcase(last))+Len(last)-1) end select Else finddate="" End if end function 这个就是截取里面内容的函数了 下面我们来得到文章标题:03月10日值得注意病毒列表 dim title,artor,content,wherefrom title=finddate(mydate,"width=540 borderColorDark=#ffffff borderColorLight=#cccccc",,1) 这样,我们就把标题定位到了个小范围内了:width=540 borderColorDark=#ffffff borderColorLight=#cccccc cellPadding=0 cellSpacing=0>
03月10日值得注意病毒列表
在精确定位下就行了, title=finddate(title,"
","
",0) 现在,title的值就是:03月10日值得注意病毒列表 artor=finddate(mydate,"作者:","
",0) '得到作者 wherefrom=finddate(mydate,"来源:
","
",0)'得到来源 content=finddate(mydate,"
","
4 then exit function GetData = BytesToBstr(OXML.responseBody)' if err.number<>0 then err.Clear End Function mydate=getdata(url) mydate=Replace(mydate,chr(34),"") '去掉一些特殊字符,如双引号等,看自己情况定 mydate=Replace(mydate,chr(16),"") Public Function finddate(byref str,byref start,byref last,byref n) If Instr(lcase(str),lcase(start))>0 then select case n case 0 '左右都截取(都取前面)(去处关键字) finddate=Right(str,Len(str)-Instr(lcase(str),lcase(start))-Len(start)+1) finddate=Left(finddate,Instr(lcase(finddate),lcase(last))-1) case 1 '左右都截取(都取前面)(保留关键字) finddate=Right(str,Len(str)-Instr(lcase(str),lcase(start))+1) finddate=Left(finddate,Instr(lcase(finddate),lcase(last))+Len(last)-1) end select Else finddate="" End if end function dim title,artor,content,wherefrom title=finddate(mydate,"width=540 borderColorDark=#ffffff borderColorLight=#cccccc","",1) title=finddate(title,"
","
",0) artor=finddate(mydate,"作者:","
",0) wherefrom=finddate(mydate,"来源:
","
",0) content=finddate(mydate,"
","
我这里只是以采集文章为例,其它的采集软件等都是这个道理。 说了怎么多,我也不知道各位能不能看懂,如看不动那可能是我不会表达了,大家见谅。毕竟我没读过文 科,^_^ 我只是讲原理,程序是靠自己写的,要采集的速度快,你还可以写成exe的啊,这样比较快,占内存少
上一篇:
也谈跨站脚本攻击与防御
下一篇:
验证码识别技术
相关内容
•
15种asp技巧
•
6行代码实现无组件上传(author_stimson)
•
[教程+分享]具有良好体验度的Web注册系统
•
做了CDN加速的asp网站获取用户真实IP程序
•
最简洁的asp多重查询的解决方案
•
邹建的分页存储过程改了一下
•
字符批量替换程序asp服务器版
•
转换中文为unicode_转换unicode到正常文本
•
重置TSYS系统中的所有"生成的文件"成"未生成文件"
•
值得收藏的一些HTML、JavaScript、asp代码
•
支持权重的无组件asp广告显示代码
•
支持加号空格的查询
•
整理了一个editplus的剪辑文件(asp方面的内容)
•
整理了下手动注入脚本命令[带注释]
•
站长感慨asp编程究竟何去何从__font_color=red_原创__font_
•
怎样判断一个盘上是否有文件
•
怎样读取一个文本文件的内容_
•
在不刷新页面的情况下调用远程asp脚本
•
在Z-BLOG可用的新版asp的GIF验证码[V70404]
•
在Vista_IIS_7_中用_vs2005_调试_Web_项目的注意事项
•
在JScript中使用缓存技术的实际代码
•
在asp应用程序中限制重复提交同一表单
•
在asp里面创建GUID
•
在asp处理程序时显示进度
•
在asp程序中取得表单所有内容的代码
•
在asp编程中使用数组
•
在asp编程中nothing代表什么意思_
•
远程图片自动按文件夹上传到服务器-默飞出品
•
原来asp和PHP都是可以删除自身的
•
雨哲浅谈关于防采集而不影响收录内容篇
•
雨哲防采集策略之列表篇
•
有效防止asp木马上传运行—小知识[网络安全技术]
•
由给定的字符串生成关键字
•
用正则和xmlHttp实现的asp小偷程序
•
用实现asp批量删除目录及文件的代码
•
用存储过程、GetRows()、抽取10万条数据的速度测试
•
用XMLHTTP来偷东西哈!
•
用XMLHTTP很好的一个例子
•
用xmlhttp编写web采集程序
•
用XML+FSO+JS实现服务器端文件的选择效果
•
用XML+FSO+JS实现服务器端文件的
•
用sql设置access的默认值
•
用SQL批量插入数据的存储过程
•
用QuickWAP组件结合asp建设Wap站点第1_2页
•
用js实现QQ在线查询功能
•
用javascript解决外部数据抓取中的乱码问题
•
用javascript编写asp应用--第一课--通览
•
用JAVASCRIPT帮我写个计数器
•
用GetString提高asp的速度
•
用FSO获得图片文件的信息(大小,宽,高)
•
用cookies实现闪电登录论坛方法
•
用asp做一个TOP_COOL的站内搜索
•
用asp做的DNS_LOOKUP程序
•
用asp应用程序实现自己的UrlDeCode
•
用asp隐藏文件路径,实现防盗链_的代码
•
用asp写组件
•
用asp实现在线压缩与解压缩功能代码
•
用asp实现远程批量文件改名
•
用asp实现远程将文件批量改名的代码
•
用asp实现写IIS日志的代码
•
用asp实现无组件生成验证码的方法2种
•
用asp实现文件浏览、上传、下载的程序
•
用asp实现网页邮箱访问的方法
•
用asp实现网页调用doc附Response.ContentType_详细列表
•
用asp实现批量删除bak文件
•
用asp实现距指定日期的倒记时程序源码
•
用asp实现检测文件编码
•
用asp实现分级权限控制
•
用asp实现多线程
•
用asp实现对MP3曲目信息的操作
•
用asp实现读取文件的最后一行的代码
•
用asp实现的截取指定格式字符串的代码
•
用asp实现的获取文件夹中文件的个数的代码
•
用asp实现的代码批量修改程序,fso相关
•
用asp实现的iframe批量替换工具
•
用asp实现把文件打包成Xml文件包,带解包的asp工具附下载
•
用asp实现MSSQL用户密码破解
•
用asp生成UTF-8网页文件的两种方法
•
用asp设计购物推车
•
用asp如何实现防止网页频繁刷新?
•
用asp脚本实现限制IP访问
•
用asp获取微软安全更新列表的代码_小偷程序
•
用asp和SQL实现基于Web的事件日历
•
用asp读取XML文件的具体方法与示例
•
用asp打开远端MDB文件的方法
•
用asp创建日志文件(附源程序)
•
用asp创建MDaemon用户的代码
•
用asp+XML打造留言本
•
用asp+xmlhttp编写web采集程序
•
用asp+DLL实现WEB方式修改服务器时间
•
用asp_VBS_xmlhttp_adodbstream下载和保存图片的代码
•
隐藏修改文件时间和文件属性的asp脚本
•
隐藏asp木马后门的两种方法
•
隐蔽的asp后门_大家可以查看下
•
以前写的一个分页存储过程,刚才不小心翻出来的
•
一些值得一看的代码asp
•
一些关于asp_购物车的想法
•
一些asp技巧和实用解决方法
•
一想千开PJblog审核功能补丁_v2.0版_发布第1_3页
•
一搜图片搜索小偷
•
一款不错的asp木马_黑色界面
•
一句话木马连接客户端
•
一句话_asp木马加密版_彻底突破杀毒软件
•
一个实用的FSO-实时统计在线人数
•
一个强健_实用的asp+ajax二级联动菜单(有演示和附源程序打包下载)
•
一个较新的asp后门服务端实现代码
•
一个简单的HTML病毒分析
•
一个防止被采集的方法
•
一个查asp木马的小东东
•
一个不太让人讨厌的自动弹出窗口
•
一个sql查询器,自动画表格填字段
•
一个asp中的数组
•
一个asp小马
•
一份asp内存的释放的实验报告
•
一段几乎可以让你死机的JS代码
•
一段采集程序代码
•
一段asp防注入的通用脚本
•
一段asp的HTTP_REFERER判断代码
•
一段asp单页显示文件夹下所有图片的代码
•
一段asp_伪静态代码
QQ客服
公众号
手机版
帮助中心