1. js加密后能在网页中运行吗怎么运行
可以 运行的。加密之后你不需要做其它事情,同样可以识别的。
http://zh-cn.bin2hex.com/javascript_compressor_obfuscator_encryption.html
这个工具可以加密。上面还有解密工具
2. nodejs怎么才能用爬虫爬取https网页
爬虫爬https站点处理,方法步骤如下:
1、网络蜘蛛爬虫Spider爬取HTTPS网站
1)、根据网页中的超链接是否是HTTPS,网络中会有一些超链,如果是HTTPS会认为是HTTPS站点。
2)、根据站长平台提交入口的提交方式,例如主动提交,如果在文件当中提交的是HTTPS链接会以HTTPS的形式来发现。
3)、参考前链的抓取相对路径,第一个网页是HTTPS的,网站内容里面的路径提供的是相对路径,会认为这种链接是HTTPS。
4)、参考链接的历史状况,使用这种方式的原因主要是为了纠错,如果错误提取HTTPS会遇到两种情况,一种因为HTTPS不可访问会抓取失败,第二即使能抓成功可能展现出来的可能不是站长希望的,所以会有一定的纠错。
2、HTTPS链接的抓取
现在比较常见的两种,第一种是纯HTTPS抓取,就是它没有HTTP的版本,第二个是通过HTTP重定向到HTTPS,这两种都能正常的进行抓取跟HTTP抓取的效果是一样的。
3、HTTPS的展现
对于HTTPS数据,展现端会有明显的提示
3. 如果网页内容是由javascript生成的,应该怎么实现爬虫
用神箭手云爬虫,完全在云上编写和执行爬虫,不需要配置任何开发环境,快速开发快速实现。
简单几行 javascript 就可以实现复杂的爬虫,同时提供很多功能函数:反反爬虫、 js 渲染、数据发布、图表分析、反防盗链等,这些在开发爬虫过程中经常会遇到的问题都由神箭手帮你解决。
4. 如何利用javascript给页面加密,就是进入时需要输入密码……
没错啊,我把你的代码粘下来,把注释(<!--
and
-->JS
里好像没有这样的注释吧)去掉在IE6下就可以了。
5. js爬虫如何实现网页数据抓取
爬虫就是自动提取网页的程序,如网络的蜘蛛等,要想让自己的网站更多页面被收录,首先就要让网页被爬虫抓取。
如果你的网站页面经常更新,爬虫就会更加频繁的访问页面,优质的内容更是爬虫喜欢抓取的目标,尤其是原创内容。
如果你做了许多努力仍没有被爬虫抓取,可以看一下老渔哥给出的两点建议:
1、不建议站点使用js生成主体内容,如过js渲染出错,很可能导致页面内容读取错误,页面则无法被爬虫抓取。
2、许多站点会针对爬虫做优化,建议页面长度在128k之内,不要过长。
6. 有什么好的办法解决爬虫中很容易遇到的用 javascript 编写的网页...
这个爬虫跟JS关系不大,直接看Network,看发出的网络请求,分析每个URL,找出规律,然后用程序来模拟这样的请求,首先要善于用Chrome的Network功能
7. ★★★如何加密网页★★★
1.在html的body区最后加入:
<SCRIPT language=JavaScript> document.oncontextmenu=new Function("event.returnValue=false;"); document.onselectstart=new Function("event.returnValue=false;"); </SCRIPT>
注意不要复制入空格
2.不许复制网页,将下面代码加到网页代码的最后(</html>后面):
<!-- 禁止复制的代码开始 -->
<noscript>
<iframe scr="*.htm"></iframe>
</noscript>
<script language="JavaScript">
document.oncontextmenu=new Function("event.returnValue=false;");
document.onselectstart=new Function("event.returnValue=false;");
</script>
<!-- 禁止复制的代码结束 -->
禁止浏览器对网页进行缓存
<meta http-equiv=Pragma content=no-cache>
<meta http-equiv=expires content=0>
<meta http-equiv="cache-control" content="no-store">
禁止抓图
<script language="javascript">
<!--
function testclip(){
try {
if(clipboardData.getData("Text")||clipboardData.getData("HTML")||clipboardData.getData("URL"))
{
null;
}
}
catch(e){
clipboardData.setData("Text","")
}
setTimeout("testclip()",500)
}
testclip();
//-->
</script>
</head>
禁止另存为
<noscript><iframe src=*.html></iframe></noscript>
屏蔽左右键
<body oncontextmenu="return false" onselectstart="return false">