pv 同一访问者访问网站的次数,去掉重复的,同一访问者访问了这个网站的几个页面
1.为什么使用WebBrowser刷网页流量?
只有WebBrowser最能够模仿一次自然的客户访问,也只有WebBrowser最能被我们编程操控。
2.流量是什么?
流量主要指标就是日ip和日pv,另外还有些指标,来路,独立访问者,平均pv,停留时间,浏览深度,回头客,初访者,广告展示率,广告点击率,广告有效点击率(成功转化率)等
3.刷网页流量有什么用?
刷流量本身是没有直接用处的,但是如果像我一样在站点上挂有xx广告联盟的广告,多刷些流量可以多得到一些美刀
4.如何刷网页流量?
4.1.要增加ip,就要用代理,目前我写的这个程序理论上随时可以换ip,但是实际上因为网络原因,大概10秒左右才能启用一个新ip。代理的内核是Tor,我通过分析它的工作流程,可以像Tor官方提供的外壳Vidalia一样随意操作它了。
还有一点很重要,如何使用Tor的代理。因为webbrowser是与IE公用系统设置的,刚开始我设置了IE的代理,影响正常网页打开的速度;后来使用internetsetoption,使得webbrowser可以像遨游浏览器一样,随意随时更换代理而不影响ie了。
4.2.要增加pv,就要使用多Load几个WebBrowser,并且每隔一定时间重新Navigate
4.3 伪造来路,使用winsock和xmlhttp等非常容易,但是webbrowser就不那么简单了,我尝试伪造Header头,就是在Navigate中添加一个Header参数(注意,要使这个参数有效,Navigate的第二个参数必须设定,可以设置为2),效果不错,至少我成功欺骗了我所见到的所有在服务端识别的WEB应用,让他们以为我测操作系统是MAC,使用IE1.0的版本,系统语言是zh-en,来路是Google。
还有一种方法,就是先Navigate到一个其他页面,比如Google.com,然后使用DOM在该页面上加上你的链接,再模拟点击,这样你的来路就是Google.com,谷歌的首页啊。
另外,虽然可以欺骗服务端,但是客户端的js脚本不好欺骗,js很可能取得我们的真实信息后使用xmlhttp向服务端汇报;当然,禁止js脚本执行是不可以的,因为绝大部分广告要到js来显示
4.4 点击广告。获取并点击一个webbrowser中的超级链接非常简单,因为我们有对webbrowser的完全控制权。但是绝大部分广告是显示在js加载的框架中的,最要命的是这种框架是跨域的,我们可以实用dom控制框架,但是无法控制跨域框架,网上极少有这方面的资料。幸好,当年写bho时参看过mvp蒋晟的相关文章,这次IE编程,我又从他那里获得了灵感,可以取出一个页面中的google和百度及其他广告联盟的广告链接并模拟点击。
这里要注意的是,点击率,不能见到广告就点,应当设置一个随机率。
4.5独立访问者。这个说不上好还是坏,反正每次更换一个ip,我就清空一次cookie。不过听说google的Adsense防作弊规则中有这样几条:来访者大部分都是第一次访问,来访者大部分没有google的cookie,则判为刷流量作弊。这个可以稍加改进,增强对coockie的管理,不能一概删除了之,以后改进吧
5.加快webbrowser载入速度。禁止activx控件实用,如flash的等,禁止图片、声音下载,可以极大提高webbrowser的载入速度,当然脚本是不能禁止的,不然就没广告可点了。这个功能用vb实现较为麻烦,需要设定DownloadCtrlFlags,最好的办法是自己定制一个webbrowser,参见Edanmo的Custom your webbrowser