天天看点

google hack语法 初级

google hack 语法

如何使用google,对于google这个浏览器不想多说:

推荐百度google镜像站关键字,总有一个能用的.

如: intitle:google镜像站 语法和关键字之间不要存在空格

初级:

  1. filetype: 锁定搜索文件的后缀名或者是扩展名,如: filetype:php,asp,txt,xls,xlsx
  2. intitle: 锁定标题,如: intitle:侠客行
  3. inurl: 锁定url或?后的关键字,如: inurl:baidu.com inurl:robots.txt
  4. intext: 锁定正文内容,如: intext:十步杀一人
  5. site: 锁定范围.如:限定再百度网站下查询,site:baidu.com 锁定一级域名baidu.com,查询baidu.com域名下的一二三级域名包含信息.
  6. 双引号: 精确查询
  7. 乘号: 通配符
  8. 英文句号: 单一通配符
  9. 加号: 强制锁定,即必须包含加号后面的内容
  10. 减号: 可忽略

举个栗子:

  1. 查询1.标题带有后台管理字段 2.网站为php编写的.
    google hack语法 初级
  2. 查询1.www.jsjhgk.com的url链接下 2.标题带有后台管理字段 3.网站为php编写的.
    google hack语法 初级
  3. 用site进行限制范围
    google hack语法 初级
    4.intext查询内容关键字
    google hack语法 初级
    5.双引号,精确查询,不会出现,后台,管理累死的模糊分词.
    google hack语法 初级
以上网站均为google镜像随机搜索若有侵权,请告知撤销!!!

注:

1.robots.txt应放置于网站的根目录下。robots协议并不是一个规范,而只是约定俗成.

2.在robots.txt这个文件中网站管理者可以声明该网站中不想被robots访问的部分,或者指定搜索引擎只收录指定的内容。

3.robots是网站跟爬虫间的协议,用简单直接的txt格式文本方式告诉对应的爬虫被允许的权限,也就是说robots.txt是搜索引擎中访问网站的时候要查看的第一个文件。当一个搜索蜘蛛访问一个站点时,它会首先检查该站点根目录下是否存在robots.txt,如果存在,搜索机器人就会按照该文件中的内容来确定访问的范围;如果该文件不存在,所有的搜索蜘蛛将能够访问网站上所有没有被口令保护的页面。

继续阅读