以下是 Google 对 Amazon.com 的索引的一些结果: 请注意,此处的结果计数(以及任何大型搜索量)是最佳估计值。不过,考虑到 119,000,000 页的估计值,我们可以确定实际数字要高得多。在任何规模合适的网站规模上,您都需要深入了解… 52. 过滤“www”子域。
站点:要深入挖掘网站的索引
“site:”与“inurl:”。例如,您可能只想查看 Amazon 上不在“www”子域下 电话号码数据 的页面。您可以在“inurl:”运算符上使用“site:”和否定匹配 (-): 即使在前几个结果中,您也可以看到 Google 正在索引的其他子域的示例。
这可以为您下一步钻探提供一个
良好的起点。 53.过滤多个子域。 站点:amazon.com -inurl:www -inurl:物流 -inurl:开发人员 -inurl:kdp 您可以将这个概念扩展得更远,在以前的搜索的基础上连续构建以返回越来越窄的页面列表。
这是一个包含四个
运算符的示例: 我已经使用了十多个“inurl:”语句来完成此操作,并且 过向常客提供折扣或奖 我不知道在一次搜索中可以组合多少个运算符有任何固定限制。大多数网站都不够大,不需要这种极端的方式,但很高兴知道它在您需要时是可能的。 54. 专注于单个子域。
网站:或者您可以
专注于单个子域。为此,我通常更喜欢将子域添加到“site:”运算符,而不 购买电子邮件列表 是使用“inurl:”。否则,您可以在 URL 中的任何位置找到该文本: 您可以扩展此概念以更深入地研究此处返回的任何子文件夹(“/ios”、“/ja”等),甚至将更具体的“site:”运算符与其他“inurl:”运算符结合起来。
55.过滤不安全页面。 站点:amazon.com -inurl:https 有趣的是,您可以使用“inurl:”来包含或排除安全(https:)页面: 如果您要将网站从“http:”移动到“https:”,此技巧可以帮助您确保新页面正确索引,并且旧页面逐渐从索引中消失。
56. 找到URL参数
站点:amazon.com inurl:字段关键字 您还可以使用“inurl:”将 URL 参数定位到动态页面。例如,假设您想查看 Google 在 Amazon 上建立索引的内部搜索页面类型: 请注意,无法指定 URL 参数 – Google 可以在 URL 中的任何位置找到文本。
好的一面是,许多 URL 参数都有唯一的名称。 57.查找多个URL属性。 allinurl:亚马逊字段关键字尼康 与“allintitle:”和“allintext:”一样,有一个“allinurl:”运算符。在此示例中,您要在 Amazon 上查找 URL 中包含“Nikon”一词的内部搜索页面: 不幸的是,“allinurl:”有两个问题。
第一您无法可靠地将其与
site:”关联起来,这限制了您的选择。第二,它往往会返回奇怪的结果。例如,请注意,我在美国搜索的最佳结果是亚马逊法国。在大多数情况下,我建议使用多个“inurl:”语句。 58. 查找杂散文本文件。 站点:您可能想知道您的网站上是否留下了任何已被 Google 拾取的零散文档文件。