jjzjj

GoogleBot

全部标签

php - 向用户显示年龄检查表,而不是机器人 - SEO 安全吗?

我遇到了一个问题,我的网站上有一个年龄验证脚本,它阻止了网站上的页面被谷歌索引。解决这个问题的方法似乎很脆弱,javascript和css覆盖了最常见的解决方案——有什么理由不能只使用PHP来检测它是否是访问该站点的机器人,如果不是,则显示年龄检查表单,如果是是,允许通过?我只是想知道这是否被视为不好的做法...? 最佳答案 这仅适用于GoogleBot,您需要为其他机器人进行编辑:if(strstr(strtolower($_SERVER['HTTP_USER_AGENT']),"googlebot")){//noagecheck

seo - 如何防止谷歌机器人抓取页面的特定部分?

我希望谷歌机器人阻止抓取页面的特定部分,比如div。我的网站是有角度的,我正在使用seo转义片段页面。我不想为此使用iframe。有什么建议吗? 最佳答案 我可以想到两种方法来完成此操作:1-使用jQuery或Javascript只需要将页面中不想被抓取的部分包裹在一个div中,并为其分配一个id即可。然后,将display:none样式应用于css文件中的id,然后在页面加载时通过jQuery或Javascript使其成为display:block。这段HTML、CSS和javascript应该可以做到:HTML:Theconte

javascript - Google 爬虫如何查看 jquery 链接重定向

我有链接Link并且该网页存在,并且链接有效。现在,当该链接放置在其他具有url的网页的内容中时,例如。http://example.com/questions我想将我的链接重定向到/questions/my-webpage并打开与之前相同的页面。如果网页有urlhttp://example.com/answers,我的链接将重定向到/answers/my-webpage并且它将打开与之前相同的内容我想保留url结构。我可以用jquery做到这一点,但我担心seo。我想知道google会因为链接重定向而限制我吗?据我了解,爬虫收集href值,并将它们添加到要爬取的页面列表中。我的第一个

seo - 使用 robots.txt 阻止来自搜索引擎的 100 多个 url

关闭。这个问题不符合StackOverflowguidelines.它目前不接受答案。这个问题似乎与helpcenter中定义的范围内的编程无关。.关闭5年前。Improvethisquestion我的网站上有大约100个页面,我不想在google中编入索引...有什么方法可以使用robots.txt来阻止它...编辑每个页面会非常烦人并添加noindex元标记....我想阻止的所有url都像...www.example.com/index-01.htmlwww.example.com/index-02.htmlwww.example.com/index-03.htmlwww.exam

asp.net - 是否有太多内部链接(菜单链接、页脚链接等)被​​视为 "duplicate content"?

关闭。这个问题是off-topic.它目前不接受答案。想改进这个问题吗?Updatethequestion所以它是on-topic用于堆栈溢出。关闭10年前。Improvethisquestion我有一个水平顶部导航栏,其中包含指向我网站页面的菜单和子菜单链接。这些包含在我的母版页和资源文件中。我还有一个垂直菜单,其中包含指向相同页面的相同链接。我的页脚也有一些链接(法律、联系等)。我将网站设置成这样的原因是因为我的许多客户都是年长的工程师,他们对互联网不太了解,这使得网站对于这些类型的观众来说“更易于浏览”。也许这张照片会让事情更清楚:我的问题是,我是否会因为“重复内容”或“重复链接

.htaccess - 带有 $_GET 参数的单个 PHP 页面,对 SEO 不利吗?

关闭。这个问题不符合StackOverflowguidelines.它目前不接受答案。这个问题似乎与helpcenter中定义的范围内的编程无关。.关闭9年前。Improvethisquestion假设我有一家公司的网站,我想对其进行SEO。考虑两种情况:1)只有index.php,对于/about/contact部分,我是这样做的:index.php?what=about,index.php?what=contact等,我使用.htaccess更改了url,所以链接变成了www.company.com/about,www.company.com/contact当然每个页面都有独特的内

javascript - google bot 是否会在网站上触发 javascript 点击操作及其解决方案?

那么目前我们的问题是什么,我们正在从我们网站上的产品中获取评论,为了优化桌面和移动设备上的页面加载,我们最初只加载10条评论,然后在每个用户交互的每个按钮点击我们加载下10评论。因此,我们希望Google和其他搜索引擎能够对最初未显示的其他评论的内容编制索引。我们用将我们的代码堆叠在vanillajavascript中jQuery(function(){...document.getElementById("ID").onclick(function(...));...});但是在阅读了一些文章之后,我发现Google爬虫最终只能访问在文档就绪时加载的内容。所以我想问一下是否有人遇到过

seo - 为 a/404.shtml 页面重定向 301

关闭。这个问题不符合StackOverflowguidelines.它目前不接受答案。这个问题似乎与helpcenter中定义的范围内的编程无关。.关闭9年前。Improvethisquestion就SEO(以及被谷歌蜘蛛视为黑帽技术的东西)而言,我是否应该避免将我的404流量重定向到我的主页?正在考虑将这一行添加到我的.htaccess文件中Redirect301/404.shtml/home.php

seo - GoogleBot 非常频繁地抓取导致服务器过载

我的网站有大约500.000页。我制作了sitemap.xml并在其中列出了所有页面(我知道每个文件限制50.000个链接,所以我有10个站点地图)。无论如何,我在webmastertool中提交了站点地图,一切似乎都正常(没有错误,我可以看到提交和索引链接)。Hoverer我经常遇到蜘蛛网问题。GoogleBot每天抓取同一页面4次,但在sitemap.xml中我告诉该页面每年都会更改。这是一个例子http://www.domain.com/destitution2015-01-01T16:59:23+02:00yearly0.11)那么如何告诉GoogleBot不要过于频繁地抓取,

javascript - 如何让 "manipulate"google bot 使用动态内容加载?

关闭。这个问题不符合StackOverflowguidelines.它目前不接受答案。这个问题似乎与helpcenter中定义的范围内的编程无关。.关闭6年前。Improvethisquestion据我所知,如果您在您的网站中使用AJAX或javascript链接,它会损害SEO,因为谷歌机器人在抓取您的网站时遇到问题,基本上它喜欢anchor标记。因此,在您的网站中避免使用AJAX或Flash是一个普遍的说法,尽管有人说谷歌机器人知道读取javascript链接。现在我相信有可能以某种方式操纵googlebot,当操纵的意思是我不意味着任何非法或黑帽子,我只是想Ajaxise我的网站