jjzjj

GoogleBot

全部标签

django - 在 Django 中,为搜索引擎蜘蛛禁用 @login_required

我正在寻找一种干净的方法让搜索引擎蜘蛛绕过@login_required,查看通常需要登录用户的页面。我可以编写自动将搜索引擎登录到虚拟帐户的中间件,但这并不是我所谓的干净。对更好的解决方案有什么建议吗?谢谢。 最佳答案 不要这样做。这是“隐藏真实内容”,可能会使您被Google索引禁止。CloakingreferstothepracticeofpresentingdifferentcontentorURLstousersandsearchengines.Servingupdifferentresultsbasedonuserage

seo - 禁止某些图像文件夹

我正在制作我的robots.txt文件。但是我对如何禁止Googlebot-Image有点不安全。我想允许Google机器人抓取我的网站,但我在下面做出的禁止除外。这是我做的:User-agent:GooglebotDisallow:Disallow:/courses/Disallow:/portfolio/portfolio-template.php/User-agent:Googlebot-ImageDisallow:/images/graphics/erhvervserfaring//images/graphics/uddannelse/sitemap:http://www.ex

coldfusion - 为什么我的 ColdFusion 页面向搜索引擎返回一个空白页面?

我做过很多ASP.NET和PHP开发,但我不太熟悉如何在CF中跟踪这类事情。我天真的第一个攻击角度是在任何源代码中搜索对谷歌的任何引用。运气不好。我在IIS7上运行网站。Google、Bing和Yahoo显然都“看不到”我网站上的任何内容。更新:我运行FetchasGooglebot并得到以下信息:HTTP/1.1200OKTransfer-Encoding:chunkedContent-Type:text/html;charset=UTF-8Server:Microsoft-IIS/7.0Set-Cookie:CFID=1638251;expires=Sat,14-Apr-20401

ajax - 我可以让我的 ajax 网站 'crawlable' 吗?

我目前正在构建一个基于音乐的网站,我想构建类似于thistemplate.的网站它使用ajax和深层链接。(它利用了History.js库——请注意URL中没有“#”。)我想使用这些“ajax”方法(或者可能完全使用模板)的原因是,当播放音乐时,它会在用户浏览网站时保持不间断。我担心Google无法抓取我的网站,但我想我可以修改页面源代码中的代码来解决这个问题。如果我查看模板的源代码,我会在头部看到现在,如果我将其添加到头部:这会使网站可抓取吗?我还需要添加其他代码吗?还是这个模板根本不可能?我正在遵循本指南https://developers.google.com/webmaster

seo - Googlebot 索引我的本地主机开发机器 - 它在哪里找到我的 IP?

我发现Googlebot通过其IP地址为我的开发站点(家用PC)编制索引。惊喜。我已经更改了我的.htaccess文件以防止将来访问,但是......Googlebot是如何找到我的?我已向Google请求将我的实时网站编入索引,但网络上的任何地方都不应该有指向我的IP的任何链接。我的IP在我的网站上唯一列出的地方是在一个PHP函数中,该函数用于将我的地址排除在记录之外。Googlebot(或任何机器人)能否从原始PHP代码中获取IP地址? 最佳答案 IP地址不太可能从您的PHP代码中获取,因为Web服务器将执行PHP脚本并且只将结

javascript - 如何让 Google 索引 Angular.js 应用程序中的动态标题

Google正在为我的Angular.js应用程序的内容编制索引,即它执行JS、XHR和整个交易,但由于某种原因,标题未正确编制索引并且仍然是静态HTML后备(默认标题由HTML设置,在执行JS之前)。在index.html我有:DefaultTitle每当路线改变时,它就这样设置:app.run['$location','$rootScope',($location,$rootScope)->$rootScope.$on'$routeChangeSuccess',(event,current,previous)->$rootScope.title=current.$$route.ti

search - 告诉 GoogleBot 跳过页面的一部分?

我阅读了很多链接,试图弄清楚如何告诉Google不要将页面的某些部分编入索引。所有的答案似乎是否定的,或者做一些蹩脚的事情,比如使用IFrame。在我们的案例中,法律部门希望在每一页的页脚中都有一个冗长的免责声明。这会导致SEO问题。有什么全新的技术来处理这个问题吗? 最佳答案 Inourcaselegalwantsalengthydisclaimerinthefooteroneverypage.ThisiscausinganSEOissue.不,它不适用于Google。如果它出现在每个页面上,那么它将被视为样板内容,而不是每个页面

laravel - 如何索引没有公共(public)链接的谷歌动态页面?

我遇到了一个非常大的问题,我目前正在制作一个网络应用程序。这是一个概述:公共(public)页面:/home/login/post/:id(soeachdynamicpagemustbepublicandindexed)私有(private)页面/posts/post/:id/comments/and-other-private-urls如您所见,/posts页面将包含每个帖子的完整列表,并且它的url是私有(private)的,因此,我如何才能让google知道我的帖子单页,因为我有没有页面索引所有这些?据我所知,googlebot会来到我的/home并查找链接,为它们编制索引,并对

seo - 如何阻止谷歌抓取我的 Bitly Branded 短域名?

问题是我们正在使用bitlybrandedshortdomains作为urlshortener。我们的品牌短域名是d.so.city现在,每当我在google上搜索site:so.city时,所有d.so.city链接甚至会出现在真正的网站url之前。我不希望bitlyurl被抓取。我知道这可以通过子域的robots.txt轻松完成,但我们无法访问子域的robots.txt文件,因为它与bitly完全链接。我也尝试过谷歌网站管理员的参数阻止,但也没有运气。我也浏览了Bitly文档,但在那里也找不到任何相关内容。下面是我的站点搜索的快照:我不希望这些d.so.city链接出现在谷歌搜索中

search - 在 robots.txt 开头禁止所有机器人后,指定指令是否会产生异常?

案例如下:User-agent:*Disallow:/User-agent:GooglebotDisallow:/test在这种情况下,Googlebot是否能够完成它的工作?我想也许是因为该文件只指定不允许对Googlebot进行/test,所以Googlebot可以在除/test之外的其他目录上执行它们的工作? 最佳答案 问题:在这种情况下,Googlebot是否能够完成它的工作?回答:不是这种情况User-agent:*Disallow:/问题:我想也许是因为该文件只指定不允许对Googlebot进行/test,所以Googl