jjzjj

seo - 如何向 Googlebot 提供照片库更新?

如何在网站上的相册更新时设置重定向?一些照片已被删除,因此Googlebot现在得到404。但是那些老照片是无可替代的。同一主题中有一些新的相似照片,但不相同。我应该将请求重定向到某个地方吗?例如。日志被对/images/some.jpg的请求淹没,因此将其重定向到(哪里?)。 最佳答案 我建议采用双管齐下的方法:1)更新您网站的Google索引通过GoogleWebmasterTools声明您的网站,并请求抓取您的网站。这应该从他们的索引中删除大部分已删除的图像,并减少访问您网站的404错误访问者的数量。Removeapageor

robots.txt - 如何禁止来自单个页面或文件的机器人

如何禁止来自单个页面的漫游器并允许抓取所有其他内容。不要出错非常重要,所以我在这里问,在其他地方找不到明确的答案。这是正确的吗?User-Agent:*Disallow:/dir/mypage.htmlAllow:/ 最佳答案 Disallow行是所有需要的。它将阻止对以“/dir/mypage.html”开头的任何内容的访问。Allow行是多余的。robots.txt的默认值为Allow:/。一般情况下,Allow不是必需的。它在那里,以便您可以覆盖对不允许的内容的访问。例如,假设您想禁止访问“/images”目录,但“publi

javascript - 我们是否应该使用 JavaScript 和 CGI​​ 变量从我们的访问者报告中清除机器人?

我正在使用ColdFusion8和jQuery1.7。**这是一道编程题,因为我提问的解法需要编程。它可能不是问题的正确解决方案,但如果是,那么我需要弄清楚如何最好地对这个概念进行编程。**当用户访问我们的站点时,我们通过使用CFC和存储的procures将各种CGI变量写入数据库来跟踪他们的session。首先,我们通过用户代理中的关键字(例如“bot”)过滤掉非人类流量。不幸的是,许多机器人程序和垃圾邮件发送者掩盖了他们的用户代理。后来,我们尝试从我们的访问者报告中排除不良机器人和其他一些正在抓取页面等的已知实体。但这是一个手动过程。我们正在考虑使用其他/替代方法来跟踪使用情况。加

jquery - Google Bot 错误地读取 Javascript

在我正在处理的网站上,我们有一堆jquery,可以根据在选择选项中选择的内容重定向到页面的下一级。更改功能工作得很好,但谷歌网站管理员工具没有正确读取代码,并在GWT中返回一堆404错误。vartype=$('#select-typeoption:selected').attr('value');if(type=='Masters'||type=='Bachelors'||type=='Associates'){location.href='/'+type+'/Degree-in-Criminal-Justice';}GWT为/Degree-in-Criminal-Justice返回4

seo - 文档格式是否会改变 Google bot 在 SEO 方面的行为?喜欢/路径和/路径.htm .html .php

关闭。这个问题不符合StackOverflowguidelines.它目前不接受答案。这个问题似乎与helpcenter中定义的范围内的编程无关。.关闭7年前。Improvethisquestion我被告知要从Web应用程序链接中删除“.html”,以便Google机器人更好地识别它。所以example.com/path/to/resource.html应该是example.com/path/to/resource。我没有找到任何文件说明放置在url中的资源格式本身有任何影响。无论是php、htm、html还是任何其他aspx。那么,怎么样?省略.html或任何其他格式对Google机

ruby-on-rails - cucumber - 步骤结束后出现服务器错误

我的Cucumber测试在某些测试结束后出现非确定性失败。似乎当浏览器/cucumber步骤完成时,服务器上仍在处理请求,并且即使在DatabaseCleaner运行和删除文档时它们似乎仍在运行,这导致在尝试访问服务器中的模型时失败.当我的应用程序创建用户时,他们存储在实例变量@users=[]中以便于访问。当我捕捉到这些异常时,我意识到变量仍然存在@users.first.present?#=>true但其文档已被删除@users.first.reload#=>nil。我真的不明白问题出在哪里,因为不应该有额外的页面加载(可能是Turbolinks/缓存在耍我),而且失败似乎真的不确

jquery - 无法使用 Google Search Console 抓取我的新网站

我正在开发一个网站,后端为django,前端为jquery。当调用列表/详细信息页面url时,我将在页面加载时调用ajax方法并从后端呈现数据。支持的结果由django序列化为json数据并呈现回ajax。例如:functionlistFunction(){$.ajax({url:'',type:'GET',dataType:'json',}).done(function(response){//responseasjson$.each(response,function(index,value){$(container).append(value)});});}$(document)

java - 网络爬虫是否读取WEB-INF文件夹内的JSP页面

我有一个使用jsp页面的网络应用程序。我故意没有把jsp页面放在WEB-INF中文件夹,因为jsp中只有最少的代码,而且当时(大约5年前)我读到网络爬虫不会在WEB-INF文件夹中找到文件。因此影响我的SEO/排名/搜索引擎搜索结果。我还将jsp文件位置放在sitemap.xml文件中。我使用的是tomcat,该站点是完全公开的,没有登录/安全要求。所以,快进到现在。我的网站有很好的排名和很好的搜索结果。我应该将jsps移动到WEB-INF文件夹吗?5年前我的来源是错误的吗? 最佳答案 你5年前读到的信息,仍然适用。WEB-INF下

seo - 由于脚本被阻止而部分获取和呈现(Twitter 转换跟踪)

当我在Google网站管理员工具中使用FetchandRender工具时,它返回“部分”(而不是“完整”)结果,因为我添加了Twitter转换跟踪,它指向Twitter的限制性robots.txt。我尝试将rel="nofolow"添加到Twitter的javascript文件并尝试使用googleon/googleoff标签将其注释掉,但没有成功。有解决办法吗? 最佳答案 我想通了,只有在用户代理不是机器人时才显示twitterblock,方法是在服务器端用C#检查它:varIsRobot=Regex.IsMatch(Reques

javascript - 让 Google Bot 检测 AJAX 内容

我正在开发一个网站(不是我的),我遇到了一个大麻烦!在这个网站上,我有一些模式会在用户点击产品后打开,但我需要这样做,GoogleBot会像页面一样检测到这些模式。当模式打开时,JS函数会向URL添加一个#参数,如“#abc=modal_one”。我希望在Google结果中此页面显示为“www.test.com/page.php?#abc=modal_one”。我已经尝试(并且正在尝试)在GoogleSearchConsole中像GoogleBot一样呈现页面,但GSC只打开页面而不是模式。我还添加了一个ES6(JS)代码,当模态显示给用户时(在用户点击打开模态之后)只编辑页面标题但什