PHP file_get_contents 很慢并返回 500 Internal Server Error

coder 2024-05-03 原文

我正在尝试阅读新闻机构网站的 rss 并获取所有新闻的多个选项以保存在我的数据库中。所以我使用 php 函数作为 file_get_contents 或 cURl，但它需要大约一分钟来获取网站内容并分析它以分离我想要的新闻部分。

这是我从 rss 获取新闻数据的代码的一部分:

$rss = new DOMDocument();
$rss->load('http://isna.ir/fa/Sports/feed');
$feed = array();
foreach ($rss->getElementsByTagName('item') as $node) {
    $item = array ( 
        'title' => $node->getElementsByTagName('title')->item(0)->nodeValue,
        'category' => $node->getElementsByTagName('category')->item(0)->nodeValue,
        'link' => $node->getElementsByTagName('link')->item(0)->nodeValue,
        'date' => $node->getElementsByTagName('pubDate')->item(0)->nodeValue,
        );
    array_push($feed, $item);
}
$title = str_replace(' & ', ' &amp; ', $feed[0]['title']);
    $link = $feed[0]['link'];
    $category = $feed[0]['category'];
    $date = date('l F d, Y', strtotime($feed[0]['date']));

在这部分我使用新闻链接从原始新闻页面获取照片:

$context = stream_context_create(array('http' => array('header'=>'Connection: close')));

$f = explode("news", $link);
$photo_link = $f[0]. 'photo' .$f[1];

$ff = file_get_contents($photo_link, false, $context);
$f1 = explode('<div class="news-image">', $ff);
$f2 = explode('<h1', $f1[1]);
$f3 = explode('href="', $f2[0]);
$f4 = explode('">', $f3[1]);
$image = $f4[0];

echo '<img src="' .$image. '"></img>';

大多数情况下是这样的:

Warning: file_get_contents(http://isna.ir/fa/photo/92040301515/مدافع-تیم-ملی-آلمان-از-فوتبال-خداحافظی-کرد) [function.file-get-contents]: failed to open stream: HTTP request failed! HTTP/1.1 500 Internal Server Error in /opt/lampp/htdocs/example8/reader.php

我也使用了 cURL 函数，但并没有获得更好的结果!

最佳答案

试试这个

<?php
  $photo_link = explode( "news", $link );

  $first  = $photo_link[0];
  $last   = str_replace( basename( $photo_link[1] ), urlencode( basename( $photo_link[1] ) ), $photo_link[1] );

  $photo_link = $first."news".$last;
  print_r( file_get_contents( $photo_link, false, $context ) );
?>

所以你的完整代码应该是这样的

<?php
  $feed = array();
  $rss  = new DOMDocument();
  $rss->load( 'http://isna.ir/fa/Sports/feed' );

  foreach( $rss->getElementsByTagName( 'item' ) as $node ) {
    $feed[] = array(
      'title'     =>  str_replace( " & ", " &amp; ", $node->getElementsByTagName( 'title' )->item(0)->nodeValue ),
      'category'  =>  $node->getElementsByTagName( 'category' )->item(0)->nodeValue,
      'link'      =>  $node->getElementsByTagName( 'link' )->item(0)->nodeValue,
      'date'      =>  strtotime( $node->getElementsByTagName( 'pubDate' )->item(0)->nodeValue )
    );
  }

  $title    = $feed[0]["title"];
  $link     = $feed[0]["link"];
  $category = $feed[0]["category"];
  $date     = date( "l F d, Y", $feed[0]["date"] );

  print_r( $feed );

  $context  = stream_context_create(
    array(
      'http'  =>  array(
        'header'  =>  'Connection: close'
      )
    )
  );

  $f  = explode( "news", $link );

  /** My Code Starts **/
  $f[1] = str_replace( basename( $f[1] ), urlencode( basename( $f[1] ) ), $f[1] );
  /** My Code Ends **/

  $photo_link = $f[0]."photo".$f[1];

  $ff = file_get_contents( $photo_link, false, $context );
  $f1 = explode( '<div class="news-image">', $ff );
  $f2 = explode( '<h1', $f1[1] );
  $f3 = explode( 'href="', $f2[0] );
  $f4 = explode( '">', $f3[1] );
  $image  = $f4[0];

  echo '<img src="'.$image.'"></img>';
?>

关于PHP file_get_contents 很慢并返回 500 Internal Server Error，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/17291374/

file_get_contents Internal 39 gt link php curl file-get-contents rss-reader

有关PHP file_get_contents 很慢并返回 500 Internal Server Error的更多相关文章

ruby - Facter::Util::Uptime:Module 的未定义方法 get_uptime (NoMethodError) - 2
我正在尝试设置一个puppet节点，但rubygems似乎不正常。如果我通过它自己的二进制文件(/usr/lib/ruby/gems/1.8/gems/facter-1.5.8/bin/facter)在cli上运行facter，它工作正常，但如果我通过由rubygems(/usr/bin/facter)安装的二进制文件，它抛出:/usr/lib/ruby/1.8/facter/uptime.rb:11:undefinedmethod`get_uptime'forFacter::Util::Uptime:Module(NoMethodError)from/usr/lib/ruby
ruby - 为什么 4.1%2 使用 Ruby 返回 0.0999999999999996？但是 4.2%2==0.2 - 2
为什么4.1%2返回0.0999999999999996？但是4.2%2==0.2。最佳答案参见此处:WhatEveryProgrammerShouldKnowAboutFloating-PointArithmetic实数是无限的。计算机使用的位数有限(今天是32位、64位)。因此计算机进行的浮点运算不能代表所有的实数。0.1是这些数字之一。请注意，这不是与Ruby相关的问题，而是与所有编程语言相关的问题，因为它来自计算机表示实数的方式。关于ruby-为什么4.1%2使用Ruby返
ruby-on-rails - Rails 3.2.1 中 ActionMailer 中的未定义方法 'default_content_type=' - 2
我在我的项目中添加了一个系统来重置用户密码并通过电子邮件将密码发送给他，以防他忘记密码。昨天它运行良好(当我实现它时)。当我今天尝试启动服务器时，出现以下错误。=>BootingWEBrick=>Rails3.2.1applicationstartingindevelopmentonhttp://0.0.0.0:3000=>Callwith-dtodetach=>Ctrl-CtoshutdownserverExiting/Users/vinayshenoy/.rvm/gems/ruby-1.9.3-p0/gems/actionmailer-3.2.1/lib/action_mailer
ruby - 检查字符串是否包含散列中的任何键并返回它包含的键的值 - 2
我有一个包含多个键的散列和一个字符串，该字符串不包含散列中的任何键或包含一个键。h={"k1"=>"v1","k2"=>"v2","k3"=>"v3"}s="thisisanexamplestringthatmightoccurwithakeysomewhereinthestringk1(withspecialcharacterslike(^&*$#@!^&&*))"检查s是否包含h中的任何键的最佳方法是什么，如果包含，则返回它包含的键的值？例如，对于上面的h和s的例子，输出应该是v1。编辑:只有字符串是用户定义的。哈希将始终相同。最佳答案
ruby - Ruby 中的隐式返回值是怎么回事？ - 2
所以我开始关注ruby，很多东西看起来不错，但我对隐式return语句很反感。我理解默认情况下让所有内容返回self或nil但不是语句的最后一个值。对我来说，它看起来非常脆弱(尤其是)如果你正在使用一个不打算返回某些东西的方法(尤其是一个改变状态/破坏性方法的函数!)，其他人可能最终依赖于一个返回对方法的目的并不重要，并且有很大的改变机会。隐式返回有什么意义？有没有办法让事情变得更简单？总是有返回以防止隐含返回被认为是好的做法吗？我是不是太担心这个了？附言当人们想要从方法中返回特定的东西时，他们是否经常使用隐式返回，这不是让你组中的其他人更容易破坏彼此的代码吗？当然，记录一切并给出
ruby-on-rails - ruby 日期方程不返回预期的真值 - 2
为什么以下不同？Time.now.end_of_day==Time.now.end_of_day-0.days#falseTime.now.end_of_day.to_s==Time.now.end_of_day-0.days.to_s#true 最佳答案因为纳秒数不同:ruby-1.9.2-p180:014>(Time.now.end_of_day-0.days).nsec=>999999000ruby-1.9.2-p180:015>Time.now.end_of_day.nsec=>999999998
ruby - 从 String#split 返回的零长度字符串 - 2
在Ruby1.9.3(可能还有更早的版本，不确定)中，我试图弄清楚为什么Ruby的String#split方法会给我某些结果。我得到的结果似乎与我的预期相反。这是一个例子:"abcabc".split("b")#=>["a","ca","c"]"abcabc".split("a")#=>["","bc","bc"]"abcabc".split("c")#=>["ab","ab"]在这里，第一个示例返回的正是我所期望的。但在第二个示例中，我很困惑为什么#split返回零长度字符串作为返回数组的第一个值。这是什么原因呢？这是我所期望的:"abcabc".split("a")#=>["bc"
Get https://registry-1.docker.io/v2/: net/http: request canceled while waiting - 2
1.错误信息：Errorresponsefromdaemon:Gethttps://registry-1.docker.io/v2/:net/http:requestcanceledwhilewaitingforconnection(Client.Timeoutexceededwhileawaitingheaders)或者：Errorresponsefromdaemon:Gethttps://registry-1.docker.io/v2/:net/http:TLShandshaketimeout2.报错原因：docker使用的镜像网址默认为国外，下载容易超时，需要修改成国内镜像地址（首先阿里
ruby - 为什么 Integer.respond_to?( :even? ) 返回 false？ - 2
我一直在研究RubyKoans，我发现about_open_classes.rbkoan很有趣。特别是他们修改Integer#even?方法的最后一个测试。我想尝试一下这个概念，所以我打开了Irb并尝试运行Integer.respond_to?(:even?)，但令我惊讶的是我得到了错误。然后我尝试了Fixnum.respond_to?(:even?)并得到了错误。我还尝试了Integer.respond_to?(:respond_to?)并得到了true，当我执行2.even?时，我也得到了true。我不知道发生了什么。谁能告诉我缺少什么？最佳答案
ruby - Time.to_i 是否总是以 UTC 返回自 EPOCH 以来的秒数？ - 2
无论时间在哪个时区表示，时区差异是否总是被忽略？直觉上，对于那些使用UTC+2的人来说，从EPOCH开始经过的秒数应该更高。然而，事实并非如此。最佳答案 Epoch基于utc时区https://en.wikipedia.org/wiki/Unix_time它与您当前所在的时区无关。关于ruby-Time.to_i是否总是以UTC返回自EPOCH以来的秒数？，我们在StackOverflow上找到一个类似的问题： https://stackoverflow.

PHP file_get_contents 很慢并返回 500 Internal Server Error

有关PHP file_get_contents 很慢并返回 500 Internal Server Error的更多相关文章

随机推荐