jjzjj

javascript - phantomjs pdf 到标准输出

coder 2024-05-17 原文

我正在拼命尝试将 phantomJS 生成的 PDF 输出到标准输出,如 here

我得到的是一个空的 PDF 文件,虽然它的大小不是 0,但它显示一个空白页。

var page = require('webpage').create(),
system = require('system'),
address;

address = system.args[1];
page.paperSize = {format: 'A4'};

page.open(address, function (status) {
    if (status !== 'success') {
        console.log('Unable to load the address!');
        phantom.exit();
    } else {
        window.setTimeout(function () {
            page.render('/dev/stdout', { format: 'pdf' });
            phantom.exit();
        }, 1000);
    }
});

我这样调用它:phantomjs rasterize.js http://google.com>test.pdf
我尝试更改 /dev/stdoutsystem.stdout但不是运气。将 PDF 直接写入文件没有任何问题。

我正在寻找一个跨平台的实现,所以我希望这可以在非 Linux 系统上实现。

最佳答案

将输出写入 /dev/stdout/ 时或 /dev/stderr/在 Windows 上,PhantomJS执行以下步骤(如 \phantomjs\src\webpage.cpp 中的 render 方法所示):

  • 在没有 /dev/stdout/ 的情况下和 /dev/stderr/分配了一个临时文件路径。
  • 调用 renderPdf使用临时文件路径。
  • 将网页渲染到此文件路径。
  • 将该文件的内容读入 QByteArray .
  • 调用 QString::fromAscii在字节数组上并写入 stdoutstderr .
  • 删除临时文件。

  • 首先,我为 PhantomJS 构建了源代码。 ,但注释掉文件删除。在下一次运行中,我能够检查它渲染的临时文件,结果证明它完全没问题。我也试过运行 phantomjs.exe rasterize.js http://google.com > test.png结果相同。这立即排除了渲染问题,或任何与 PDF 相关的问题,这意味着问题必须与数据写入 stdout 的方式有关。 .

    在这个阶段,我怀疑是否有一些文本编码恶作剧正在发生。从之前的运行中,我有同一个文件的有效和无效版本(在这种情况下是 PNG)。

    使用一些 C# 代码,我运行了以下实验:
    //Read the contents of the known good file.
    byte[] bytesFromGoodFile = File.ReadAllBytes("valid_file.png");
    //Read the contents of the known bad file.
    byte[] bytesFromBadFile = File.ReadAllBytes("invalid_file.png");
    
    //Take the bytes from the valid file and convert to a string
    //using the Latin-1 encoding.
    string iso88591String = Encoding.GetEncoding("iso-8859-1").GetString(bytesFromGoodFile);
    //Take the Latin-1 encoded string and retrieve its bytes using the UTF-8 encoding.
    byte[] bytesFromIso88591String = Encoding.UTF8.GetBytes(iso88591String);
    
    //If the bytes from the Latin-1 string are all the same as the ones from the
    //known bad file, we have an encoding problem.
    Debug.Assert(bytesFromBadFile
        .Select((b, i) => b == bytesFromIso88591String[i])
        .All(c => c));
    

    请注意,我使用 ISO-8859-1 编码为 QT将此用作 default encoding for c-strings .事实证明,所有这些字节都是相同的。该练习的目的是看看我是否可以模仿导致有效数据无效的编码步骤。

    为了进一步的证据,我调查了\phantomjs\src\system.cpp\phantomjs\src\filesystem.cpp .
  • system.cpp , System类包含对 File 等内容的引用stdout 的对象, stdinstderr ,设置为使用 UTF-8编码。
  • 写信给 stdout 时, write File 的功能对象被调用。此函数支持写入文本和二进制文件,但由于 System 的方式类初始化它们,所有写入都将被视为写入文本文件。

  • 所以问题归结为:我们需要对 stdout 执行二进制写入。 ,但我们的写入最终被视为文本并对其应用了编码,导致生成的文件无效。

    鉴于上述问题,如果不更改 PhantomJS,我看不到任何方法可以在 Windows 上按照您想要的方式工作。代码。所以他们在这里:

    第一个更改将提供一个我们可以调用 File 的函数。对象以显式执行二进制写入。

    \phantomjs\src\filesystem.h 中添加如下函数原型(prototype):
    bool binaryWrite(const QString &data);
    

    并将其定义放在\phantomjs\src\filesystem.cpp (此方法的代码来自此文件中的write 方法):
    bool File::binaryWrite(const QString &data)
    {
        if ( !m_file->isWritable() ) {
            qDebug() << "File::write - " << "Couldn't write:" << m_file->fileName();
            return true;
        }
    
        QByteArray bytes(data.size(), Qt::Uninitialized);
        for(int i = 0; i < data.size(); ++i) {
            bytes[i] = data.at(i).toAscii();
        }
        return m_file->write(bytes);
    }
    

    \phantomjs\src\webpage.cpp 的第 920 行附近您将看到如下所示的代码块:
        if( fileName == STDOUT_FILENAME ){
    #ifdef Q_OS_WIN32
            _setmode(_fileno(stdout), O_BINARY);            
    #endif      
    
            ((File *)system->_stderr())->write(QString::fromAscii(name.constData(), name.size()));
    
    #ifdef Q_OS_WIN32
            _setmode(_fileno(stdout), O_TEXT);
    #endif          
        }
    

    将其更改为:
       if( fileName == STDOUT_FILENAME ){
    #ifdef Q_OS_WIN32
            _setmode(_fileno(stdout), O_BINARY);
            ((File *)system->_stdout())->binaryWrite(QString::fromAscii(ba.constData(), ba.size()));
    #elif            
            ((File *)system->_stderr())->write(QString::fromAscii(name.constData(), name.size()));
    #endif      
    
    #ifdef Q_OS_WIN32
            _setmode(_fileno(stdout), O_TEXT);
    #endif          
        }
    

    所以代码替换所做的就是调用我们的新 binaryWrite函数,但由 #ifdef Q_OS_WIN32 保护堵塞。我这样做是为了保留非 Windows 系统上的旧功能,这些系统似乎没有表现出这个问题(或者是吗?)。请注意,此修复仅适用于写入 stdout。 - 如果您愿意,您可以随时将其应用于 stderr但在这种情况下,它可能并不重要。

    如果您只想要一个预构建的二进制文件(谁不想要?),您可以找到 phantomjs.exe在我的 SkyDrive 上进行了这些修复.我的版本大约是 19MB,而我之前下载的版本只有大约 6MB,尽管我遵循了 here 的说明。 ,所以应该没问题。

    关于javascript - phantomjs pdf 到标准输出,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/19512983/

    有关javascript - phantomjs pdf 到标准输出的更多相关文章

    1. ruby - 检查 "command"的输出应该包含 NilClass 的意外崩溃 - 2

      为了将Cucumber用于命令行脚本,我按照提供的说明安装了arubagem。它在我的Gemfile中,我可以验证是否安装了正确的版本并且我已经包含了require'aruba/cucumber'在'features/env.rb'中为了确保它能正常工作,我写了以下场景:@announceScenario:Testingcucumber/arubaGivenablankslateThentheoutputfrom"ls-la"shouldcontain"drw"假设事情应该失败。它确实失败了,但失败的原因是错误的:@announceScenario:Testingcucumber/ar

    2. ruby - 通过 erb 模板输出 ruby​​ 数组 - 2

      我正在使用puppet为ruby​​程序提供一组常量。我需要提供一组主机名,我的程序将对其进行迭代。在我之前使用的bash脚本中,我只是将它作为一个puppet变量hosts=>"host1,host2"我将其提供给bash脚本作为HOSTS=显然这对ruby​​不太适用——我需要它的格式hosts=["host1","host2"]自从phosts和putsmy_array.inspect提供输出["host1","host2"]我希望使用其中之一。不幸的是,我终其一生都无法弄清楚如何让它发挥作用。我尝试了以下各项:我发现某处他们指出我需要在函数调用前放置“function_”……这

    3. ruby - 如何进行排列以有效地定制输出 - 2

      这是一道面试题,我没有答对,但还是很好奇怎么解。你有N个人的大家庭,分别是1,2,3,...,N岁。你想给你的大家庭拍张照片。所有的家庭成员都排成一排。“我是家里的friend,建议家庭成员安排如下:”1岁的家庭成员坐在这一排的最左边。每两个坐在一起的家庭成员的年龄相差不得超过2岁。输入:整数N,1≤N≤55。输出:摄影师可以拍摄的照片数量。示例->输入:4,输出:4符合条件的数组:[1,2,3,4][1,2,4,3][1,3,2,4][1,3,4,2]另一个例子:输入:5输出:6符合条件的数组:[1,2,3,4,5][1,2,3,5,4][1,2,4,3,5][1,2,4,5,3][

    4. ruby - 将 spawn() 的标准输出/标准错误重定向到 Ruby 中的字符串 - 2

      我想使用spawn(针对多个并发子进程)在Ruby中执行一个外部进程,并将标准输出或标准错误收集到一个字符串中,其方式类似于使用Python的子进程Popen.communicate()可以完成的操作。我尝试将:out/:err重定向到一个新的StringIO对象,但这会生成一个ArgumentError,并且临时重新定义$stdxxx会混淆子进程的输出。 最佳答案 如果你不喜欢popen,这是我的方法:r,w=IO.pipepid=Process.spawn(command,:out=>w,:err=>[:child,:out])

    5. ruby-on-rails - 标准化文件名的字符串,删除重音和特殊字符 - 2

      我正在尝试找到一种方法来规范化字符串以将其作为文件名传递。到目前为止我有这个:my_string.mb_chars.normalize(:kd).gsub(/[^\x00-\x7F]/n,'').downcase.gsub(/[^a-z]/,'_')但第一个问题:-字符。我猜这个方法还有更多问题。我不控制名称,名称字符串可以有重音符、空格和特殊字符。我想删除所有这些,用相应的字母('é'=>'e')替换重音符号,并将其余的替换为'_'字符。名字是这样的:“Prélèvements-常规”“健康证”...我希望它们像一个没有空格/特殊字符的文件名:“prelevements_routin

    6. ruby - Ruby 是否使用 $stdout 来写入 puts 和 return 的输出? - 2

      我想知道Ruby用来在命令行打印这些东西的输出流:irb(main):001:0>a="test"=>"test"irb(main):002:0>putsatest=>nilirb(main):003:0>a=>"test"$stdout是否用于irb(main):002:0>和irb(main):003:0>?而且,在这两次调用之间,$stdout的值是否有任何变化?另外,有人能告诉我打印/写入这些内容的Ruby源代码吗? 最佳答案 是的。而且很容易向自己测试/证明。在命令行试试这个:ruby-e'puts"foo"'>test.

    7. ruby-on-rails - 无法在 Rails 助手中捕获 block 的输出 - 2

      我在使用自定义RailsFormBuilder时遇到了问题,从昨天晚上开始我就发疯了。基本上我想对我的构建器方法之一有一个可选block,以便我可以在我的主要content_tag中显示其他内容。:defform_field(method,&block)content_tag(:div,class:'field')doconcatlabel(method,"Label#{method}")concattext_field(method)capture(&block)ifblock_given?endend当我在我的一个Slim模板中调用该方法时,如下所示:=f.form_field:e

    8. ruby-on-rails - 使用 javascript 更改数据方法不会更改 ajax 调用用户的什么方法? - 2

      我遇到了一个非常奇怪的问题,我很难解决。在我看来,我有一个与data-remote="true"和data-method="delete"的链接。当我单击该链接时,我可以看到对我的Rails服务器的DELETE请求。返回的JS代码会更改此链接的属性,其中包括href和data-method。再次单击此链接后,我的服务器收到了对新href的请求,但使用的是旧的data-method,即使我已将其从DELETE到POST(它仍然发送一个DELETE请求)。但是,如果我刷新页面,HTML与"new"HTML相同(随返回的JS发生变化),但它实际上发送了正确的请求类型。这就是这个问题令我困惑的

    9. ruby-on-rails - 连接字符串时如何在 <%=%> block 内输出 html_safe? - 2

      考虑一下:现在这些情况:#output:http://domain.com/?foo=1&bar=2#output:http://domain.com/?foo=1&bar=2#output:http://domain.com/?foo=1&bar=2#output:http://domain.com/?foo=1&bar=2我需要用其他字符串输出URL。我如何保证&符号不会被转义?由于我无法控制的原因,我无法发送&。求助!把我的头发拉到这里:\编辑:为了澄清,我实际上有一个像这样的数组:@images=[{:id=>"fooid",:url=>"http://

    10. ruby - 捕获 Ruby Logger 输出以进行测试 - 2

      我有一个像这样的ruby​​类:require'logger'classTdefdo_somethinglog=Logger.new(STDERR)log.info("Hereisaninfomessage")endend测试脚本行如下:#!/usr/bin/envrubygem"minitest"require'minitest/autorun'require_relative't'classTestMailProcessorClasses当我运行这个测试时,out和err都是空字符串。我看到消息打印在stderr上(在终端上)。有没有办法让Logger和capture_io一起玩得

    随机推荐