jjzjj

c++ - 在 C++ 中,关于位移和转换数据类型

coder 2024-02-12 原文

我最近在 Stack Overflow 上问了一个问题,关于如何将我的数据从 16 位整数后跟不确定数量的 void*-cast 内存转换为 std::vector of unsigned chars,以便使用已知的套接字库作为 NetLink,它使用签名如下所示的函数来发送原始数据:

void rawSend(const vector<unsigned char>* data);

(作为引用,这里是那个问题: Casting an unsigned int + a string to an unsigned char vector )

问题已成功回答,我感谢回答的人。 Mike DeSimone 给出了一个 send_message() 函数示例,该函数将数据转换为 NetLink 接受的格式(std::vector),如下所示:
void send_message(NLSocket* socket, uint16_t opcode, const void* rawData, size_t rawDataSize)
{
    vector<unsigned char> buffer;
    buffer.reserve(sizeof(uint16_t) + rawDataSize);
    buffer.push_back(opcode >> 8);
    buffer.push_back(opcode & 0xFF);
    const unsigned char* base(reinterpret_cast<const unsigned char*>(rawData));
    buffer.insert(buffer.end(), base, base + rawDataSize);
    socket->rawSend(&buffer);
}

这看起来正是我所需要的,所以我开始编写一个随附的 receive_message() 函数......

......但我很尴尬地说我并不完全理解所有的位移和诸如此类的东西,所以我在这里遇到了一堵墙。在我过去近十年编写的所有代码中,我的大部分代码都是使用高级语言编写的,而我的其余代码从未真正调用过低级内存操作。

回到编写 receive_message() 函数的主题,正如您所想象的,我的出发点是 NetLink 的 rawRead() 函数,其签名如下所示:
vector<unsigned char>* rawRead(unsigned bufferSize = DEFAULT_BUFFER_SIZE, string* hostFrom = NULL);

看起来我的代码将以这样的方式开始:
void receive_message(NLSocket* socket, uint16_t* opcode, const void** rawData)
{
    std::vector<unsigned char, std::allocator<unsigned char>>* buffer = socket->rawRead();
    std::allocator<unsigned char> allocator = buffer->get_allocator(); // do I even need this allocator?  I saw that one is returned as part of the above object, but...
    // ...
}

在第一次调用 rawRead() 之后,看来我需要遍历 vector ,从中检索数据并反转位移操作,然后将数据返回到 *rawData 和 *opcode。同样,我对 bitshifting 不是很熟悉(我做了一些谷歌搜索来理解语法,但我不明白为什么上面的 send_message() 代码需要移位),所以我对下一步感到茫然这里。

有人可以帮助我理解如何编写这个随附的 receive_message() 函数吗?作为奖励,如果有人可以帮助解释原始代码,以便我将来知道它是如何工作的(特别是,在这种情况下转换是如何工作的以及为什么有必要),那将有助于加深我对 future 的理解。

提前致谢!

最佳答案

库的函数签名……

    void rawSend( const vector<unsigned char>* data );

强制你建立一个 std::vector的数据,这实质上意味着它会造成不必要的低效率。要求客户端代码构建 std::vector 没有优势。 .设计它的人不知道他们在做什么,不使用他们的软件是明智的。

库函数签名...
    vector<unsigned char>* rawRead(unsigned bufferSize = DEFAULT_BUFFER_SIZE, string* hostFrom = NULL);

更糟糕的是:它不仅不必要地要求您构建 std::string如果你想指定一个“hostFrom”(不管它真正意味着什么),但它不必要地要求你释放结果 vector .至少如果函数结果类型有任何意义。当然,可能没有。

您不应该使用具有如此令人厌恶的函数签名的库。可能任何随机挑选的图书馆都会好得多。即,更容易使用。

现有的使用代码如何...
void send_message(NLSocket* socket, uint16_t opcode, const void* rawData, size_t rawDataSize)
{
    vector<unsigned char> buffer;
    buffer.reserve(sizeof(uint16_t) + rawDataSize);
    buffer.push_back(opcode >> 8);
    buffer.push_back(opcode & 0xFF);
    const unsigned char* base(reinterpret_cast<const unsigned char*>(rawData));
    buffer.insert(buffer.end(), base, base + rawDataSize);
    socket->rawSend(&buffer);
}

作品:
  • reserve call 是一种过早优化的情况。它试图使 vector只做一个单一的缓冲区分配(此时执行)而不是两个或更多。更好地解决构建 vector 明显效率低下的问题, 是使用一个更理智的库。
  • buffer.push_back(opcode >> 8)放置(假定)16 位数量的高 8 位 opcode , 在 vector 的开头。放置高的部分,最重要的部分,首先,被称为 大端格式。另一端的阅读代码必须采用大端格式。同样,如果这个发送代码使用了 小端格式,那么读取代码将不得不采用小端格式。所以,这只是一个数据格式的决定,但鉴于决定,两端的代码必须遵守它。
  • buffer.push_back(opcode & 0xFF)调用放置 opcode 的低 8 位在高位之后,对于大端是正确的。
  • const unsigned char* base(reinterpret_cast<const unsigned char*>(rawData))声明只是命名一个适当类型的指向你的数据的指针,称之为 base .型号const unsigned char*是合适的,因为它允许字节级别 地址算术 .原始形式参数类型 const void*不承认地址算术。
  • buffer.insert(buffer.end(), base, base + rawDataSize)将数据添加到 vector 中。表达式 base + rawDataSize是先前声明启用的地址算法。
  • socket->rawSend(&buffer)是最后一次调用 SillyLibrary 的 rawSend方法。


  • 如何结束对 SillyLibrary 的调用 rawRead功能。

    首先,为字节数据类型定义一个名称(命名总是一个好主意):
    typedef unsigned char Byte;
    typedef ptrdiff_t Size;
    

    请参阅有关如何解除分配/销毁/删除(如有必要) SillyLibrary 函数结果的文档:
    void deleteSillyLibVector( vector<Byte> const* p )
    {
        // perhaps just "delete p", but it depends on the SillyLibrary
    }
    

    现在,对于具有 std::vector 的发送操作参与只是一种痛苦。对于接收操作,则相反。创建一个动态数组并将其作为函数结果安全有效地传递,正是 std::vector 的那种事情。是专为。

    然而,发送操作只是一次调用。

    对于接收操作,根据 SillyLibrary 的设计,您可能需要循环执行一定数量的接收调用,直到您收到所有数据。您没有提供足够的信息来执行此操作。但是下面的代码显示了您的循环代码可以调用的底层读取,在 vector 中累积数据。 :
    Size receive_append( NLSocket& socket, vector<Byte>& data )
    {
        vector<Byte> const* const result = socket.raw_read();
    
        if( result == 0 )
        {
            return 0;
        }
    
        struct ScopeGuard
        {
            vector<Byte>* pDoomed;
            explicit ScopeGuard( vector<Byte>* p ): pDoomed( p ) {}
            ~ScopeGuard() { deleteSillyLibVector( pDoomed ); }
        };
    
        Size const nBytesRead = result->size();
        ScopeGuard cleanup( result );
    
        data.insert( data.end(), result->begin(), result->end() );
        return nBytesRead;
    }
    

    请注意使用析构函数进行清理,这使得异常更安全。在这种特殊情况下,唯一可能的异常是 std::bad_alloc ,无论如何这是非常致命的。但是,为了异常安全,使用析构函数进行清理的一般技术非常值得了解并作为理所当然地使用(尽管通常不必定义任何新类,但是在处理 SillyLibrary 类时)可能必须这样做)。

    最后,当循环代码确定所有数据都在手头时,它可以解释 vector 中的数据。 .我把它留作练习,尽管这主要是你要求的。那是因为我已经在这里写了几乎整篇文章。

    免责声明:即用代码。

    干杯 & hth.,

    关于c++ - 在 C++ 中,关于位移和转换数据类型,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/7775599/

    有关c++ - 在 C++ 中,关于位移和转换数据类型的更多相关文章

    1. ruby-on-rails - 在 Rails 中将文件大小字符串转换为等效千字节 - 2

      我的目标是转换表单输入,例如“100兆字节”或“1GB”,并将其转换为我可以存储在数据库中的文件大小(以千字节为单位)。目前,我有这个:defquota_convert@regex=/([0-9]+)(.*)s/@sizes=%w{kilobytemegabytegigabyte}m=self.quota.match(@regex)if@sizes.include?m[2]eval("self.quota=#{m[1]}.#{m[2]}")endend这有效,但前提是输入是倍数(“gigabytes”,而不是“gigabyte”)并且由于使用了eval看起来疯狂不安全。所以,功能正常,

    2. ruby - 使用 ruby​​ 将 HTML 转换为纯文本并维护结构/格式 - 2

      我想将html转换为纯文本。不过,我不想只删除标签,我想智能地保留尽可能多的格式。为插入换行符标签,检测段落并格式化它们等。输入非常简单,通常是格式良好的html(不是整个文档,只是一堆内容,通常没有anchor或图像)。我可以将几个正则表达式放在一起,让我达到80%,但我认为可能有一些现有的解决方案更智能。 最佳答案 首先,不要尝试为此使用正则表达式。很有可能你会想出一个脆弱/脆弱的解决方案,它会随着HTML的变化而崩溃,或者很难管理和维护。您可以使用Nokogiri快速解析HTML并提取文本:require'nokogiri'h

    3. ruby - 解析 RDFa、微数据等的最佳方式是什么,使用统一的模式/词汇(例如 schema.org)存储和显示信息 - 2

      我主要使用Ruby来执行此操作,但到目前为止我的攻击计划如下:使用gemsrdf、rdf-rdfa和rdf-microdata或mida来解析给定任何URI的数据。我认为最好映射到像schema.org这样的统一模式,例如使用这个yaml文件,它试图描述数据词汇表和opengraph到schema.org之间的转换:#SchemaXtoschema.orgconversion#data-vocabularyDV:name:namestreet-address:streetAddressregion:addressRegionlocality:addressLocalityphoto:i

    4. ruby - 将数组的内容转换为 int - 2

      我需要读入一个包含数字列表的文件。此代码读取文件并将其放入二维数组中。现在我需要获取数组中所有数字的平均值,但我需要将数组的内容更改为int。有什么想法可以将to_i方法放在哪里吗?ClassTerraindefinitializefile_name@input=IO.readlines(file_name)#readinfile@size=@input[0].to_i@land=[@size]x=1whilex 最佳答案 只需将数组映射为整数:@land边注如果你想得到一条线的平均值,你可以这样做:values=@input[x]

    5. ruby - 将散列转换为嵌套散列 - 2

      这道题是thisquestion的逆题.给定一个散列,每个键都有一个数组,例如{[:a,:b,:c]=>1,[:a,:b,:d]=>2,[:a,:e]=>3,[:f]=>4,}将其转换为嵌套哈希的最佳方法是什么{:a=>{:b=>{:c=>1,:d=>2},:e=>3,},:f=>4,} 最佳答案 这是一个迭代的解决方案,递归的解决方案留给读者作为练习:defconvert(h={})ret={}h.eachdo|k,v|node=retk[0..-2].each{|x|node[x]||={};node=node[x]}node[

    6. ruby-on-rails - 如何优雅地重启 thin + nginx? - 2

      我的瘦服务器配置了nginx,我的ROR应用程序正在它们上运行。在我发布代码更新时运行thinrestart会给我的应用程序带来一些停机时间。我试图弄清楚如何优雅地重启正在运行的Thin实例,但找不到好的解决方案。有没有人能做到这一点? 最佳答案 #Restartjustthethinserverdescribedbythatconfigsudothin-C/etc/thin/mysite.ymlrestartNginx将继续运行并代理请求。如果您将Nginx设置为使用多个上游服务器,例如server{listen80;server

    7. ruby - Infinity 和 NaN 的类型是什么? - 2

      我可以得到Infinity和NaNn=9.0/0#=>Infinityn.class#=>Floatm=0/0.0#=>NaNm.class#=>Float但是当我想直接访问Infinity或NaN时:Infinity#=>uninitializedconstantInfinity(NameError)NaN#=>uninitializedconstantNaN(NameError)什么是Infinity和NaN?它们是对象、关键字还是其他东西? 最佳答案 您看到打印为Infinity和NaN的只是Float类的两个特殊实例的字符串

    8. ruby - 检查方法参数的类型 - 2

      我不确定传递给方法的对象的类型是否正确。我可能会将一个字符串传递给一个只能处理整数的函数。某种运行时保证怎么样?我看不到比以下更好的选择:defsomeFixNumMangler(input)raise"wrongtype:integerrequired"unlessinput.class==FixNumother_stuffend有更好的选择吗? 最佳答案 使用Kernel#Integer在使用之前转换输入的方法。当无法以任何合理的方式将输入转换为整数时,它将引发ArgumentError。defmy_method(number)

    9. ruby - Ruby 有 `Pair` 数据类型吗? - 2

      有时我需要处理键/值数据。我不喜欢使用数组,因为它们在大小上没有限制(很容易不小心添加超过2个项目,而且您最终需要稍后验证大小)。此外,0和1的索引变成了魔数(MagicNumber),并且在传达含义方面做得很差(“当我说0时,我的意思是head...”)。散列也不合适,因为可能会不小心添加额外的条目。我写了下面的类来解决这个问题:classPairattr_accessor:head,:taildefinitialize(h,t)@head,@tail=h,tendend它工作得很好并且解决了问题,但我很想知道:Ruby标准库是否已经带有这样一个类? 最佳

    10. ruby-on-rails - Ruby url 到 html 链接转换 - 2

      我正在使用Rails构建一个简单的聊天应用程序。当用户输入url时,我希望将其输出为html链接(即“url”)。我想知道在Ruby中是否有任何库或众所周知的方法可以做到这一点。如果没有,我有一些不错的正则表达式示例代码可以使用... 最佳答案 查看auto_linkRails提供的辅助方法。这会将所有URL和电子邮件地址变成可点击的链接(htmlanchor标记)。这是文档中的代码示例。auto_link("Gotohttp://www.rubyonrails.organdsayhellotodavid@loudthinking.

    随机推荐