我正在做一个项目,我需要通过 TCP/IP 协议(protocol)与设备通信。 该设备发送大量数据,我想以某种方式将其解析为一些对象/结构。
数据包示例(在 TCP buffer[] 中):
[64] [1] [78] [244] [77] [189] [249] [149] hcurrent
[64] [1] [78] [247] [89] [95] [104] [85] htarget
[0] [0] [0] [0] [0] [0] [0] [0] qcurrent
[188] [220] [97] [3] [66] [62] [0] [0] kcurrent
[66] [0] [102] [103] [66] [99][153] [154] mcurrent
[253] [191] [246] [74] [170] [216] [242] [29] fmode
[102] [191] [246] [74] [178] [44] [92] [72] tmil
[137] mode
现在这个包框架被标识为:
double hcurrent
double htarget
double qcurrent
float kcurrent
float mcurrent
float fmode
float tmil
unsigned char mode
我的想法是,我可以通过某种方式将数据直接解析为结构与上述结构相同的结构。 当然,需要识别一些关键值来确定它是哪种数据。
如何做到这一点?
因为我正在为 iOS 设备编码,所以它必须是 Objective-C 或 C(++)。
编辑(将数据报的每个部分复制到结构中的测试方法):
我尝试读取前 4 个字节的小型 Java 实现 [0] [0] [1] [5]:
byte[] read = new byte[4];
int length = 0;
while (length < read.length) {
len = iStream.read(read, len, read.length);
}
int ByteLength = (int)unsignedIntToLong(read);
ByteLength = ByteLength-5;
state = 1; // Continue and work with next data.
以及位操作方法:
public long unsignedIntToLong(byte[] b)
{
long l = 0;
l |= b[0] & 0xFF;
l <<= 8;
l |= b[1] & 0xFF;
l <<= 8;
l |= b[2] & 0xFF;
l <<= 8;
l |= b[3] & 0xFF;
return l;
}
所以我获取了我之前提到的前 4 个字节,它确定了一些特定的东西,最后找到了 465 的长度。我的计划是对接收到的数据的所有其他部分重复此过程。
最佳答案
您将遇到的最大问题是结构不以完全连续的形式存储数据,它们对齐数据 acording to word boundaries
这意味着如果缓冲区不包含开始的结构,您不能简单地定义一个结构然后将 buffer[] 转换为它。相反,您可能需要做的是声明一个结构,然后使用指向缓冲区 [] 的指针偏移一次将缓冲区 [] 的每个部分 memcpy 到一个字段中。
如果这种方法太麻烦,通常可以关闭结构对齐,以便结构可以表示完全打包的数据。 MSVC 允许使用 #pragma pack去做这个。然而,这种方法确实会减慢对结构的内存访问。
编辑:这是一个示例,展示了如何使用模板函数从缓冲区中读取任何类型,然后将偏移量更新到该缓冲区中。您可以使用此方法安全地将任意数量的类型一一解析为结构:
// We want to copy raw data to this structure
// but the short will cause it to be unaligned
struct _parsed_structure
{
int a;
int b;
short c;
int d;
} parsed_structure;
template<typename T>
void read_and_update_offset (int & offset, char * buffer, T & var)
{
T * pInt = (T*)(buffer + offset);
var = *pInt;
offset += sizeof(T);
};
int _tmain(int argc, _TCHAR* argv[])
{
// Here's a buffer which we know contains ints and shorts, we could just cast it to our structure
// but this will cause errors because the structure will not be aligned properly.
char buffer[] = { 1, 0, 0, 0, 2, 0, 0, 0, 3, 0, 4, 0, 0, 0 };
// Read the first int from the buffer into the structure
int offset = 0;
read_and_update_offset(offset, buffer, parsed_structure.a);
read_and_update_offset(offset, buffer, parsed_structure.b);
read_and_update_offset(offset, buffer, parsed_structure.c);
read_and_update_offset(offset, buffer, parsed_structure.d);
// Print the values
std::cout <<
parsed_structure.a << " " <<
parsed_structure.b << " " <<
parsed_structure.c << " " <<
parsed_structure.d << " " << std::endl;
// Look the size of our structure is different than the size of our buffer due to alignment
std::cout <<
"sizeof(buffer)" << "==" << sizeof(buffer) << " " <<
"sizeof(parsed_structure)" << "==" << sizeof(parsed_structure) << std::endl;
return 0;
}
关于c++ - 将数据解析为结构,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/10394951/
我有一个字符串input="maybe(thisis|thatwas)some((nice|ugly)(day|night)|(strange(weather|time)))"Ruby中解析该字符串的最佳方法是什么?我的意思是脚本应该能够像这样构建句子:maybethisissomeuglynightmaybethatwassomenicenightmaybethiswassomestrangetime等等,你明白了......我应该一个字符一个字符地读取字符串并构建一个带有堆栈的状态机来存储括号值以供以后计算,还是有更好的方法?也许为此目的准备了一个开箱即用的库?
我想将html转换为纯文本。不过,我不想只删除标签,我想智能地保留尽可能多的格式。为插入换行符标签,检测段落并格式化它们等。输入非常简单,通常是格式良好的html(不是整个文档,只是一堆内容,通常没有anchor或图像)。我可以将几个正则表达式放在一起,让我达到80%,但我认为可能有一些现有的解决方案更智能。 最佳答案 首先,不要尝试为此使用正则表达式。很有可能你会想出一个脆弱/脆弱的解决方案,它会随着HTML的变化而崩溃,或者很难管理和维护。您可以使用Nokogiri快速解析HTML并提取文本:require'nokogiri'h
我主要使用Ruby来执行此操作,但到目前为止我的攻击计划如下:使用gemsrdf、rdf-rdfa和rdf-microdata或mida来解析给定任何URI的数据。我认为最好映射到像schema.org这样的统一模式,例如使用这个yaml文件,它试图描述数据词汇表和opengraph到schema.org之间的转换:#SchemaXtoschema.orgconversion#data-vocabularyDV:name:namestreet-address:streetAddressregion:addressRegionlocality:addressLocalityphoto:i
我正在使用ruby1.9解析以下带有MacRoman字符的csv文件#encoding:ISO-8859-1#csv_parse.csvName,main-dialogue"Marceu","Giveittohimóhe,hiswife."我做了以下解析。require'csv'input_string=File.read("../csv_parse.rb").force_encoding("ISO-8859-1").encode("UTF-8")#=>"Name,main-dialogue\r\n\"Marceu\",\"Giveittohim\x97he,hiswife.\"\
我的瘦服务器配置了nginx,我的ROR应用程序正在它们上运行。在我发布代码更新时运行thinrestart会给我的应用程序带来一些停机时间。我试图弄清楚如何优雅地重启正在运行的Thin实例,但找不到好的解决方案。有没有人能做到这一点? 最佳答案 #Restartjustthethinserverdescribedbythatconfigsudothin-C/etc/thin/mysite.ymlrestartNginx将继续运行并代理请求。如果您将Nginx设置为使用多个上游服务器,例如server{listen80;server
有时我需要处理键/值数据。我不喜欢使用数组,因为它们在大小上没有限制(很容易不小心添加超过2个项目,而且您最终需要稍后验证大小)。此外,0和1的索引变成了魔数(MagicNumber),并且在传达含义方面做得很差(“当我说0时,我的意思是head...”)。散列也不合适,因为可能会不小心添加额外的条目。我写了下面的类来解决这个问题:classPairattr_accessor:head,:taildefinitialize(h,t)@head,@tail=h,tendend它工作得很好并且解决了问题,但我很想知道:Ruby标准库是否已经带有这样一个类? 最佳
简而言之错误:NOTE:Gem::SourceIndex#add_specisdeprecated,useSpecification.add_spec.Itwillberemovedonorafter2011-11-01.Gem::SourceIndex#add_speccalledfrom/opt/local/lib/ruby/site_ruby/1.8/rubygems/source_index.rb:91./opt/local/lib/ruby/gems/1.8/gems/rails-2.3.8/lib/rails/gem_dependency.rb:275:in`==':und
给定一个复杂的对象层次结构,幸运的是它不包含循环引用,我如何实现支持各种格式的序列化?我不是来讨论实际实现的。相反,我正在寻找可能会派上用场的设计模式提示。更准确地说:我正在使用Ruby,我想解析XML和JSON数据以构建复杂的对象层次结构。此外,应该可以将该层次结构序列化为JSON、XML和可能的HTML。我可以为此使用Builder模式吗?在任何提到的情况下,我都有某种结构化数据-无论是在内存中还是文本中-我想用它来构建其他东西。我认为将序列化逻辑与实际业务逻辑分开会很好,这样我以后就可以轻松支持多种XML格式。 最佳答案 我最
我正在尝试使用Curbgem执行以下POST以解析云curl-XPOST\-H"X-Parse-Application-Id:PARSE_APP_ID"\-H"X-Parse-REST-API-Key:PARSE_API_KEY"\-H"Content-Type:image/jpeg"\--data-binary'@myPicture.jpg'\https://api.parse.com/1/files/pic.jpg用这个:curl=Curl::Easy.new("https://api.parse.com/1/files/lion.jpg")curl.multipart_form_
无论您是想搭建桌面端、WEB端或者移动端APP应用,HOOPSPlatform组件都可以为您提供弹性的3D集成架构,同时,由工业领域3D技术专家组成的HOOPS技术团队也能为您提供技术支持服务。如果您的客户期望有一种在多个平台(桌面/WEB/APP,而且某些客户端是“瘦”客户端)快速、方便地将数据接入到3D应用系统的解决方案,并且当访问数据时,在各个平台上的性能和用户体验保持一致,HOOPSPlatform将帮助您完成。利用HOOPSPlatform,您可以开发在任何环境下的3D基础应用架构。HOOPSPlatform可以帮您打造3D创新型产品,HOOPSSDK包含的技术有:快速且准确的CAD