jjzjj

c - 如何解析通过/proc文件传递给内核模块的大量数据?

coder 2023-06-17 原文

编辑: 我发现 seq_file 可以轻松地将大量数据从内核写入用户空间。我正在寻找的是相反的;一种有助于从用户空间读取大量数据(多于一页)的 API。

编辑 2 :我正在将 <stdio.h> 端口实现为内核模块,该模块将能够打开类似于 /procFILE (以及以后的其他虚拟文件系统)并处理类似于 <stdio.h> 的输入和输出。您可以找到项目 here

我发现了很多关于内核如何将大量数据写入/proc(供用户空间程序使用)的问题,但反之则没有。让我详细说明:

这个问题基本上是关于输入被标记的算法(例如 int s 或 int 和字符串的混合等), 考虑到数据可能在多个缓冲区 之间被破坏。

例如,假设以下数据被发送到内核模块:

12345678 81234567 78123456 67812345 5678 1234 45678123 3456 7812 23456781

在这个例子中,假设 Linux 提供给/proc 处理程序的页面大小是 20 字节(与实际的 4KB 相比)。

从/proc 读取数据的函数(在内核模块中)然后将数据视为这样:
call 1:
"12345678 81234567 78"
call 2:
"123456 67812345 5678"
call 3:
" 1234 45678123 3456 "
call 4:
"7812 23456781"

如您所见,当在第一次调用中读取 78 时,它​​不应在下一帧之前进行处理,以决定 78 是整数还是帧之间的一个剪切。

现在我发现 seq_file 显然只适用于内核想要将数据写入用户而不是读取的情况(或者可能是 HOWTO 写得很糟糕)。

我做了什么

到目前为止,我已经有了以下解决方案(我是凭内存写的,所以我可能会错过一些错误检查,但请耐心等待):

在初始化阶段(比如 init_module ):
initialize mutex1 to 1 and mutex2 to 0
create /proc entry
call data_processor

/proc 阅读器:
1. down(mutex1)    /* down_interruptible of course, but let's not get into details */

2. copy_from_user to an internal buffer
   buffer_index = 0
   data_length = whatever the size is

3. strip spaces from end of buffer (except if all left from buffer is 1 space)
   if so, there_was_space_after = 1 else 0

4. up(mutex2)

我稍后会解释为什么我要去掉空格
get_int 函数:
wait_for_next = 0
number_was_cut = 0
last_number = 0

do
{
    1. down(mutex2)

    2. if (number_was_cut && !isdigit(buffer[buffer_index]))
           break     /* turns out it wasn't really cut
                        as beginning of next buffer is ' ' */
       number_was_cut = 0
       wait_for_next = 0

    3. while (buffer_index < data_length && !isdigit(buffer_index[buffer_index]))
           ++buffer_index;    /* skip white space */

    4. while (buffer_index < data_length && isdigit(buffer[buffer_index]))
           last_number = last_number * 10 + buffer[buffer_index++] - '0';

    5. if (buffer_index >= data_length && !there_was_space_after)
           number_was_cut = 1
           wait_for_next = 1
           up(mutex1)         /* let more data come in */
       else
           up(mutex2)         /* let get_int continue */
           break
} while (wait_for_next)

return last_number
data_processor 函数(例如):
int first_num = get_int()
int sencod_num = get_int()
for i = first_num to second_num
    do_whatever(get_int())

解释: 首先看 data_processor 。它不涉及如何读取数据的复杂性,因此它只获取整数并对其进行任何它想做的事情。现在让我们看看/proc 阅读器。它基本上等待 data_processor 调用 get_int 足够多的时间来消耗所有当前数据(步骤 1),然后将下一个缓冲区复制到内部存储器中,允许 data_processor 继续(步骤 2)。然后它需要去除尾随空格,以便可以稍微简化 get_int(步骤 3)。最后,它向 get_int 发出信号,表示它可以开始读取数据(步骤 4)。
get_int 函数首先等待数据到达(第 1 步),(暂时忽略第 2 步)它跳过任何不需要的字符(第 3 步),然后开始读取数字(第 4 步)。读完数字有两种可能;到达缓冲区的末尾(在这种情况下,如果/proc 读取器没有去除任何空格,则数字 可以在帧之间剪切 )或遇到空白。在前一种情况下,它需要向/proc reader 发出信号以读取更多数据,并等待另一个循环将剩余的数字附加到当前数据上,在后一种情况下,它返回数字(第 5 步)。如果从上一帧继续,请检查新帧是否以数字开头。如果不是,那么前一个数字实际上是一个整数,应该返回。否则,它需要继续将数字附加到最后一个数字(步骤 2)。

问题

这种方法的主要问题是过于复杂 。添加 get_string 时会变得更加复杂,或者读取的整数可能是十六进制等。基本上,您必须重新发明 sscanf !请注意,在 sscanf 的第 4 步的这个简单示例中,可以使用 get_int 而不是 while 循环(或者也可以使用 get_string ,但是当也可以使用十六进制输入时,这会变得更加棘手(假设十六进制数在 0 和 x0212ae4 之间被截断) . 即便如此,它只是替换了 get_int 的第 4 步,其余内容仍应保留。

它实际上给我带来了许多错误和繁重的测试,以完善所有特殊情况。这是我觉得它不优雅的另一个原因。

问题

我想知道是否有更好的方法来处理这个问题。我知道使用共享内存可能是一种选择,但我正在为这项任务寻找一种算法(更多是出于好奇,因为我已经有了我的工作解决方案)。进一步来说:
  • 在 Linux 内核中是否有一种已经实现的方法可以像普通的 CFILE 一样处理,您可以从中获取数据并处理将数据分解为页面本身?
  • 如果不是,我是不是把事情复杂化了,我是否错过了一个明显的简单解决方案?
  • 我相信 fscanf 面临类似的问题。这是怎么处理的?

  • 附带问题:我在互斥锁上阻塞/proc 读取器是一件可怕的事情吗?我的意思是,写入数据可能会阻塞,但我不确定这通常发生在用户空间还是内核空间。

    最佳答案

    您可能对 request_firmware() 接口(interface)感兴趣;整个事情在交给你之前就被内核缓冲了。

    否则,也许 sysfs 二进制属性接口(interface)比 proc 更有用?

    关于c - 如何解析通过/proc文件传递给内核模块的大量数据?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/9831567/

    有关c - 如何解析通过/proc文件传递给内核模块的大量数据?的更多相关文章

    1. ruby - 如何使用 Nokogiri 的 xpath 和 at_xpath 方法 - 2

      我正在学习如何使用Nokogiri,根据这段代码我遇到了一些问题:require'rubygems'require'mechanize'post_agent=WWW::Mechanize.newpost_page=post_agent.get('http://www.vbulletin.org/forum/showthread.php?t=230708')puts"\nabsolutepathwithtbodygivesnil"putspost_page.parser.xpath('/html/body/div/div/div/div/div/table/tbody/tr/td/div

    2. ruby - 如何从 ruby​​ 中的字符串运行任意对象方法? - 2

      总的来说,我对ruby​​还比较陌生,我正在为我正在创建的对象编写一些rspec测试用例。许多测试用例都非常基础,我只是想确保正确填充和返回值。我想知道是否有办法使用循环结构来执行此操作。不必为我要测试的每个方法都设置一个assertEquals。例如:describeitem,"TestingtheItem"doit"willhaveanullvaluetostart"doitem=Item.new#HereIcoulddotheitem.name.shouldbe_nil#thenIcoulddoitem.category.shouldbe_nilendend但我想要一些方法来使用

    3. Ruby 解析字符串 - 2

      我有一个字符串input="maybe(thisis|thatwas)some((nice|ugly)(day|night)|(strange(weather|time)))"Ruby中解析该字符串的最佳方法是什么?我的意思是脚本应该能够像这样构建句子:maybethisissomeuglynightmaybethatwassomenicenightmaybethiswassomestrangetime等等,你明白了......我应该一个字符一个字符地读取字符串并构建一个带有堆栈的状态机来存储括号值以供以后计算,还是有更好的方法?也许为此目的准备了一个开箱即用的库?

    4. ruby - 使用 RubyZip 生成 ZIP 文件时设置压缩级别 - 2

      我有一个Ruby程序,它使用rubyzip压缩XML文件的目录树。gem。我的问题是文件开始变得很重,我想提高压缩级别,因为压缩时间不是问题。我在rubyzipdocumentation中找不到一种为创建的ZIP文件指定压缩级别的方法。有人知道如何更改此设置吗?是否有另一个允许指定压缩级别的Ruby库? 最佳答案 这是我通过查看ruby​​zip内部创建的代码。level=Zlib::BEST_COMPRESSIONZip::ZipOutputStream.open(zip_file)do|zip|Dir.glob("**/*")d

    5. ruby - 其他文件中的 Rake 任务 - 2

      我试图在一个项目中使用rake,如果我把所有东西都放到Rakefile中,它会很大并且很难读取/找到东西,所以我试着将每个命名空间放在lib/rake中它自己的文件中,我添加了这个到我的rake文件的顶部:Dir['#{File.dirname(__FILE__)}/lib/rake/*.rake'].map{|f|requiref}它加载文件没问题,但没有任务。我现在只有一个.rake文件作为测试,名为“servers.rake”,它看起来像这样:namespace:serverdotask:testdoputs"test"endend所以当我运行rakeserver:testid时

    6. ruby-on-rails - 在 Rails 中将文件大小字符串转换为等效千字节 - 2

      我的目标是转换表单输入,例如“100兆字节”或“1GB”,并将其转换为我可以存储在数据库中的文件大小(以千字节为单位)。目前,我有这个:defquota_convert@regex=/([0-9]+)(.*)s/@sizes=%w{kilobytemegabytegigabyte}m=self.quota.match(@regex)if@sizes.include?m[2]eval("self.quota=#{m[1]}.#{m[2]}")endend这有效,但前提是输入是倍数(“gigabytes”,而不是“gigabyte”)并且由于使用了eval看起来疯狂不安全。所以,功能正常,

    7. python - 如何使用 Ruby 或 Python 创建一系列高音调和低音调的蜂鸣声? - 2

      关闭。这个问题是opinion-based.它目前不接受答案。想要改进这个问题?更新问题,以便editingthispost可以用事实和引用来回答它.关闭4年前。Improvethisquestion我想在固定时间创建一系列低音和高音调的哔哔声。例如:在150毫秒时发出高音调的蜂鸣声在151毫秒时发出低音调的蜂鸣声200毫秒时发出低音调的蜂鸣声250毫秒的高音调蜂鸣声有没有办法在Ruby或Python中做到这一点?我真的不在乎输出编码是什么(.wav、.mp3、.ogg等等),但我确实想创建一个输出文件。

    8. ruby-on-rails - Rails 3 中的多个路由文件 - 2

      Rails2.3可以选择随时使用RouteSet#add_configuration_file添加更多路由。是否可以在Rails3项目中做同样的事情? 最佳答案 在config/application.rb中:config.paths.config.routes在Rails3.2(也可能是Rails3.1)中,使用:config.paths["config/routes"] 关于ruby-on-rails-Rails3中的多个路由文件,我们在StackOverflow上找到一个类似的问题

    9. ruby-on-rails - 如何验证 update_all 是否实际在 Rails 中更新 - 2

      给定这段代码defcreate@upgrades=User.update_all(["role=?","upgraded"],:id=>params[:upgrade])redirect_toadmin_upgrades_path,:notice=>"Successfullyupgradeduser."end我如何在该操作中实际验证它们是否已保存或未重定向到适当的页面和消息? 最佳答案 在Rails3中,update_all不返回任何有意义的信息,除了已更新的记录数(这可能取决于您的DBMS是否返回该信息)。http://ar.ru

    10. ruby-on-rails - 'compass watch' 是如何工作的/它是如何与 rails 一起使用的 - 2

      我在我的项目目录中完成了compasscreate.和compassinitrails。几个问题:我已将我的.sass文件放在public/stylesheets中。这是放置它们的正确位置吗?当我运行compasswatch时,它不会自动编译这些.sass文件。我必须手动指定文件:compasswatchpublic/stylesheets/myfile.sass等。如何让它自动运行?文件ie.css、print.css和screen.css已放在stylesheets/compiled。如何在编译后不让它们重新出现的情况下删除它们?我自己编译的.sass文件编译成compiled/t

    随机推荐