jjzjj

java - 如何确定ThreadPoolTask​​Executor池和队列大小?

coder 2024-03-11 原文

关于如何确定线程池大小,这可能是一个更笼统的问题,但是在这种情况下,让我们使用Spring ThreadPoolTaskExecutor。对于池核心,最大大小和队列容量,我具有以下配置。我已经了解了所有这些配置的含义-here是一个很好的答案。

    @SpringBootApplication
    @EnableAsync
    public class MySpringBootApp {

        public static void main(String[] args) {
            ApplicationContext ctx = SpringApplication.run(MySpringBootApp.class, args);
        }

        @Bean
        public TaskExecutor taskExecutor() {
            ThreadPoolTaskExecutor executor = new ThreadPoolTaskExecutor();
            executor.setCorePoolSize(5);
            executor.setMaxPoolSize(10);
            executor.setQueueCapacity(25);
            return executor;
        }

    }

以上数字对我来说似乎是随机的,我想了解如何根据我的环境正确设置它们。我将概述以下约束:
  • 该应用程序将在两核CPU盒上运行
  • 执行者将执行通常需要大约1-2的任务
    秒完成。
  • 通常,我希望将800/min的任务提交给我的执行者,峰值为2500/min
  • 该任务将构造一些对象,并对Google pubsub进行HTTP调用。

  • 理想情况下,我想了解我需要考虑的其他限制,并根据这些限制对我的池和队列大小进行合理的配置。

    最佳答案

    更新:多年来,这个答案获得了几票,所以我为那些没有时间阅读我的奇怪比喻的人们添加了一个简短的版本:

    TL; DR答案:

    实际的限制是(逻辑)CPU内核只能同时运行一个线程。因此 :

  • 核心数:CPU的逻辑核心数* 1/(ratio_of_time_your_thread_is_runnable_when_doing_your_task)

  • 因此,如果您的计算机上有8个逻辑核心,则可以安全地将8个线程放入您的threadPool中(好吧,请记住排除可能使用的其他线程)。然后,您需要问自己是否可以投入更多:您需要对打算在线程池上运行的任务进行基准测试:如果您发现线程平均仅运行50%的时间,则意味着您的CPU处于运行状态。有50%的时间可以自由地在另一个线程上工作,您可以添加更多线程。
  • 队列大小:可以等待的数量。

  • 队列大小是您的threadPool在拒绝之前将接受的项目数。这是业务逻辑。这取决于您期望的行为:接受十亿个任务是否有意义?你什么时候丢毛巾?
    如果一项任务需要一秒钟才能完成,并且您有10个线程,则意味着队列中的第10,000个任务有望在1000秒内完成。可以接受吗?
    最糟糕的事情是让客户端超时并在完成第一个任务之前重新提交相同的任务。

    ELI12原始答案:

    这可能不是最准确的答案,但我会尝试:

    一种简单的方法是要知道您的2核CPU将只能同时在两个线程上工作。

    如果您具有相对较新的 Intel CPU,并且已打开超线程(aka。 HT (TM), HTT (TM), SMT )(通过BIOS中的设置),则您的操作系统将看到可用核心数是CPU中物理核心数的两倍。

    无论哪种方式,都可以通过int cores = Runtime.getRuntime().availableProcessors();从Java中检测可以使用多少个内核(或同时进行其他线程抢占)。

    如果您尝试将您的应用程序视为 Workshop (实际的一种):
  • 处理器将由一名员工代表。它是将为产品增值的物理单位。
  • 一个任务将是一大堆原 Material (加上一些说明列表)
  • 您的线程是一张桌子,员工可以在上面放置任务并进行工作。
  • 队列大小是将原 Material 带到办公桌的传送带的长度。

  • 因此,您的问题变成“在雇员人数不变的情况下,我如何选择多少张桌子以及传送带可以在工厂内停留多长时间?”。

    有关多少个桌子(线程)部分:

    一名员工一次只能在一个办公桌上工作,而每个办公桌只能有一个员工。因此,基本设置是至少要有与员工一样多的办公桌(以避免没有任何员工(处理器)而无法工作)。

    但是,根据您的 Activity ,您可能会为每个员工提供更多的办公桌:

    如果希望您的员工将邮件不断地放入信封中,则需要他们全神贯注的操作(在编程中:对集合进行排序,创建对象,递增计数器),增加办公桌数量将无济于事,甚至可能有害,因为您的员工会必须
    有时需要更改工作台(切换上下文需要花费一些时间),因此留下他们正在处理的工作,以使工作在另一个工作上进行。

    但是,如果您的任务是制作陶器,并且依靠您的员工等待粘土在烤箱中煮熟(了解访问外部资源(例如文件系统,Web服务等)的权限),那么您的员工就可以进行建模在另一张桌子上黏土,然后回到第一张桌子。

    因此,只要您的任务的 Activity 工作/等待比率(运行/等待)足够大,您就可以为每个员工提供更多的服务台。办公桌的数量就是您的员工在等待时间内可以完成多少任务。

    用于传送带(队列)大小的部分:

    队列大小表示允许您开始拒绝任何其他任务(通过引发异常)之前要排队的项目数量,因此是您开始告诉“好吧,我已经被超额预定并且永远不会出现的阈值”能够遵守”

    首先,我想说您的传送带需要安装在车间内。这意味着集合应该足够小以防止内存不足错误(显然)。

    之后,它基于您的公司策略。假设每次客户下订单时一项任务都会添加到皮带上(另一个服务调用您的API)。如果调用者不在乎您花费多少时间来遵守和信任您对执行的要求,那么就没有必要限制皮带的大小了。

    但是,如果您可以期待您的客户在等待一个月的陶器后会感到烦恼,并且假设您丢失了第一笔订单,并且不会打扰检查第一笔订单是否被打扰,那么您就可以并发您或重新订购另一只陶器。完成...第一笔订单一无所获,您将无法获得付款,如果您的客户在您太慢而无法遵守时又下了另一笔订单,您将进入反馈循环,因为每条新订单都会减慢速度整个过程。

    因此,在这种情况下,您应该贴上一个标语,告诉您的客户“对不起,我们已经被超额预订,您现在不应该再下任何新订单,因为我们将无法在可接受的时间范围内遵守”。

    然后,队列大小将为:可接受的时间范围/完成任务的时间。

    具体示例:如果您的客户服务期望提交的任务必须在不到100秒的时间内完成,并且知道每个任务都需要1-2秒,则应该将队列限制为50-100个任务,因为一旦您拥有100个在队列中等待的任务,您可以确定下一个任务将在不到100秒的时间内完成,因此拒绝了该任务以防止服务无所事事。

    关于java - 如何确定ThreadPoolTask​​Executor池和队列大小?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/43874079/

    有关java - 如何确定ThreadPoolTask​​Executor池和队列大小?的更多相关文章

    1. ruby - 如何使用 Nokogiri 的 xpath 和 at_xpath 方法 - 2

      我正在学习如何使用Nokogiri,根据这段代码我遇到了一些问题:require'rubygems'require'mechanize'post_agent=WWW::Mechanize.newpost_page=post_agent.get('http://www.vbulletin.org/forum/showthread.php?t=230708')puts"\nabsolutepathwithtbodygivesnil"putspost_page.parser.xpath('/html/body/div/div/div/div/div/table/tbody/tr/td/div

    2. ruby - 如何从 ruby​​ 中的字符串运行任意对象方法? - 2

      总的来说,我对ruby​​还比较陌生,我正在为我正在创建的对象编写一些rspec测试用例。许多测试用例都非常基础,我只是想确保正确填充和返回值。我想知道是否有办法使用循环结构来执行此操作。不必为我要测试的每个方法都设置一个assertEquals。例如:describeitem,"TestingtheItem"doit"willhaveanullvaluetostart"doitem=Item.new#HereIcoulddotheitem.name.shouldbe_nil#thenIcoulddoitem.category.shouldbe_nilendend但我想要一些方法来使用

    3. ruby-on-rails - 在 Rails 中将文件大小字符串转换为等效千字节 - 2

      我的目标是转换表单输入,例如“100兆字节”或“1GB”,并将其转换为我可以存储在数据库中的文件大小(以千字节为单位)。目前,我有这个:defquota_convert@regex=/([0-9]+)(.*)s/@sizes=%w{kilobytemegabytegigabyte}m=self.quota.match(@regex)if@sizes.include?m[2]eval("self.quota=#{m[1]}.#{m[2]}")endend这有效,但前提是输入是倍数(“gigabytes”,而不是“gigabyte”)并且由于使用了eval看起来疯狂不安全。所以,功能正常,

    4. python - 如何使用 Ruby 或 Python 创建一系列高音调和低音调的蜂鸣声? - 2

      关闭。这个问题是opinion-based.它目前不接受答案。想要改进这个问题?更新问题,以便editingthispost可以用事实和引用来回答它.关闭4年前。Improvethisquestion我想在固定时间创建一系列低音和高音调的哔哔声。例如:在150毫秒时发出高音调的蜂鸣声在151毫秒时发出低音调的蜂鸣声200毫秒时发出低音调的蜂鸣声250毫秒的高音调蜂鸣声有没有办法在Ruby或Python中做到这一点?我真的不在乎输出编码是什么(.wav、.mp3、.ogg等等),但我确实想创建一个输出文件。

    5. ruby-on-rails - 如何验证 update_all 是否实际在 Rails 中更新 - 2

      给定这段代码defcreate@upgrades=User.update_all(["role=?","upgraded"],:id=>params[:upgrade])redirect_toadmin_upgrades_path,:notice=>"Successfullyupgradeduser."end我如何在该操作中实际验证它们是否已保存或未重定向到适当的页面和消息? 最佳答案 在Rails3中,update_all不返回任何有意义的信息,除了已更新的记录数(这可能取决于您的DBMS是否返回该信息)。http://ar.ru

    6. ruby-on-rails - 'compass watch' 是如何工作的/它是如何与 rails 一起使用的 - 2

      我在我的项目目录中完成了compasscreate.和compassinitrails。几个问题:我已将我的.sass文件放在public/stylesheets中。这是放置它们的正确位置吗?当我运行compasswatch时,它不会自动编译这些.sass文件。我必须手动指定文件:compasswatchpublic/stylesheets/myfile.sass等。如何让它自动运行?文件ie.css、print.css和screen.css已放在stylesheets/compiled。如何在编译后不让它们重新出现的情况下删除它们?我自己编译的.sass文件编译成compiled/t

    7. ruby - 如何将脚本文件的末尾读取为数据文件(Perl 或任何其他语言) - 2

      我正在寻找执行以下操作的正确语法(在Perl、Shell或Ruby中):#variabletoaccessthedatalinesappendedasafileEND_OF_SCRIPT_MARKERrawdatastartshereanditcontinues. 最佳答案 Perl用__DATA__做这个:#!/usr/bin/perlusestrict;usewarnings;while(){print;}__DATA__Texttoprintgoeshere 关于ruby-如何将脚

    8. ruby - 如何指定 Rack 处理程序 - 2

      Rackup通过Rack的默认处理程序成功运行任何Rack应用程序。例如:classRackAppdefcall(environment)['200',{'Content-Type'=>'text/html'},["Helloworld"]]endendrunRackApp.new但是当最后一行更改为使用Rack的内置CGI处理程序时,rackup给出“NoMethodErrorat/undefinedmethod`call'fornil:NilClass”:Rack::Handler::CGI.runRackApp.newRack的其他内置处理程序也提出了同样的反对意见。例如Rack

    9. ruby - 如何每月在 Heroku 运行一次 Scheduler 插件? - 2

      在选择我想要运行操作的频率时,唯一的选项是“每天”、“每小时”和“每10分钟”。谢谢!我想为我的Rails3.1应用程序运行调度程序。 最佳答案 这不是一个优雅的解决方案,但您可以安排它每天运行,并在实际开始工作之前检查日期是否为当月的第一天。 关于ruby-如何每月在Heroku运行一次Scheduler插件?,我们在StackOverflow上找到一个类似的问题: https://stackoverflow.com/questions/8692687/

    10. ruby-on-rails - 如何从 format.xml 中删除 <hash></hash> - 2

      我有一个对象has_many应呈现为xml的子对象。这不是问题。我的问题是我创建了一个Hash包含此数据,就像解析器需要它一样。但是rails自动将整个文件包含在.........我需要摆脱type="array"和我该如何处理?我没有在文档中找到任何内容。 最佳答案 我遇到了同样的问题;这是我的XML:我在用这个:entries.to_xml将散列数据转换为XML,但这会将条目的数据包装到中所以我修改了:entries.to_xml(root:"Contacts")但这仍然将转换后的XML包装在“联系人”中,将我的XML代码修改为

    随机推荐