mysql - 根据时间从多个表中获取最接近数据的最快方法

coder 2023-10-14 原文

我有三个表，具有以下设置:

TEMPERATURE_1
  time
  zone (FK)
  temperature
TEMPERATURE_2
  time
  zone (FK)
  temperature
TEMPERATURE_3
  time
  zone (FK)
  temperature

每个表中的数据会定期更新，但不一定同时更新(即时间条目不相同)。

我希望每次都能访问每个表中最接近的读数，即:

TEMPERATURES
  time
  zone (FK)
  temperature_1
  temperature_2
  temperature_3

换句话说，对于我的三个表中的每个唯一时间，我都希望在 TEMPERATURES 表中有一行，其中 temperature_n 值是每个原始表中在时间上最接近的温度读数。

目前，我使用两个 View 进行设置:

create view temptimes
as select time, zone 
  from temperature_1
union
  select time, zone
  from temperature_2
union
  select time, zone
  from temperature_3;

create view temperatures
as select tt.time,
          tt.zone,
          (select temperature 
           from temperature_1
           order by abs(timediff(time, tt.time))
           limit 1) as temperature_1,
          (select temperature 
           from temperature_2
           order by abs(timediff(time, tt.time))
           limit 1) as temperature_2,
          (select temperature 
           from temperature_3
           order by abs(timediff(time, tt.time))
           limit 1) as temperature_3,
from temptimes as tt
order by tt.time;

这种方法可行，但在生产中使用速度太慢(对于每个温度约 1000 条记录的小数据集，需要几分钟以上)。

我对 SQL 不是很了解，所以我确信我没有找到执行此操作的正确方法。我应该如何解决这个问题？

最佳答案

昂贵的部分是相关子查询必须计算每个 temperature_* 表的每一行的时间差，以便为 找到一个最近的行主查询中一个行的一个列。

如果您可以根据索引仅选择当前时间之后的一行和当前时间之前的一行，那将会快得多计算这两个候选人的时间差。要使其快速，您需要的只是表中 time 列的索引。

我忽略了 zone 列，因为它在问题中的作用还不清楚，它只会给核心问题增加更多噪音。应该很容易添加到查询中。

没有额外的 View ，这个查询一次完成:

SELECT time ,COALESCE(temp1 ,CASE WHEN timediff(time, time1a) > timediff(time1b, time) THEN (SELECT t.temperature FROM temperature_1 t WHERE t.time = y.time1b) ELSE (SELECT t.temperature FROM temperature_1 t WHERE t.time = y.time1a) END) AS temp1 ,COALESCE(temp2 ,CASE WHEN timediff(time, time2a) > timediff(time2b, time) THEN (SELECT t.temperature FROM temperature_2 t WHERE t.time = y.time2b) ELSE (SELECT t.temperature FROM temperature_2 t WHERE t.time = y.time2a) END) AS temp2 ,COALESCE(temp3 ,CASE WHEN timediff(time, time3a) > timediff(time3b, time) THEN (SELECT t.temperature FROM temperature_3 t WHERE t.time = y.time3b) ELSE (SELECT t.temperature FROM temperature_3 t WHERE t.time = y.time3a) END) AS temp3 FROM ( SELECT time ,max(t1) AS temp1 ,max(t2) AS temp2 ,max(t3) AS temp3 ,CASE WHEN max(t1) IS NULL THEN (SELECT t.time FROM temperature_1 t WHERE t.time < x.time ORDER BY t.time DESC LIMIT 1) ELSE NULL END AS time1a ,CASE WHEN max(t1) IS NULL THEN (SELECT t.time FROM temperature_1 t WHERE t.time > x.time ORDER BY t.time LIMIT 1) ELSE NULL END AS time1b ,CASE WHEN max(t2) IS NULL THEN (SELECT t.time FROM temperature_2 t WHERE t.time < x.time ORDER BY t.time DESC LIMIT 1) ELSE NULL END AS time2a ,CASE WHEN max(t2) IS NULL THEN (SELECT t.time FROM temperature_2 t WHERE t.time > x.time ORDER BY t.time LIMIT 1) ELSE NULL END AS time2b ,CASE WHEN max(t3) IS NULL THEN (SELECT t.time FROM temperature_3 t WHERE t.time < x.time ORDER BY t.time DESC LIMIT 1) ELSE NULL END AS time3a ,CASE WHEN max(t3) IS NULL THEN (SELECT t.time FROM temperature_3 t WHERE t.time > x.time ORDER BY t.time LIMIT 1) ELSE NULL END AS time3b FROM ( SELECT time, temperature AS t1, NULL AS t2, NULL AS t3 FROM temperature_1 UNION ALL SELECT time, NULL AS t1, temperature AS t2, NULL AS t3 FROM temperature_2 UNION ALL SELECT time, NULL AS t1, NULL AS t2, temperature AS t3 FROM temperature_3 ) AS x GROUP BY time ) y ORDER BY time;

->sqlfiddle

解释

suqquery x 替换您的 View temptimes 并将温度带入结果。如果所有三个表都同步并且具有所有相同时间点的温度，则甚至不需要其余部分并且速度非常快。
对于三个表中的一个没有行的每个时间点，将按照指示获取温度:从每个表中取出“最接近”的一个。

suqquery y 聚合来自 x 的行并获取上一次 (time1a) 和下一次 (time1b) 根据缺少温度的每个表中的当前时间。使用索引，这些查找应该很快。

最终查询从实际缺失的每个温度的最接近时间的行中获取温度。

如果 MySQL 允许从当前子查询之上的多个级别引用列，则此查询可能会更简单。位它不能。在 PostgreSQL 中工作得很好:->sqlfiddle

如果可以从相关子查询返回多个列，也会更简单，但我不知道如何在 MySQL 中执行此操作。

使用 CTE 和窗口函数会多简单，但是 MySQL 不知道这些现代 SQL 特性(不像其他相关的关系型数据库)。

关于mysql - 根据时间从多个表中获取最接近数据的最快方法，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/14678492/

最快 mysql time temperature code sql time-series

有关mysql - 根据时间从多个表中获取最接近数据的最快方法的更多相关文章

ruby - 如何使用 Nokogiri 的 xpath 和 at_xpath 方法 - 2
我正在学习如何使用Nokogiri，根据这段代码我遇到了一些问题:require'rubygems'require'mechanize'post_agent=WWW::Mechanize.newpost_page=post_agent.get('http://www.vbulletin.org/forum/showthread.php?t=230708')puts"\nabsolutepathwithtbodygivesnil"putspost_page.parser.xpath('/html/body/div/div/div/div/div/table/tbody/tr/td/div
ruby - 如何从 ruby 中的字符串运行任意对象方法？ - 2
总的来说，我对ruby还比较陌生，我正在为我正在创建的对象编写一些rspec测试用例。许多测试用例都非常基础，我只是想确保正确填充和返回值。我想知道是否有办法使用循环结构来执行此操作。不必为我要测试的每个方法都设置一个assertEquals。例如:describeitem,"TestingtheItem"doit"willhaveanullvaluetostart"doitem=Item.new#HereIcoulddotheitem.name.shouldbe_nil#thenIcoulddoitem.category.shouldbe_nilendend但我想要一些方法来使用
ruby - 为什么我可以在 Ruby 中使用 Object#send 访问私有(private)/ protected 方法？ - 2
类classAprivatedeffooputs:fooendpublicdefbarputs:barendprivatedefzimputs:zimendprotecteddefdibputs:dibendendA的实例a=A.new测试a.foorescueputs:faila.barrescueputs:faila.zimrescueputs:faila.dibrescueputs:faila.gazrescueputs:fail测试输出failbarfailfailfail.发送测试[:foo,:bar,:zim,:dib,:gaz].each{|m|a.send(m)resc
ruby - Facter::Util::Uptime:Module 的未定义方法 get_uptime (NoMethodError) - 2
我正在尝试设置一个puppet节点，但rubygems似乎不正常。如果我通过它自己的二进制文件(/usr/lib/ruby/gems/1.8/gems/facter-1.5.8/bin/facter)在cli上运行facter，它工作正常，但如果我通过由rubygems(/usr/bin/facter)安装的二进制文件，它抛出:/usr/lib/ruby/1.8/facter/uptime.rb:11:undefinedmethod`get_uptime'forFacter::Util::Uptime:Module(NoMethodError)from/usr/lib/ruby
ruby-on-rails - Rails 3 中的多个路由文件 - 2
Rails2.3可以选择随时使用RouteSet#add_configuration_file添加更多路由。是否可以在Rails3项目中做同样的事情？最佳答案在config/application.rb中:config.paths.config.routes在Rails3.2(也可能是Rails3.1)中，使用:config.paths["config/routes"] 关于ruby-on-rails-Rails3中的多个路由文件，我们在StackOverflow上找到一个类似的问题
ruby-on-rails - 在 Ruby 中循环遍历多个数组 - 2
我有多个ActiveRecord子类Item的实例数组，我需要根据最早的事件循环打印。在这种情况下，我需要打印付款和维护日期，如下所示:ItemAmaintenancerequiredin5daysItemBpaymentrequiredin6daysItemApaymentrequiredin7daysItemBmaintenancerequiredin8days我目前有两个查询，用于查找maintenance和payment项目(非排他性查询)，并输出如下内容:paymentrequiredin...maintenancerequiredin...有什么方法可以改善上述(丑陋的)代
Ruby 方法() 方法 - 2
我想了解Ruby方法methods()是如何工作的。我尝试使用“ruby方法”在Google上搜索，但这不是我需要的。我也看过ruby-doc.org，但我没有找到这种方法。你能详细解释一下它是如何工作的或者给我一个链接吗？更新我用methods()方法做了实验，得到了这样的结果:'labrat'代码classFirstdeffirst_instance_mymethodenddefself.first_class_mymethodendendclassSecond使用类#returnsavailablemethodslistforclassandancestorsputsSeco
ruby - 解析 RDFa、微数据等的最佳方式是什么，使用统一的模式/词汇(例如 schema.org)存储和显示信息 - 2
我主要使用Ruby来执行此操作，但到目前为止我的攻击计划如下:使用gemsrdf、rdf-rdfa和rdf-microdata或mida来解析给定任何URI的数据。我认为最好映射到像schema.org这样的统一模式，例如使用这个yaml文件，它试图描述数据词汇表和opengraph到schema.org之间的转换:#SchemaXtoschema.orgconversion#data-vocabularyDV:name:namestreet-address:streetAddressregion:addressRegionlocality:addressLocalityphoto:i
ruby-on-rails - Rails - 一个 View 中的多个模型 - 2
我需要从一个View访问多个模型。以前，我的links_controller仅用于提供以不同方式排序的链接资源。现在我想包括一个部分(我假设)显示按分数排序的顶级用户(@users=User.all.sort_by(&:score))我知道我可以将此代码插入每个链接操作并从View访问它，但这似乎不是“ruby方式”，我将需要在不久的将来访问更多模型。这可能会变得很脏，是否有针对这种情况的任何技术？注意事项:我认为我的应用程序正朝着单一格式和动态页面内容的方向发展，本质上是一个典型的网络应用程序。我知道before_filter但考虑到我希望应用程序进入的方向，这似乎很麻烦。最终从任何
ruby-on-rails - Rails 3.2.1 中 ActionMailer 中的未定义方法 'default_content_type=' - 2
我在我的项目中添加了一个系统来重置用户密码并通过电子邮件将密码发送给他，以防他忘记密码。昨天它运行良好(当我实现它时)。当我今天尝试启动服务器时，出现以下错误。=>BootingWEBrick=>Rails3.2.1applicationstartingindevelopmentonhttp://0.0.0.0:3000=>Callwith-dtodetach=>Ctrl-CtoshutdownserverExiting/Users/vinayshenoy/.rvm/gems/ruby-1.9.3-p0/gems/actionmailer-3.2.1/lib/action_mailer

mysql - 根据时间从多个表中获取最接近数据的最快方法

解释

有关mysql - 根据时间从多个表中获取最接近数据的最快方法的更多相关文章

随机推荐