当前位置: 首页 > 面试题库 >

如何根据事件的日期,时间和持续时间检查SQL表中的平均并发事件?

聂宜
2023-03-14
问题内容

我有一组呼叫详细记录,从这些记录中,我可以确定每个系统每小时的平均并发活动呼叫(精确到一分钟)。如果查询从晚上7点到晚上8点,则应该看到该小时(对于每个系统)在该小时内的平均并发呼叫数(每分钟的并发呼叫数平均值)。

因此,我需要一种方法来检查7:00-7:01、7:01-7:02等的活动呼叫计数,然后对这些数字求平均值。如果呼叫的时间和持续时间在当前要检查的分钟内,则认为该呼叫处于活动状态。

更困难的是它需要跨越SQL 7.0和SQL
2000(7.0中的某些功能在7.0中不可用,例如GetUTCTime()),如果我能使2000正常工作,我会很高兴的。

我可以采取什么方法来解决这个问题?

我考虑过要在检查的小时中循环浏览分钟(60),并添加介于该分钟之间的呼叫计数,然后以某种方式交叉引用持续时间,以确保从7:00
pm开始且持续时间为300秒显示在7:04处于活动状态,但我无法想象如何解决该问题。我试图找出一种方法,可以根据特定的分钟权重对每个呼叫进行加权,从而告诉我该分钟内该呼叫是否处于活动状态,但无法提出有效的解决方案。

这里的数据类型与我要查询的数据类型相同。我对架构没有任何控制权(除了可能转换数据并将其插入具有更适当数据类型的另一个表中之外)。我提供了一些示例数据,这些数据我知道它们具有并发活动调用。

CREATE TABLE Records(
  seconds char(10),
  time char(4),
  date char(8),
  dur int,
  system int,
  port int,
)

--seconds is an stime value. It's the difference of seconds from UTC 1/1/1970 00:00:00 to the current UTC time, we use it as an identifier (like epoch).
--time is the time the call was made.
--date is the day the call was made.
--dur is the duration of the call in seconds.
--system is the system number.
--port is the port on the system (not particularly relevant for this question).

INSERT INTO Records(seconds, time, date, dur, system, port) VALUES('1239924228','1923','20090416',105,2,2)
INSERT INTO Records(seconds, time, date, dur, system, port) VALUES('1239923455','1910','20090416',884,1,97)
INSERT INTO Records(seconds, time, date, dur, system, port) VALUES('1239924221','1923','20090416',116,2,15)
INSERT INTO Records(seconds, time, date, dur, system, port) VALUES('1239924259','1924','20090416',90,1,102)
INSERT INTO Records(seconds, time, date, dur, system, port) VALUES('1239923458','1910','20090416',891,2,1)
INSERT INTO Records(seconds, time, date, dur, system, port) VALUES('1239924255','1924','20090416',99,2,42)
INSERT INTO Records(seconds, time, date, dur, system, port) VALUES('1239924336','1925','20090416',20,2,58)
INSERT INTO Records(seconds, time, date, dur, system, port) VALUES('1239924293','1924','20090416',64,2,41)
INSERT INTO Records(seconds, time, date, dur, system, port) VALUES('1239923472','1911','20090416',888,2,27)
INSERT INTO Records(seconds, time, date, dur, system, port) VALUES('1239924347','1925','20090416',25,1,100)
INSERT INTO Records(seconds, time, date, dur, system, port) VALUES('1239924301','1925','20090416',77,2,55)
INSERT INTO Records(seconds, time, date, dur, system, port) VALUES('1239924332','1925','20090416',52,2,43)
INSERT INTO Records(seconds, time, date, dur, system, port) VALUES('1239924240','1924','20090416',151,1,17)
INSERT INTO Records(seconds, time, date, dur, system, port) VALUES('1239924313','1925','20090416',96,2,62)
INSERT INTO Records(seconds, time, date, dur, system, port) VALUES('1239924094','1921','20090416',315,2,16)
INSERT INTO Records(seconds, time, date, dur, system, port) VALUES('1239923643','1914','20090416',788,2,34)
INSERT INTO Records(seconds, time, date, dur, system, port) VALUES('1239924447','1927','20090416',6,2,27)
INSERT INTO Records(seconds, time, date, dur, system, port) VALUES('1239924342','1925','20090416',119,2,15)
INSERT INTO Records(seconds, time, date, dur, system, port) VALUES('1239924397','1926','20090416',76,2,41)
INSERT INTO Records(seconds, time, date, dur, system, port) VALUES('1239924457','1927','20090416',23,2,27)

问题答案:

我认为MarkusQ可以解决问题,但是让我开发一种可能会更易于使用的替代方法。我将使用惯用的方法将其开发为视图中的一系列简单转换,这类似于过程语言中的功能分解。

首先,让我们将所有内容都放在同一单元中。回想record的专栏s是因为秒 时代
,午夜1月1日1970年我们可以发现,因为呼叫的一天午夜的秒数,该呼叫发生后,通过只是走在一天的秒模量数:s % (60 * 60 * 24)

select *, 
s % (60 * 60 * 24) as start_secs_from_midnight,
s % (60 * 60 * 24) + dur - 1 as end_secs_from_midnight,
;

我们减去一个是s + dur因为从12:00:00开始的一秒钟呼叫也于12:00:00结束。

通过将这些结果除以60或仅乘以floor( s / 60 ) % (60 * 24):,我们可以找到自午夜以来的分钟数:

create view record_mins_from_midnight as
select *, 
floor( s / 60 ) % (60 * 24) as start_mins_fm,
floor( ( s + dur - 1) / 60 ) % (60 * 24) as end_mins_fm 
from record
;

现在我们创建一个分钟表。我们需要1440个,编号从0到1439。在不支持任意序列的数据库中,我 创建了一个人工范围或序列, 如下所示:

  create table artificial_range ( 
   id int not null primary key auto_increment, idz int) ;
  insert into artificial_range(idz) values (0);
  -- repeat next line to double rows
  insert into artificial_range(idz) select idz from artificial_range;

因此要创建一个minute表:

  create view minute as 
   select id - 1 as active_minute 
   from artificial_range 
   where id <= 1440
   ;

现在我们minute进入记录视图

create view record_active_minutes as
select * from minutes a 
join record_mins_from_midnight b
on (a.active_minute >= b.start_mins_fm 
and a.active_minute <= b.end_mins_fm 
 ;

这只是跨乘积/乘以记录行,因此通话进行的每一分钟都有一个记录行。

请注意,我这样做是通过将active定义为“呼叫在一分钟内发生的(一部分)”。也就是说,根据此定义,从12:00:59开始并在12:01:01结束的两秒钟呼叫发生在两个不同的分钟内,但是从12:00:58开始并在12:结束的两秒钟呼叫一分钟内发生00:59。

我这样做是因为您指定了“因此,我需要一种方法来检查7:00-7:01、7:01-7:02的活动呼叫计数”。如果您希望仅在超过一分钟的时间内进行持续超过60秒的通话,则需要调整联接。

现在,如果要查找等于或大于分钟粒度的任何粒度的活动记录数,则只需对最后一个视图进行分组。要查找每小时的平均通话次数,我们用60除以将分钟数转换为小时数:

 select floor( active_minute / 60 ) as hour, 
 count(*) / 60 as avg_concurent_calls_per_minute_for_hour
 from record_active_minutes
 group by floor( active_minute / 60 ) ;

请注意,这是一整天 所有呼叫 每小时的平均值;如果我们希望将其限制为特定的一天或几天的范围,则可以添加一个where子句。

但是,等等,还有更多!

如果我们创建一个record_active_minutes左外部联接的版本,则可以得到一个报告,该报告显示一天中所有小时的平均值:

 create view record_active_minutes_all as
 select * 
 from 
 minutes a 
 left outer join record_mins_from_midnight b
   on (a.active_minute >= b.start_mins_fm 
       and a.active_minute <= b.end_mins_fm) 
 ;

然后,我们再次进行选择,但针对新视图:

 select floor( active_minute / 60 ) as hour, 
 count(*) / 60 as avg_concurent_calls_per_min
 from record_active_minutes_all
 group by floor( active_minute / 60 ) ;


+------+------------------------------+
| hour | avg_concurrent_calls_per_min |
+------+------------------------------+
|    0 |                       0.0000 |
|    1 |                       0.0000 |
|    2 |                       0.0000 |
|    3 |                       0.0000 |
   etc....

我们也可以使用where对此进行索引。不幸的是,联接意味着record在特定时间段内不存在任何调用的基础表将具有空值,例如,

 select floor( active_minute / 60 ) as hour, 
 count(*) / 60 as avg_concurent_calls_per_min
 from record_active_minutes_all
 where month(date) = 1 and year(date) = 2008 
 group by floor( active_minute / 60 ) ;

在没有通话的时间段内,将不带回任何行。如果我们仍然希望显示所有小时的“类似于报告”的视图,请确保我们也包括没有记录的那些小时:

 select floor( active_minute / 60 ) as hour, 
 count(*) / 60 as avg_concurent_calls_per_minute_for_hour
 from record_active_minutes_all
 where (month(date) = 1 and year(date) = 2008) 
 or date is null 
 group by floor( active_minute / 60 ) ;

请注意,在最后两个示例中,我使用的是SQL日期(可以对其应用函数month和功能year),而不是记录表中的char(4)日期。

这就引出了另一点:记录表中的日期和时间都是多余的并且是非规范化的,因为每个日期和时间都可以从列s导出。将它们保留在表中可能会导致行不一致,其中date(s) <> datetime(s) <> time。我更喜欢这样:

   create table record ( id int not null primary key, s, duration) ;

   create view record_date as 
   select *, dateadd( ss, s, '1970-01-01') as call_date
   from record
  ;

dateadd函数中,ss是枚举类型,它告诉函数增加秒;s是记录中的列。



 类似资料:
  • 我需要有关构建SQL查询的帮助: 这是我用来存储测试运行统计信息的postgres表。 此表包含测试开始时间、结束时间和状态。我需要计算由于测试失败而使用的时间间隔。即测试失败和下一个立即测试开始之间的时间间隔。 即对于每个测试失败的记录,获取end_date并获取同一测试的下一个即时记录的start_date。计算时间差。将所有此类失败记录的持续时间相加,并按失败次数计算。以获得平均值。 例子:

  • 问题内容: 寻找时间平均问题的最快解决方案。 我有一个日期时间对象列表。需要找到时间的平均值(不包括年,月,日)。这是到目前为止我得到的: 问题答案: 这是解决此问题的更好方法 生成日期时间样本 平均20m次 结果为timedelta(请注意,这需要numpy 1.7和pandas 0.13 ,很快就会出现) 以秒为单位(这适用于熊猫0.12,numpy> = 1.6)。

  • 我需要一些解释为什么这个代码不编译: 错误: 类型Duration中的(TemporalAmount)方法不适用于参数(ChronoUnit) 正如本文所述: public static Duration from(TemporalAmount amount)从时间量中获取持续时间的实例。这将根据指定的金额获得持续时间。TemporalAmount表示一个时间量,可以是基于日期的,也可以是基于时间

  • 问题内容: 我仅使用DATETIME跟踪表中每周发生的定期事件。我只关心时间和星期几。 我需要能够将设置的DATETIME转换为当前或即将到来的未来时间。 IE如何将使用当前日期存储的日期转换为下一个出现的日期?即下个星期五的12:00:00左右,这样我就可以按日期订购活动了? 或者,我可以将时间和星期几分别存储为数字0-6。 更新: 从欧文(Erwin),我得到了类似的东西: 除了我得到的第一个

  • 我想把24小时表示为“持续时间”。也就是说,应该是从00:00:00到24:00:00。像今天上午12点到明天上午12点这样的事情是不好的。这也是24小时,但这不是我想要的。此外,这个“持续时间”不应该附带日期或日期的概念。 如何使用Joda Time完成此操作? 编辑- 用例——“我想创建一个调度程序。24小时的“周期”被分成任意大小的切片,如20分钟、30分钟或1小时。我只想用Joda创建一个

  • 问题内容: 根据下表 输入变量将是开始日期和结束日期。例如 如何生成以下输出? 问题答案: 您要查找的内容通常称为交叉表查询。如果您要问的是如何在给定 静态 列列表的情况下构建交叉表查询,则可以执行以下操作: 同样,您可以使用Broken Link建议的PIVOT功能。但是,以上解决方案和PIVOT功能都依赖于 静态 列声明。如果您想要的是动态列列表(又称动态交叉表),那么您将超出T-SQL最初设