资讯详情

【数据治理】什么是时序数据?如何治理?有哪些应用场景?终于有人讲明白了

在生产经营过程中,工业企业将利用物联网技术收集大量数据并实时处理。这些数据是时间顺序,具有时间戳、结构化、未更新、唯一数据源等显著特点。

定义和作用时序数据

指时间序列数据。它是按时间顺序记录的数据列。同一数据列中的每个数据必须直径相同,需要可比性。时间序列数据可以是时间数或时间点数。

帮助企业实时监控企业的生产经营过程,主要是收集、处理和分析时序数据。

时序数据在应用中也有明显的特点。例如,数据通常只保留一定的时间,需要进行降频采样、插值、实时计算、聚合等操作,关心一段时间的趋势,而不是特定时间的值。

为了监控设备、生产线和整个系统的运行状态,工业企业配备个关键点都配备了传感器,并收集了各种数据。这些数据是由周期或准周期产生的,有些收集频率高,有些收集频率低,通常发送到服务器进行汇总和实时处理,并对系统的运行进行实时监控或预警。

1)分析故障,看主要设备故障是什么;

2)分析产能,看如何优化配置,提高生产效率;

3)分析能耗,看如何降低生产成本;

4)分析潜在的安全隐患,以减少故障时间。

时序数据的十二个典型特征

与各种信息管理系统的数据相比,工业领域的时序数据具有鲜明的特点。 在这里插入图片描述**(1)数据是时序的,一定带有时间戳:**根据设定的周期或外部事件的触发,连接到网络的设备不断生成数据。每个数据点在哪个时间点生成,这对数据的计算和分析非常重要,必须记录。

**(2)数据结构化:**网络爬虫的数据、微博、微信的大量数据都是非结构化的,可以是文本、图片、视频等。然而,物联网设备产生的数据往往是结构化的和化的。例如,智能电表采集的电流和电压可以用4字节的标准浮点数来表示。

**(3)数据很少更新:**网络设备生成的数据是机器日志数据,一般不允许,也不需要修改。很少有场景需要修改收集到的原始数据。但对于典型的信息或互联网应用程序,记录必须被修改或删除。

**(4)数据源是唯一的:**一个物联网设备收集的数据与另一个设备收集的数据完全独立。设备的数据必须由设备生成,不能由人工或其他设备生成,也就是说,设备的数据只有一个生产者,数据源是唯一的。

**(5)相对互联网应用,写多读少:**对于互联网应用程序,数据记录通常是一次写作,多次阅读。例如,一篇微博或一篇微信公共账号文章,一次写作,但可能有数百万人阅读。然而,物联网设备生成的数据是不同的。对于生成的数据,计算和分析程序通常会自动阅读,计算和分析次数不多。只有分析事故和其他场景,人们才会主动查看原始数据。

**(6)用户关注一段时间的趋势:**对于一个银行记录,或者一个微博,微信,对于它的用户来说,每一个都非常重要。但对于物联网数据,每个数据点和数据点的变化并不大,通常是渐变的,我们更关心一段时间,如过去5分钟,过去1小时的数据变化趋势,一般不关注特定时间点的数据值。

**(7)数据有保留期:**收集的数据通常有基于持续时间的保留策略,如只保留一天、一周、一个月、一年甚至更长时间。为了节省存储空间,系统最好自动删除。

**(8)数据的查询分析往往是基于时间段和一组设备:**对于物联网数据,在做计算和分析时,一定是指定时间范围的,不会只针对一个时间点或者整个历史进行。而且往往需要根据分析的维度,对物联网设备的一个子集采集的数据进行分析,比如某个地理区域的设备,某个型号、某个批次的设备,某个厂商的设备。等等。

**(9)除存储查询外,计算操作往往需要实时分析:**对于大多数互联网大数据应用程序来说,离线分析更多。即使有实时分析,实时分析的要求也不高。例如,用户肖像可以在积累某些用户行为数据后进行。然而,对于物联网应用程序来说,实时数据计算的要求往往很高,因为需要根据计算结果实时报警,以避免事故。

**(10)流量稳定,可预测:**给定物联网数量和数据采集频率,可以更准确地估计所需的带宽和流量,以及每天新生成的数据大小。

:与典型的互联网相比,有不同的数据处理需求。例如,检查设备在特定时间收集的数量,但传感器的实际收集时间不是这个时间点,通常需要插值处理。还有许多场景需要根据收集量计算复杂的数学函数。

:以智能电表为例,智能电表每15分钟收集一次数据,每天自动生成96个记录。全国智能电表近5亿台,每天生成近500亿台。一辆联网车每10到15秒收集一次数据发送到云端,一辆车每天很容易产生1000条记录。若中国2亿辆车全部联网,每天将有2000亿条记录。物联网设备产生的数据将占世界总数的90%以上。

时序数据场景中通用大数据处理工具的三个挑战

从工具维度来看,时序数据处理工具与传统时序数据库有很大的不同。后者仅限于车间级可编程逻辑控制器,而不是企业级。企业级时序数据处理首先基于数据架构和数据模型。

随着物联网、汽车互联网和工业互联网的兴起,每个人都想使用通用的大数据平台来处理数据。市场上流行的物联网、汽车互联网等大数据平台几乎都是这样的架构,但这种通用处理工具的效果如何呢?可以说有很多缺点,

数字化工厂产生的时序数据量巨大,处理起来有相当大的技术挑战。以数控机床加工生产为例,由于工业行业的要求,需要存储各种工况数据,包括报警。假设每个厂区有2000个监测点,5秒的收集周期,全国共有200个厂区。粗略估计,每年都会产生惊人的数十万亿数据点。假设每个点0.5KB,总数据将达到PB如果每台服务器的硬盘容量是10TB,总共需要100多台服务器)。这些数据不仅要实时生成并写入存储,还要支持快速查询,实现可视化显示,帮助管理者分析决策;也可用于大数据分析,发现深层次问题,帮助企业节能减排,提高效率。要解决的关键技术问题如下。

时序数据场景中通用大数据处理工具的挑战

传统的数据采集系统面临着数据质量差、查询速度慢、缺乏实时智能分析等问题。

**(1)高并发、高吞吐量的写入能力:**最关键的技术能力是如何支持每秒数千万数据点的写入。

**(2)数据高速聚合:**如何支持数亿数据以秒级的速度分组和聚合,如何在大数据量的基础上有效地查询和聚合符合条件的原始数据。我们应该知道,由于时间长,统计数据的原始值可能不在内存中,因此这可能是一个非常耗时的操作。

**(3)降低存储成本:**时序数据库量数据存储的成本,需要时序数据库提供高压缩率。

**(4)多维查询能力:**时序数据通常有多个维度的标签来描述数据。如何根据多个维度进行高效查询是必须解决的问题。

时序数据应用场景

时序数据广泛应用于各行各业,如;在**实时监控石化行业油井、运输管道运输车队;智能城市实时路况、卡口数据交叉口流量监控、金融业交易记录、访问记录ATM、POS机器监控、智能安全(建筑门禁、车辆管理、井盖、电子围栏)、应急响应(消防、人群聚集、危险化学品、结构健康、电梯)**等。

时序数据应用于各行业

**、智能城市、智能行业智能应急指挥与整合通信调度**

综合通信指挥调度计划采用,围绕可视化指挥调度方案等多种功能集成。在预警、报告、响应、指挥等环节实现及时有效的可视化指挥,满足实时图像传输和视频咨询的快速响应需求。

整合通信指挥调度计划

**、园区智能检查安全**

标签: 再接至异地进电流变送器光电超强传感器pb系列电量变送器

锐单商城拥有海量元器件数据手册IC替代型号,打造 电子元器件IC百科大全!

锐单商城 - 一站式电子元器件采购平台