工业互联网迅速崛起
湖南长沙,工程机械之都
如何有效地向制造业转型升级
更大程度地满足各种业务场景的需求
作者
于成铭-智能研究所副所长
褚凤天-大数据工程师
工业设备互联采集是数字工厂建设的基础。设备在运行过程中会产生大量有价值的数据,如新泵车运行状态、搅拌压力、总泵送量、异常报警信息等,为后续数据分析和挖掘提供最可靠的数据源。
MatrixDB 专门为工业互联网、物联网、车联网等场景设计,专门优化设备多、指标多、数据量大的场景,支持数据的快速写入、查询和计算。工业领域设备采集的实时数据不仅用于设备状态监控和预警,还能满足批量数据复杂分析的要求,指导生产决策,提高效率和质量,大大降低数据存储和存储系统的运维成本,实现高吞吐量、低延迟、实时处理流量数据和大量历史数据。
三一重工专注于以工程为装备的制造业,
通过工业大数据挖掘,实现混凝土机械设备智能检查的主要性能指标,形成设备肖像,实现设备预测维护,通过工厂数据和业务数据,实现设备生命周期管理,构建设备生命周期最佳模型,优化资源利用和配置效率,提高设备可用性。
通过对抖、堵、高、转、效五大关键性能的量化分析,提供单个设备的综合体检报告和故障预警,并对智能操作和维护提出建议。同时,基于历史的多设备、多维统计和比较分析,为研发产品的定义、优化和跟踪提供数据决策支持;全面支持数据决策、新产品跟踪、技术改革验证和精确故障排除。
泵诵云大数据平台应运而生,以支撑上述功能和业务。,实现了每天每台车的指标计算、智能巡检、模型训练和时序数据的展示。
我们使用早期版本Hadoop Spark 架构,
传统的 Hadoop Spark 需要建造架构 CDH 全家桶等大数据,包括 Hadoop(负责存储原始数据),Spark(负责日常任务),Hive(临时离线任务),HBase(负责数据显示),形成复杂的技术栈。
为了满足不同服务的需求,我们的数据以不同的形式存在于不同的组件中,浪费资源也给运营和维护带来了极大的不便。太多的技术堆栈不利于团队成员的配置和培训。
。在设备工作过程中,由于各种不可预测的情况,数据无法整齐上传,大量数据在行维上不对齐。
该平台是数据的被动接收器。只有在数据下降后才能清理数据。集群每天都有大量的空数据,数据清理繁琐,准确性低。
数据分析师有必要对数据进行反复测试。在此前提下,分析工具需要快速得到结果,,使数据分析师持续思考,有利于算法的输出。
传统架构中的数据计算引擎 Spark 计算需要存在 HDFS 的数据移动出来,归集的过程中非常消耗资源和时间,严重影响我们的计算速度。
类似于工业场景 Python 过程语言是数据分析师必要的分析方法之一。在传统的架构中,采用 Spark 在计算引擎中 pandasUDF 批量运行的功能 python 代码本身代码中有大量的胶水,延缓了算法开发的周期。
为了改善当前的业务挑战,我们将泵背云平台的底层架构切换成 MatrixDB 在主体架构上,
MatrixDB 将不同的场景需求集成到数据库中,满足数据存储、实时计算、离线计算和数据显示的功能,避免 Hadoop 全家桶式的尴尬。MatrixDB 界面安装与 Grafana 监控大大降低了运维难度,
这对我们机械设备上传的时间序列数据非常友好。同时,我们可以将部分清洗数据放在仓库前,简化数据清洗过程。
MatrixDB 是一款 OLAP OLTP 数据本身存储在性数据库中 MatrixDB 计算时不需要移动数据。,使算法人员在查看原始数据的时候更加方便。
在每台物理机配置相同的情况下,两代集群性能的整体对比表如下图所示:
可以看出 MatrixDB 机器数量只有一半,算法运行时间从2开始.5小时减少到1小时。
,在集群中存储所有接口的定义和调用,Python 代码的迁移、调用与管理更加方便,这是只有程序员才懂的优点,非常有利于我们后续数据的分析与算法结构化迭代工作。
从从日常工作场景出发,不断深化用户服务体系,有效支持工作和决策。
分析各地区市场的开工率和泵送量,判断整体市场情况和客户盈利能力,协助分析各级国家市场盈利能力和建设需求类型(如地铁、高架桥、高层建筑等),进一步挖掘重点市场。
不同地区设备的用户使用习惯和性能维度,找出各地区关键设备的需求。通过对臂长、底盘类型、设备型号、出厂时间等多维分析,帮助营销更有针对性的指定市场策略。
根据设备技术改造工作进度,对技术改造前后设备数据性能进行实时分析比较,量化技术改造前后指标性能,直观展示技术改造效果。从原线下电话跟踪反馈到在线数据统计分析,大大提高了工作效率和结果可靠性。
远程快速定位故障原因,提高故障排除效率,通过实时检查(或回顾)故障发生时的设备工况数据表现,。
通过对臂架长度、底盘类型、设备型号、出厂时间等多维度的分析,帮助研发更详细的比较,了解产品性能,掌握市场的真实需求。
全区域设备健康情况扫描,明确全区域设备的整体表现,找到表现好的设备用来做技术分享;找到表现差的设备,做重点跟进。对26项预测故障和297项故障自诊断问题的跟进闭环。
将泵诵云平台和服务小助手集成,以微服务的方式助力服务效率提升,最终
当前各类业务对“海量、实时”数据需求变得更加迫切,实时推荐、精准营销、实时决策成为数字化场景的关键能力,更为敏锐地识别和引导用户需求、提升用户的产品体验将为企业带来持续的竞争优势。,一站式数据平台同时解决海量数据和实时分析难题,使得数据价值的变现更高效、简单。
原文链接
本文为 yMatrix 原创内容,未经允许不得转载。
欲了解更多超融合时序数据库相关信息,请访问 “yMatrix” 官方网站