工信部的数据显示:“中国制造业约占整个世界制造业20%的份额,在500余种主要产品中,我国有220多种产量位居世界第一。2014年,我国共有100家企业入选‘财富世界500强’,其中制造业企业占56家”。
但长期粗放式发展之后,中国制造业发展面临着稳增长和调结构的双重困境,进入了“爬坡过坎”的关键时刻。正如国务院发布的《中国制造2025》提到,“新一代信息技术与制造业深度融合,正在引发影响深远的产业变革,形成新的生产方式、产业形态、商业模式和经济增长点……但我国仍处于工业化进程中,与先进国家相比还有较大差距。制造业大而不强…”。
与此同时,德国提出了工业4.0,美国提出了工业互联网的概念希望藉此实现制造业的复兴。中国提出《中国制造2025》正是要推动制造业向中高端迈进,以大数据、物联网、云计算等新一代信息技术将引爆这一轮产业变革,加速传统制造企业的转型升级。
工业大数据与德国工业4.0、中国制造2025的关系
工业4.0、中国制造2025的核心是工业大数据。
2013年4月,德国政府汉诺威工业博览会上正式推出“工业4.0”战略,其目的是为了提高德国工业的竞争力,在新一轮工业革命中占领先机。该战略通过充分利用信息通讯技术和网络空间虚拟系统(信息物理系统Cyber-Physical System)相结合的手段,将制造业向智能化转型。
2015年5月8日,国务院公布《中国制造2025》,这是中国版的“工业4.0”规划。该规划提到“加快推动新一代信息技术与制造技术融合发展,把智能制造作为两化深度融合的主攻方向;着力发展智能装备和智能产品,推进生产过程智能化,培育新型生产方式,全面提升企业研发、生产、管理和服务的智能化水平。
无论是“德国工业4.0”还是“中国制造2025”,都提到了智能化和互联网化,而智能化和互联网化的核心是:
一方面利用互联网技术实现传统的以产品为中心变为以客户为中心,加强客户需求预测并尝试让客户参与产品研发,提供个性化的产品、服务及体验;
另一方面采集大量消费数据动态调整生产方式以快速适应客户需求变化,即变大规模批量生产为大规模定制生产;最后一方面利用企业内部营销、科研、生产、采购等经营数据,为企业经营解决提供依据,实现企业经营透明。随着企业智能化和互联网化水平的提升,企业拥有了越来越多的数据,而这些数据反过来有提升了企业智能化和互联网化的水平。
利用大数据驱动业务发展,打造企业新型能力
制造型企业面临着客户需求个性化,产品上市时间短,研制成本提高等巨大挑战。这种挑战本身更多体现在企业与企业之间如何以更低的成本、更高的质量、更快的速度满足客户多样的需求。所以传统方式很难解决大数据时代的企业问题,需要有创新的手段来解决。目前越来越多的企业通过大数据来驱动业务创新,提升产品质量、降低研制成本、加快上市周期。
全球航空发动机制造企业劳斯莱斯公司,在飞机引擎的制造和维护过程中,都配备了劳斯莱斯引擎健康模块。所有的劳斯莱斯引擎,不论是飞机引擎,直升机引擎还是舰艇引擎都配备了大量的传感器,用来采集引擎的各个部件,各个系统,以及各个子系统的数据。这些信息通过专门的算法,进入引擎监控模块的数据采集系统中。利用这些数据的分析结果,不仅可以帮助劳斯莱斯提前发现故障,还可以帮助客户更及时有效地安排引擎检测和维修。通过算法的不断改进,劳斯莱斯如今已经可以通过数据分析预测可能出现的技术问题。
劳斯莱斯引擎使用寿命在过去30年里延长了10倍,比同行类似引擎的寿命长10年左右;尤其重要的是飞行安全得到了更大的保障。成功之处在于打破了制造业和服务业的界线,并使两者相得益彰:技术先进的制造部门为售后服务提供可靠的技术保证。优质的售后服务不仅巩固现有销售市场份额,还不断挖掘越来越大的潜在市场。
“盘活存量数据、用好增量数据”,推动企业转型升级。
制造型企业在信息化的每个发展阶段都会有大量的数据处理要求并且会因为大量的业务活动产生各式的数据各样,只要采用数据驱动业务的方式进行业务活动就是大数据,大数据是企业信息化发展到当前阶段的必然结果。所以工业大数据的利用不仅仅是信息化基础设施建设,更重要的是采用数据思维来管理和创新业务,大数据应是管理创新的手段,优化全业务流程和提供业务管理工具。所以制造型企业大数据应用的难点是打通企业数据采集、集成、管理、分析的产业链条,帮助业务人员养成使用数据的习惯。在这方面互联网企业走在前面,值得制造型企业学习。
2012年12月,阿里宣布在集团管理层面设立首席数据官(Chief Data Officer)岗位,负责全面推进阿里巴巴集团成为“数据分享平台”的战略并成立了数据委员会,委员会的成员是各个数据部门的领导。该数据委员会主要职责是协同不同数据部门的工作,制定整个集团数据应用的方向和规划,协同各个部门使用数据,打通商业运营、做(基础)数据、(构建)数据模型等产业链条各环节。避免传统上做数据的人不知道别人怎么用,用数据的人不知道数据怎么来的;而做数据模型不知道数据是否稳定;用数据模型的人不知道数据模型究竟是怎样的,甚至不相信数据模型的问题。
工业大数据的产生及特点
工业大数据是制造型企业创新转型的驱动力和催化剂,随着三维设计、3D打印、机器人技术等在制造型企业广泛应用。工业大数据广泛分布在产品设计、制造、物流、服役等各环节,具体如下:
数字化设计:如飞机全数字化设计:波音公司利用CATIA软件设计波音777的300万个零部件的尺寸和形状数据;
智能化制造:以智能工业机器人为典型代表的智能制造装备已经开始在多个领域得到应用;我国今年的工业机器人超过日本。
网络化监控:大型工业装备运行状态网络化远程动态监测:例如,波音737发动机在飞行中每30分钟产生10TB数据;陕鼓动力实现数百台旋转机械远程在线监测及故障诊断。
物联化管理:工业生产过程开始大量使用RFID实现零件与产品管理。
工业大数据区别其他行业大数据有自身的特点和挑战:
一是多源性获取,数据分散、非结构化数据比例大
工业大数据来源广泛且分散,有来源于产品制造现场工控网监控数据,有来源于互联网的客户、供应商数据,有来源于企业内网的经营管理数据。海量异构多源多类数据难以有效集成,语义描述困难,不能实现面向系统生命周期管理的数据协同管理;
二是数据关联性强,有关联也要有因果
工业大数据的产生和应用都围绕产品全生命周期、企业主价值链等,数据间关联性强且分析准确性要求高。不但要利用大数据给出决策也要用大数据给出决策依据。工业大数据预测精度低,准确性和可靠性不高,无法满足安全性要求;
三是持续采集、具有鲜明的动态时空特性
工业大数据来源于工控网络和传感设备,具有实时性强、连续性、稳定性要求高等特点,需要采用可靠的数据采集、存储、管理的工具进行管理,另外涉及国计民生领域还要求整个平台安全可控。工业大数据分析的实时性要求高,动态控制困难,量化难度大。
四是与具体工业领域紧密相关
工业大数据产生依赖于CPS网络和智能产品,但目前面向信息物理融合系统的分析方法单一,无法实现闭环、多层次、多阶段、自比较等的综合分析;面向智能设备和智能产品的故障检测能力不足,健康预测管理水平低,无法实现面向产品可靠性的深层次分析。
工业大数据的重点研究方向
为了应对工业大数据分散、形式多样、预测精度高等挑战,国内外研究机构与厂商开展了基于产品全生命周期的数据集成和管理,基于数据挖掘的数据分析应用等方面的技术研究与实践,下面分别介绍。
研究方向1:基于MBD和物联网的数据集成技术
CAX工具数据集成技术:面向产品设计过程中结构设计、电气设计、仿真、试验等过程,一方面定义产品所需标准件、材料、元器件的参数模型和实体模型及标准标准,供不同CAX工具共享使用,另一方面集中管理CAX工具输入输出参数等过程数据并形成设计知识。
智能装备数据集成技术:面向车间各类对象的实时监控和管理,底层采用传感器对环境和设备进行信息采集,采用电子标签对物料、人员、工具工装等进行标识和跟踪,通过数据采集和处理实现信息的可靠高效传输,实现人机料法环测等生产要素的状态监控和集成管理。
异构业务系统数据集成技术:面向工厂内部ERP、PDM、MES、QIS、TDM等业务系统,利用企业门户、企业服务总线、流程平台等集成工具实现各业务系统间界面、服务、流程和数据的集成,最终达到跨业务部门和业务系统的数据融合和流程贯通。
研究方向2:基于产品全生命周期数据管理技术
产品全生命周期管理不同于传统的PDM,它将分散在设计单位、生产单位、供应商、客户等地理分散、形式不同的“产品数据”通过工作流平台和产品全生命周期模型,连接为一种单一的、标准的、真正的产品信息资源的能力。它包括产品设计、仿真、试验制造的数据,还集成来自企业内外部数据,如销售、市场、质量、制造、供应商、客户使用、产品报废处理等数据,从而建立起规范的产品信息来源。
这种信息资源保存整个产品开发决策过程的信息,包括产品的特征描述、功能描述以及对设计和资源的考虑,从而跟踪整个项目进度,并为将来启动的新项目或产品改进项目提供知识。
产品全生命周期管理的关键在于产品生命周期的建模技术、集成数据环境技术和设计制造协同技术。
产品全生命周期建模技术:产品全生命周期建模的目的是建立面向产品生命周期的统一的、具有可扩充性的能表达完整信息的产品模型,该模型能随着产品研制自动扩张,并从设计模型自动映射为不同目的的模型,如可制造性评价模型,成本估算模型、可装配性模型、可维护性模型等,同时产品模型应能全面表达和评价与产品全生命周期相关的性能指标。
集成数据环境技术:产品全生命周期的数据分开存放,系统提供数据的联邦机制,分散在网络上的用户对数据进行存取时,所有数据对用户都应是透明的,所以需要一个电子仓库对分散在企业内外部产品及相关数据进行存储和增删修改操作。当然产品全生命周期数据符合大数据的4V特征,传统数据库管理系统难以支撑,需要大数据平台和技术支撑。
产品研制协同技术:异地设计与制造是指在异地异时、异构系统、异种平台间进行实时动态设计和制造,它是企业内部或供应链之间进行产品全生命周期管理的重要技术手段。
研究方向3:面向智慧工厂的数据分析方法
在工业4.0及大数据应用背景下,“智慧工厂”的建设将以大数据中心为平台,辅以智能技术、数字技术、信息技术,构建精益化的大融合研制体系,形成基于知识工程的产品研发设计、仿真、试验、制造、检验、售后等一体化的服务型研制模式,打造具有自主创新能力、透明管控能力、自我优化能力的智慧化生态环境。
智慧工厂“智慧”的体现应涵盖企业的各个业务领域,能够实现科研院所信息流、物流、资金流、知识流、服务流的高度集成与融合,使得企业持续创新,并不断开发新产品、新服务。但工业大数据具有数据量大、来源广泛、形式多样、种类繁杂等特点,传统的数据分析手段难以实现数据分析和利用。所有要实现各业务领域的智慧就必须结合数据挖掘、文本视频挖掘、统计分析、高维可视化等技术实现工业大数据的充分利用,具体介绍如下:
数据挖掘技术:“数据海量、信息缺乏”是相当多企业在信息化建设和技术手段更新后遇到的问题,数据挖掘又称为知识发现(Knowledge Discovery),是通过分析每个数据,从大量数据中寻找其规律的技术。知识发现过程通常由数据准备、规律寻找和规律表示3个阶段组成。数据准备是从数据选取所需数据并整合成用于数据挖掘的数据集;规律寻找是用分类、聚类、回归、预测、关联等算法将数据集所含规律尽可能以用户理解的方式将找出来。第三节的案例详细描述了整个过程。
图像挖掘技术:产品制造使用过程中有大量的视频、文本、图纸等非结构化数据,这些数据占到了企业数据的80%以上,如何进行非结构化数据挖掘分析是工业大数据利用的核心问题。
例如,某汽轮机企业通过X光机进行叶片虚焊质量监测,传统采用人工方式进行看片,工作量巨大且长时间在高亮度环境下工作对人体有害。该企业对历史二十万张X光机底片进行扫描,并提取存在虚焊的底片利用聚类算法提取虚焊特征,并采用机器学习技术进行算法优化并建立专家库。现在通过X光扫描仪就可以进行疑似虚焊底片的识别,人工在进行复查,提高了检验准确率并减低人员工作强度。
高维数据可视化技术:该技术旨在用图形表现高纬度的数据,并辅以交互手段,帮助人们对其分析和理解高维数据。例如,一个机电产品包含了型号、厂家、价格、性能、售后服务等多种属性,传统BI手段很难直观的表现三维以上的数据关系,人们也很难直观快速的理解。高纬数据可视化是将多维度的原始数据通过聚类算法转换成可显示的低纬度数据,并通过分类算法进行规律总结并通过计算机以图形和图像的技术表达。
例如复杂机电产品寿命数据是一序列的时间记录,利用高纬数据可视化技术将产品失效率的演变规律用图像方式ibiaoda,帮助用户直观地了解到运行环境的可靠性。
工业大数据的典型应用场景
1、企业经营管控
现状:对企业的掌控依赖于纸质的、离散的报表及总结报告等,获取的信息往往存在滞后、缺乏综合性分析意见的反馈等;
目标:实时的、准确的、全面的获取企业运营现状,实现管控透明化,及时发现问题,为科学决策提供支撑;
应用示例:
通过问题看板展示相关负责人或领导可直观的了解现行问题及项目进展等情况,追溯科研能力及生产能力相关的缺失,及时予以科研流程及生产流程的干涉,从根本上解决问题,达到企业价值及客户需求。
大数据对于企业透明化的经营管控可实时的、直观的、全面的展现企业现状、及时地发现问题、快速的定位问题根源并提出相应措施,最终回归到企业价值体现及经营目标建设。
2、产品研制协同
现状:各学科设计分散,缺乏综合考虑;知识以经验的形式掌握在少数人手中;设计工作对少数人的依赖性强,传承性差;存在未考虑上下游客户需求的问题等;
目标:开展多学科融合的协同设计、产品货架支撑的并行设计、以产品全生命需求为依据的综合设计(以客户为中心,向产品定制转型)。
应用示例:
通过建立统一的设计开发环境,实现知识的积累和重用。建立设计平台,对产品研制过程中的各种工作内容进行集成展现和管理,并根据用户角色和工作内容的不同,管理并查看相应的内容,用户可通过研发设计工作台直接开始设计工作。
协同设计研发平台一方面通过数据、产品数据、运营数据管理为基础,将设计经验、工艺信息、制造信息、产品服役过程信息(零部件寿命、质量问题记录等)、客户需求等统一纳入设计需求范畴,也即完成客户等纳入需求考虑,保证设计需求的全面响应,实现定制化奠定基础,逐步协助企业服务化转型;另一方面具体执行设计研发业务支持基于多学科融合的综合,支持多学科并行设计等。
3、全面质量控制
现状:由于质量问题等原因的工程变更追踪困难、变更范围难以确定;
目标:可通过BOM集成管理的数据,进行产品问题的向上及向下追溯,一方面追踪问题根源并对其影响范围进行确定(如存在多少在制品等)并干预,保证后续产品的质量;另一方面根据问题根源,改进原材料或设计工艺等,从根源上解决问题,降低问题重复带来的损失。
应用示例:
以某零部件服役过程产生质量问题为例说明。当产品产生问题时回馈制造商形成质量问题记录单,零部件制造企业基于完整的产品全生命周期数据管理可通过BOM追溯实现零部件批次、设计信息、工艺信息、制造过程信息的快速定位,进而由专业人员进行分析质量原因并采取响应的改进措施:
一方面:保证后续零部件/半成品按更改后的文件制造生产,使问题重复再现得到改善;
另一方面:对同一样已交付使用的零部件采取一定的维护更换或召回处理,规避由某零部件问题造成工程停产的更大损失。