大数据用来指那些很难用传统数据库和软件技术处理的海量数据。从NASA到Netflix公司,很多不同行业和规模的机构都在利用大数据的优势,提升自身业务效率。当然,也有大量公司仍然落后于时代大潮,并非因为缺乏数据,而是缺少收集和分析数据的高效体系。
这一切将很快改变。美国通用电气公司和匹维托客户关系管理公司合作研发了一套新系统,这套系统让更多公司能够利用大数据分析工具和产业互联网,后者是一个复杂的物理机械网络。
这一新系统叫做“产业数据湖”,该系统结合了通用公司的Predix工业软件平台和开源软件框架Apache Hadoop。通用软件副总裁比尔•荣解释说,“产业数据湖”融合了操作技术和信息技术,以便更好地满足我们的客户对生产率和效率的要求,使他们能发挥其关键任务信息的最大功效”。
因为很多公司都在寻求更有效的方法,对其机器和其他运营设备进行更有效的在线控制,该系统也就应运而生。分析公司IDC估计,至少四分之三的智能产业解决方案是数据密集型的。通用软件负责平台产品营销的洛塔尔•舒伯特说,“因此,高效的产业数据管理系统成为寻求将自身业务数字化的公司的首要选择。
数据湖效应
数据湖是怎样工作的呢?该系统的基本运行方式是:Predix把产业互联网内范围内的产业设备连接在一起,使得操作者可以从不同的联网机器里筛选传感器数据,并上传至一个单一平台。Hadoop的大规模并行处理机会把单一平台里的数据按照一个整体进行分析,而不是10亿多分散的信息。
通用航空首席技术官、计算机科学家大卫•巴特利特说:“我们抓取元数据,即数据的数据,而不是对数据进行分割分类。”
这种数据处理系统能够应用于航空、铁路、医疗等多个行业,用小而有力的洞察分析带来巨大的成本节省。
至今为止,产业数据湖系统已经应用于通用航空集团,并产生巨大效应。在一次试验中,通用航空集团收集了来自25条不同航线的15000次航班的数据。通过产业数据湖方法,工作人员第一次整合全部飞行数据,更有效的分析了飞机发动机温度和其他运行因素,从而节约了10倍的成本。
这意味着,大数据拥有巨大潜力和发展前景。它不仅仅是不同信息的大型数据库,而是一个适应商业发展速度的相互关联相互参照的系统。大数据让人们对函数有了更深刻的认识,也改变了业务模式。