物联网平台是任何物联网解决方案的基础,可实现连接设备以及从这些设备捕获的数据的连接,配置,设备管理,自动化,仪表板和数据分析。物联网平台提供了一组现成的功能,可以极大地加快管理和监视大量物联网设备所需的应用程序和基础设施的开发速度,从而保证可扩展性以及一定程度的跨设备兼容性。
值得注意的是,许多在4-5年前就开始创业的物联网初创公司在其最初和形成阶段因为那时还不存在强大的物联网平台。如今,有太多这样的平台存在于各种不同的需求、垂直市场和成本点上供选择。有开源物联网平台、横向物联网平台和垂直专项综合物联网平台。但现在大多数都是基于云的。
边缘物联网平台的出现
所有数据通常都被发送到云端,而网关本质上更像是一座南北桥,以不同的协议从传感器获取数据,转换然后使用诸如CoAP/mqt之类的物联网协议将数据发送到云端,并使用更具网络化的基于IP的网络协议。网关还内置传感器数据的数据管理和传感器设备的空中传送(OTA)升级。
但是现在随着从云到边缘的转变,网关和边缘模型已经变得非常突出。除了协议转换和设备管理的基础知识外,Edge IoT平台现在还需要实现许多固有的云IoT平台功能,包括存储、数据分析、数据规范化、可视化等。所有这些都需要在资源约束更大的环境中完成。
连接性和构建管理的重要性
在现场管理大量的边缘设备可能是一个巨大的挑战。由于缺乏强大的基础设施来管理、维护和监控这些边缘设备,许多物联网解决方案初创公司的整个投资回报率都在下降,甚至在现场对设备进行基本调试和更新时,也有多辆卡车/人员。有趣的是,上面提到的大多数方面要么没有实现,要么在试点和概念验证过程中被忽视了,但随着规模的扩大,它们会反过来咬你。几家物联网解决方案提供商都强调了其规模扩大带来的困难。传感器、边缘设备、网关的连接、它们的缓冲能力、能量收集、电池以及彼此之间的构建兼容性都可能成为运行和支持物联网系统的大量威胁的来源。
在实际的大型物联网部署中,很少会出现以下常见问题:
- 无线连接可能会中断
- 传感器/边缘设备可能需要重新启动电源
- 传感器和边缘不兼容,无法进行OTA升级
- 边缘分析需要对一些设备进行特殊更新,但不是所有设备
- 一个传感器在两年前就售出了,现在客户正在把它带到网上(在工业物联网中可能发生)
- 基于JSON(或任何其他格式)的数据未到达云(可能是连接或边缘构建问题)
- 边缘构建正在崩溃
- 对边缘进行小更新后,API失败
上述问题经常发生,因此有必要制定一个自动化的调试和缓解计划。以上所有都必须手动管理,那么完全不可能构建物联网系统来实现规模化。
假设工厂的一个系统中有100个传感器和100个边缘-一个规模非常小的物联网系统。一个简单的组合分析将显示工厂可以在一个工厂中经历3200个物联网故障!随着一个系统中传感器数量的增加,比如说10000个——总的故障数量将超过320000个。没有物联网支持系统的自动化,没有人可以手动管理如此复杂的系统。
大多数所谓的物联网边缘平台还不支持边缘分析。在边缘,通常需要管理三个构建——传感器固件、操作系统和分析。通常,分析需要更新得更快,而其他人的更新频率要低得多。现在,所有三个版本都需要在更新期间自动同步。第二个重要的方面是分析的OTA,因为分析包比400MB包大得多,而系统包要小得多。因此,OTA的分析包需要一个更安全的碎片化方法。
在任何物联网解决方案中,运营商都需要知道发生了什么,原因和地点。传感器网络故障数据在传感器节点内部可用。还提供Internet连接数据、服务器数据、网关数据和API日志。但是随着事情的扩大,需要一个中央自动化工具来进行大量的机器学习,以找出问题与其根本原因之间的关系,分析可用的日志文件。本质上,需要解析日志文件并将其放在某种结构化的数据格式上,以便能够自动检测到问题-原因关系并内置缓解逻辑。在任何大规模的物联网部署中,上述自动化理想情况下都需要在体系结构层面上完成,否则当发生故障时,很难处理这种情况,随后的纠正会消耗资源、时间和利润。
系统运行状况和诊断
随着物联网部署规模的扩大,必须监控服务器实例、传感器电子设备、边缘电子设备、运行进程等的系统健康状况。例如,10000个传感器的系统可能包括10000个传感器电子设备、1000个网关/边缘电子设备和100个服务器。它们中的任何一个可能会出现故障,或者可能需要重新启动或诊断以进行修复,而这又可能只是一个补丁或系统更新。服务器健康数据可通过API从公共云中获取,用户可以从网关(hub)/边缘设备和传感器电子设备中提取相同级别的API驱动的健康数据。跟踪所有这些系统过程是非常重要的。这为时间序列数据和警报/短信驱动系统提供了一个系统化和统一的仪表板,以提醒系统管理员某个特定的传感器或服务器正在关闭或可能关闭。典型的经验法则是尽可能地自动化修复。
简单地说,物联网的整体理念是自动化或减少人力,以提供更好的服务和信息。因此,在24×7检查物联网系统的健康状况时,如果需要额外的人力,基本前提将被破坏。