第三章产品与技术
3.1智能仓储管理技术介绍---以智慧图书馆为例
3.1.1控制系统
控制系统由借阅系统和任务分配系统组成。考虑到使用场景存在流动性强等特点,将通过集成资产管理、借阅管理和库存清算以提高系统整体稳定性和可操作控制性。整个系统使用分布式、容器技术,通过分散数据解决高并发下性能问题,同时利于部署,减轻安装上线的运维成本。
1、借阅系统
借阅系统的设计需要实时反应真实的储存情况,且在高数据下最大提升系统整体运行效率,以提高用户整体的使用体验。为解决以上问题,以减少因为实时变动而带来的异常情况。本系统使用热缓存、热度算法控制、RFID技术,基于分布式运算能力,提高系统整体稳定性。
2、调度系统与调度算法
调度系统集成了资产管理、任务分配、实施规划、热度预测、资源调控等功能。作为一套完整的服务系统,能够解决减轻部署难问题。设计容器部署,减少由于环境原因带来的部署问题。将资产管理系统和任务分配系统集成在调度系统内,既便于用户维护也降低用户部署成本。系统使用分布式开发,既减轻了单个服务器的负载问题,同时也能保障下属从机的连接稳定,降低系统的故障率。该系统存在实时信息传输和处理的特性,设计使用ElasticStack进行实时日志接收和输入收入,基于ElasticSearch的高级搜索能力,可以有效提高整体系统运行效率。通过消息服务系统,各系统间可以进行实时通讯,提高整体系统数据沟通和效率。图3-1资产管理模块示意图
由于多个陆地运输平台在同时自巡航运动时会出现包括异常在内的许多复杂情况,从而导致系统错误的问题。为解决这一问题,本项目选择通过ELK使陆地运输平台实时上报位置和运动状态,通过服务器进行跟踪分析和宏观调控,能够定点追踪问题、解决问题,减轻运维成本,提高系统稳定性。流程图如下:
图书在系统各部分间周转的每一个流程,稍有不慎就会造成生产事故。考虑到这个问题,通过实时的信息交换和数据传输。保证书籍交换的同时数据同时交换,做到无感知迁移。仓库布局是任何仓储服务调度算法主要基于遗传算法与群智能算法而设计,通过热度计算将仓库内频繁取用的书籍部署在利于随时取换的位置,减少用户的等待时间。将服务器中所收集的相关数据通过群智能算法的寻优计算,以较高的运算效率得出实时状态下最优的调度方案,从而实现调度系统的优化。
3.1.2数据库的实现
数据库架构设计方面,计划使用MySQL+MongoDB+redis+ELK开发。如图6.1.4。固定的数据会存在基本的冷备数据库,减少服务器性能要求,利于优化和部署,最小化地降低固定数据存储造成的性能损失,而对于需要大范围随机读写的数据,考虑到传统MySQL数据库架构会造成隐式的性能损耗,便通过设计加缓存、使用更高效的数据库架构提升整个系统的查询效率,提升整个系统的运行速度。架构如下图:
和传统架构相比,本项目数据库部分使用了多种数据库软件,通过中间件和消息服务将数据有机结合在一起。在特定的情况下比单个架构数据库的查询效率更高。和纯MongoDB架构和纯ElasticStack架构对比,本项目计划设计的架构有较高容错性和数据稳定性。在业务环境下,稳定性、容错性、查询速度是很重要的三点,通过对数据提供并发性的支持。
3.1.3组件同步实现
实时数据的处理、控制和通知是该系统中较为重要的一部分成分。计划使用ElasticStack+Kafka进行消息队列同步。生产者和消费者(订户)使用Kafka进行消息的同步,对应的运输机器人可以在接收到消息变动通知后主动向数据库拉取数据进行更新。每一步操作使用Kafka进行广播,同时发送至ElasticSearch中的日志通道。后端运维系统使用Kibana进行日志的收集采样分析,保证系统整体稳定性能。基于Kafka消息队列,可以有效管理信息通知,实现整个系统的异步请求和信息实现,架构图如下:
3.2多智能体协同技术介绍多智能体系统(MAS)是由多个分布配置的自治或半自治的智能体通过网络互连所构成的复杂的大规模系统,具有“个体智能+通信网络=整体运动行为”特点,远超单智能体的处理能力。其中,系统的每个个体都具有一定的自主能力,包括自我运动控制、信息传感、处理和通信能力等。总而言之,多智能体拥有去中心化、智能体自主化与复杂功能分布式化。在复杂实时动态环境下,多智能体系统的重点是在有限时间、有限资源的情况下,解决资源分配、任务调度、行为协调、冲突消解等协调合作问题。多智能体协同的实现是每个个体通过学习而采取最优的策略,智能体通过学习来改善自身的性能,以及如何实现群体的协调和优化。通信是协调多个智能体行为的有效机制,通信策略定义了如何决定是否与潜在通信方通信以实现消息传输。通信学习集中于如何更新和调整通信协议,包括学习通信策略和消息内容。通过无人机与无人车之间的相互通信和协调,MAS可通过分布式或协同的方式完成一系列复杂的任务。事实上,在无人集群技术方面一般采用时变切换拓扑结构,即在执行不同任务时无人机与无人车之间可以采用不同的通信拓扑结构连接,在任务完成之后又可以切断连接,具体而言,其拓扑结构是在集中式结构、分布式结构与混合式结构三种中不断切换的,如图图3-6所示。参照传统群智能算法,可将无人设备根据功能设计划分为三类工蜂,将中继站类比于蜂后,并对四者分别采用不同的神经网络训练模型进行初始化。此外,由于该集群需实现多智能体协同作业,对各无人设备采用流计算持续对其内搭载的模型进行更新,并将新获取的数据集与新模型共享到整个集群,新数据集将在中继站进行模型的更新迭代,而后下发至整个集群,集群中无人机或无人车在执行任务时进行自组织与自决策。
此外,为了实现多智能体协同过程中群体的协调性与高效性,需遵循领导者-跟随者(Leader-follower)法、一致性(Consensus)法与基于行为的控制三种编队方法。为实现三种编队方法,则需要基于群智能算法与分布式计算进行算法设计。
3.3目标检测技术介绍
YOLO模型是一种基于深度神经网络的对象识别和定位算法,其最大的特点是运行速度快,可以用于实时系统,并作为一种在计算机视觉领域获得极大声誉与广泛引用。在此基础上,众多学者对其进行研究与改进,提出了多种新颖的改进模块与方法,从而诞生了众多经典的改进型模型。YOLOv8于年1月10日由Ultralytics推出,标志着这一演进的重大进展。与YOLOv5和YOLOv7等早期模型不同,其已经是如今世界上最先进的计算机视觉模型,也是最适合进行适应性改造的模型。其网络主要由Head、Backbone与Neck三部分所构成。在YOLOv8中使用改进后的CSPDarknet53作为主干网络,并通过五个连续的下采样阶段生成五个不同的尺度特征。在之前的主干结构中,其主要是通过借助CSPNet提取分流的思想,同时结合残差结构的思想,设计了所谓的C3Block,这里的CrossStagePartial(CSP)主分支梯度模块为BottleNeck模块,也就是所谓的残差模块。在YOLOv8的主干结构中,其通过ELAN的思想对C3模块进行改进并最终设计出了C2f模块,使得其能在保证模型轻量化的同时获得更为丰富的梯度流信息。其次,YOLO框架最为重要的设计则是其设计了一种SpatialPyramidPooling(SPP)结构。在骨干网络的后期使用了空间金字塔池化快速(SPPF)模块,通过三个连续的最大池化层自适应地生成具有一致大小的数据,从而池化输入特征图。与空间金字塔池化(SPP)结构相比,SPPF通过一系列连续的最大池化层优化了计算效率并减少了延迟。借鉴PANet的思想,YOLOv8在其颈部组件中引入了PAN-FPN架构。与YOLOv5和YOLOv7模型中的颈部设计不同,YOLOv8通过消除PAN结构内部上采样后的卷积操作,实现了更简化的配置,同时保留了模型的初始性能。这一策略构建了一个综合的网络结构,统一了自上而下和自下而上的组成部分。通过特征融合,它结合了表层位置洞察和深刻语义细节,从而丰富了特征的广度和深度。在头部结构上,YOLOv8使用了Decoupled-Head,同时使用了DistributionFocalLoss(DFL)的思想,用于目标分类和边界框回归的预测。此外,YOLOv8还改进了损失函数的使用。具体而言,其分类损失为VFLLoss,其回归损失为CIOULoss联合DFL的形式。VFL主要改进是提出了非对称的加权操作,FL和QFL都是对称的。相对于的针对这里的DFL,其主要是将框的位置建模成一个generaldistribution,让网络快速的聚焦于和目标位置距离近的位置的分布。与此同时,分类任务受到了二元交叉熵损失(BCE损失)的支持。这一有意的设计选择有助于提高检测精度并加速模型的收敛。YOLOv8是一种无锚检测模型,简化了正负样本的区分。此外,它还整合了Task-AlignedAssigner以进行动态样本分配,从而提高了检测的准确性和模型的鲁棒性。为了增强网络提取特征能力,本技术中设计了一种新的Backbone结构替换原来YOLOv8算法的DarkNet-53网络。DarkNet-53网络是Yolov8的主干网络,分别用于提取8、16、32倍降采样的特征。网络部分大量使用了1×1卷积和3×3卷积,其中1×1卷积主要应用于通道的扩充与缩减。整体的卷积网络采用的是Conv+BN+SiLU结构形式,C2f结构如图3-7所示,C2f层的Block的瓶颈结构(图3-8左)先使用1×1的卷积核对通道进行收缩,再使用3×3的卷积核对通道进行还原,其本质是矩阵分解的思路,用于减少参数量,其次还使用到了CSP结构减少计算量。
本技术首先采用一个新的CSPConvNeXtLayer层,如图3-7(右)所示。具体来说,主分支为一个卷积层接一个重复N次的Block结构,如图3-8(右)所示,残差分支为一个卷积层,然后将两个分支的结构拼接,经过一个注意力层后,使用一个卷积层输出最终结果。其中的Block结构为两个分支,分支一为卷积核大小为9的组卷积层,经过一个残差连接后,接卷积核大小为3的卷积层;分支二为卷积核大小为3的组卷积层,接卷积核大小为1的卷积层。将两个分支的结果相加后,最后进行通道清洗融合不同通道的信息。
此外,为了增强特征融合网络的特征融合能力和网络的预测能力,本技术中还设计了一种新的FPN结构,具体来说,如图3-9所示,使用CSPConvNeXtLayer层替换C2f层;其次,引入ODConv动态卷积,如图3-10和图3-11所示,其通过并行策略采用多维注意力机制沿核空间的四个维度(卷积核数、空间大小、输入通道数和输出通道数)学习互补性注意力。作为一种“即插即用”的操作,它可以轻易地嵌入到现有CNN网络中。同时考虑到实际场景中火焰和烟火为非刚性物体,目标大小变化较大,针对存在小目标的情况,本项目加入了特征图大小为原图下采样4倍的预测层,增强对浅层特征信息的学习能力,进一步提升目标的检测精度。
订阅解锁TA的全部专属内容