科研成果

当前位置: 首页 > 科学研究 > 科研成果 > 正文

论文推荐第1期:大语言模型赋能的新一代智能制造技术

发布时间:2025-02-14 点击数量:

论文简介

论文《A survey on potentials, pathways and challenges of large language models in new-generation intelligent manufacturing》已于2024年9月成功发表于中科院1区期刊《Robotics and Computer-Integrated Manufacturing》,作者为西安交通大学张超副教授、周光辉教授等。论文全面探讨了大语言模型(LLM)在新一代智能制造中的应用潜力、技术路径和面临挑战,前瞻性地提出了适用于新一代智能制造的大语言模型赋能架构,分析了LLM在设计、生产、服务等环节的应用路径和典型案例,为工程领域制造企业快速、低成本、高兼容地接入和应用LLM提供理论方法与技术路径支撑。

原文链接:

https://doi.org/10.1016/j.rcim.2024.102883

引用本文:

Zhang C, Xu Q, Yu Y, et al. A survey on potentials, pathways and challenges of large language models in new-generation intelligent manufacturing[J]. Robotics and Computer-Integrated Manufacturing, 2025, 92: 102883.

论文摘译

A survey on potentials, pathways and challenges of large language models in new-generation intelligent manufacturing

摘要:如何增强人类能力甚至将人类从制造过程感知、学习、决策与执行的流程中解放出来,已成为工业5.0背景下智能制造领域亟待解决的关键问题之一。作为新一代人工智能的突破性成果,大语言模型(LLM)能够提供适用于多种应用场景的类人交互、推理与应答能力,在辅助甚至替代人类参与智能制造中的感知、学习、决策与执行全过程展现了巨大潜力。LLM与智能制造的结合具有天然优势,有望成为下一个研究热点。因此,本文主要针对LLM在智能制造中的应用开展系统性调研和分析,以识别具有较高研究潜力的前沿研究方向和应用落地路径。首先,本文揭示了LLM的概念内涵与基础架构;其次,总结医疗健康、药物研发、社会经济、教育、软件开发等若干典型前沿交叉领域的LLM应用路径,并在此基础上设计了LLM赋能的新一代智能制造架构,为LLM在智能制造中的应用提供参考;再次,从设计、生产与服务三个维度探讨了LLM在智能制造中的具体应用路径;最后,本文揭示了LLM在智能制造研究与应用中将面临的局限性与挑战,并探讨了潜在的解决路径。

关键词:大语言模型,智能制造,新一代人工智能


1.引言

当前,工业革命(Industry 1.0~5.0)的演进推动了制造系统的变革性发展。制造系统经历了从以机器为核心的传统制造,到以系统为核心的智能制造,直至以人为本的新一代智能制造。在此背景下,如何增强人类能力甚至将人类从制造过程感知、学习、决策与执行的流程中解放出来,已成为新一代智能制造亟待解决的关键问题之一。

近年来,新一代人工智能技术取得重大进展,推动着科技领域向前发展。该领域的最新突破是大语言模型(LLM),其在问答、推理、机器翻译等多种自然语言处理(NLP)任务中取得了显著成功。大语言模型(LLM)能够提供适用于多种应用场景的类人交互、推理与应答能力,在辅助甚至替代人类参与智能制造中的感知、学习、决策与执行全过程展现了巨大潜力,并已在制造知识库管理、工艺文件编制、智能运维等若干制造场景中初步应用。然而,LLM赋能的新一代智能制造系统仍处于起步阶段,LLM在新一代智能制造中的应用潜力、技术路径与面临挑战仍有待探索。

鉴于此,本文总结了LLM的概念内涵与基础架构,并针对LLM在新一代智能制造中的应用潜力开展了系统性调研和分析,以揭示具有较高研究潜力的前沿研究方向和应用落地路径。具体包括:

跨学科赋能框架设计:参考医疗、经济等跨学科领域LLM应用经验和路径,设计了LLM赋能的新一代智能制造架构。

全过程应用路径探索:从设计、生产、服务三个阶段,探讨了LLM在新一代智能制造中的具体落地场景与典型案例。

挑战与未来方向揭示:本文揭示了LLM在新一代智能制造研究与应用中将面临的局限性与挑战,并探讨了潜在的解决路径。


2.人工智能新突破:LLM崛起

LLM的兴起与发展脉络:LLM的发展经历了从20世纪50年代基于规则的语言模型,到统计语言模型、神经网络语言模型、预训练语言模型的演化,最终形成今天的大语言模型(如图2所示)。早期基于规则的模型可解释性强,但处理复杂语言有限。随着RNN、LSTM的引入,模型更好地捕捉上下文关系。2013年,word2vec提出了神经网络词向量表示,2018年基于Transformer的预训练模型(如BERT)提升了NLP任务性能,促使生成模型如GPT-2、BART的研究迅速发展。自2020年起,GPT-3等大规模预训练模型展现了超越小型模型的能力,使得“大语言模型”成为热门话题,并开创了更为广泛的应用场景。

LLM的基础架构总结:LLM的核心是Transformer,解决了传统神经语言模型在处理可变长度序列和上下文感知方面的局限性。Transformer架构由编码器和解码器组成,其核心组件包括多头注意力机制和前馈神经网络,这些特性使其能够有效处理长距离依赖关系,并支持高并行性。这些特性使Transformer在多种NLP任务中表现出色,尤其适合大规模预训练,因此已成为主流模型(如T5、BERT和GPT系列)的骨干架构。原文中表1详细列出了不同LLM的配置,包括它们的优缺点、适用的NLP任务以及相关开源代码的链接。

3. LLM赋能的新一代智能制造系统架构设计

LLM赋能架构:LLM技术在制造业中的应用展现了其在产品生命周期各阶段(设计、生产和服务)的巨大潜力,但目前缺乏全面且实用的架构范式来系统评估其效用。如图1所示,本文提出了一种适用于制造业的LLM应用架构范式,旨在指导行业部署LLM,促进其全面发展。LLM与先进技术(如机器学习、知识图谱、数字孪生等)的集成,可为制造全流程提供协同支持,提升产品生命周期管理。在设计阶段,LLM的自然语言处理能力可高效实现技术文档处理与工艺规划;在生产阶段,其数据分析能力可用于数据管理、质量控制和预测性维护;经过专业知识微调后,LLM能为技术培训和生产问题提供支持;同时,LLM的代码生成能力可在建模和程序测试中发挥作用,提升工艺实施效率。尽管New-IM的目标是实现自我管理,LLM卓越的人机交互能力仍可在制造过程中提供智能辅助。最终,该架构将LLM的五大能力与New-IM范式中的自感知、自学习、自决策、自执行与自适应相对应,为LLM在制造业的逐步集成提供基础。

图1 LLM赋能架构

LLM赋能机制:LLM在制造业中的应用集成是一个逐步的过程,分为四个阶段:辅助型LLM、协作型LLM、自主型LLM和系统化LLM,如图2所示。在初始阶段,辅助型LLM作为工具支持人类,承担低风险的任务,如数据整理和操作指导;在协作型LLM阶段,LLM承担更积极的角色,辅助产品设计和工艺规划,提供实时数据分析,但仍需要人类判断和调整;自主型LLM进一步提升,能够独立执行特定任务,减少人工干预,但仍需人类间接监督;最终,系统化LLM通过多智能体协作,实现复杂任务分解与分配,并确保任务完成的逻辑一致性。

图2 LLM赋能机制

4.新一代智能制造中LLM应用路径研究

本节从设计、生产和应用角度探讨了LLM在新一代智能制造中的应用路径,并分析了相关案例。

LLM赋能的设计方案优化生成:设计不仅涉及产品外观和功能,还包括从概念到生产的全过程,如设计优化、可制造性分析和生产过程规划,特点包括多学科协作、创新、个性化需求、复杂决策过程以及关注用户体验。LLM通过自动化生成和优化提升了设计效率,快速创建满足制造要求的解决方案,减少设计迭代时间。在工业5.0中,LLM增强的设计方法全面满足设计师、生产者和消费者的需求,增强了设计决策能力。从原文中的案例可以看出,基于GPT-4的DesignGPT能够进行可制造性分析,识别不可制造区域并自动生成优化设计建议,减少人为错误,提高设计效率,确保产品设计符合制造要求。

LLM赋能的生产过程智能优化:智能生产以高效、柔性和高质量为目标,涉及广泛的数据处理、智能优化和人机协作。LLM凭借强大的数据处理、分析和生成能力,在提升生产过程效率、灵活性和质量展现巨大潜力和优势。例如,在智能工艺规划中,LLM通过理解人类意图,生成初步工艺方案并促进人机交互,提升了工艺规划的效率和一致性。从原文中生成式智能工艺规划案例可以看出,结合LLM与数字孪生技术,通过微调GPT模型开发了ProcessGPT,支持工艺规划人员随时访问与学习,生成工艺知识并通过数字孪生系统进行在线仿真验证,确保工艺规划过程的高效与可靠性。

LLM赋能的智能运维服务:产品服务在制造业中至关重要,涵盖了从支持到维护、修理和运营(MRO)等活动,旨在提升客户满意度、增加产品可靠性并延长使用寿命。LLM在MRO流程中,通过强大的数据处理、实时分析、知识整合和个性化服务能力,有效支持故障诊断、设备分析及维护决策等过程,能够显著提高维护效率和客户满意度,推动制造业智能化和个性化服务发展。从原文中的应用案例可以看出,通过将航空装配知识图谱整合到LLM中,利用推理帮助识别故障根本原因并提供解决方案。通过语音或文本输入,LLM能生成故障示意图,分析原因并提供排除计划,有效减少停机时间和经济损失。

5挑战与趋势

本节总结了LLM在新一代智能制造中的局限性和挑战,并提供了持续改进的建议和研究方向。

LLM赋能新一代智能制造面临的挑战:尽管LLM在新一代智能制造中展现了巨大潜力,但仍在数据、算力、可靠和隐私等方面面临挑战:(1)缺乏高质量领域数据和多模态数据整合工具;(2)训练和使用LLM需要大量计算资源,且模型效果与轻量化的平衡仍是难题;(3)LLM输出的不可解释性和“幻觉”问题影响其应用;(4)伦理和隐私问题,特别是决策责任和员工个人数据保护。

LLM赋能新一代智能制造的未来趋势:为应对LLM在New-IM中的局限性,未来研究将聚焦于:开发多模态LLM和高效微调技术,减少对大数据集的依赖;创建轻量级LLM以降低计算成本;结合知识图谱和数字孪生提高可解释性并解决幻觉问题;建立伦理与法律框架应对隐私和数据保护。具体而言,多模态LLM通过整合文本和图像提升效能,轻量化方法通过压缩减少计算负担,知识图谱和数字孪生增强可解释性并减少错误预测,伦理框架和联邦学习确保数据隐私和合规性。

作者简介:

第一作者:

张超,西安交通大学机械学院副教授、航天制造与信息工程研究所副所长,曾入选国家博新计划(2021)、陕西省青年人才托举计划(2021)、Elsevier全球前2%顶尖科学家榜单(2024),兼任中国图学学会数字孪生专委会委员、中国机械工程学会高级会员等。主持国家自然科学基金专项/面上/青年项目、国家重点研发计划子课题等10余项。近五年以第一/通讯作者在机械工程学报、IEEE TII、IEEE IoT、JMS、RCIM等期刊发表SCI/EI论文30余篇(ESI高被引论文2篇),共同主编学术专著/教材3部,授权国家发明专利/软件著作权20余项,以第一完成人获2024年陕西高等学校自然科学一等奖。

通讯作者:

周光辉,教授、博士生导师,现任西安交通大学机械工程学院副院长、智能制造创新中心主任,教育部新世纪优秀人才,享受陕西省“三秦”人才津贴,兼任中国机械工程学会生产系统专委会副主任、中国自动化学会制造技术专委会副主任委员、中国图学学会数字孪生专委会常务委员、陕西省智能制造专家咨询委员会委员。近年来在机械工程学报、IEEE Trans、ASME会刊、RCIM、JMS、JCP等发表高水平论文150余篇,出版学术专著2本,主编/参编教材及教学参考书12部;授权国家发明专利37项、软件著作权28项;曾获教育部自然科学一等奖、陕西省学位与研究生教育学会教学成果一等奖、陕西高等学校自然科学一等奖等科研奖励。