打造垂直领域矿山大模型
打造垂直领域矿山大模型
——看云鼎科技如何赋能矿山智能化
◎ 本报记者 马晓敏 通讯员 刘强
近日,杭州深度求索人工智能基础技术研究有限公司开发的DeepSeek(深度求索)大模型成为科技圈顶流,不仅实现了技术上的突破,而且完全开源,开启了低成本探索人工智能(AI)的新阶段,这也标志着AI大模型正式步入“低成本、高精度、全开源”的普惠时代。
作为山东能源集团旗下专注于信息技术服务和工业智能化应用的A股主板上市公司——云鼎科技股份有限公司(以下简称“云鼎科技”)第一时间接入DeepSeek,同时凭借其在矿山、化工行业积累的海量数据优势,蒸馏出首个垂直领域矿山大模型,目前已全面接入山东能源集团知识助手。
构建垂直领域矿山大模型
数据是矿山大模型的养分,而山东能源集团则为AI的落地提供了丰沃的土壤。在矿山智能化领域,云鼎科技依托山东能源等积累了覆盖安全生产、设备管理、应急救援等关键业务场景的百万级数据资源,这也为构建垂直领域矿山大模型提供了数据蒸馏基础。
云鼎科技相关负责人告诉记者,通过数据蒸馏技术,云鼎科技采用DeepSeek-R1作为教师模型,对高质量矿山数据进行数据蒸馏,获得矿山行业高质量思维链数据。同时,利用高质量思维链数据对自有模型进行微调,将教师模型的输出与学生模型的输出差异通过损失函数进行度量,并通过这一损失值指导学生模型反向传播过程,从而实现参数的优化。
通过这种方式,学生模型能够学习到教师模型的高级特征,达到或接近教师模型的性能水平,从而显著增强自有模型在矿山行业中的推理能力,最终蒸馏出首个基于DeepSeek-R1的垂直领域矿山大模型。
打通落地应用“最后一公里”
只有垂直领域矿山大模型还不够,真正深入核心业务环节还需要链接应用,基于这个需求,云鼎科技打造了自然语言处理应用智能体。DeepSeek的完美接入,让应用效果大幅提升。
记者了解到,云鼎科技自然语言处理应用智能体提供知识问答应用,解决大模型“幻觉”问题。采用端到端自研的检索增强生成架构,内置中文增强的向量化模型与重排序模型,辅以混合检索与多源融合排序,有效提升知识检索精度,中文领域端到端检索精度超过90%。工作流应用基于智能体工作流表达式语言,支持十多项内置组件以及自定义组件,用户可根据业务逻辑构建工作流,降低开发门槛、提高开发效率。
赋能行业数智化升级
云鼎科技垂域矿山大模型的应用,解决了通用大模型无法理解矿山行业知识的问题,并且通过自然语言处理应用智能体,在安全生产、运营管理、财务审计和辅助决策等多个业务场景实现落地。
利用向量数据库存储大量的矿山行业数据,结合检索增强生成提升回答准确率。在专业的安全生产场景中,云鼎科技打造煤矿安全生产知识助手,支持用户通过自然语言快速精准获取安全生产、生产数据、设备信息、创伤急救等知识,煤矿安全生产信息获取效率提升80%以上,设备故障排查和处置知识传递效率提升70%以上。
“云鼎科技将持续深化与DeepSeek等AI大模型的融合,依托‘行业数据+大模型能力+场景经验’三位一体的核心优势,打造差异化的本地部署解决方案。针对矿山、化工、电力、钢铁、油气等行业对数据安全和私有化部署的强需求,提供模型部署、应用开发、场景方案定制、场景效果优化、系统运营运维的端到端一体化服务,以技术创新推动业务发展,赋能行业迈向智能化新时代。”云鼎科技相关负责人告诉记者。
评论
已有条评论