- 当前位置:
- 首页
- >
- 技术攻关
- >
- 工业时序数据的分布式标注和增量学习框架研究
工业时序数据的分布式标注和增量学习框架研究
- 分享到:
- 项目计划总投入:300万元
- 奖励金额:300万元
- 单位名称:硕橙(厦门)科技有限公司
- 所属领域:新一代信息技术
- 技术需求类型:关键难题
- 期望合作方式:联合开发、全职引进、委托专家团队长期技术服务
- 联系人:尤**
- 联系电话:18030091200
我要揭榜
项目需求说明
随着工业物联网的发展,工业设备产生了海量的时序数据,这些数据包含了设备运行状态和生产过程参数变化等重要信息,对提高设备可靠性、优化生产流程、提升产品质量及实现预测性维护具有重要意义。一方面,工业领域日益依赖数据标注技术,通过数据标注和特征工程的方法,将难以直接解读的时序数据转化为可用于机器学习和深度学习模型的格式,从而训练出基础模型,为后续的故障诊断、质量预测和生产优化等应用提供支撑。另一方面,面对不断增长和变化的数据,传统的数据存储方法不仅浪费了大量存储空间,还对基础模型的实时性和泛化能力提出了严峻挑战。因此,亟需高效的数据管理方案,以降低存储成本并保留有价值的数据。在经过自动化或人工标注后,如何利用待定标记数据实现基础模型的增量训练策略,以应对数据变化,确保新数据上模型性能的下降不超过5%,从而提高模型的稳定性和适应性,是当前的关键问题。
通过以下技术攻关方向和指标的实现,期望能够有效解决当前工业物联网中面临的技术壁垒,推动智能制造的持续发展:
1)自动化数据标注:开发基于机器学习和深度学习的自动标注工具,以降低人工标注的成本和时间,提高标注效率,目标是减少50%以上标注时间,并将提高标注准确率至95%以上。
2)特征提取算法优化:研究新型特征提取算法,从海量时序数据中提取关键特征,提升模型性能。
3)高效的数据存储与管理:开发高效的数据压缩算法和去重技术,减少存储空间的浪费,同时确保重要数据的保留。根据数据的重要性和使用频率,合理分配存储资源,预计存储成本减少30%以上。
4)实时监测与反馈机制:构建实时监测系统,对模型在新数据上的性能进行跟踪,及时反馈并调整模型。增量训练后,模型在新数据上的性能下降不超过5%,确保其稳定性和适应性,并保证模型的准确率、召回率或者F1-Score不低于95%。
现有基础条件情况
公司位于厦门市集美区,占地面积1900㎡。公司具备专业配套、装备齐全、控制和检测仪器先进、工程化能力强、具有国内领先、国际先进水平的研发和试验场所,实现了科研、办公的全自动化工作环境。技术研发人员有86人,现有博士6人(平均年龄36岁)、在读博士2名,研究生9人,95%以上拥有大学本科以上学历;其中总工程师瞿千上是福建省高层次境内A类人才,首席科学家谭熠是厦门市政府重点引进双百计划领军型创业人才;公司2023年投入1832万研发经费,占销售收入18%。
公司拥有多年所累积的实际工业设备的运行数据库,现有工业声振数据库音频达168 GB,包含48,600分钟的声振数据,涉及19个不同场景和48种原始工业音频。我们在半监督学习算法(如 Mean Teacher 和 Pseudo-Labeling)及多种深度学习和机器学习算法方面具有丰富经验。目前,自动化标记的准确率已达到87.65%。此外,公司配备了GPU服务器和云计算资源,能够支持大规模的数据处理和模型训练,从软件、硬件、算法等研发开发提供完备的支撑。
预期成果及经济社会生态效益
工业时序数据标注及增量学习平台开发出了网页界面,结合设备传感器数据,可完成设备运行状态、报警事件和设备属性的标注。通过训练机器学习和深度学习模型,能够预测设备故障的发生,从而减少停机时间和维修成本,提高终端产品质量,并降低不合格产品的制造率,帮助企业提前发现问题并及时采取措施。此外,考虑到工业数据的安全性和隐私问题,企业在标注数据时,特别是涉及敏感信息时,需确保数据的保密性。采用安全标注平台和流程以保护数据安全至关重要。
工业数据标注是提高生产效率和质量的关键。通过实时监测生产过程和建立高质量的标记数据集,企业可以获得竞争优势,降低成本,提高产品质量,以满足不断变化的市场需求。数据标注技术的不断进步将为工业行业带来更多机遇,带动工业物联网研发进展,助力企业提高产线生产效率、经济收益,提高运营安全,进一步优化工艺水平,充分发挥数字经济给企业带来的红利效益。加速“中国制造”向“中国智造”转型,促进中国制造业升级,提升国际竞争力,推动实体经济高质量发展。
对技术难题解决应征方要求
1)资质条件:应征方需展示在类似项目或技术领域的研发经验,包括已完成的相关项目。要求提供相关技术成果或案例,包括论文发表、专利申请等。
2)科研能力:拥有专业的技术研发团队和工业数据算法相关人员。
3)项目时限:应征方需提出明确的研发时间表和项目里程碑,确保项目按时完成。需有能力在规定的时间内完成技术难题的攻克,并提供有效的解决方案。
4)产权归属:明确项目成果的知识产权归属,研发过程中产生的新技术、新方法等相关知识产权应有明确的归属和使用规定,以确保双方权益。
5)利益分配:确定项目收益的分配方案,明确各方的收益比例。
6)保密相关:应征方需同意签署相关的保密协议,以保护商业秘密和技术信息。