一、图像数据采集与智能分拣设备:相关参数: 一、硬件: 1、沙盘外形:长为850mm,宽为560mm,高为1800mm(允许±5%误差)。 2、支架采用铝型材,面板为铝塑复合板件,兼顾结构的稳定性与整体的美观。 3、采用USB接口相机。 4、采用轻量型四轴机械臂,最大功率60W,配置吸盘、气泵控制盒。 5、参数:CPU i7以上,内存16G以上,固态硬盘容量1T以上。 6、键盘×1,鼠标×1,物料托盘×2,专用标定板1块,工具收纳盒1个。 7、显示屏参数:面板尺寸≥31.5英寸,屏幕比例16:9,最佳分辨率1920×1080以上。 8、物料参数:提供电容零件≥50个。 二、软件: 1、提供无序分拣功能。对处于无序状态下的若干个电容零件,可以通过神经网络预测出零件的抓取位置并指挥机械臂进行抓取。 2、提供基于Windows GUI的机械臂标定、移动、工作区域圈定、连接、断开功能。 3、支持数据源、预处理算法、神经网络模型、发布模型的选择。 4、提供图像处理前后的实时对比功能。 5、提供基于TensorFlow的深度神经网络初始模型,支持用户在初始模型的基础上搭建新的神经网络,进行训练并保存结果。 6、支持根据当前代码实时生成网络结构图。 7、支持模型训练步骤设置、模型名称设置、实时查看模型训练损失和模型准确率。 8、支持HTML格式模型训练报告的生成。 9、支持抓取结果、抓取成功率、模型预测成功率的实时查看。 10、支持基于光电感应开关的图像数据实时自动标注功能。 11、支持用户更改抓取对象,重新采集数据并进行深度学习训练。 12、提供模版匹配功能,能够根据提前截取的模版,通过计算相似度,对高于一定阈值的物体进行抓取。 三、教学资源: 1、提供基于深度学习的无序抓取案例说明文档不少于1份,文档内容包括图像数据采集、图像数据预处理、模型构建、模型对比、模型评价等。 2、提供案例配套教学PPT不少于1份,辅助日常教学工作。 3、提供案例配套样例数据包不少于2份,可添加沙盘实时数据。 4、提供案例配套代码不少于3份,代码与文档对应,沙盘增量数据无需更改代码即可运行。 二、设备配套互联网大数据采集实训系统:相关参数: 一、基础技术模块: 1.平台主体包括配置流程设计的客户端和包含主程序、采集节点、数据库的服务器端。 2.提供公有云和私有云两种网络方式,支持服务器端分布式集群架构,可部署多个采集节点和数据库,实现大规模、高并发的云采集。 3.支持热插拔添加集群,保证系统正常运行。并通过自动负载均衡算法调节用户资源配额,确保公平利用。 4.支持主程序部署在Windows、Linux服务器上,客户端可运行于Windows、Linux、MacOS个人电脑。 5.支持自动拆分云采集任务,智能分发到服务器端采集集群,自动汇总子任务数据。 二、数据采集模块: 1.提供互联网公开网页数据采集,支持使用采集模板或定制化采集。 2.允许单用户同时进行多个采集工程,支持导入先前完成的项目数据链接。 3.提供日志和快照的实时查看功能,支持自动过滤重复数据。 4.支持使用代理IP采集,提供接口获取IP,支持JSON和text两种模式,支持手动输入或使用隧道代理IP。 5.支持模拟人工网页浏览操作,包括预登录、输入文本、点击元素、提取数据,支持可视化制作采集规则流程设计。 6.提供选择的元素高亮显示功能。 7.支持相对路径xpath元素选择。 8.支持直接配置多页数据采集,包括翻页类型和参数配置。 9.支持多层级网页数据采集,自动合并主从页面数据。 10.支持翻页前可校验页码成功性,并查看翻页快照。 11.允许自定义采集字段,在可视化规则流程出错时具有智能提示功能。 12.支持文档、图片、视频等字段类型修改。 13.支持配置账号密码登录并记住cookie信息,确保登录后数据采集的完整性。 14.支持自动重试采集任务,可配置重试次数并自动检测问题。 15.客户端和服务端支持定时控制,可设置单次采集时间,支持每天、每周、每月定时采集。 16.支持定时增量采集任务,实现定期自动数据更新。 17.支持查看最近十次的采集日志记录。 18.支持采集工程流程审批与公开模板的实现。 19.支持审批状态的消息提醒同步。 20.支持查看并下载采集结果数据至本地。 21.包含不少于48点位数。 三、设备配套大数据分析建模实训系统:相关参数: 一、基础技术模块: 1.平台采用B/S架构,基于JAVA语言开发,采用分布式架构,基于Spring Cloud构建,提供稳定可靠的服务调用、服务治理、服务降级能力。 2.提供服务管理功能,查看服务上线情况,快速实现动态服务发现、服务配置及服务注册。 3.提供数据空间,用户可以从本地上传自有数据,支持表结构化数据和非结构化数据,通过高效同步解决异构数据源共享问题,同时支持共享数据集功能。 4.支持增加多台PostgreSQL数据库服务器搭建分布式存储架构,使用安全可靠的文件系统进行数据存储。 二、核心功能模块: 1.提供工程模板功能,可快速通过模板创建包含数据和流程的工程。 2.支持通过拖拽组件到画布快速编排训练流程,支持流程节点编辑和参数配置。 3.支持多任务的并行执行,在大量任务待执行的环境下,可提高系统运行效率,减少任务排队等待时间。 4.提供灵活的工作流开发,支持串行和并行工作流,以满足多输入、多输出、多分支等复杂场景需求。 5.支持在有GPU节点情况下,算法组件可配置调用GPU资源进行任务计算。 6.支持在线查看和修改算法组件源代码,并一键将修改的算法组件保存为个人算法组件,便于应用和管理。 7.支持分类算法组件自动生成算法评估报告,评估报告包含精确率、精准率、召回率、F1-score等指标,并展示训练结果的混淆矩阵等指标结果信息,支持呈现模型训练效果。 8.支持回归算法组件自动生成算法评估报告,评估报告包含均方误差(MSE)、均方根误差(RMSE)、平均绝对误差(MAE)、解释方差分数(EVS)、决定系数(R-Squared)等指标,并展示训练结果的拟合曲线等信息,支持呈现模型训练效果。 9.支持聚类算法组件自动生成算法评估报告,评估报告包含聚类中心点、各类样本数及占比等关键信息,并可视化展示各类样本的分布情况,包括聚类分布饼图、雷达图、散点图等,直观呈现聚类效果和数据特征。 10.支持通过IDE工具编写与调试代码,可使用Python开发语言。 11.提供个人算法管理,支持用户自定义算法配置,用户可创建自定义算法,支持配置数据输入输出节点、可设置参数、代码等多种参数。并对个人算法组件进行编辑和删除。 12.支持定时训练任务,可创建定时训练任务,设置任务来源、启动时间及调度策略。 13.提供计算和存储能力的弹性扩展功能,硬件扩展过程中不影响系统的正常运行。 14.支持模型管理,支持模型发布为api接口进行调用,支持模型在线预测。 15.前后端以及内部各模块间都采用Restful接口交换数据,用户可以方便、快捷的通过浏览器在线浏览、测试各个接口。 三、算法组件模块: 1.支持Python计算引擎,支持使用Python进行算法开发。 2.提供12大类不少于187种算法,其中统计分析22种、预处理59种、分类算法15种、聚类算法8种、回归算法7种、时间序列算法15种、关联规则4种、文本分析35种、绘图17种、模型评估1种、模型预测1种、深度学习3种。分别为: (1) 预处理算法包括:Python脚本、随机数生成、行列计算、列表求差、两列求差集、数据透视表、设置索引、宽表变长表、新增时间戳列、时间类型转换、一致性检查、异常值检测和处理、连续重复值处理、编码转换、数据排序、列拆为多行、修改列名、提取数据标签、数据离散化、图像切割、KNN插补缺失值、单列转序列化、数据分箱、分层抽样、数据筛选、解压文件、杰卡德矩阵、杰卡德预测与评估、表堆叠、衍生变量、数据编码化、数据采样、行列转置、行扁平化、主键合并、新增序列、记录去重、数据标准化、字符集转换、分组聚合、数据抽取、数据拆分、差分、缺失值处理。 (2) 统计分析算法包括:LjungBox检验、平稳性检验、纯随机性检验、模型残差检验、移动计算、累计计算、分布函数、var方差函数、同比环比、时间聚合计算、LASSO回归、时序检验、对比校验、行列统计、全表统计、主成分分析、卡方检验、相关性分析、正态性检验、方差齐性检验、因子分析、频数统计。 (3) 时间序列算法包括:ARCH、灰色预测(可选多列)、时间序列趋势分解、模型定阶、ARIMA、AR模型、ES模型、MA模型、模型定阶、ARMA、指数平滑法、指数平滑法、模型残差检验、趋势拟合、组合模型、灰色预测、GARCH。 (4) 分类算法包括:梯度提升树、多层感知机(分类)、LGBM、ID3决策树、OVR、多层感知机、神经网络、单层感知机、随机森林、逻辑回归、K最近邻、朴素贝叶斯、CART分类树、Adaboost、支持向量机。 (5) 模型评估算法包括:模型评估。 (6) 模型预测算法包括:模型预测。 (7) 回归算法包括:岭回归、XGBoost、Lasso回归、CART回归树、K最近邻回归、支持向量回归、线性回归。 (8) 聚类算法包括:Kmeans聚类数目寻优、K-中心点聚类、DBSCAN密度聚类、高斯混合模型、模糊C均值聚类、层次聚类、快速Kmeans、KMeans。 (9) 关联规则算法包括:FP-Max、Apriori、FP-Growth、HotSpot。 (10)文本分析算法包括:实体识别、追加词汇、同义词查询模型预测、相似词查询、去停用词、hanlp分词与词性、FastText、相似度计算、语义相似度、新词发现、自动摘要、文本过滤、词袋模型、双向GRU、分词词汇索引映射、内容展平、构造词汇索引、序列定长、词汇分隔、TF、IDF、词频统计、HT向量化、实体抽取、实体关系抽取、情感分析、jieba分词、jieba追加词汇、向量空间、TF-IDF、关键词题分析、文本分词、停词器、Word2Vec、分词器。 (11)深度学习包括:卷积神经网络、循环神经网络、ALS。 (12)绘图算法包括:仪表盘、日历图、组合图、雷达图、柱形图、树状图、直方图、箱线图、面积图、词云图、漏斗图、饼图、折线图、地图、时序图、分布图、散点图。 四、教学资源模块: 1.提供Python数据挖掘教学案例不少于15个,配套实训指导书。包含但不限于: (1)航空公司客户价值分析。 (2)市财政收入分析预测。 (3)应用系统负载分析与磁盘容量预测。 (4)信用卡高风险客户识别。 (5)RFM在线零售客户分群。 (6)气象与输电线路缺陷关联分析。 (7)金融服务机构资金流量预测。 (8)家用热水器用户行为分析。 (9)商品评论情感分析。 (10)水产养殖水质智能识别。 (11)医疗保险欺诈发现。 (12)皮肤癌图像智能检测。 (13)二手汽车售价预测。 (14)餐饮企业客户流失预测。 (15)新闻文本分类。 2.包含不少于48点位数。 质保5年。 |