微信投票群

首页

当前位置:首页 > 帮忙投票

企业投票软件 人工智能应用升阶

当前栏目:帮忙投票|更新时间:2021-12-07 17:53:01|浏览:0


人工神经网络三要素


  1. 数据信息
  2. 学习培训优化算法
  3. 实体模型



人工神经网络课处理的问题


  1. 重归
  2. 归类
  3. 聚类分析
  4. 归因于
  5. 异常检测



人工神经网络三环节


  1. 数据信息提前准备
  2. 创建实体模型
  3. 实体模型运用



人工神经网络的种类


  • 有监督学习
  • 无监督学习(找出规律)
  • 半监督学习(一部分数据信息带标识,协助学习培训)
  • 增强学习(多次意见反馈)



数据预处理


  • 数据预处理(文件格式规范化、不正确改正、出现异常数据预处理、清理反复数据信息)
  • 数据集成(多库或多表合一)
  • 数据信息转换(让数据信息对电子计算机更强了解)
  • 数据信息归约(除去沉余特点)



逻辑回归模型(将信息转换的更加有意义,发觉合理特点的构思)


  • 特点搭建(根据人力方法找寻物理学特点,数据信息求和求差、切分融合等)
  • svm算法(特征提取,更改特点关联,组成等)
  • 特征选择(过滤法:设定阈值;封装形式法:将特点分次放进实体模型,比照选最佳;置入法:将挑选特点置入为实体模型练习的一部分,根据实体模型挑选。选非空子集的方式等)



人工神经网络是一种学习培训逻辑思维,而不是实行逻辑思维


有监督学习:把数据分成


  • 训练集:供实体模型学习培训
  • 验证集:用以调节超参数(迭代频次、链路层等数人为因素调整主要参数),认证验证集也是练习实体模型的全过程
  • 检测集:供练习好的实体模型检测


区划为了防止多重共线性,即結果只融入练习数据信息,不适合新数据;普遍区划占比为5:2.5:2.5或8:1:1

信息量较少时可应用K折交叉式法:将信息分成K份,每一次练习K-1份(练习k-1次),剩下一份做检测集


维数灾祸:层面提升产生的实际效果减少


基本数据类型


  • 标值型(连续型:范畴区段内可无尽选值,如个子;离散型:自然数或整数金额,如的家庭人口总数)
  • 类型型(定种类:男孩和女孩,血形等不能排列;定序型:高中低档、第一第二第三等可排序)含意没不幸数据交换为数字表示也不可以开展求和等实际操作



形象化呈现数据信息


  • 条形图:展现每组的取之各分部(留意与柱形图的不一样)
  • 散点图:2个自变量以前的关联,切入点簇合离群点



评价指标体系


  • 混淆矩阵:N行N列的引流矩阵,列意味着估计值,行意味着具体值。表明好几个类型是不是有搞混,是多少正确了是多少错
  • 准确度:预测分析恰当总数/总预测分析量
  • 精que率:类似中预测分析恰当总数/预测分析为类似結果总产量
  • 均方误差:类似中预测分析恰当总数/类似预测分析总产量
  • F值:精que率与均方误差越贴近越大,综合性指标值
  • ROC曲线:从图象视角辨别2个茎类結果的归类状况及其选购适宜的阈值
  • AUC值:通常意味着ROC曲线下总面积,任意给一个正样版和负样版,支持向量机导出的正样版为正几率(P1)比负样版为正几率(P2)值要大的概率(P1>P2的几率=AUC值)。AUC值越高意味着排列工作能力越强



多元回归分析


  • 回归分析:解决持续数据信息
  • 逻辑回归:解决归类每日任务;在回归分析基本上套入逻辑运算
  • 梯度下降法:越贴近总体目标,步幅越小(学习率小:每一次走的间距小),前行变慢;找部分极小值



决策树(有监督学习随机森林算法)


  • 一般是指一个根节点、多个 內部连接点、多个叶连接点(归类結果)
  • 每一次归类时寻找当今最佳特点,随后从该特点选值寻找最佳結果值
  • 预修枝:在每一个连接点区划前开展测算,若当今连接点不可以提高广泛特性(设定阈值,超过阈值则终止),则终止区划并做为叶连接点;降低時间,减少多重共线性,但很有可能产生泛线性拟合;
  • 后修枝:转化成详细决策树后,自底向上开展调查更换;广泛应能好于预修枝,但用时久;
  • ID3优化算法:以“信息熵(错乱度;越错乱,信息熵越高)”和“信息增益(纯净度;信息增益=信息熵【沒有必要条件时的数据量】-条件熵【有必要条件时的数据量】;选较大做为连接点)”做为选择连接点规范创建决策树
  • ID3缺陷:沒有考虑到持续特点(如日期等无穷数据信息,真分数大,因此条件熵贴近0,导致子连接点只有一个归类);偏重挑选信息增益大特点;缺乏修枝沒有考虑到多重共线性
  • C4.5优化算法:处理ID3缺点问题;但应对持续特性时用时较长、仅仅用与能存留在运行内存中的小规模纳税人数据
  • C5.0优化算法:是C4.5运用于规模性数据信息上的随机森林算法,速度更快,占运行内存少,是现阶段工业生产上较为广泛的优化算法
  • CART优化算法:简单化决策树经营规模、提高搭建高效率;选用二分递归切分技术性,每一次将当今样版排序成2个子样本集;应用基尼指数(意味着不纯净度;越小不纯净度越低,特点越好)替代信息增益比;
  • 决策树优势:对比神经元网络等白盒实体模型简易形象化,逻辑性易表述;数据预处理简易;既可以解决离散值也解决持续值
  • 决策树限定:易造成多重共线性;不适感用以特点不一样数据;无法学习培训特点间繁杂关联;忽视了数据信息间关联性;偏重有大量数据信息值特点;



朴素贝叶斯优化算法


  • 基本上观念:没有可以用信息内容状况下,挑选几率最大的类型
  • 特点标准单独假定:假设样版中每一个特点与别的特点也不有关,忽视特点本质关联
  • 基础理论几率:钱币正反两面几率为50%(具体并不会那么平稳)
  • 条件概率:在已经知道情况下企业投票软件,此外一件事产生几率(如看到朋友出站,跟随出站,到对的站的几率)
  • 先验标准:没有理由时几率(到恰当站几率)
  • 后验标准:有标准时几率(朋友出站时,到恰当站几率)
  • 词包装袋窘境:就是错乱词句排列,分辨結果也一样,事实上次序不一样,表述的含意不一样



神经网络模型


  • 神经网络算法由生物体神经元网络演变而成,包括键入、导出测算作用实体模型
  • 优势:非线性工作能力;响应式;泛化能力;容错机制工作能力
  • 缺陷:相较贝叶斯算法或决策树不太好表述;费人力资源,要求数据信息大获取难,费存储资源
  • 神经元模型(二值神经元模型MP):对键入开展权重计算解决,后在神经细胞开展阈值限制,根据阈值分辨导出
  • 感知机学习培训优化算法:适用线形可分时图,没法解决异或运算问题;画一条线,后依据主要参数持续调节线位,最后进行归类
  • 双层神经元网络:由键入层、掩藏层(双层计算,各层权重值不一样等)、导出层构成
  • BP算法:正方向散播;反向散播(正方向不符预估时运行,将結果反传至键入层企业投票软件,并根据梯度下降法调节各模块权重值;不断实行直到可接纳)
  • RBF神经元网络:只有一个掩藏层且挑选非线性函数,不用权重值联接;每一次计算不用升级全部主要参数,只必须关系主要参数;计算快



集成化优化算法(指应用一系列学习培训设备开展学习培训,并根据标准开展融合企业投票软件,进而得到比单独一个更强学习效率的方式)


  • Boosting(响应式优化算法):应用弱支持向量机迭代更新,造成强支持向量机;每场迭代造成一个新的弱支持向量机并授予权重值,最终投票造成最后归类結果
  • AdaBoost:对比Boosting多对数据信息设定了权重值,对支持向量机设定了权重值
  • GBDT:融合梯度下降法与决策树优势,根据上一轮支持向量机的方差基本上开展练习
  • Bagging:任意、有回看的选择训练集,开展并构弱学习培训器,最终融合为强学习培训器;每个学习培训器沒有相互依赖
  • Random Forest(随机森林):任意选数据信息、特点;可并行处理,用时短、高效率;投票体制防止多重共线性;放弃了可实证性,是一种白盒实体模型



图象


  • 灰度级:0(黑)-255(白)
  • RGB:红蓝绿三个安全通道混和构成,每一个安全通道都为0-255,如橘色(255,97,0)
  • HSV:用颜色、对比度、色度三个份量



图像识别技术关键流程


  • 图象收集:接触传感器,抽样、量化分析后以像素数数字编号方式键入电子计算机#p#分页标题#e#
  • 图像预处理:让图象更易于被电子计算机鉴别
  • 特点提取和挑选
  • 支持向量机设计模型
  • 归类管理决策



卷积神经网络


  • 卷积层:减少数据信息层面获取特点
  • 激话层:将卷积层导出变为非线性投射。提高互联网主要表现
  • 池化层:在持续的卷积层正中间,缩小数据信息和主要参数的总数;缩小图象尺寸
  • 全连接层:支持向量机,完成图像分类



面部识别:分二步


  • 人脸识别算法:寻找面部部位
  • 面部识别:图像分类每日任务,人脸识别算法、svm算法(卷积神经网络实体模型)、人脸对比剖析与归类



自然语言处理问题:五大类


  • 归类问题
人工智能 应用 升阶 人工 神经网络 要素

相关推荐

网站友情链接: