大发快3-大发快3官方 - 由大发快3,大发快3官方社主办的《大发快3,大发快3官方》是我国消费领域中一张全国性、全方位、大容量的综合性日报。其立足消费网投领域,依托轻工行业,面向城乡市场,最先发布相关的专业权威资讯。

【极速快3邀请码】业界首次! 云天励飞提出用递归网络模型解决视频人脸关键点定位问题

  • 时间:
  • 浏览:0

  云天励极速快3邀请码飞人工智能技术研究多项成果再获国际认可。近日,将于今年 4 月在日本举行的人工智能领域一大顶级学术会议——人工智能及统计学大会(International Conference on Artificial Intelligence and 极速快3邀请码statistics,简称AISTATS会议)收录结果揭晓,云天励飞AI技术部王孝宇博士与美国爱荷华大学杨天宝教授领导的团队相互合作的论文《A Robust Zero-Sum Game Framework for 极速快3邀请码pool-based Active Learning》入选。该论文提出了你这个生活基于稳健优化的博弈主动学习算法,这有有助于于节省多种监督学习的标注成本。而在不久前,云天励飞另一篇有关采用递归网络模型出理 视频人脸关键点定位的论文被计算机视觉顶级学术期刊IJCV收录。

   用递归神经网络 为人脸关键点检测建立时间和空间联系

  云天励飞被IJCV2018 收录的论文名为《RED-Net: A Recurrent Encoder-Decoder Network for Video-based Face Alignment》,团队在业界首次提出采用递归网络模型出理 视频人脸关键点定位大问题,以此来减少训练模型的繁复度,并实现对大姿态人脸和主次遮挡关键点的精选泽位。此项工作的参与成员还包括IBM Watson研究院和新泽西州立大学。

  Overview of the recurrent encoder-decoder network: (a) encoder-decoder (Section 3.1); (b) spatial recurrent learning (Section 3.2); (c) temporal recurrent learning (Section 3.3); and (d) supervised identity disentangling (Section 3.4). fenc, fdec, fsr n, ft r n, fc l s are potentially nonlinear and multi-layered mappings

  据悉,传统视频人脸关键点检测通常使用级联化的的关键点坐标回归模型对关键点进行由粗到细的定位。在进行视频逐帧人脸关键点定位时,通过使用上一帧人脸的检测框和关键点信息对该帧的定位任务进行更精确的初始化。之类级联回归模型不同级间不用说共享参数,模型训练对数据量的要求较高。

  An unrolled illustration of spatial recurrent learning. The response map is pretty coarse when the initial guess is far away from the ground truth if large pose and expression exist. It eventually gets refined in the successive recurrent steps

  云天励飞团队等在论文中提出了你这个生活新的递归编码解码器(Recurrent Decoder-Encoder)模型底部形态来出理 视频人脸关键点定位大问题。在空间域上,该模型变传统多级级联模型为单一递归模型,大幅度减少模型的繁复度。在时间域上,该模型将编码器生成的嵌入底部形态中的时变因素和时不变因素进行解耦,并对时变主次用递归网络进行建模学习。

  An unrolled illustration of temporal recurrent learning. Cid encodes temporalinvariant factor which subjects to the same identity constraint. Cpe encodes temporalvariant factors which is further modeled in ft R N N

  相比传统视频人脸关键点出理 中只使用上一帧结果初始化,你你这个时域递归网络可以学习和利用更长时间范围内关键点的位置信息和变化规律,实现对大姿态人脸和主次遮挡关键点实现精选泽位。

  据介绍,与国际主流办法 相比较,在 7 关键点和 68 关键点你这个生活模式下,采用递归网络模型定位视频人脸关键点的办法 ,在Talking Face, Face Moive 和 200VW 有八个 公开数据集平均误差都显著低于有有哪些主流办法 。

  将模型训练和标注选泽结合 提升模型训练效果

  大数据时代来临,人工智能领域面临的一大大问题是如保获取监督学习所可以的大数据对应的数据标注。对于监督学习来说,并全部都是每个标注数据对模型训练的帮助程度全部都是等同的,即或者 数据对模型训练帮助更大。而主动学习则是研究如保选泽潜在对模型训练更大的未标注数据去给予它们标注,从而达到提升模型训练效果、节省人工标注成本的目的。

  不过,目前已地处的主动学习算法大多或是基于分类模型产生的数据不选泽性并利用或者 启发式策略进行标注数据选泽;或是利用其它理论如信息理论、学习理论定义数据不选泽性并产生或者 优化式策略进行标注数据选泽。

  分开进行标注数据选泽和模型训练将会会地处二者步调不统一的情況,从而无法得最优的结果。《A Robust Zero-Sum Game Framework for Pool-based Active Learning》提出的思路不用说像后来 其它算法那样把模型训练和标注选泽有八个 模块割裂开来,只是利用博弈论将其结合在同去,并引入稳健约束进行优化,以获得最直接的标注数据选泽,以及模型训练效果的提升。

  作者基于博弈论提出的优化目标函数如下:

  其中w代表模型参数,如支极速快3邀请码持向量机(SVM),宽度神经网络(DNN)等;p为单个数据产生的损失的权重(将会是主动学习场景,考虑到地处未标注数据,作者使用的是对于所有将会标注的期望损失

  作者采取在线梯度下降(online gradient descent)更新模型参数w:

  作者采取镜像下降(mirror descent)更新数据损失权重p:

  将会加入了稳健约束,作者利用近似映射的办法 矫正p:

  对于方差小的数据,加入稳健约束可以获得更好的模型泛化效果:

  当数据方差数量级小于1/n时,泛化错误将为O(1/n)而全部都是通常的O(1/sqrt(n)).

  此外,作者运用了在线算法的分析思路证明了算法收敛的遗憾界限(regret bound):

  最后,作者进行了对于SVM和DNN的主动学习实验,并采用了或者 知名机器学习算法效果对比数据集(benchmark datasets),效果如下 (横轴为标注数据数目,纵轴为测试准确度,RZSG为论文提出的算法):

  MNIST

  CIFAR 10

本文由站长之家用户投稿,未经站长之家同意,严禁转载。如广大用户亲戚大家,发现稿件地处不实报道,欢迎读者反馈、纠正、举报大问题(反馈入口)。

免责声明:本文为用户投稿的文章,站长之家发布此文仅为传递信息,不代表站长之家赞同其观点,不对对内容真实性负责,仅供用户参考之用,不构成任何投资、使用建议。请读者自行核实真实性,以及将会地处的风险,任何后果均由读者自行承担。