您当前位置:创新资讯

阿里高效AI分类技术获计算机视觉顶会竞赛冠军

发布时间: 2020年08月10日

近日,两年一度的世界计算机视觉领域顶级学术会议ECCV2020的各项挑战赛结果出炉,在图像分类赛中,阿里安全的人工智能分类技术力压三星、深兰科技、同济大学等国内外多支队伍,获得该赛道冠军。

与其他比赛动辄使用十几万的数据不同,ECCV2020分类比赛共有1000个类别,每个类别仅有50张图片作为训练数据。比赛要求选手在不使用任何预训练模型和额外数据情况下,从零训练模型——这无疑给模型训练制造了巨大难度。换言之,参赛队伍需要打造一个高效能、低成本的分类人工智能(AI)模型。

据阿里安全图灵实验室算法工程师夜清介绍说,阿里安全智能算法团队从三个技术方向进行了突破:利用随机抽取的两张图像,使用数据增强并进行拼接,最大程度丰富训练样本资源;设计新的神经网络结构,加入显著性特征模块挖掘样本的特点,提升分类性能;利用分层语义结构,让AI模型更好地挖掘数据。

这一高效的AI分类技术最终脱颖而出。阿里安全图灵实验室资深算法专家华棠说,该技术间接解决了计算资源消耗和数据标注的人力成本问题,为自动驾驶、物体识别、智慧城市等应用提供了新的思路和方法。

目前,阿里安全这项基于小规模图像的高效AI分类技术已应用在知识产权商标识别、通用商品识别和动植物保护等场景中。

华棠以某知名品牌运动鞋上新为例解释说:“一段时间内我们仅能获得该产品的配色和几个不同角度的图片。在仅有少量商品展示图的情况下,通过高效AI分类方案,我们在新产品问世的极短时间内就能实现新款商品识别能力的覆盖,可大大降低新产品被‘山寨’的风险。”

夜清进一步介绍说,该方法还可以与自监督学习有效结合,在学习更好的数据表征基础上,指导模型高效学习,获得更好的识别能力。

在“戴口罩人脸识别”问题上,这一AI分类技术也能派上用场。阿里安全图灵实验室资深算法专家薛晖介绍说,疫情期间,摘下口罩“刷脸”不但麻烦还不安全,应用高效AI分类技术可显著降低模型初始化的数据需求量、可快速训练模型,从而解决了戴口罩的人脸识别问题。

阿里安全相关负责人介绍说,作为新一代安全架构安全技术层的核心AI技术,目前高效AI方案对内已赋能阿里多个业务场景,如淘宝视频、淘宝直播、优酷等平台的知识产权保护,为数字基建的安全建设提供样本参考,对外则通过绿网直接服务大中小企业。