如何成为鉴酒达人?教你使用飞桨图像分类套件快速识别世界名酒-人工智能-热点资讯-野望文存-科技 
    欢迎来到野望文存-科技!
当前位置:野望文存-科技 > 热点资讯 > 人工智能 >  如何成为鉴酒达人?教你使用飞桨图像分类套件快速识别世界名酒

如何成为鉴酒达人?教你使用飞桨图像分类套件快速识别世界名酒

发表时间:2020-07-31 12:01:00  来源:野望文存  浏览:次   【】【】【
酒是天人共酿的产物,是以粮食谷物为原料,通过不同的酿造工艺,经由各种不同微生物的催化发酵,从而形成风味各异,各具特色的不同酒种。
 
作为非酒中行家,掐指这么一说,貌似也能说出不少酒的名称:白酒、啤酒、葡萄酒、红酒、米酒、黄酒、清酒,威士忌、白兰地、鸡尾酒,哦,还有茅台、五粮液、82年拉菲……
 
不过,紧跟着就有点迷糊了。
 
              
白兰地是和白酒一样的一个品类,还是和茅台一样的一个品牌?红酒、葡萄酒什么关系?鸡尾酒又算在哪边?清酒是日本专属的吗?
             
 
为此,不能不了解酒的分类,且必须从大类开始,才能在头脑中建立一个框架,才不容易乱。
总体按酿造方法,可分为三类:酿造酒(发酵酒)、蒸馏酒、配制酒。
 
  • 酿造酒根据制酒的原料不同,主要分为葡萄酒、果酒、谷物发酵酒( 谷物发酵酒包括啤酒、黄酒、清酒等)。
  • 最负盛名的蒸馏酒有中国白酒、白兰地、威士忌、朗姆酒、伏特加、金酒、龙舌兰。
  • 配制酒在中国,叫做露酒,在西方,就是鸡尾酒。当然,鸡尾酒必须含有一种以上的蒸馏酒。我们国内最常见的动物或中药泡酒,人参酒、虫草酒、枸杞泡酒,都是配制酒。
              
随着市面上酒的品牌与种类越来越丰富,各种本土与进口的啤酒、洋酒、葡萄酒等在市面上琳琅满目,不认识的品牌越来越多,消费者们选择一款适合自己的品牌也越来越难。
 
在此背景下,某 App 产生了通过移动端的图像识别来分辨酒水种类的需求。
               
经分析,该功能主要用到的是图像分类技术,这里选择了飞桨图像分类套件 PaddleClas ,它提供了丰富的图像分类模型资源,覆盖 ResNet_vd、MobileNetV3 等 23 种系列的分类网络结构以及对应的 117 个分类预训练模型,用户可根据自己的需求,针对不同场景选择相应的模型进行训练使用。
 
如果你的企业也想应用「图像识别技术」拥抱人工智能,创造更多商机,那么就点击阅读原文或扫码填写表单,获得来自百度飞桨官方的免费指导吧!(PS.高校教师希望应用飞桨AI Studio进行教学活动也可报名~)

             
 
对技术实现更感兴趣的小伙伴可以继续往下看:
 
在本项目中,考虑识酒功能需要在移动端上部署,因此采用了参数量和计算量较少的MobileNetV2 模型。同时采用飞桨轻量化推理引擎 Paddle Lite 实现移动端轻量化部署和高效预测,最终在测试数据上达到了超过 97% 的识别准确率。
 

案例结果展示

 
训练后的模型成功部署于某 App,支持了App 中的“扫酒标识酒”功能。如图所示,打开App中的拍照功能,拍摄想识别的酒标,即可快速识别出对应的酒,并把酒的相关信息和评论信息推送出来。
       

案例实现过程回顾

1. 数据集收集

数据集总共包含114个品牌,每个品牌独立为一个类别。其中训练集中每个类别有250张左右的图像,验证集中每个类别有50张左右的图像。为满足真实场景的多样性,数据集中同类别图像的酒瓶摆放方向、光线、酒标出镜程度等略有不同。

2. 训练集聚类

在对训练集进行分析后,我们发现由于数据采集方式较为单一,导致训练集中同一类别下的图像重复度较高,如果直接训练将花费较长时间,且容易带来模型过拟合的问题。因此我们采用K-means聚类方法对训练集进行聚类,在每个类中随机抽取一张作为此类的代表,训练过程如下图所示。最终训练集中,每个类别下的样本数据减少为原来的1/5,聚类后的数据集仅保留了差异较为明显的样本。
             
训练集聚类过程

3. 数据预处理

在真实应用场景中,被拍摄的酒瓶往往会受到光线、摆放角度、入镜大小等因素的影响,会与训练集存在一定的差异,通过数据增强来提高模型的泛化能力,是十分必要的。数据增强主要为5个步骤,具体如下:
  1. 以50%的概率进行随机旋转(旋转范围为0-30度);
  2. 对上一步中图像进行随机裁剪;
  3. 将上一步中裁剪后的图像调整大小到224*224分辨率(分辨率大小可根据实际数据集适当调整);
  4. 对上一步中结果进行随机颜色扰动,随机颜色扰动由图2中四种扰动方式构成,以50%的概率按照“明亮度->对比度->色相->平衡度”的顺序进行颜色扰动,剩余50%的概率按照“明亮度->色相->平衡度->对比度”的顺序进行颜色扰动;
  5. 对上一步中结果以50%的概率进行左右翻转;
       
随机颜色扰动
在进行图像增强操作后,为了更好地适配飞桨所提供的预训练模型,对当前的图像进行减均值除以方差的操作。

4. 模型训练

基于模型最终的实际使用场景,我们采用MobileNetV2模型作为分类模型,它可以看做是一种MobileNetV1和ResNet的结合,在MobileNetV1引入深度可分离卷积降低计算量和参数量的基础上,引入了ResNet的残差结构(bottleneck),精度相对于MobileNetV1有较大提升,图3对比了3种模型的子结构。
             
MobileNetV1、MobileNetV2、ResNet子结构对比
最终,在学习率策略为piecewise decay、学习率为0.0025、批大小为64、epoch为20的基础上,分类精度可达到97%以上。

5. 模型部署

移动端APP的大小和响应速度往往是评价APP性能的两个重要指标。飞桨轻量化推理引擎Paddle Lite专门用于实现包括手机移动端在内的端侧轻量化高效预测,是一个高性能、轻量级的深度学习预测引擎。
 
在该项目中,Paddle Lite首先对训练获得的MobileNetV2模型进行操作融合 (Operator fusion)、存储优化 (Memory optimization)这一系列计算图优化操作,优化后模型体积大幅减小且预测速度得到大幅提升。
 
通过操作的融合,Paddle Lite在对推理库进行剪裁后获得只包含feed、fetch、conv2d、depthwise_conv2d、 elementwise_add、fc、pool2d、relu6、softmax这几个Operator的推理库;对于优化后的模型,Paddle Lite将执行阶段和计算图优化阶段实现良好的解耦拆分,移动端直接部署无任何第三方依赖的执行阶段。
 
最终单张图片在不同硬件环境中推理耗时如下表所示:
       
 

结语

飞桨提供了涵盖丰富模型资源的图像分类套件 PaddleClas,针对不同的任务有不同的适配模型,用户可根据自己的需求,针对不同场景灵活选择相应的模型;并且通过飞桨轻量化推理引擎Paddle Lite,可灵活的实现移动端或嵌入端的轻量化高效预测。
 
除了通过图像分类实现上述项目,帮助该 App 用户量实现巨大增长外,飞桨在人工智能领域还协助上百家企业实现了人工智能的接入,帮助他们在各行各业实现了生产和研发效率的巨大进步。
 
利用深度学习图像识别技术,对图片数据进行监测,未来会将数据源扩充至全网。
 
               
海量的文本和图像大数据结合,使得用户标签极大丰富,场景被更真实地还原,这也将为市场和消费者研究提供更广更深的空间。
 
根据平安证券的《通信行业人工智能图像识别专题报告》,图像识别分为生物识别、物体与场景识别和视频识别。
 
到2020年,生物识别技术市场规模将达到250亿美元,5年内年均增速约14%。其中,人脸识别增速最快,将从2015年的9亿美元增长到2020年的24亿美元。

图像识别作为人工智能研究的重要分支,占据着极为重要的地位。随着我国计算机技术与信息技术的不断发展,人工智能中的图像识别技术的应用范围不断扩展。
 
图像识别可能应用的场景整理如下:

1.安全领域:指纹识别、人脸识别等,代表项目如Face++、依图科技、深醒科技等。

据不完全统计,在人工智能通用应用层下,图像识别的热度仅次于语音识别,其中人脸识别层面更是广泛应用于金融、公共安全、军事、航空航天、工业、教育、医疗等行业。

此外,从36K“鲸准”APP数据来看,在人工智能企业中有接近三分之一的企业提供人脸识别的产品或服务。
 
             
(图片来源:IT桔子)
 
2.军事领域:地形勘察、飞行物识别等,代表项目全悉科技。
在军事方面图像处理和识别主要应用场景为通过对侦察照片的判读,进行目标识别并追踪。
在战争中,发现敌方的飞行物并不困难,难点在于能否识别飞行物。作为远距离探测,光线强弱、隐蔽范围等因素都是对图像识别技术能否顺利落地的考验。
 
3.交通领域:车牌号识别、无人驾驶、交通标志识别等,代表项目纵目科技、TuSimple(图森科技)、驭势科技等。
自IBM、英伟达、Uber、Google、Apple相继打入无人驾驶市场,各家公司不惜重金投入技术研发层面,但就目前来说,想要完全实现自动驾驶/无人驾驶,距离技术成熟还有一段路要走。
此外,高昂的生产成本也导致无人驾驶很难商用。据了解,去年完成测试的百度无人车的成本奇高,仅一台车载雷达就耗资70万元。
 
                (图片来源:IT桔子)
 
4.医疗领域:心电图、B超、健康管理、营养学等,代表项目智影医疗、图玛深维等。
             (图片来源:健康界)
AI医疗类项目,多围绕大数据、云计算及人工智能等技术创建基于数字图像处理系统下的医疗诊断辅助工具。
具体场景可以是各类医学图像分析诊断、病例图像分析以及超声波图像处理、心电图分析等方面。依托前沿的科技,不仅降低了医疗成本,还极大程度提升了医疗质量及效率。
 
6.生活领域:智能家居、购物、智能测肤等,代表项目Yi+、木薯科技、肌秘等。
所谓科技改变生活,当人工智能以迅雷不及掩耳之势闯入大众视野后,人们的衣食住行也在发生着锦上添花的变化。
              
如果你也想像他们一样拥抱人工智能,那么就点击阅读原文或扫码填写表单,获得来自百度飞桨官方的免费指导吧!
 
              
 
       
责任编辑:蔡学森