您现在的位置: 天极网 > IT新闻 > 业内快讯

GMIC:码隆科技CTO码特演讲AI商品识别实录

Yesky天极新闻 2017-05-05 14:53 我要吐槽

  【天极网IT新闻频道】GMIC全球移动互联网大会是全球规模最大、最具影响力的移动互联网行业盛会,GMIC北京2017大会主题为“天·工·开·悟”,于4月27日至5月1日在北京国家会议中心、以及鸟巢举行。

  作为全球具影响力的创新者平台,大会聚集了众多国内外顶尖的科学家,本次盛会由“全世界最聪慧的大脑”——剑桥大学物理学家史蒂夫•威廉•霍金(Stephen William Hawking)在全球领袖峰会上的视频演讲引爆。

  码隆科技联合创始人兼CTO

  码特(Matt Scott)

  码隆科技联合创始人兼CTO码特(Matt Scott)受邀担任GMIC演讲嘉宾,于4月28日(周五)上午10:40于GMIC新技术演示SHOW上发表《人工智能商品识别助力行业创新(AI for Product Recognition)》演说,为大家带来AI商品识别从技术到商业落地应用的全方位解析。

  |同台重量级演讲嘉宾|

  丨如下为演讲实录丨

  Hello GMIC, 大家好,我是码特Matt Scott,码隆科技公司联合创始人兼CTO,很高兴今天来到这里,为大家带来今天的演讲主题──人工智能商品识别助力行业创新。

  要了解商品识别,首先,我们可以从人脸识别这个大家熟悉的例子来切入去理解它,其实两者的本质是一样的,我们要识别不同的人脸,并从中提取相关的语意信息,而这个世界上有各式各样不同的商品,就如同有各式各样的不同的人脸一样。当我们进行人脸识别时,我们会使用领域专用语言(Domain Specific Language)进行搜索引擎搭建,而非通用的图像搜索,同理,商品识别也是一样。

  以人脸识别为例,我们需要透过人工智能分类技术去提取如性别、年龄、种族等信息,对商品识别来说也是一样的,我们需要去提取商品的某些特定属性,举例来说,在时尚领域,我们可以提取出服饰商品的材质、色彩、风格等特征,而人工智能商品识别正是码隆科技投入大量精力去钻研的领域。

  码隆科技和其他人工智能公司不同之处在于,我们提供这样的人工智能技术给所有人。

  我们不希望这样的技术仅仅是一个C端的APP,我们的信念是将这项领先世界的商品识别技术开放给其他企业,我们相信这样才能使这项技术在市场上发挥最大的影响力。

  我们成立于2014年,总部在深圳,北京也有办公室,我们专注于人工智能商品识别技术服务,致力于让企业能够将世界级的商品识别API用于他们的产品中。

  该项技术背后是拥有海量商品数据的支持,我们能够收集到针对特定行业的商品图像数据,并运用适用于特定行业的算法去搭建这些垂直领域的模型,借此产生针对垂直领域的商品识别结果,如:分类(Classification)、检测(Detection)、分割(Segmentation)、检索(Retrieval)等等。企业能够运用这些功能去搭建他们自己的商品识别服务,我们将上述提供的服务进行整合,搭建成一个人工智能平台,我们将这个平台产品命名为ProductAI,ProductAI是企业运用这项人工智能商品识别服务的入口。

  这是ProductAI的登入界面,ProductAI为企业提供最先进的人工智能商品图像识别API。ProductAI有两大核心技术:针对垂直领域检索(Vertical AI Image Retrieval)和垂直领域标注(Vertical Auto-Tagging)服务。

  事实上,我们所提供的技术可支持各行各业的海量商品检索。针对特定垂直行业,我们提供了专业的垂直行业商品识别技术,以时尚行业为例,我们投入了大量的时间与精力在柔性商品识别这个领域。此外,在家具行业、面料纺织行业、酒类行业、版权图片行业等等我们都投入了大量的时间。你或许曾经体验过不少已上线的图像检索服务,但他们大多只是通用的图像检索服务(Generic Image RetrievalServices),而我们专注于打造针对垂直领域的检索服务,我们能了解到特定垂直行业中商品与场景的语意,及该行业最直接的问题痛点,接着我们深入到该特定垂直行业中,打造出该垂直行业最好的图像检索服务,提供给他们。这就是垂直领域人工智能(Vertical AI)。由于我们是针对特定垂直领域打造的检索服务,这样的服务所呈现的搜索结果,将会大大优于其他通用服务所提供的解决方案。

  另一个部分是垂直领域自动标注(Vertical Auto-Tagging),现在我们能达到毫秒级的标注速度,并以非常低的成本应用到垂直行业中,并获得特定物体的描述性的属性(Descriptive attributes)标签。

  而现阶段我们面临的技术挑战是:如何能搭建一个横跨多个领域的智能识别平台系统。举例来说,时尚服装、面料行业与酒类行业有很大差别,服装面料属于柔性物体,我们可以穿戴它、可以折叠它,而酒就属于刚性物体。同时如何维护一个高速运作、性价比高的系统,让它实时处理上亿数据,同时又满足不同行业客户,和不同类别的调用请求?我们又是如何打磨一个高质量的API,让开发者切身体会到提高了他们的工作效率,并且乐于继续使用呢?

  接下来与大家分享我们是如何突破这些技术难点,有如下三个主要方法:

  第一点是算法,在每个垂直行业的基础上,我们使用多任务的深度度量学习来训练端到端的图像检索模型,以符合该垂直行业的图像数据检索需求。此外,我们拥有大量特定垂直行业的图像数据来训练我们的深度学习模型。

  第二点是我们首次提出“场景选择”(Scenario Selection)的概念,用户可在我们提供的图像检索服务中,选择自己所属行业的场景服务,用户可将其运用到自己的产品中,以获得最好的性能。

  最后一点是速度,我们花了非常多时间与研发精力在二值神经网络和分布计算,将其运用在我们深度学习网络当中,如此一来便能实现大规模且高效率的查询检索。

  这是我们ProductAI登入界面的样子,在这里,你能够在几分钟内就搭建一个自己专属的图像检索引擎,现在我为大家演示一下如何轻松搭建一个时尚搜索引擎:给这个服务创建一个名字,这看着很像与一般服饰搜索引擎很像,但其实不同的是,这个搜索引擎是你专属的,你能够用自己的商品图片是去搭建一个自己专属的图像搜索引擎。我命名服务以后,接着上传一个CSV文件,里面有着图像的URL,现在我有一个数据集,接着我要选择一个场景,在此我选择了时尚领域场景,这样的场景选择功能,能够使得最合适的模型被运用到这个数据集上。我们稍微等个几秒钟,这个数据集的索引就搭建完毕,API也就绪了,接着我们可以去测试这个衬衫的图片,这些是高圆圆的穿搭照片,大家可以看到这个搜索结果的精度是很好的。

  上述这些功能都涉及到代码,我们为大家提供了这些代码,在ProductAI平台上和GitHub上我们都提供了SDK开发包,用户可根据需求选择自己喜欢的开发语言。

  除了图像检索之外,ProductAI还有另一项主要功能:针对垂直行业的商品图像自动标注。我现在在ProductAI平台上为大家演示一下为时尚服饰打标签的功能,前期我们透过许多分类和标注系统来训练这个时尚标注模型,现在我们上传了这张图片,系统反馈告诉我们,这是日式穿搭风格的照片。总结一下,上述这些服务都能过透过代码与接口在ProductAI一站式的获得,并整合到你自己的产品系统中。

  刚刚我介绍了ProductAI平台是什么,接下来我们一起看看我们的企业客户基于这个平台,有了哪些实际商业应用。接下来展示的视频,虽然看起来比较简单粗暴,但都是我们在实际使用中进行实拍的,非常具有代表性。

  第一个客户应用案例是在ProductAI平台上建立的“以图搜布”搜索引擎,全中国前10大纺织面料企业,有七家都在用我们的“以图搜布”服务,包含中国最大的面料电商平台优料宝。有了面料商品图像搜索引擎,顾客只需要对着想要购买的面料拍摄一张照片,就可以得到相应的购买链接,十分便捷。其实不仅仅是面料商品,图像搜索引擎有非常广阔的行业应用空间,尤其一些难以用语言描述的场景,比如布料的花纹和质地,用视觉方式检索就会很直接。

  接下来介绍的是搜款网,中国最大的B2B服装交易平台之一。只要将服装网站上的喜欢的款式截图,复制粘贴到基于ProductAI的图像搜索引擎上,便可以迅速得到服装的批发购买链接。即使服装商品图片经过PS、翻转、变形,即使有些相同衣服的模特不同,也能够精准而完美地搜索出来。同时,同样款式的衣服可以一起被搜索出来,进行比价挑选,找到最优选择。可以说视觉搜索是批发B2B平台非常有价值的组成部分。

  名师联是一个非常大的室内设计师平台,它的愿景便是给设计师们提供无限的设计灵感。有了ProductAI平台商品识别技术助力,名师联支持对室内设计进行任意部分地单独框选,并搜索。比如视频中,随意框选设计图中的家具,就可以在数据库中找到完全一样或类似家具的设计推荐,让设计具有无限可能性。

  《光明日报》是中国最权威、有名的报纸之一,ProductAI为其提供出版物识别技术。《光明日报》嵌入人工智能识别技术后,只要对着报纸拍一张照片,便可实时识别出与之相关联的全媒体信息,如视频等,搭建起了虚拟与现实的桥梁。

  中国纺织信息中心是中国最权威的面料纺织行业机构之一,通过ProductAI平台的技术,可以实现用人工智能分析时尚流行趋势。作为权威行业机构,中国纺织信息中心需要预测流行色等未来的流行趋势,再把预测信息和整个产业进行分享,起到引领风潮的作用。而ProductAI能够自动抽取海量T台图像信息中的主体色彩,并在非常短的时间内完成颜色分析,总结出整体趋势,大大减少了人力观测成本。POP是另一家行业领先的2C2B时尚平台,他们则是把这种技术直接植入他们的网站中,用理性数据诠释每一张感性的时尚图片。

  穿衣助手是国内最受欢迎的时尚穿搭app之一。只要对着单品服饰拍摄一张照片,ProductAI便会自动系统扫描,立刻识别出单品颜色及类型,并推荐相应的穿搭方式。

  各种各样的商品识别客户案例还有很多,那码隆科技的核心竞争力在哪里呢?首先,第三方盲测数据表明,我们拥有业界最为精准和快速的商品识技术,这是我们ProductAI平台的立命之本;第二,几百家企业客户已在ProductAI平台创造了过亿的调用量,数据安全一直是我们关注的重中之重,并以实际效果取得了企业客户们的信任;第三,从API调用的角度来说,整个体验非常优雅、简洁,接入门槛非常低,开发者们可以非常便捷地使用人工智能服务。

  为了实现这些核心竞争力,码隆科技成立两年半以来,在技术积累、数据处理和人才引进方面都付出了巨大的努力。在技术方面,我们已经拥有了有显着优势的深度学习算法研发成果;在数据方面,为了实现垂直行业商品识别技术提升,我们的模型训练数据已经超过1个亿;在人才方面,我们吸引了来自世界顶级人工智能实验室,如微软亚洲研究院、牛津大学VGG实验室、谷歌实验室、百度深度学习实验室等高级人才加入。

  接下来,我们要做什么?

  我们想为更多垂直行业解决问题。

  比如我们为AR行业完成了一个解决方案,是市场营销的好帮手。如视频所示,对着“加多宝”的罐子不论从哪个角度拍摄一张照片,ProductAI可以进行360°立体识别,然后在此基础上生成一个AR大炮,点击便可以互动进行射击,非常有代入感和趣味性。

  当大家刚刚从新闻中看到可以开始预定HoloLens的时候,我们已经完成了HoloLens的应用开发。通过ProductAI技术的接入,售货员能够在零售场景中对顾客的信息进行迅速识别,并收到智能购物建议,是一种销售的新体验。

  我的演讲到此结束,谢谢大家!

  GMIC四楼主会场码隆科技巨幅海报

(广告资讯)
免责声明:以上内容为本网站转自其它媒体,相关信息仅为传递更多信息之目的,不代表本网观点,亦不代表本网站赞同其观点或证实其内容的真实性。
评论
* 网友发言均非本站立场,本站不在评论栏推荐任何网店、经销商,谨防上当受骗!
今日更新
1iPhone XR售价创历史新低
iPhone XR

近日,京东、苏宁、天猫等电商平台已通过各种方式对苹果手机进行降价。

2vivo升级品牌形象:更年轻时尚
vivo品牌形象

今日vivo更换Logo、启动新视觉形象,将在18个国家和地区建设全球…

3任正非:坚决尊重他人知识产权
华为任正非

任正非说:“我们今天可能要碰到的问题,在十多年前就有预计,我们已经准备…

4小米首次回购:盘中大涨3.90%
小米首次回购

小米自上市后首次进行股份回购,成效初显:盘中大涨3.90%,报10.1…

5苹果“失火” 殃及“供应商”
苹果手机

苹果设备A系列芯片的唯一供应商台积电表示自己预测季度营收将迎来大幅度下…

热门文章
1《王者荣耀》大版更新后“闪退”
王者荣耀闪退

王者荣耀2.0手游更新版本后,很多玩家碰到对局异常闪退,并扣除信誉分的…

2大公司晨读:董明珠连任!
大公司晨读

昨晚,格力电器发布公告称,选举董明珠女士为公司董事长,续聘董明珠女士为…

3摩托罗拉RAZR折叠手机曝光
摩托罗拉

《华尔街日报》报道称,摩托罗拉经典功能手机Moto RAZR将在今年某…

4电子社保卡来了 支付宝刷脸领取
电子社保卡

目前,全国已有18个省、超过140个城市可以通过支付宝领取电子社保卡。

5三星A90搭载屛下指纹+48MP主摄
三星A90曝光

三星A系列手机将采用全新命名方式。三星A90首次曝光,搭载屏下指纹技术…

6这E天:王者荣耀更新后频闪退
这E天

王者荣耀S14开启,更新后频闪退;新款iPhone摄像头曝光,前置10…

7带你看今年CES上那些黑科技!
CES黑科技

今年的CES已经结束了,都有哪些有趣的内容呢?小编来带大家回顾一下!

8逆转!德国法院驳回高通诉讼
苹果专利侵权

德国曼海姆市的地方法院称苹果智能手机上安装芯片并没有侵犯相应专利权。

9大公司晨读:马云乡村教师奖
大公司晨读

昨日晚间,“心有光芒,必有远芳”2018“马云乡村教师奖”颁奖典礼在海…

10OPPO发布10倍混合光学变焦技术
OPPO变焦技术

今天,OPPO在北京举办了2019未来科技沟通会,发布10倍混合光学变…

每日IT极热