▲ 腾讯高级执行副总裁汤道生
走进位于漕河泾新兴技术开发区的优图实验室之前,必定会先遇到一套人脸识别门禁,被成功识别的员工可一秒放行,而访客则被要求先行登记——这套人脸识别门禁如今已在很多公司推广,“出品方”正来自优图,一家专注计算机视觉的人工智能实验室。
9月6日,作为腾讯公司三大人工智能实验室之一,优图与美国《科学》杂志达成战略合作。此前,这支人工智能隐形战队“潜伏”在上海,悄无声息地在技术上跑出不少高分,而且还深入“跑场景”,落地产品已潜入数亿用户的日常生活。
做 “学霸”,2017年发表18篇A类论文
刷爆朋友圈的 “小学生证件照”,有没有让你 “秒变童颜”?这种 “变脸”技术,看似简单,背后的技术关键全部落在人脸识别——“聪明”的计算机在准确认出五官之后,结合小学生的特点将人脸呈现在孩子脸上,进行 “融合”与 “形变”,才能使得每张照片在保留个人特征的同时,与肖像照完美结合。支撑这些 “变脸”照片的技术,是优图多年积累的 “看家本领”。
2012年,优图在上海成立,定位于国际顶级人工智能实验室,专注在图像处理、模式识别、机器学习、数据挖掘等领域开展技术研发和业务落地。彼时,如今被称作“视觉识别四小龙”的四家国内人工智能企业中的两家——商汤、云从尚未成立,另一家旷视则与优图同处萌芽阶段。
在人工智能技术还没有实现大规模应用落地之前,人脸识别、图像识别领域的基础技术研发和储备是优图的重要方向。这支“隐形战队”就像一个刻苦学习的孩子,频频在人工智能行业顶级赛事及会议中一试身手,在基础能力上做“学霸”,跑高分。仅在去年,优图就发表了18篇A类论文,研究成果多次在国际权威比赛中刷新世界纪录。
基础研究的突破,往往需要全球领域专家更开放的合作和分享。六年间,这支“隐形战队”不断扩容,清华大学、北京大学、中国科学院、上海交通大学等国内名校博士是“标配”。腾讯高级执行副总裁汤道生说,上海拥有国际化视野,全球人才荟萃,赋予优图快速发展的动力。
跑出实验室,走进医疗、零售和工业
当前,人工智能技术的几个主要分支,计算机视觉、语音识别、自然语义处理、机器学习等基础技术都处于爆发的 “临界点”。对于人工智能实验室来说,在技术上跑高分已然不够,必须快速走进垂直领域技术落地的 “跑场景”时代。正是看到了这一变化,自去年起,优图开始探索以计算机视觉为核心的具体应用,包括医疗、零售、工业等多场景落地。
最令人意想不到的应用场景在医疗领域 “开花结果”。去年,优图与腾讯内部事业群合作,发布了一款 “AI+医疗”产品——腾讯觅影,利用人工智能医学影像分析辅助医生筛查食管癌、肺结节、糖尿病视网膜病变、结直肠肿瘤、乳腺癌、宫颈癌等疾病,其中对早期食道癌的筛查准确率高达90%,已在全国100多家三甲医院落地。
“现在发现病灶越来越早、越来越小,人眼或者是传统手术很难精准找出来,这是人工智能在医疗领域的发展机遇。”汤道生说。数据显示,截至上月,这一应用已累计辅助医生阅读医学影像超过一亿张,服务90余万患者,提示高风险病变13万例。
智慧零售也是优图的发力方向。在优图走一圈,不时可以看见刷脸支付系统的模型机散落在各个角落,其应用实践也在上海 “首发登场”——今年5月,优图和微信支付合作的刷脸支付系统在上海家乐福投入使用。优图总经理贾佳亚透露,这个刷脸支付系统融入了实验室研发的活体识别和 1∶1核身技术,能够判断面部的细微差别,在1∶1条件下实现十亿分之一的错误率。
机器不仅能“看得懂”,还要“看得远”
这几天,优图忽然 “火了一把”:它与美国 《科学》杂志达成合作,双方将共享在计算机视觉领域的资源和信息,通过产学研之间的无障碍合作,共同推动计算机视觉技术发展。
汤道生透露了与 《科技》合作的初衷: “希望未来能够与更多全球科学家展开合作,通过学术奖金、产学研交流等多种形式,进一步提升计算机视觉技术水平,推动人工智能技术发生质变。”
从应用场景中提取需求、看到不足,再次投入基础研发,是优图正在行进的方向。 “我们希望机器不仅能 ‘看得见’,还能 ‘看得懂’,甚至能帮人类‘看更远’。”汤道生举例解释道,目前停车场、电梯、家庭婴儿房的监控仍需人工巡查和判断,未来希望计算机视觉能 “理解”它看到的状况,并及时做出预警。
据悉,优图将加强计算机视觉领域的人才招募、底层技术研发和应用场景探索。在计算机视觉领域,实验室未来将基于自学习或半监督、弱监督学习方式,让机器自动学习自然世界的问题,通过图像或者视频分析有可能发生的事情。汤道生说,这是很有挑战的基础研究工作,实验室会长期持续投入。
作者:本报记者 徐晶卉
编辑:孙欣祺
来源:文汇
*文汇独家稿件,转载请注明出处。