AI在传统产业变革中扮演什么角色的问题,以及其商业模式创新的问题,是一个互补关系,AI企业需要有传统产业的人才和经验补充进来。
Recently, Ruigang Li, Founding Partner of CMC Capital, was invited to attend the Investment and Financing Forum at the 2020 World Artificial Intelligence Conference (WAIC), and provided online audiences with his keen and unique insights into the roundtable discussion topic How AI is applied in traditional industries.
我们了解到CMC资本近年来在AI领域有不少精彩的投资,能否借此机会请黎总和大家分享一下?
CMC资本作为一个成长期的PE投资机构,起步是从文娱开始的,但今天我们已经不局限于文娱,我们在消费、教育、科技等领域也有广泛布局和覆盖。而且在这些领域的投资布局中,技术的创新、研发的驱动、数据的学习和应用,一直是背后的一个基本逻辑。
我们也在AI投资领域不断地探索,比如在我们熟悉的文娱领域,AI的应用,大家都比较了解,机器识别、用户匹配、内容分发和推荐等等,我们投资的不少媒体平台类公司都有这类应用和实践。我们最近更感兴趣的是AI在我们其他领域投资机会中的应用。
比如绿色清洁能源领域。风力发电,无论是海上大量的风力发电机组,还是高山和戈壁的风力发电设施,大型发电叶片的维护和检修的成本非常高,人工检修的安全性也是极为重要的因素。我们投资的扩博智能就是通过AI的技术赋能来解决这些难题的企业,他们利用无人机技术和机器视觉识别采集相结合,利用算法进行图像拼接和鉴别风机叶片表面缺陷和损坏,大大提高检修的精确度,有效控制成本,在国际上处于领先地位。
比如,教育领域,线上教学常态化,人工智能存在诸多赋能的节点。CMC过往在教育领域布局投资了一些公司,包括猿辅导、掌门一对一和英语流利说等,都在利用人工智能技术构建内部的结构化知识图谱,旨在为客户提供自适应和个性化的学习模式。
比如,零售领域和供应链领域,传统零售行业积累了大量数据,供应链领域的效率优化和提升,为人工智能赋能行业提供了更多的可能性。例如CMC的投资企业,包括生鲜电商渠道的“叮咚买菜”、ToB的生鲜供应链电商平台“美菜网”、ToB的服装供应链电商平台“一手”等,都在利用大数据和人工智能等技术来管理中后台,进行货品预测,以实现更好的降本增效。对于销售及供应链企业,包括生产企业来说,都存在计划排期的问题,怎么预测订单,怎么预测供应链效率和成本优化,怎么组织生产和物流,怎么根据需求和供给变化来灵活调整和programming,怎么来优化调集资源,在此基础上,组织架构体系如何变化适应,员工考核指标怎样快速应对,等等。这事实是一套求解器,solver。AI在这些传统行业领域是有巨大潜力的。
再比如,最近我们还比较关注的是设计和工业智能这个领域。我们对工业智能领域的切入点会从设计这个角度,这可能也跟我们之前做媒体投资的基因有一定的关系。我们预测,设计和数据结合,可能是推动工业智能的柔性生产、个性化生产的一个很重要的环节,一个发动的引擎。从创意设计到生产组织,AI深度学习所产生的积极效果,对行业是裂变。比如,我们投资的时谛科技,在鞋类设计领域,利用算法,提供二维成像三维建模及渲染,大大缩短设计流程和复杂程度,同时累积大量材质和面料数据库,其人工智能支撑的渲染效果可以媲美摄影照片和打样产品,直接提供给品牌客户选样选型,为用户定制化、个性化设计、小批量生产、柔性生产供应链管理提供可能。
这次疫情对很多传统行业,尤其是对文娱行业造成了巨大的冲击。如果将AI技术和文娱行业相结合,能否另辟蹊径,挖掘一些新的投资机会,我们想听听黎总对此的看法?
疫情的冲击是阶段性的,但引发的思考是持续性的,思考在巨大停摆和震荡之后的结构性变化是什么,如何夯实自己核心能力。疫情让我们进一步认识到大数据、云计算、人工智能等技术对各行各业的影响,当然也包括文娱行业,下一步的发展和应用很多,我不能全部概括,举一些例子:
比如,从语音识别、语义识别到语音生成和表达。在NLP (Natural Language Processing, 自然语言处理) 领域,技术还在向两个维度发展,一是识别和翻译要更加准确,语义分析综合的精准率更加提高,这里还有很大的技术提高空间,二是个性化生成,现在生成的声音是机器声音,没有个性化,随着算法进一步发展,数据训练更成熟,已经开始模拟真人的声音。这种应用场景,可以配音,电影翻译dubbing,不需要真人就可以配音,只要采集真人的声音数据,就能生产语音,包括模仿各种个人特质的发音习惯、音色音质等。我在上海科技大学的创意学院担任院长,我们学院下属的AI实验室也进行过一些相关研究,比如用喉镜扫描人的发声器官结构和发声机制,在演唱不同歌剧和戏曲过程中的独特的发声技巧,采集数据,提供给机器训练和学习,机器就有可能在表演艺术上有突破,这都是语音生成领域的进展。
当然,与这个领域相关的还有就是现在蓬勃兴起的虚拟人偶,靠算法驱动的动作捕捉和面部跟踪,同样也包括实时渲染和变声技术。
比如,从内容分发到内容生成。基于大数据和人工智能技术,可以实现内容图谱和用户兴趣图谱的匹配,基于相关的数据挖掘和推荐算法为客户提供更加个性化和匹配的高质量内容,这已经应用很多。但目前在内容生成领域,突破还不多,包括现在的一些写作机器人,主要是生成一些模式化的template,然后往里面填空,这还不是完全智能,下一步要关注是机器决策,就是说要机器学会生成新结构,这就是深度学习以后的机器意识和机器决策问题,机器可以学习去创造新的内容结构,而不是结构化的内容。
再比如,值得关注的是版权维护,基于AI实现低成本的音频/视频的版权识别是一个重要方向。
还有我最近看到一些资料,就是对内容效果的测评,以前我们主要是两类,一是事后测评,比如像收视率调查、流量监测,另一类是事前预测,国外很多内容机构往往会聘请第三方机构进行焦点小组测评,所谓focus group,这种做法一般是事先观看,然后填问卷表或者按表决器,这里事实上会存在很多噪音干扰,也就是常说的口是心非,我最近看到的一些实验,是用视觉识别和算法来进行表情及肢体动作监测和学习,训练机器来读懂观众的表情和动作以及背后的心态,准确率大大提高,一些研究机构早在特朗普在初选阶段就通过选举大会的观众表情读取和学习,已经判断了他的胜算率,这些都是有意义的尝试。这对于内容爆款预测、预测结果回馈内容修改创作、数据化提升内容品控都有价值。
AI的发展过程是算力、算法、数据等要素螺旋式上升发展的过程,近几年AI相对高速发展主要是由于算力和数据的高速发展。中国是数据大国,数据资源丰富,而现在我们的算力成长也很快,主要原因是商业需求推动算力成长,这方面我们比美国强,现在看一下那些国际比赛榜单,现在刷单的都是中国公司,前些年都是几家硅谷公司和一些美国高校,现在霸占这些榜单的都是中国公司。但是AI的发展光靠数据和算力还不够,还要在算法上进一步突破,比如我们现在感知方面,特别是在机器识别方面,AI已经能比较好的解决问题,这是开创性的,是填补空白。但是在认知和决策方面,现在还没有出现什么颠覆性的技术,大家还都在摸索中。现在进入纵深领域,就是AI要与传统产业进行整合,然后创新,这就涉及到了两个问题,一是传统产业自身的数字化问题,二是AI企业如何深度认识理解传统产业的问题。算法的开发和进步需要进一步理解现实场景和应用,这是一个整合的问题。AI在传统产业变革中扮演什么角色的问题,以及一个商业模式创新的问题,是一个互补关系,AI企业需要有传统产业的人才和经验补充进来。