EN
CN
CN EN
2023.03.31
来源 : CMC资本

640.png


ChatGPT的热度还未过,OpenAI便于前不久发布了多模态预训练大模型GPT-4,行业惊呼又一场颠覆性的变革呼啸而来。对于AIGC(人工智能生成内容)方向来说,变革随着GPT-3和GPT-4的横空出世已然落定;然而对于AIGA(人工智能生成动作)方向来说,变革还在路上。在通用人工智能领域中,语言大模型、多模态大模型已经乘着ChatGPT的东风被大家熟知,而面向产业级的多任务决策能力是缺位的。GhatGPT旨在解决机器与人语言的交互问题,无法进行系统性决策,比如机器控制、群体协作、动态调度、业务规划等,而这些显然是产业革命更具价值的部分。


作为一家致力于破解人工智能产业谜题的创新型公司,Enigma Tech看到了这一点,希望构建面向产业的最顶级的AGI(通用人工智能)能力,追逐图灵测试的标准,将人工智能真正推进产业化革命。Enigma Tech(中文名“谜题科技”)是由上海数字大脑研究院(简称“数研院”)孵化的独立初创企业,它的名字也昭示着它探索未知领域、破解复杂问题、构建一个AI与人类和谐共处的新世界的决心。Enigma Tech的科学家们正专注于挖掘隐藏在技术谜题背后的秘密,力求解决当今世界面临的最复杂和迫切的问题。


Enigma Tech的首席科学家汪军,除了为人熟知的CMC资本孵化企业上海数字大脑研究院的联合创始人、伦敦大学学院计算机系教授、上海交通大学-约翰·霍普克罗夫特客座教授等身份外,他还是阿兰·图灵研究所的Turing Fellow,著有数百篇学术论文,多次获得最佳论文奖,在决策智能领域享有极高的盛誉。本期C位将带大家一起了解一下汪军教授及团队研发的决策智能大模型,将会引发怎样的产业变革。


1

基于DB大模型,构建全链路的决策能力输出

谜题科技作为行业的佼佼者,致力于将最前沿的AI技术推向市场。公司于2022年推出首个多模态决策大模型(简称DB1),填补了国内在此方面的空白,进一步验证了预训练模型在文本、图-文、强化学习决策、运筹优化决策等方面应用的潜力。其主要对标DeepMind推出的Gato,具备业界最强泛化迁移能力,可全面支撑多智能体,能够并发处理千个以上决策任务。目前,DB1在多方面有超越Gato的表现,并已经开始向更加贴近实际业务的需求域体进化。

近期谜题科技正式发布了AIGA(人工智能生成动作)系统Enigma Alpha,旨在基于DB1大模型进一步构建完善的人工智能驱动决策的应用生态体系。Enigma Alpha具备强大的自然语言理解与决策指令/动作生成能力,能够实现自然语言对话生成、工具增强的自然语言交互、以自然语言为接口的物理/虚拟世界交互等多项任务。并且进一步构建了基于决策大模型的通用决策AI App开发工具,以提供端到端的开发体验。


微信图片_20230403103859.png

图:Enigma Alpha的产品能力

2

以自然语言为接口,实现虚实空间的交互联动

Enigma Alpha融合了自然语言处理以及决策智能的能力,前端基于预训练大模型技术,能够准确理解人类的语言,可实现与人类的多轮交互,提供了丰富而高效的对话体验。同时谜题科技进一步引入了工具增强对话能力,可融合应用API、数据仓,执行知识融合、计算增强,实现了与外部数据源和第三方服务的无缝连接,极大地拓宽了系统的应用范围和实用性。


目前,Enigma Alpha在工具增强方面已经取得了显著的成果。例如,在执行数学运算任务时,系统可以快速准确地给出答案;在查询实时天气信息时,能够提供最新、准确的数据。Enigma Alpha将继续在工具增强方面发展,拓展其应用场景,包括但不限于:1)个性化交互:通过结合用户历史记录、推荐系统等外部工具,实现个性化交互,为用户提供更精准的推荐和回答;2)智能客服与智能家居:工具增强的Enigma Alpha可以实现更智能化、更人性化的交互体验,提升用户满意度;3)在专业的水电、交通、法律等领域:借助外部工具,Enigma Alpha有望实现更准确、更快速的风险识别、情报分析,为专业人士提供有力支持。

Enigma Alpha在自然语言交互和工具增强的基础上,进一步融合决策大模型DB1多任务控制能力,拓展了与物理和虚拟世界复交互的能力。Enigma Alpha可以输出特定任务的决策指令与动作,在第三方工具/环境执行,并针对外部环境反馈进行应用。这使得Enigma Alpha能够在广泛的应用领域发挥作用,包括但不限于游戏设计、机器人控制、多智体控制。凭借以自然语言为接口的物理/虚拟世界交互能力,Enigma Alpha正逐渐打破自然语言交互的局限,实现更加广泛和深入的应用。Enigma Alpha在不断发展的过程中,通过更多与外部环境进行交互,将能够更好地适应各种应用场景和用户需求,为人们的生活带来更多便利。以下是3个应用场景的演示视频:


微信图片_20230403182935.png
场景1: 坦克大战游戏设计


微信图片_20230403183026.png

场景2:浏览器控制


微信图片_20230403183222.png

场景3:机器人控制


此外Enigma Alpha还提供了一套易于使用的开发工具,更丰富的模态输入使开发者能够轻松创建和管理自定义决策AI App,该工具的核心思想是将不同的组件“链接”在一起,输入与输出不同模态数据,调用第三方工具,与第三方环境进行交互,围绕决策大模型创建更高级的用例。通过提供完整的前后端交互系统和稳定的自然语言大模型与决策大模型服务,Enigma Alpha有效确保了系统的性能和稳定性,为用户提供更加便捷的体验。


微信图片_20230403183301.png

图:Enigma Alpha构建的智能决策生态

3

顶配创始团队,研发+商业化并驾齐驱

对于落地,Enigma Tech也有着极强的信心,除开聚集了顶级科学家阵营,公司还配备有丰富业务经验的复合型团队。首席科学家汪军教授在海内外都拥有极强的影响力及号召力,汇集了一支在强化学习、大模型以及自然语言处理领域颇有建树的科学家团队。Enigma Tech的创始人郭宏博也先后在华为、乐视、百度、阿里等国内较早落地AI的企业供职,还曾是阿里云企业大脑负责人、阿里神经符号(AGI)实验室和机器智能场景发起人,积累了丰富的实战经验。


面向企业环境、生产环境、机器环境,谜题科技以人/场景/机器在环路的强化学习作为内核去构建决策式多任务大模型,未来可以链接更多不同的Action任务,实现控制机器、机器运营调度、自动运维、效率优化等功能,让AI无处不在。在单智能体控制领域,可进行机械臂控制与协作、柔性制造、多场景机器人自适应;针对机器数据拟合与泛化,也可以进行机器自动运维、控制、调度、维护、优化;此外,Enigma Alpha还可以进行大规模智能体协同,如无人机&车协同作业、人机仿真协作、人机策略协作、虚拟演习、智能NPC等;最具突破性的一点是,模型可实现实时超大规模决策,如传统运筹问题可根据业务描述直出结果。


目前,谜题科技已与包括中交建、上汽研发总院等多家行业头部企业建立了合作关系,为整个业务链显性提效。在新车实验环节,谜题科技通过与合作伙伴在关键环节和关键时间精确协调资源与任务,使得新车试验验证周期大幅缩短,试验资源投入成本大幅下降。在无人车调度场景,谜题科技与合作伙伴共同开发矿区无人车动态调度决策系统,帮助其调度系统更柔性地应对矿区内多种突发情况,改善传统方法求解效率低下带来的多种问题。后续随着底层模型的迭代,公司的算法产品将会解决更多的场景需求。

4

总结


AIGA(人工智能生成行动)是在AIGC(人工智能生成内容)基础上的一次重大创新,专注于决策智能技术的发展,其中多模态决策大模型是实现决策智能体从游戏走向更广泛场景,从虚拟走向现实,在现实开放动态环境中进行自主感觉与决策,最终实现通用人工智能的关键探索方向之一。未来谜题科技将持续迭代底层引擎以及AIGA系统,以实现跨域、跨模态、跨任务的知识泛化与迁移,最终在现实应用场景下提供更通用、更高效、更低成本的智能决策。