EN
CN
CN EN
2023.04.07
来源 : CMC资本

78e2d5ebb65f243bb50b3a65e10d6e48.png

2023上海全球投资促进大会于昨日(4月6日)上午在世博中心举行。市委书记陈吉宁出席并致辞。市委副书记、市长龚正宣读2023上海全球招商合作伙伴名单。本次大会遴选出26个规模大、能级高的代表性项目进行现场签约,总投资674亿元。

人才资源一直以来都是上海产业高质量发展的最大优势。目前,上海拥有全国50%的5G人才,40%的集成电路人才,33%的人工智能人才,25%的创新药人才。为推动创新链、产业链、资金链、人才链深度融合,今年大会首次引入招才引智签约环节,10位来自海内外的科学家和高端产业人才与10家本地企业及研究机构签约合作,帮助上海加快在燃料电池、工业软件、智慧交通等诸多领域的技术创新步伐,持续扩容上海的人才、招商“朋友圈”。

CMC资本孵化企业上海数字大脑研究院(简称“数研院”)联合创始人、英国伦敦大学学院教授、阿兰图灵研究所图灵学者汪军教授作为全球顶级科学家的身份应邀出席大会,并参加招才引智签约环节,成为10位签约科学家之一,将就决策式多任务通用大模型的开发进行合作。

WechatIMG1629.jpg
上海数字大脑研究院联合创始人汪军教授(右二)出席现场签约仪式

汪军教授在本次大会会后的新闻通气会上谈到,“上海聚集了国内外诸多高校和研究机构,拥有大量高水平科技实验室、顶尖科学家和高级人才,所以上海在科技创新和创业领域拥有强大的引领能力。上海能够助力企业走向国际,在全球市场上占据优势,这也为创新创业公司、科学家、顶尖人才打造了一个更广阔的发展舞台。”
“英国孕育了DeepMind这样的企业,不仅是因为英国高校的学术研究非常活跃,还因为英国的很多高科技企业、资本以及高校的结合形成了比较好的研究土壤,可以吸引整个欧洲的AI人才。” 他同时也表示,上海可以借鉴这一做法,在高科技企业、资本、高校的结合等方面多下文章,提高人才的眼界,使得他们在研究更愿意做一些突破性的工作,敢于比别人更早地问一些前瞻性地问题并承担一定的风险。
去年4月,汪军教授和CMC资本联合创立上海数字大脑研究院,并于今年初内部孵化成立了一家独立初创企业— “谜题科技”,汪军担任上海数字大脑研究院联合创始人、院长,并出任谜题科技首席科学家。截止目前,谜题科技已实现了大模型自然语言对话交互、决策智能工具增强的自然语言交互等若干功能。
上海数字大脑研究院汇集了一支在强化学习、大模型以及自然语言处理领域颇有建树的科学家团队,是在创业领域拥有强大的引领能力的一个创新平台,成立至今已推出:
1)首个数字大脑多模态决策大模型(简称DB1)(☞原文请戳),填补了国内在此方面的空白,进一步验证了预训练模型在文本、图-文、强化学习决策、运筹优化决策方面应用的潜力。此外,创新性地尝试将预训练模型的成功复制到决策任务上,并且取得了突破;
2)在机器人控制方面,成功用强化深度学习方法,将Transformer大模型应用于四足机器人跨地形、跨具身运动控制(☞原文请戳),让不同具身的四足机器人成功在多种真实复杂地形上“化险为夷”,如履平地,为自由、自主的运动控制奠定基础。相关成果以两篇论文的形式发表在国际机器人顶级会议ICRA 2023上;
3)在多智能体决策方面,以足球球队为应用场景,基于Transformer建立起了一支人工智能球队(☞原文请戳)。数研院的足球AI训练框架把每一个球员作为一个单独的策略智能体,让智能体从零开始学习,使球队自我对抗,逐步开发探索出新的技能来升级。数研院开放了足球AI的研究资源在https://github.com/Shanghai-Digital-Brain-Laboratory/DB-Football,除了训练框架,还包括分析工具、基线模型等,希望推动足球AI研究社区的进一步发展。

4)在商业落地方面,以决策智能大模型为底层架构的决策智能平台在各个领域都有着出色的表现。以高端制造业的研发环节为例,一直存在时间与成本居高不下的问题,在研发的不同阶段,研发物料、任务排程和研发人力三者之间也存在资源协调上的矛盾。数研院在与上汽研发总院(☞原文请戳)的合作中,基于数据驱动的业务计划智能决策引擎,将“决策大模型”引入业务计划的制定和执行过程中,通过数据让机器辅助决策,从根本上优化传统靠“人的经验”排程和变更带来的弊端,使得管理提质、增效。


附:数研院近期大模型论文成果


1. On Realization of Intelligent Decision-Making in the Real World: A Foundation Decision Model Perspective. Arxiv 2022. https://arxiv.org/abs/2212.12669

2. Sim-to-Real Transfer for Quadrupedal Locomotion via Terrain Transformer. ICRA 2023. https://arxiv.org/abs/2212.07740

3. Multi-embodiment Legged Robot Control as a Sequence Modeling Problem. ICRA 2023. https://arxiv.org/abs/2212.09078

4. Multi-agent reinforcement learning is a sequence modeling problem. NeurIPS 2022. https://arxiv.org/abs/2205.14953

5. Offline pre-trained multi-agent decision transformer: One big sequence model conquers all starcraftii tasks. MIR 2023. https://arxiv.org/abs/