【环球时报特约记者 任重 环球时报驻美国特约记者 冯亚仁】美国人工智能公司OpenAI近日推出的生成式人工智能模型Sora,震动全球科技界,其背后的研究团队也浮出水面。根据OpenAI官网介绍,Sora团队包括两名研发负责人威廉·皮伯斯和蒂姆·布鲁克斯,系统负责人康纳·霍姆斯,以及12名核心成员。而这支团队十分年轻,成立时间尚未超过一年。
皮伯斯和布鲁克斯二人就读于加州大学伯克利人工智能研究所,都是2023年才毕业,博士导师同为该所教授阿廖沙·埃夫罗斯。
根据相关信息TG体育,皮伯斯在麻省理工学院读本科,主修计算机科学,曾参与GAN(生成式对抗网络)和Text2Video的研究。他和纽约大学的华人学者谢赛宁一起合著的论文《基于Transformer架构探索一种新的扩散模型》被认为是Sora背后的重要技术基础之一。
Meta首席人工智能科学家杨立昆此前曾转发谢赛宁的推文,认为Sora基本上是基于上述被2023国际计算机视觉大会收录的论文提出的框架设计而成。而该论文曾因“缺乏创新”,被国际计算机视觉与模式识别会议拒绝。
Sora被推出之后,谢赛宁在社交媒体上表示:“Sora是皮伯斯等在OpenAI的呕心之作,我虽然不知道细节,但是皮伯斯告诉我,他们每天基本不睡觉,高强度工作了一年。跟我的关系是什么呢,只能说是一点关系都没有。”
团队另一名主要负责人布鲁克斯研究领域是模拟物理世界的大规模生成模型。他本科毕业于埃夫罗斯曾经执教的卡内基梅隆大学,主修逻辑与计算,辅修计算机科学。2017年,本科毕业的布鲁克斯先到谷歌工作了近两年,之后到伯克利人工智能研究所攻读博士。在伯克利读博期间,他的主要研究方向就是图片与视频生成,与导师埃夫罗斯教授和同组博士后一起开发人工智能图片编辑工具InstructPix2Pix。布鲁克斯毕业后加入OpenAI,成为图像生成系统DALL-E的主要研究人员。
布鲁克斯还是个多才多艺的人,喜欢摄影和音乐。他高中时的摄影作品曾获得国家地理最佳摄影和国家野生动物联合会的奖项,他还曾在纽约百老汇的灯塔剧院演出。
Sora的系统负责人是康纳·霍姆斯,他本科和研究生都就读于科罗拉多矿业大学,后来获得了高性能计算博士学位。毕业后,霍姆斯到微软工作,并致力于解决在推理和训练深度学习任务时遇到的系统效率问题,在大语言模型、循环神经网络等领域都拥有丰富的经验。去年12月,霍姆斯加入OpenAI,参与Sora、DALL-E等项目。
在Sora团队中,也有OpenAI的“老人”,阿迪蒂亚·拉梅什便是其中一位。他是DALL-E的创造者,主导了3代DALL-E的研究。阿迪蒂亚曾就读于纽约大学,并在杨立昆实验室参与过一些项目。其间阿迪蒂亚已经在研究生成式模型,并和杨立昆共同发表论文。杨立昆在社交媒体上写道,阿迪蒂亚本来毕业后要读博士,但在OpenAI实习后,就直接留下了。
此外,团队成员大卫·施努尔和乔·泰勒都没有博士学位TG体育。前者毕业于加州大学圣塔芭芭拉分校,后者毕业于美国旧金山艺术大学,在包括用户界面设计、网页设计、艺术指导等多方面拥有很强的专业技能。
Sora团队成员甚至还有“00后”。团队中的威尔·德普生于2003年,2022年刚从密歇根大学计算机系毕业,2023年7月入职OpenAI,并于今年1月加入Sora项目小组。
此外,Sora团队中还有多名华人。其中,靖礼2014年毕业于北京大学物理系,2019年获得美国麻省理工学院物理学博士学位,2022年加入OpenAI,曾参与DALL-E 3的开发。里基·王则是今年1月刚从Meta跳槽到OpenAI。高中时期,他在中国的一所学校就读TG体育,本科毕业于加州大学伯克利分校。加入OpenAI前,他曾在Meta和Instagram工作过。还有名为郭宇飞(音)的华人团队成员尚未有太多公开信息介绍,不过在OpenAI两大主要项目——GPT-4和Sora中,都有此人名字。
OpenAI在Sora视频公布时称,Sora是能够理解和模拟现实世界的模型基础,相信这一功能将成为实现通用人工智能的重要里程碑。
Sora团队正在持续扩张。施努尔17日在X平台发布招聘广告,寻找有视频基础设施相关经验的人员。
显然,Sora推出后,该团队的研发工作并未停止。美国《麻省理工科技评论》报道称,OpenAI表示,它还在调整为DALL-E 3开发的假图像检测器,以便与Sora一起使用。阿迪蒂亚说,“在我们发布视频之前,我们肯定需要得到更多的反馈,了解更多需要解决的风险类型。”TG体育TG体育