把政府撒播的创新种子,和市场化机制连接起来。
2020 年,沈向洋在深圳成立了 IDEA 粤港澳大湾区数字经济研究院,开启了人生的新阶段。他希望能以新的机制,做一些推动技术落地的事情。于是这座国际化创新研究机构的定位为:推动 AI 技术发展,立足社会需求,研发颠覆式创新技术并回馈社会,让更多的人从数字经济发展中获益。
2022 年 11 月 22 日,第二届 IDEA 大会召开,第一天上午的主要议程是沈向洋主讲的「IDEA 技术与产品发布会」。2 个小时的发布会中,沈向洋介绍了这一年来 IDEA 的各项成果,以及每一项成果背后对趋势的思考,既涉及当下大热的 AIGC,也涉及研究方式的转变……除此之外,他从创新-资本范式的视角,梳理了技术创新从实验室走向市场的四个阶段,以及 IDEA 在这其中的定位,要怎样做。
最后他总结,IDEA 一直在寻找属于自己的创新「甜区」,也就是从使命驱动到风险型创新的进程。纵观整场发布会,除了获取前沿趋势的动态,也能在如何思考科技发展上得到的启发。
这是沈向洋当天发布会演讲的主要内容,由极客公园精简整理:
大家早上好!欢迎来到 IDEA 大会。我们非常高兴在深圳这片土地上做一些非常了不起的工作。举办 IDEA 大会的目的有两个,第一是有一个机会可以汇报和展示我们在 IDEA 做出的最新成果。第二是希望能够有机会跟大家分享一下我们对前沿技术的看法和未来趋势的判断。
今天我的演讲分为两部分,第一部分是过去一年多来我个人的体会,在计算机科学、人工智能发展方面有些什么最新的趋势。在这个过程当中,我也会穿插一些我们研究院做的优秀工作,梳理一下我们 IDEA 研究院到底在做什么,我们是什么样的一批人,怎么思考这样的科学的问题,为什么我们要做这样的工作。此外,我想把科学研究这件事情和资本的投入之间的关系用一条创新曲线跟大家分享。
关于人工智能的发展,我以前一直讲两大原因:大数据、大算力。精准的算法推动到整个行业发展到现在,这一点很了不起。现在还不断地有新的了不起的大模型出现,推动着人工智能发展新高潮。
今天,我想跟大家分享四个很有意义的 idea。
01 从一言胜千图到一图胜千言第一个跟大家分享的 idea,一言胜千图。人工智能最近的蓬勃发展,就是预训练大模型的发展,它整体的规模和速度都到了今天我们不可忽视的地步。还有很多问题人工智能还远远没有解决,但没关系,我今天想跟大家分享一些例子,你讲一句话就可以生成出来非常漂亮的照片,而且结果非常震撼,栩栩如生。我自己做计算机视觉这么多年,三五年前跟我讲大概能做出这样的结果,我是不会相信的。
有一个系统叫做 Open AI,其实也是微软资助的一家公司做的。你讲一句话,日落的时候有一个狐狸在草丛上,能不能用莫奈的风格给它画出来。一年前 DALL·E 就可以做出这样的结果:一个草丛的样子、一个狐狸的样子、一个日落的样子。一年以后的结果,进步非常快。
他能够做出这样的结果有三个原因:巨大的数据量,庞大的算力,了不起的新的深度学习算法,这里特别用到 Diffusion 模型。在互联网上可以找到大量的图像、标注和语言之间的数据对,来做出这样的结果。很多人认为今天深度学习出来这样的结果,技术路线简单粗暴,但是你不得不同意做出来这样的结果已经是非常的细致、漂亮。
有了这样了不起的结果以后,我们应该去想什么样的问题?在 IDEA 技术到了一定地步,我们就想能不能把这些技术做成产品、做成工具。因为我们专注于数字经济,数字生产力的底层,就是以人工智能为代表的工具。这件事情最重要的是可以帮助艺术家,每个人有艺术创作冲动的时候做一些事情。
有人研究过历史上了不起的艺术家他们在做作品的时候,为什么很多艺术家一辈子只能画几张画,而又有其他艺术家可以画很多画。最出名的人是达芬奇,艺术史的研究者研究后得出一个可能性:达芬奇那么多画不是他一个人画的,他带了很多徒弟画。至少我这个外行看不出来达芬奇画的质量和他徒弟画的画的质量。
艺术家要带一堆徒弟,才能够画很多东西。今天 DALL·E 这样的系统出来之后,给我们带来的冲击是什么呢?人工智能就是你的小徒弟,有了人工智能加一些工具,每个人都是「达芬奇」,每个人都有机会做这样的事情,真正提高数字生产力。事实上伟大的艺术家都是非常敏感的技术使用者。达芬奇如果今天在世的话,他肯定第一个尝试像 DALL·E 这样的系统。
看到这样的效果以后,大家是不是觉得人工智能的问题都已经解掉了?当然不是,这里面还是有很多问题的。今天大数据、人工智能还是一个记忆和阐释的过程,还没有真正理解和认知的过程。
举一个简单例子,你让人工智能去做宇航员骑在马上,然后换一个说法,马骑在宇航员的身上,就出来这样的结果。因为以前人类积累的数据里面就没有类似概念,所以很正常。这样一些瑕疵,并不妨碍技术和应用不断迭代和进步,因为有反馈,我们才能闭环、才能有进步、才能有创新。
大模型这件事情已经火到什么样的地步?微软支持的 Open AI 这样一个初创公司 DALL·E,号称估值 200 亿美元。比如美国出来一个 Stable Diffusion 的方法,有一家公司他用开源的方法来做,横空出世,出来就是一个十亿美元估值的独角兽。这家公司的算力远不如DALL·E,但开源出来,就有很多人用,就有闭环,就有可能进步。
IDEA研究院的张家兴博士,两年前就在IDEA对大模型做深入研究。今天非常高兴发布我们 IDEA 研究院在人工智能内容生成领域的「盖亚计划」,一个是模型自动生产力引擎,另外一个方面是预训练模型体系。
整个项目都是开源的,这个项目也自主研发了首个中文开源的 Stable Diffusion 模型,这个项目的开源也标志着中文 AIGC 时代的来临。我们非常高兴能够为中文 AIGC 社区做一些贡献。
大家可以看几个例子,进我们这个系统打一句话:梦回江南,你就可以看到这样的结果。现在我们这个模型已经在 Hugging face 上,在一百多个 Stable Diffusion 中今年已经排名第三。三个星期前下载量已突破 10 万。