如何让大模型更聪明?

【导读】 6月20日下午，163期文汇讲堂“数字强国”系列启动，首期《AIGC驱动生产力跃升与良好世界塑造》，在涌动着毕业季青春气息的华东师大樱桃河畔成功举办。北京智源人工智能研究院副院长兼总工程师林咏华应邀作主讲，华东师大学者杨国荣致辞，计算机学院贺樑、哲学系郦全民、付长珍、潘斌、刘梁剑参与数字&人文圆桌对谈，13位听友现场互动。校内外7600余人观看华东师大微信号直播。现场发放了50枚NFT数字徽章.

本次讲座由文汇报社、上海树图区块链研究院、华东师大中国现代思想与文化研究所、华东师大哲学系伦理与智慧研究中心联合主办。

现经整理，刊发现场互动，以飨听友与读者。主讲和圆桌对话请见文末链接。

大模型走向更智能会遇到的天花板，尚在集体摸索中

AI行业Convertlab公司主管高鹏：今年2月份开始，我们一直折腾于在大模型上做自动化应用，结果发现它没有想象中那么聪明。请问这种序列到序列的模型，技术上的天花板在哪里？智源有何突破计划？

林咏华：这是很专业的问题。从从业者的角度来看，当前国内的大模型并没有大家想象的那么聪明，大多数情况都还是要依赖人去调教。坦白来说，目前我们还没能够摸到天花板在哪里。包括智源自己在内的AI科研团队，还无法保证我们每一步都做对了。这里有很多的因素，包括许多算法的选择或者算法突破，还有待很多的实践。大模型正因为太大，试错成本很高，使得一些更激进的想法、创新或突破性设想不敢轻易去实施，因为可能动辄就要几百万、上千万的投入。

企业众筹降低大模型开发成本，还需要更智慧的机制

商业协会秘书长平渊海：我毕业于经济学系，很关心成本。现在开发大模型需要很高的成本，有没有想过发动相同利益的企业一起做众筹呢？比如说和快递业企业联手研发专门用于分拣的大模型？如有，其中面临过哪些挑战？

林咏华：这个设想从今年上半年开始就一直就有。每一个行业都可以至少找到八到十家共同性质的企业一起众筹、训练行业大模型，做出来以后各家在企业的内部更精细地去锻造。这个想法很合理。只不过这里需要有充满智慧的顶层设计，难度不在技术层面，更多是在合作模式、商业模式、未来利益共享的顶层设计。

人文学者可以在AI支撑的体验时代继续提问和批判

华东师大哲学系博士生李祥翔：AI在信息收集和处理方面的能力已经远远超过人类，未来在分析和回答问题上，人类或许也会落后于AI。根据您对科技和哲学的了解，哲学和人文社科学者，以后存在的意义和价值是什么，哲学人的任务只压缩为提出问题吗？

郦全民：按照我的理解，哲学家这个职业就是擅长提问题。假如说生产力发展了，机器人成为劳动者的主体，留给我们哲学家的任务是在体验时代提出好问题。英国在尝试的UBI实验（发基本月薪但可自由选择是否工作）就是这样的，需要哲学家提出新问题：比如，我们人类是否已经进入了那种包括看风景的体验时代？

另外，哲学家还有一个工作就是批判，它是永远需要的。今天的圆桌对话当中，大家发现我们的观点并不一样，就是在“批判性”地讨论。比如，对于通用人工智能是否会有自主意识，保留意见居多。但只要大模型达到一定程度，“涌现”某种能力是肯定的。目前，人工智能模型还没有达到人脑1%的参数。所以，我们需要一种开放、批判的心态。

审美确实创造出工作岗位，前提是人不依赖机器判断

华东师大学哲学系博士生丁洪然：人工智能能替代的工作越来越多，但是人类的审美是有很大的差异性的，审美是否不可能被AI替代，由此创造出更多的职业选择和生活方式？

贺樑：在人工智能的影响下，未来需要人类做的工作应该会越来越少，当然，我们人类会被动或主动地想办法设计出适合我们做的事，审美是其中一个可能。美本身在不同的时代、不同的人群里就有不同的定义。它一是来自生物自然的感受；二是来自人类后天的定义，主观性较强。现在对美的标准，再过五年、十年都会发生变化。所以只要人还是世界主体的话，就有望按照人类的标准来定义，由此创造出超越机器能力的职业。

但前提是，要规避美的标准是由AI来帮我们确立和判断的，那样会沦为当下的下围棋一样，一步棋下得好不好，很多是依赖机器判断和指导，而并非由我们人来判断。这些充满创意的环节一旦都变成了机械的确定，就容易索然无味。

翻译领域生产力跃升：机器高效+人脑智慧与经验

翻译公司创业主林韶春：我在六年前加入文汇讲堂时还是翻译公司的职员，后来响应国家双创号召成为了独立的创业者。请问，包括ChatGPT在内的AIGC技术，在翻译领域会如何提升行业的生产力？

付长珍：如何提升翻译领域的生产力？我自己没有创业的经历，只能“纸上谈兵”。技术和人的关系，是一种双向赋能，随着技术的发展不断更新自己创业的方式是非常必要的。ChatGPT拥有强大的语义理解和上下文推理能力，通过人机交互，可以使翻译过程更加流畅、高效，某种程度上确实可以大大提高生产力。但在一些关键环节上，仍然需要强调人的个性才智和想象力，需要翻译工作者的加工提升和检验。

我想，只要保持对技术的谦逊与审慎，人机协同才能更好地应对复杂性，不断提升翻译的质量和公司效益。

隐私保护的途径之一是大模型部署到私有化网络中

通信行业高级工程师柴忠於：通过ChatGPT询问公司方面的业务，而公司又禁止用ChatGPT，具体落地时如何保护隐私？

林咏华：关于数据隐私，基于不同的大模型部署方式，通常有两种考虑。一是类似于ChatGPT包括国内的某些大模型，提供了在云上的服务，用户上传问题及相关信息，它再回答。理论上，大模型运营商都需要获得授权的情况下才能够访问用户上传的数据，否则是不合法行为。所以，这里存在一个问题，即你是否信任这些大模型运营商。

二是对于那些对信息保密有要求的行业，包括金融机构、医疗机构等，我们可以支持大模型的私有化部署，部署到企业的内部网络里，以避免商业信息的泄露。

版权的加密都在探索，最终应从技术层面加以实现

人力资源工作者叶沛松：在基础大模型推动下，如何保护我们自己的版权和知识产权？在基础大模型推动下，如何保护我们自己的版权和知识产权？

林咏华：目前版权问题的讨论，主要是针对放到预训练数据里的知识内容，涵盖图片、视频、文字作品。怎么能够做到在训练的时候，对这些有版权的作品进行加密，从而避免版权作品的泄露？目前学术界在不断地研究各种方法，包括同态加密技术等。但使用这类技术，对现在的计算成本会上升很多很多。

多模态下的文生3D，技术上指日可待，其后需不断迭代

3D智能动画科技公司市场推广翁缪纯：我们公司在三四年前利用AI技术，开发了一款3D智能动画，所用时间、费用都较小。大模型出来后就遇到研发成本较高的瓶颈。请问，如何通过大模型解决这对成本矛盾？

林咏华：大模型在多模态，尤其是视觉多模态上面，不断有新的突破。当前已经发展比较成熟的是文生图的模型应用，此外有文生3D即通过一段文字就可以自动生成三维图像，进一步还可以用文字生成视频，只不过现在能自动生成的视频还比较短。所以，技术上指日可待，或许在未来一两年就可以通过大模型，让创作者输入一段文字的描述，即可自动生成3D动画。

强人工智能主导下，人有无可能发展成全面的人？

华东师大哲学系博士生郭江勇：人类作为劳动者有这样的经历：从独立自主的劳动者到机器流水线上的一个环节，未来可能是再到人工智能时代的数字化按钮或者符号，这意味着人的劳动主体地位的逐步消解。因此，我特别疑惑的是：在智能化时代里，劳动者丰富的经验、技艺与风格逐渐被弱化，那么劳动者是否会丧失劳动主体的权利或资格？此时，人还能否成为一个全面发展的人吗？

潘斌：我们今天所看到的各种智能主体，包括人机协同、人形机器人或者机器手臂等，说到底还是由人来支配与控制机器，所以说，目前，人还是唯一的劳动主体，而距离强人工智能和超级人工智能的时代还较遥远。

但是，如果智能机器人或者强AI等有可能成为新的劳动主体，我们也不能排除它们会有觊觎、独占地球资源的念头或动机。在智能技术的加持与帮助之下，人类能否真正确立劳动主体的资格，取决于我们如何认识与规范关于人工智能的研发应用，取决于人工智能技术能否成为人类的真正工具与具体延伸。

从乐观主义的立场来看，在发达的智能时代人类有可能成为全面而自由的人。

从出版界获优质训练数据并仍维护版权，需法规前行

海关工程师胡烨亮：您刚才谈到，在人工智能发展中优质语料的数量和质量不足，但又要实施版权保护。如果迁就这种版权保护，就会阻碍生产力发展。我的设想是国家或行业协会统筹支付一定的版权费用，来替代原来由各个公司垄断的版权达到版权共享。可行否？

林咏华：一方面，当前从社会及政府的层面已经意识到，不能够因为版权保护而让可能影响整个社会或者所有产业的一个重要技术的发展停滞下来。另一方面，我们这里所说的版权，只是用来做大模型的训练数据。并不是拿了一本书再次发布，这里是让机器去读，并不是人去读。

基于这两个重要的前提，目前业内正在进行很多积极的讨论，希望推动一些新的法律法规或者行业规范，可以使得我们更加有序地去组织，有机会去使用现在散落在各个地方的版权数据被组织起来，以供大模型训练使用或者被有偿使用。

这里也需要高层设计的智慧，因为它将打破两个不同产业的边界。

机器如能替代人的创造力，符合“宇宙的自然选择”理论

华东理工大学工科博士生侯志伟：《技术的本质》这本书里讲到，科技的世界里各种高科技产品本质是技术的组合，一个产品下面是技术，技术下面还是技术，最后技术追究下去是一种现象，现象被人类所利用。人工智能已经可以识别图像、认知图象，某一天可以有机组合一些技术时，是不是可以认为要按照这条逻辑，那么机器是不是必将替代人类或者替代人类的创造力？

郦全民：我觉得技术发展了，是否会出现超级智能，要看看有什么力量在驱动？简单地说，有两种力量，一是个人的好奇心，另一就是英伟达创始人黄仁勋最近在台湾大学毕业生典礼上说的，“不管你是为了追逐食物，还是为了避免成为食物，都是要跑，不要走。”就是说，你要不落后就要跑，你还要跑得更快。

最后，人类会怎么样？可能是产生新的智能物种。我觉得这是好事。人类假如要离开地球、离开这个生物系统，进入另外一个状态，就需要新的智能物种超出生物的生态系统，实现进化新的方式。目前，科学中就有一个“宇宙的自然选择”学说，主张普适达尔文主义。人工智能体所处的电子生态系统与人所处的生物生态系统不同，有更广阔的进化空间，所以，我相信AI会超越人类。

降低幻觉率的方法，或以单一大模型技术与外部知识融合

华东师大中国哲学硕士研究生龚胜男：主旨演讲中，您提到做评测时有人类参与。我在使用GPT中，发现它会说谎。是否可从技术层面保证它的客观性？

林咏华：大模型是基于概率产生内容，所以幻觉率（也就是“一本正经胡说八道”）是很难避免。目前可行的方法是，大模型与外部知识进行融合、增强。与外部客观存在的知识库、数据库或者搜索引擎去结合，尽量降低大模型的幻觉率，而使得它回答真正的“有理有据”。

AI人才不论从业时间长短，关键在于保有学习能力和融会贯通

60秒提问由舞台上小闹钟控制时间，敦促听友简洁提炼问题，36分钟共互动了12个问题

文汇报记者李念：进入AI的大模型时代后，行业对人才的培养和需求、学校学科设置，和此前有何不同？（非现场提问，为会后交流所提）

林咏华：我觉得对AI领域人才的培养并没有太大的区别。在十多年前深度学习流行时，很多非AI领域人才转行涌入，现在大模型出现，又有一批非大模型的人才转型。并且，由于各种开源平台的蓬勃发展，这一轮的学习门槛更低了。比如B站上有各种针对开源大模型代码的视频教程，大家都可以很快上手。

所以，我认为对AI人才来说，始终不变的是，第一要保有持久的学习能力，哪怕在传统赛道的AI从业者，哪怕已经四五十岁的开发者，只要保持学习、善于融会贯通，都有很好的发展机遇。

第二，我相信，大模型和小模型会并存，大模型产业落地离不开很多已有技术。例如，在深度学习出来后，用OPEN CV做计算机视觉处理的人才甚至有了对他们更大的需求，因为深度学习不能解决所有问题，需要这些传统图像处理技术来完成前处理和后处理。对大模型而言，也是一样的道理。

学科设计上，我们觉得需要融入更多基础学科，需要更多学科和AI相结合，产生新的思维模式。我们相信，类似计算机软件技术，不远的将来，AI也会变成一个普遍的工具。

整理：李念

【精彩瞬间】

1.163-1期文汇讲堂预热环节，播放了文汇报社制作的4个关联短视频，依次为文汇讲堂李念的《163期“数字强国”携NFT开启》，记者许炀的“许蜜桃下午茶”制作的《王安忆余华谈ChatGPT》，文艺部邵岭策划、融媒体视觉部制作的《AI音乐成为新生命》，文汇文艺评论制作的《莫言谈ChatGPT》，开场也引述了“文艺评论周刊”刊发的江晓原的观点。