科普中国智库·观点 | 王元卓:生成式AI在科研与科普中应用的思考与实践
发布时间: 2025-04-18
作者:科研管理处
字体:
来源: 中国科普研究所

导语:

“科普中国智库•魏公村讲坛”是中国科普研究所依托“科普中国智库”专家资源,面向科协魏公村办公区搭建的常态化学术交流平台,以“开拓视野、夯实基础、促进协作、提升能力”为目标,邀请智库专家解读前沿科技动态,分享科研学术进展,促进科研创新,营造学术氛围,助力干部科学素质和能力提升。以下为讲坛第二期内容。

 

一、发展历程:从符号智能到通用智能

自1956年达特茅斯会议至今,人工智能经历三个主要发展阶段,呈现从手工总结到自动学习、从离散符号到连续参数、从专用智能到通用智能趋势。1990年代进入专用智能阶段,属于弱人工智能,任务泛化能力差,聚焦垂直领域优化(如人脸识别准确率不断提升)。二是通用智能阶段,2018年后,通用人工智能(AGI)的探索起步,其具有多任务普适性,能够进行类似人类的抽象思维和推理,具有创造性和解决问题的能力。而生成式人工智能(AIGC)是人工智能生成的内容,不等同于通用人工智能(AGI),但AIGC是现阶段主要的技术路线。

通用人工智能阶段重要的技术基础就是通用模型架构。在2018年出现的循环神经网络(RNN)主要用于一维序列化文本建模,随后发展的卷积神经网络(CNN)能够处理二维平面图片数据。而更先进的图神经网络(GNN)则能对结构化、半结构化图数据建模,突破平面限制。这些架构的演进全面提升了大模型的能力。

大模型促成了“智能涌现”——就像物理世界中水蒸气(气态)通过量变积累逐渐转变为云、雨、雪(不同形态)的过程。同理,当大模型的数据量达到临界点,智能就会从量变产生质变。这正是大模型依赖大数据的根本原因。目前,大模型在任务复杂性上仍无法做到和人一样。

二、AI在科研、科普和科学教育中的探索实践

科研辅助方面:AI加速科学研究范式改革,向周期短、AI密集、数据驱动、合作共赢型的研究范式转变。AlphaFold预测蛋白质结构,将研究周期从年缩短至小时;AI为数学家提供证明灵感。可以将AI作为工具有限度地慎重使用,但使用的人首先一定要有这个能力,否则幻觉和错误可能导致更大的工作量或造成误导。比如:AI自动生成文献综述,但需人工核查是否存在虚构参考文献。

科普创新方面:在个人的科普实践中,找准科幻电影与科普的结合点,通过科幻电影场景来讲解科学知识,能够激发孩子的兴趣。科幻电影涵盖了天文、地理、伦理等多个领域,是科学教育的良好载体。利用AI模型学习自己的手绘风格,生成了具有个人风格的科普插图,既保留了科学性,又增加了温度和创新性,同时AI模型的应用大大提高了科普创作的效率。探索了利用数字人生成教学内容的可能性,包括课程大纲、教案、逐字稿、PPT和数字化教师等,数字人的应用将能为个性化教学提供新的途径,使没有科学背景的人也能生成适合自己的教学内容。

科学教育方面:AI可以实现个性化教学,并且持续可用,博学多才,但目前仍然存在安全隐私、知识可靠性和缺乏人际交互等问题。AI在教育领域具有巨大优势和潜力,同时也有很多不可忽视的问题。比如,如何应对个性化科学教育的需求,让学生听得懂且愿意接受?如何通过认知测绘和认知匹配,实现基于认知的科学教育?如何保证内容的可靠性和科学性?未来有望通过AI一定程度上解决科学教育资源不均衡的问题。

三、强大但不完美:技术狂飙的双重挑战

OpenAI打造的ChatGPT以病毒式传播席卷全球,5天破百万用户、60天达亿级的增长神话,揭示着技术平民化时代的到来。到目前为止,AI大模型百花齐放,各有各的强项和专长。在文本、图片、视频生成模型各有优势,组合应用场景多样,但各自仍有局限性。

文本大模型既能撰写法律文书,也能创作诗歌代码,更在科研领域展现出令人不安的创造力。大模型编写学术论文以假乱真,带来可能侵犯知识产权等问题。生成的文章结构清晰,语言表达流畅,但关键事实性信息可能出现错误,甚至编造不存在的故事,如“林黛玉倒拔垂杨柳”的故事。模型也还无法根据背景信息个性化回答,比如科普时无法根据不同受众给出符合认知能力的答案,同质化严重。

模型虽然已经具有强大的推理能力,在国际奥林匹克信息学竞赛中超金牌线,但目前模型参数量增长速度放缓,性能提升可能接近极限,同时需要更长的推理时间和更多的计算资源,因此成本飙升。图片和视频生成大模型方面,可以通过文本提示生成逼真或富有想象力的图片和视频场景。但在场景刻画、遵循物理规则、审美、文本渲染等方面,仍有局限性。走向更强的AI,能源消耗将是很大的挑战。

四、大模型时代的挑战与反思

自2022年底生成式AI爆发以来,中国AI用户快速增长:2024年6月,用户规模达2.3亿(人口16.4%),同年10月增长至6亿。AI的强大生成能力,让它具备了创造内容的潜力,但与此同时,也有人利用它制造虚假信息。相比于AI造谣,观点论述、知识科普类的AI生成内容更难察觉,更容易在互联网中广泛传播。

如果AI生成虚假、错误内容的趋势越来越严重,我们不仅难以追溯文章的真实性,整个中文互联网也将逐渐充斥着AI的幻觉地雷。这些被华丽辞藻包装、看似“有理有据”的内容,隐藏着难以察觉的事实错误与逻辑漏洞。

因此,如何监管 AI 生成内容、确保信息真实性,已成为不可忽视的问题。2025年9月1日起,将施行由国家网信办、工业和信息化部、公安部、国家广播电视总局制定的新规《人工智能生成合成内容标识办法》,明确要求AI生成或合成的内容进行清晰标识。