人工智能时代,计算机课程体系该如何变革? | CCCF精选
2023-11-15 阅读量:651 小字


编者按:2023年6月16~18日,第三期CCF秀湖会议在苏州CCF业务总部&学术交流中心举办,主题是“人工智能时代计算机课程体系”。来自学术界与工业界的二十余位专家全程参与,围绕主题进行了深入交流和研讨,并形成如下报告。





关键词:人工智能 计算机教育 课程改革


背景与意义


人工智能(AI)时代给计算机课程带来了前所未有的挑战和变革。以大语言模型为代表的人工智能领域近年来的重大突破,已经在科研、工业等多个领域表现出强大的影响力,在教育领域也展示出了巨大的潜力。由此亟须深入探讨在人工智能时代如何构建计算机课程体系,尤其是大语言模型为未来的计算机教育和学习提供的机遇和挑战。优化和调整计算机课程体系,使其更好地适应人工智能时代的需求和发展,对于培养具备人工智能领域知识和实践能力的计算机专业人才至关重要。


本次秀湖会议的与会专家围绕会议主题进行集中研讨,以期通过思想碰撞,涌现新知;进而梳理脉络,凝聚共识,推进相关课程研究和改革。会议从两个维度进行探讨:“教学 for AI”和“AI for 教学”。其中,“教学 for AI”维度主要聚焦算法类课程、数据类课程和系统类课程的讨论。“AI for 教学”维度则主要关注人工智能时代对教学方法和评价方式等带来的影响。


观点争鸣:

人工智能时代课程的机遇与挑战


算法类课程for AI



人工智能时代带来了算法知识点的进一步膨胀。以国际计算机学会(ACM)从1968年到2013年发布的计算机科学课程体系(Computer Science Curricula)为例,纵观计算机科学知识领域的发展,可以看出计算机科学课程体系一直处于动态变化中,不断有新内容加入。人工智能在早期计算机科学课程体系中就占有一席之地,人工智能知识体系的着重点也经历了从程序设计,到算法研究,再到功能赋能的不同历史阶段。然而,算法知识点不断扩展,学生的学习时间却极为有限,教师需要思考如何在有限的时间内完成更多知识点的传授。


对学生的数理基础提出更高要求。随着新兴人工智能技术的蓬勃发展,人工智能跨领域解决复杂问题的能力不断涌现,在人工智能时代学生的培养目标不应仅是能够调用现成框架构建应用,而是要具备模型设计、优化,甚至开发具有自主知识产权的深度学习框架的能力。但是,在实现这一目标的过程中,来自一线的教学工作者发现学生的数理基础往往有所欠缺,从而给后续人工智能算法和优化方法的教学和研究造成一定的困难。


要求学生把握理论与工程的关系。在算法教学过程中,应该引导学生建立为目标服务、不必拘泥于现有理论的思维方式,让学生理解理论结果不等同于基本事实,其指导意义通常取决于条件和假设。这样的理解将有助于学生认识到现有算法在理论上和实践上的局限性,并鼓励他们寻求改进与突破。例如,李维斯特(Ronald L. Rivest)1992年在《神经网络》(Neural Networks)期刊上发表了题为《训练3节点神经网络是NP完全的》(Training a 3-node neural network is NP-complete)的文章,证明了判断一个神经网络是否存在一组权重和阈值,使之能够产生与给定的训练样本一致的输出,是一个NP完全问题。这一工作表明,仅考虑十分简单的网络,从理论上就遇到了无法逾越的计算障碍。但是,近年来随着算力的飞速发展,从ResNet到Transformer,非常复杂的神经网络在现实中是可以运行的,在多个领域大量任务上都展现出了强大的能力,这个例子说明理论上的难以求解(intractable)不等同于工程上的不可求解(infeasible),在教学中要引导学生不要盲目崇拜理论,要培养工程思维。


数据类课程for AI



人工智能作为数据密集型应用,在一定程度上隶属于大数据课程的应用方向。人工智能时代对数据类课程的课程体系、知识体系、教学方法提出了全新的要求。


培养能够构建“数据赋能闭环”的人才。所谓“数据赋能闭环”,就是能够从海量数据中抽取知识,并服务于现实世界的能力。数据赋能的前提是在拥有足够数据的情况下,把数据变成模型用于驱动生产。人工智能是闭环里的一部分,在模型生产中起核心作用。所谓数据科学家,就是能够设计和构建人工智能模型的人才。


提升学生在人工智能场景的工程实践动手能力。AI模型的很大一部分成本产生于数据准备环节,有好的数据才有好的模型。AI数据的管理耗费了很多人力物力,有很多“脏活”(dirty work),才会有最后的漂亮干净工具。课程教学的实验环节也需要教会学生干“脏活”的技能,面向海量数据抽取有用信息。但在真实课程设计中,很难有机会让学生接触大量真实数据,这是一个挑战。


人工智能可以作为数据应用能力训练的重要场景。解决工程问题往往需要多种技术,工程教育恰恰要强调多种技术的融合。以数据库系统为例,现实场景已经逐步从关系数据库管理系统(RDBMS)发展到流数据库(streaming DB),再到人工智能时代的向量数据库(vector DB)。可见数据库形态是多元且易变的,但是数据库的优化思想是相通的。人工智能时代数据类课程的教学应当依旧注重传统的案例,再逐步过渡到AI的案例,从而适应AI时代的发展需求。


系统类课程for AI



人工智能应用覆盖了现有系统课程的许多知识点。人工智能在系统方面的许多知识点,都被传统的分布式课程覆盖,尤其是在系统的各种属性方面,例如可扩展性、容错性、一致性、原子性、安全性等。为了解释这些概念,传统课程会介绍相关技术。例如,为了解释容错性,可能会介绍备份策略、快照和恢复等。在人工智能时代,可以用人工智能的系统作为系统课程的教学案例,在很多方面是相通的。例如,在系统属性方面,可扩展性和容错性在人工智能时代变得更加重要,因为这两者直接关联到实际运行的成本和时间。此外,在计算图、异构计算设备和分布式计算等方面,人工智能系统同样会用到很多已有的系统。


人工智能为现有系统课程提供了新的内容。人工智能为系统课程带来了四方面新的内容。首先,场景是新的:AI时代出现了很多新的场景,需要在课程中对这些场景进行介绍和讲解。其次,硬件是新的:例如GPU等,在系统类课程中需要加入对新硬件的介绍和讲解。再次,算法是新的:AI时代涉及很多以往课程中没有的新算法,需要在课程中加入对这些新算法的介绍。最后,系统是新的:例如,“Ray”是一个新系统,应该将其作为新的课程实验加入到课程中。这些新内容给现有系统课程带来了新的挑战与机遇。


AI for教学



当今,人工智能正逐渐渗透到教育领域,给教育教学模式和教学方法带来革命性的影响。


教学的主体,从“师与生”变成“师、生、机器”。机器作为教学中一个新的参与者,共同参与到整个教学的流程中。教师在进行教学活动的同时,需要考虑到机器的参与,在课程的准备、讲授和评价等环节充分利用和发挥人工智能的优势,从而使后续的一系列变化成为可能。


教学方法从千篇一律的大众化教学,变成千人千面的个性化多元化精准教学。通过机器学习、自然语言处理、大语言模型等技术的应用,教育人工智能可以根据不同学生的特点和需求,提供更加贴合学生需求的个性化教学内容。教师可以借助人工智能的帮助,为不同学生的个性化学习需求设计课程教材和练习等,不再硬性地对所有学生进行统一的课程安排,从而提高教学的适应性和质量。教育系统在学生学习过程中采集大量数据,运用机器学习等人工智能技术,根据学生的兴趣、能力和掌握知识的程度,更好地定制学习计划和学习路径,提高教学的个性化、差异化和针对性。


以知识为中心的教学,变成以能力为中心的教学。传统的教学模式普遍以讲授知识为中心,但是在人工智能时代,学生将知识应用到实际问题中的能力变得至关重要。知识的传授可以较大程度地交给人工智能完成,甚至直接将人工智能作为巨大的知识库使用。教师在教学过程中,需要格外注重培养学生创新性思维和解决问题的能力,以及使用大语言模型等人工智能工具的能力等。


从考试等单方面评价,变成全流程、个性化的评价。基于机器学习和人工智能技术,可以根据学生的实际表现和学习数据,打分并形成评价报告,突破传统教学笔试等评价方式的局限,构建起全流程、多样化的教育评价模式。


现状分享:当前课程实践的一些尝试


算法类课程实践



复旦大学为不同专业的学生开设了“计算思维”通识课程,不同专业的学生可以与计算机专业的学生一起讨论,甚至一起开展研究。在“计算思维”课程上,通过指令学习设计不同的提示词解锁大模型的能力,通过强化学习使模型输出与人类期望的结果对齐,通过情景学习引导模型准确提取出与问题相关的信息和知识,让学生理解如何才能利用好生成式语言大模型。科普性质的“计算思维”课程为其他专业的学生构建起预备知识,为他们与计算机专业学生进行充分有效的交流架起了桥梁,促进不同专业的学生相互启发和讨论,在交叉学科上碰撞出新的火花。


数据类课程实践



国防科技大学在“数据科学与大数据基础”课程的建设与实践中进行了立足于“融合点概念”的数据科学课程探索:针对传统数据类课程体系因“自动机理论”与“概率统计理论”潜在分离而不适应大数据现实挑战的现状,基于“融合点概念”开展数据科学的课程设计,帮助学生在人工智能时代建立完整的数据知识网络。


系统类课程实践



上海交通大学在“分布式系统”课程教学中引入了人工智能系统相关知识。在人工智能时代,系统类课程需要对新场景、新算法、新系统及新硬件进行介绍,同时,原有的分布式系统知识点依然重要。特别是在AI应用中,系统的可扩展性和容错性显得尤为关键,因为它们直接影响运行成本和时间。课程中应强调计算图的理解、异构计算设备的运用及分布式计算的优化。虽然在分布式存储和编程方式上没有太大变化,但可以进一步结合AI的应用场景,举例说明这些概念在AI系统中的应用和重要性。


微软在机器学习系统课程方面进行了大量探索。从企业界的角度来看,微软认为人工智能最近的发展成果给系统研究和教育带来了新的挑战和机会。人工智能系统的发展需要对系统从业者进行教育,并利用最新的人工智能成果更好地进行系统教育。微软亚洲研究院积极探索人工智能系统的基本设计原理与实践,通过OpenPAI、NNFusion、NNI等开源系统,推动人工智能系统研究和教育。微软亚洲研究院还促成了AI System课程在多家高校开设,形成完整的人工智能课程,包括课程、教材和实验。


AI for教学实践



中国科学院大学的徐志伟老师使用计算机进行自动化测试和评价。中国科学院大学的教学团队尝试提出一种用于评估教学效果的人工智能教学方法——“高德纳测试”(Knuth test)。图灵测试区分计算机和人,高德纳测试区分学生是否理解了所学知识。高德纳测试的依据是斯坦福大学教授高德纳(Donald Knuth)在其图灵奖获奖演说中表达的观点:我是否理解某项科学知识的终极测试,是看我能否向计算机讲清楚。中国科学院大学的教学团队已在针对所有专业一年级本科生的“计算机科学导论”课程中实践了高德纳测试教学法,由教学团队设计种子题库,再由计算机自动变形出上百倍的相似题目,学生提交个性化答案,计算机自动批改。学生完成题目后,批改程序即时给出答案和解析,帮助他们检查和理解正确答案的思路。这种方法不仅节省了教师在出题和判题上的时间和精力,还有助于揭示学生的薄弱环节,避免“搭便车”和抄袭现象。


南京大学的蒋炎岩老师使用GPT作为教学助手,在课堂中使用GPT回答关于操作系统的问题,例如“在虚拟机中是否可以直接执行一个二进制文件”等。使用GPT的重点在于如何提出问题,以及提出什么样的问题。


未来展望:人工智能时代的课程调整建议


算法类课程建议



构建模块化的算法相关知识体系以应对知识点膨胀问题。为了处理好有限的学习时间和越来越多的课程内容之间的矛盾,要将整个知识体系进行拆解和重新连接,避免简单堆砌。要把握人工智能发展过程中的层递关系,构建算法知识点脉络图,厘清各个知识模块的作用,明确不同知识模块之间的联系。在帮助学生打牢算法基础、培养学生伦理意识、打造人工智能工具平台、促进人工智能为应用赋能的同时,为学生提供算法思维导图,帮助学生明辨知识点之间的逻辑关系,进而在脑海中构建人工智能的全貌,为学生学习后续课程以及在人工智能领域深挖做好准备。


将基础数学按专业分类开展针对性教学。参考部分世界名校的经验,可以将基础数学按专业分类开展针对性教学,着重强调如何使用数学方法和技巧解决本专业中的问题。在数理基础课程教学过程中,针对不同专业穿插讲解一些与本专业相关的应用或案例(例如,面向计算机专业的学生,在线性代数课程中通过讲解图像压缩帮助学生了解奇异值分解的几何意义,在概率统计课程中引入与算法和统计机器学习衔接的内容),从而使课程更加直观有趣,有利于学生对数学建立起必要的直观感受,并将数学知识应用到之后的专业学习和研究中。


鼓励从原理出发,深入研究算法背后的数学原理。在算法教学的过程中,应避免将学生培养成“调包侠”,忽视对算法原理的掌握。要鼓励学生从原理出发,逐步实现和调试算法,深入研究算法背后的数学原理和推导过程,进而逐步掌握主流的人工智能理论。在人工智能时代的算法教学中,理论和工程如“鸟之双翼、车之两轮”不可偏废,通过理论推导和编程实践,使学生能够在问题求解时恰当地选择模型、调参,并根据特定情况进行算法改进和优化,为未来融合创新和解决实际问题奠定坚实基础。


增加与大语言模型相关的教学内容。就计算机专业的学生而言,大语言模型代表了人工智能最新的技术前沿,也是当前的研究热点。掌握以编码器-解码器(encoder-decoder)结构、注意力(attention)机制为代表的知识点,以及以Transformer、BERT、GPT为代表的大语言模型的实现原理,有助于学生了解如何构建和应用这些强大的模型,并参与相关的学术研究。对于非计算机专业的学生而言,深度学习和大模型的出现在很大程度上改变了科学研究的方法,就像大数据方法对传统统计方法产生影响一样。因此,要以非计算机专业学生能够理解的方式讲解算法和生成式大语言模型,从而让学生能够从人工智能的角度解决科学问题,在学科的交叉点上取得更多发现和进展。


数据类课程建议



为特定专业方向增加数据类的课程。包括“数据科学与工程导论”“数据科学与工程的数据基础”“统计方法与机器学习”“当代人工智能”课程。其中“统计方法与机器学习”是有重叠的两方面;增加“当代人工智能”课程,更多是为了针对应用所需要的人工智能,比如深度学习的内容等。


增强学生在数据方面的工程实践动手能力。在课程实践方面,可以鼓励学生参加数据类竞赛(如天池大赛),从比赛中学习如何解决数据的疑难杂症,获取实用的技术能力。在教学方法上,鼓励从“斑马线”式教学到“汉堡包”式教学的转变,即从之前的课堂授课(填鸭式教学)+课后实践(简单原型系统的完形填空),到现在的课前实践(感受方法)+课堂授课(总结共性和差异)+课后实践(参与多个真实系统的实战)。


系统类课程建议



以人工智能作为案例介绍计算图的概念。计算图可以用来抽象地表示人工智能计算的过程,有助于学生理解人工智能系统的结构,特别是在处理大规模数据和进行复杂计算时。在系统类课程中,学生将学习如何使用类似TensorFlow这样的工具构建和使用计算图。


介绍异构计算设备在人工智能系统中的使用和挑战。在人工智能时代,高效地进行模型推理和训练需要利用各种不同的计算设备,包括CPU和加速器(如GPU)。系统类课程可以介绍从以CPU为中心到以加速器为中心的硬件变革。学生需要适应这些硬件变化,并了解它们在编程和系统硬件方面的差异。


以人工智能作为场景介绍分布式计算。为加快人工智能训练速度,分布式计算非常重要。这涉及使用数据并行和模型并行等方法在多个节点上进行计算。这些方法与传统的分布式计算有很多相似之处,但也有一些特定的挑战,如在节点之间高效通信和合理划分数据。大规模分布式训练中的容错处理也是一个关键问题,根据Facebook的数据,在大规模训练中,60%的任务在50分钟内会出现故障。因此,分布式系统中的许多容错方法,如基于分布式日志的方法,在人工智能场景中非常关键。


AI for教学建议



加强人工智能伦理方面的教学。在人工智能快速发展的时代,加强学生在伦理方面的学习尤为重要。人工智能的广泛应用涉及一系列伦理问题,如隐私保护、数据安全等,学生需要深入了解和思考这些问题,避免对人工智能技术的滥用。例如,学生应该了解个人隐私权和数据保护。随着人工智能技术的发展,个人数据的收集和使用变得越来越普遍,学生需要认识到自己的个人信息价值,并学习如何保护个人隐私,以免受到滥用或侵犯。学生也需要思考和讨论用人工智能技术进行决策时可能存在的偏见和不公正情况。人工智能往往基于大数据和算法进行决策,但这些数据和算法可能存在偏见,从而引发种族、性别、社会地位等方面的平等性问题,学生需要审视这些伦理问题,并深入探讨解决方案。他们需要学习关于公平性、透明度和可解释性的概念,以确保人工智能的决策过程是公正和可信的。通过了解伦理问题并积极探索伦理责任,学生可以在未来的职业和人生中,以积极和符合伦理道德的方式应用人工智能技术,促进社会的可持续发展与进步。


加强人工智能工具使用方法的教学。随着人工智能技术的发展,人工智能工具将会越来越流行,成为人们生产和生活中不可或缺的工具。教学中应该传授一些人工智能工具的正确使用方法,让学生能够更好地利用人工智能工具,并获得高质量的结果,提高使用人工智能工具的有效性和可靠性。了解如何明确地提问、引导对话的流程和技巧,可以提升与人工智能工具的交互效果,获得更准确、有用的回答和建议。使用者应了解工具的局限和对特定类型问题的适用性,以避免对工具产生过高的期望或错误的使用方法,从而更加明智地运用人工智能工具,避免误解和误用的风险。同时,加强对人工智能工具使用方法的教学可以帮助学生培养批判性思维和信息评估能力。了解如何验证工具的输出结果,识别可能存在的偏见或错误,以及如何采取适当的行动解决问题,都是重要的技能。掌握这些技能有助于使用者跳出对自动化工具的盲目依赖,更加理性、全面地评估和利用工具输出的结果。


结语


人工智能浪潮对课程体系带来的冲击才刚刚开始。当前,国内的各大高校和研究机构都不约而同地开始思考如何改革课程体系以适应新的趋势和需求,纷纷引入人工智能相关的工具和方法改进教学。本次秀湖会议的讨论只是一个起点,为人工智能时代计算机类课程体系的改革与发展提供了新思路和新路径。在未来,“教学for AI”和“AI for教学”仍将是一个值得探讨的主题。


作者:CCF第三期秀湖会议与会专家

整理:李明煜、张鼎言、董明凯、夏虞斌(上海交通大学)


附录:与会代表与组织者名单


特邀嘉宾

郑庆华(同济大学)、吴飞(浙江大学)、王巨宏(腾讯)


参会嘉宾(以姓氏拼音为序)

柴云鹏(中国人民大学)、杜鹏(华为)、蒋炎岩(南京大学)、靳若春(国防科技大学)、李晓明(北京大学/大湾区大学)、李鑫(科大讯飞)、陆雪松(华东师范大学)、王肇国(上海交通大学)、徐志伟(中国科学院计算技术研究所)、高彦杰(微软亚洲研究院)、袁春风(南京大学)、张军(百度)、郑骁庆(复旦大学)、周烜(华东师范大学)、周爱民(华东师范大学)


会议组织者(以姓氏拼音为序)

胡事民(清华大学)、孙涵(南京航空航天大学)、夏虞斌(上海交通大学)、臧斌宇(上海交通大学)


会议记录者(以姓氏拼音为序)

董明凯(上海交通大学)、李明煜(上海交通大学)、张鼎言(上海交通大学)


特别声明:中国计算机学会(CCF)拥有《中国计算机学会通讯》(CCCF)所刊登内容的所有版权,未经CCF允许,不得转载本刊文字及照片,否则被视为侵权。对于侵权行为,CCF将追究其法律责任

热门动态
2022-08-18
CCF发展的60年,也是伴随中国计算机事业走过的60年,庆典上的很多专家,都为中国计算机事业奉献了热血青春,当年意气风发,如今虽已满头华发,但初心未改,他们创造了CCF的光辉历史,还将继续带领CCF走向更加美好的明天。
CCF聚焦
场地预订
如何抵达
周边酒店
活动预告
返回顶部