报告题目:大模型慢思考技术探讨
报 告 人:赵鑫教授
报告时间: 2025.2.25 下午2:00
报告地点: 学院二楼学术报告厅
报告简介:
最近以DeepSeek-R1为代表的大模型慢思考技术受到了较大关注,慢思考模型通过生成更长的思考过程来解决更具挑战性的问题,在多个科学场景都取得了较大突破。本次报告将聚焦大模型慢思考的基础技术与实现方法,对于其中可能涉及到的技术路径进行探索和系统性讲解,简要探讨推理模型的科学价值,并且总结现阶段推理模型的局限。
报告人简介:
赵鑫,中国人民大学教授,2014年7月于北京大学获得博士学位,随后进入中国人民大学工作至今。研究领域为信息检索与自然语言处理,主要关注大模型预训练与慢思考技术的研究。曾主导研发了玉兰系列大语言模型,组织编写了大语言模型综述论文《A Survey of Large Language Models》(预印版文章)以及《大语言模型》中文书。