李文明  研究员  

研究方向:

所属部门:高通量计算机研究中心、处理器芯片重点实验室

导师类别:硕导计算机系统结构

联系方式:liwenming@ict.ac.cn

个人网页:http://people.ucas.edu.cn/~liwenming

简       历:

李文明,研究员,博士生导师,中国科学院大学岗位教授。研究领域为数据流执行模型与微架构、数据流运行时与编译技术、高通量众核处理器芯片架构等,基于先进工艺成功流片多款数据流架构高通量处理器芯片,应用于数字信号、人工智能及视频处理等多领域融合高通量处理场景,取得了良好的经济和社会效益。在HPCA/ASPLOS/DAC/TC/TPDS/TCAD/TACO等高水平会议期刊发表论文40余篇,申请专利70余项(授权40余项)。主持国家重点研发计划项目、北京市科技新星计划、国自然青年基金、北自然联合基金、以及华为/中移动/空天院/之江实验室等联合项目。担任国科大本科生《数字电路》课程召集人及主讲教师。入选北京市科技新星计划,获北京市技术发明一等奖、中国产学研合作促进二等奖等奖励。 

教育及工作经历:

2025年10月— 今:中国科学院计算技术研究所,研究员

2018年10月 — 2025年9月:中国科学院计算技术研究所,副研究员

2016年7月 — 2018年9月:中国科学院计算技术研究所,助理研究员

2010年9月 — 2016年7月:中国科学院计算技术研究所,硕博连读

2006年9月 — 2010年7月:山东科技大学,计算机科学与技术,本科生

个人网页:http://people.ucas.edu.cn/~liwenming

主要论著:

论文:

[1] (CCF-A/一作) Wenming Li, Zhihua Fan, Tianyu Liu, Zhen Wang, Haibin Wu, Meng Wu, Kunming Zhang, Yanhuan Liu, Ninghui Sun, Xiaochun Ye, and Dongrui Fan. DFU-E: A Dataflow Architecture for Edge DSP and AI Applications. IEEE Trans. Parallel Distrib. Syst (TPDS). 36, 6 (June 2025). 

[2] (CCF-A/通讯) Yanhuan Liu, Wenming Li*, Kunming Zhang, Yuqun Liu, Siao Wen, Lexin Wang, Tianyu Liu, Haibin Wu, Zhihua Fan, Xiaochun Ye, Dongrui Fan, Xuejun An. BitRed: Taming Non-Uniform Bit-Level Sparsity with a Programmable RISC-V ISA for DNN Acceleration. International Conference on Architectural Support for Programming Languages and Operating Systems (ASPLOS). Just Accepted, 2026.

[3] (CCF-A/通讯) Zhihua Fan, Jing Xue, Wenming Li*, Xuejun An, Xiaochun Ye. A RISC-V Extended Infrastructure for Edge FHE Through Software and Hardware Co-Design. IEEE Transactions on Computer-Aided Design of Integrated Circuits and Systems (TCAD). Just Accepted, 2026.

[4] (CCF-A/通讯) Tianyu Liu, Zhihua Fan, Wenming Li*, Zhen Wang, Yuhang Qiu, Shengzhong Tang, Haibin Wu, Yanhuan Liu, Xiaochun Ye, Dongrui Fan. DFGS: Exploring the Balance of HW-SW Scheduling through the DFG-Aware Scheme. ACM Trans. Archit. Code Optim (TACO). Just Accepted (March 2025).

[5] (CCF-A/通讯) Yudong Mu, Zhihua Fan, Wenming Li*, Zhiyuan Zhang, Xuejun An, Dongrui Fan, Xiaochun Ye. GenCNN: A Partition-Aware Multi-Objective Mapping Framework for CNN Accelerators Based on Genetic Algorithm. ACM Trans. Archit. Code Optim (TACO). Volume 22, Issue 3. Article No.: 105, Pages 1 - 26. 2025.

[6] (CCF-A/通讯) Shantian Qin, Zhihua Fan, Wenming Li*, Zhen Wang, Xuejun An, Xiaochun Ye, and Dongrui Fan. PANDA: Adaptive Prefetching and Decentralized Scheduling for Dataflow Architectures. ACM Trans. Archit. Code Optim (TACO). 22, 2, Article 62 (June 2025). 2025.  

[7](JCR Q1/通讯)Zhiyuan Zhang, Zhihua Fan, Wenming Li*, Yuhang Qiu, Zhen Wang, Xiaochun Ye, Dongrui Fan, Xuejun An. Accelerating tensor multiplication by exploring hybrid product with hardware and software co-design. Journal of Systems Architecture (JSA). Volume 159, Issue C. 2025.

[8] (CCF-A/通讯) Zhihua Fan, Wenming Li*, Zhen Wang, Yu Yang, Xiaochun Ye, Dongrui Fan, Ninghui Sun, and Xuejun An. 2024. Improving Utilization of Dataflow Unit for Multi-Batch Processing. ACM Trans. Archit. Code Optim. (TACO). 21, 1, Article 17. (2024).

[9] (CCF-A/通讯) Fan, Zhihua and Li, Wenming* and Wang, Zhen and Liu, Tianyu and Wu, Haibin and Liu, Yanhuan and Wu, Meng and Wu, Xinxin and Ye, Xiaochun and Fan, Dongrui and Sun, Ninghui and An, Xuejun. Accelerating Convolutional Neural Networks by Exploiting the Sparsity of Output Activation. IEEE Transactions on Parallel and Distributed Systems (TPDS), vol. 34, no. 12, pp. 3253-3265. (2023). 

[10] (CCF-A/通讯) Fan, Dongrui, Li, Wenming*, Ye, Xiaochun, Wang, Da, Zhang, Hao, Tang, Zhimin, Sun, Ninghui, IEEE. SmarCo: An Efficient Many-Core Processor for High-Throughput Applications in Datacenters. IEEE International Symposium on High Performance Computer Architecture (HPCA). 2018, 596-607. 


专利:

[1] 李文明、孙凝晖、谢向辉、李宏亮、郑方. 中央处理器的缓存区的缓存行的替换方法及其装置. 授权号:ZL201610460009.X.

[2] 李文明、范东睿、张浩、王达、叶笑春. 一种面向众核处理器的全局感知数据主动渗透机制与系统. 授权号:ZL201710433007.6.

[3] 李文明、范东睿、张浩、王达、叶笑春. 一种众核片上网络失败任务甄别及资源重分配方法与系统. 授权号:ZL201710437407.4.

[4] 李文明、叶笑春、安述倩、姜志颖、王晨晖、范东睿. 一种哈希硬件处理装置及方法. 授权号:ZL201910413959.0.

[5] 李文明、叶笑春、范东睿、王达、张浩. 一种通用字符操作加速处理硬件装置及控制方法. 授权号:ZL201810995831.5.

[6] 李文明、叶笑春、范东睿、张浩、王达、吴冬冬. 面向通用字符串处理的硬件加速结构装置及控制方法. 授权号:ZL201810490966.6.

[7] 李文明、叶笑春、安述倩、姜志颖、王晨晖、范东睿. 一种用于区块链的处理装置及方法. 授权号:ZL201910505407.2.

[8] 李文明、安述倩、吴萌、吴海彬、刘艳欢、叶笑春、范东睿. 基于阻变存储器的通用区块链应用处理加速方法及系统. 授权号:ZL201911001197.X.

[9] 李文明、朱亚涛、叶笑春、王达、张浩、范东睿、姜志颖. 基于检测帧的视频监控系统故障识别、定位及告警系统及其方法. 授权号:ZL201710047382.7.

[10] 李文明、叶笑春、孙凝晖、范东睿、王达、马丽娜、朱亚涛、张洋. 一种异常事件自动推送及基于历史操作的监控方法及系统. 授权号:ZL201611148500.5.

[11] 李文明、安述倩、吴海彬、刘艳欢、张昆明、叶笑春、范东睿. 带宽控制单元、处理器芯片以及访存流量控制方法,授权号:ZL202210230341.2.

[12] 李文明、叶笑春. 一种数据流架构中循环程序执行的方法及系统,授权号:ZL202110267893.6.

[13] 李文明、朱文杰、黄俊英、叶笑春、范东睿. 基于数据流架构加速器的注意力机制融合方法及装置. 授权号:ZL202510009132.9.

[14] 李文明、范志华、吴海彬、叶笑春. 一种基于多层数据流融合执行模型的计算方法及其系统. 受理号:CN202510744787.0.

[15] 李文明、范志华、秦善天、叶笑春、孙凝晖. 一种面向异构智能数据流模型的程序执行方法及装置. 受理号:CN202511335451.5.

科研项目:

[1] 主持,国家重点研发计划-青年科学家项目,多层次融合的软件定义数据流关键技术与系统,2023.12 - 2026.11

[2] 骨干,国家重点研发计划项目课题,异构数据流处理器系统的研制,2023.03 - 2026.02

[3] 主持,北京市科技新星计划,高通量多模态数据流处理器芯片研究,2022.11 - 2025.10

[4] 主持,北京市科技新星计划交叉课题,面向三维SAR成像的数据流加速芯片研究,2023.11. - 2025.10

[5] 主持,北京市自然基金委联合基金,面向工控异构SoC芯片的自动化设计空间探索研究,2024.7 - 2025.12

[6] 主持,中移动联合项目,RISC-V面向数据中心高性能通用CPU演进关键技术研究,2023.08 - 2024.03

[7] 主持,华为联合项目,基带高通量运算阵列架构研究二期合作项目,2023.10 - 2024.09

[8] 主持,中移动联合项目,基于RISC-V的数据中心高性能通用CPU可行性分析,2023.08 - 2024.03

[9] 主持,华为联合项目,基带高通量运算阵列架构研究一期合作项目,2022.10 - 2023.09

[10] 主持,之江实验室课题,高能效数控协同数字信号加速架构研究,2020.03 - 2023.02

[11] 主持,空天院联合项目,综合数字芯片研制,2021.01-2022.12

[12] 骨干, 中科院先导专项课题,高通量处理器关键技术,2020.01-2021.12

[13] 主持,国家自然基金委青年基金,高通量众核处理器访存数据通路优化研究, 2019.01 - 2021.12

[14] 主持,国重实验室开放课题,数据中心高通量处理器访存通路结构研究,2017.01 - 2018.12

[15] 主持,国家重点研发计划项目子课题:面向E级原型系统的高能效众核处理器研究,2016.07—2018.06

获奖及荣誉:

国科大校级优秀课程(数字电路)(2024)

中央和国家机关“四好”党员(2023)

国科大院级优秀课程(数字电路)(2023)

中科院计算所联想奖教金(2023)

北京市科技新星计划(创新新星)(2022) 

中科院计算所优秀科研人员(2021) 

北京市科技发明一等奖(2020) 

中国产学研促进会产学研成果二等奖(2020) 

中科院计算所优秀科研人员(2017) 

中科院计算所优秀共产党员(2016) 

国家奖学金博士奖(2015) 

曙光博士奖(2014) 

国科大三好学生(2012)

国科大优秀学生干部(2012)