近年来,人工智能已逐渐在日常生活、工业生产中发挥着至关重要的作用。然而,这些人工智能应用背后的深度学习模型仍需大量计算资源(通常在集中式的云上)来驱动其训练与预测(推理)过程,这极大程度上限制了智能应用在有高即时性需求,高隐私保障条件下的使用,或是在资源受限场景下的部署。

这个页面总结了清华大学深圳国际研究生院王智教授课题组在模型轻量化方向已完成的课题,并由模型轻量化小组维护。若对我们的工作感兴趣,欢迎通过以下方式联系我们:

联系方式:

王智教授(清华大学深圳国际研究生院): - 个人主页:https://pages.mmlab.top/ - 邮箱:[email protected] 孟媛(清华大学计算机系): - 个人主页:https://mengyuan404.github.io/ - 邮箱:[email protected]

李也(清华大学深圳国际研究生院):


研究方向概览

本小组的具体研究方向分为两个部分:


近期工作

高效训练与微调:

Untitled

Untitled

高效推理优化:

image.png

截屏2025-02-21 14.46.02.png

Untitled

Untitled

Untitled