以下文章来源于科学网,作者沈春蕾
科学网.
圈内大事,行业洞察,偶尔八卦……来自全球最大的华人科学社区,中国科学报社出品。联系我们:合作事宜market
stimes.cn;投稿事宜tougaostimes.cn。今年26岁的邵镇炜,体重仅有25公斤。他从小患有“进行性脊肌萎缩”,双手几乎只有大拇指和食指能动,终身与轮椅为伴。
邵镇炜
邵镇炜并没有就此向命运屈服。年9月,他以计算机技术与科学专业第一名的成绩获得推免资格,保送至杭州电子科技大学(以下简称杭电)攻读博士研究生,研究方向为多模态数据处理和人工智能技术;年6月,他的研究成果发表于计算机视觉领域国际顶级学术会议CVPR,被认为是国内多模态大模型领域最早入局者之一。
“今年年初做了一个轻量级多模态大模型的系列,相关论文还在审稿阶段。”近日,邵镇炜在接受《中国科学报》采访时表示,“我最近在探索多模态大模型的高效计算相关的技术。如今大模型的技术迭代非常快,我得抓紧时间做出新的成果才可能收获新的成绩。”
曾“超越”谷歌旗下的多模态大模型Flamingo
年,邵镇炜开始研究多模态大模型。当时,大模型研究还没有现在这么火热,和多模态信息(文本、图片多种形式的组合数据)理解相关的大模型研究则更少。邵镇炜所在课题组当时就预见了多模态大模型技术的前景,并开展了相关探索。
邵镇炜说:“我们走的是模型轻量化路线。不仅可以降低计算成本,还能让大模型的应用场景更加丰富。但轻量化并不是一件容易的事。因为要缩小参数量,很可能会导致模型能力也就是智能水平的下降。”
为了解决技术上的难点,邵镇炜经常在电脑前一坐就是十多个小时,啃论文、查资料,尝试不同的技术方案。在常人看来简单的敲击键盘动作,对邵镇炜来说并不轻松。他只有大拇指和食指相对灵活,并且每打几十个字,就要停下来休息一会儿。尽管如此,他还是坚持每天工作十个小时以上。
“当时,我已经觉得这个课题可能要做不下去了,但邵镇炜说再给他一两周的时间,他想尝试一个新的方法。结果成功了。”邵镇炜的导师、杭电计算机学院教授余宙告诉《中国科学报》,“我们这项研究成果最终在CVPR上发表,受到了全球同行的