即可将网页分享至朋友圈
近日,电子科技大学信息与通信工程学院刘翼鹏副教授、刘佳妮博士生、龙珍博士生和朱策教授历时两年所著的《Tensor Computation for Data Analysis》由施普林格(Springer)出版集团正式出版。该书讨论了张量计算推广的一系列机器学习方法,详细讲解了张量计算基础,全方面多层次地介绍了张量计算方法在数据分析方面的各种应用,可以作为张量计算在数据分析领域的入门书籍。
随着信息技术的快速发展,大量多维数据的涌现对传统的数据表示方式带来了挑战。张量作为多维数据的自然表征方式,近些年来被广泛关注并应用于数据分析领域。本书涵盖了一系列基于张量计算的多维数据分析技术,如张量字典学习、低秩张量恢复、张量补全、耦合张量分析、稳健张量主成分分析、张量回归、逻辑张量回归、支持张量机、多线性判别分析、张量子空间聚类、基于张量的深度学习、张量图模型和张量素描。此外,基于真实数据,本书提供了完整的应用概述和实验结果分析,如图像重建和增强、数据融合、信号恢复、推荐系统、知识图谱获取、交通流量预测、链接预测、环境预测、天气预报、背景提取、人体姿态估计、认知状态分类、红外小目标检测、异质信息网络聚类、多视图像聚类和深度神经网络压缩等。
该书作者之一刘翼鹏副教授长期致力于张量数据分析相关理论、方法与应用工作。以张量计算为基础,重点研究张量分解和低秩优化,推广信号复原、图像增强、频谱感知、协同滤波、张量回归、轻量化神经网络、对抗攻击、异常检测等技术,有效避免传统数据处理中将高维数组矩阵化带来的数据结构损失,同时还能处理大规模数据处理中的“维数灾难”计算难题。他已发表80余篇国际期刊和会议论文。主持中国国家自然科学基金2项、四川省国际/地区科研合作项目1项。他是IEEE高级会员,IEEE Signal Processing Letters编委和Signal Processing: Image Communication (Elsevier)的首席客座编委。
刘翼鹏副教授
欧洲求学,结缘张量
刘翼鹏副教授曾经于2011年至2014年期间在比利时鲁汶大学从事博士后研究工作,他当时所在电子工程系有一批出色的张量领域资深专家和青年科学家。他的博士后课题开展期间,合作导师Sabine Van Huffel教授(比利时皇家科学院院士、SIAM Fellow、IEEE Fellow)在欧盟研究理事会高级项目的资助下,将张量分解用于多种生物医学信号的盲源分离。他的博士学位论文课题导师万群教授也多次提到张量计算在信号处理领域的潜力。正是在这样的学术环境中,他掌握了张量计算的基础。
作为多维数据的自然表示方法,张量可以有效的保留多维数据元素之间的相对位置。张量在自然科学史上曾有过辉煌的历史,它被誉为打开广义相对论之门的两把钥匙之一。进入了大规模数据时代,特别在多维度的数据分析方面,张量计算有望再次发挥重要作用。传统数据处理算法常常将多维数据转化成矩阵进行处理。矩阵化的操作破坏了数据的多线性结构,导致非最优的处理性能。张量作为多维数据的自然表示,基于张量计算的数据处理技术可以避免损坏多线性数据结构,从而获得更好性能的数据处理结果。张量计算的进展,可以广泛的应用到信息科学、神经科学、心理计量学、化学计量学、生物计量学、量子物理学、量子化学等。
与Sabine Van Huffel教授合影
组建张量研究小组,探索张量数据分析
2014年底,刘翼鹏结束了在比利时鲁汶大学的博士后研究生活,回到了家乡成都,加入了由IEEE Fellow朱策教授领导的视频通信和智能计算实验室。朱策教授在图像和视频处理方向有丰富的经验和深厚的积累。在朱策教授的支持和帮助下,他开始在电子科技大学合作开展张量计算理论、方法和数据处理应用的工作。特别是在图像处理应用领域,在团队成员们的不懈努力下攻坚克难,逐步取得了一系列科研进展,获得了国际同行的关注和认可,在相关领域的国际主流期刊上发表了多篇高质量论文。
针对欠定线性逆问题,团队分析高维数据的结构特征,建立多结构张量优化框架,提出并分析一系列稀疏和低秩张量缺失成分估计方法,突破传统有限等距常数界,在磁共振成像、光学图像重建、脑电图压缩感知等应用中取得优异性能。团队在该方向的研究成果主要发表在IEEE TMI、TSP、TIP、TMM、TBME等期刊,其中光滑张量树进行图像估计的工作于2020年获首届川渝科技学术大会优秀论文一等奖。
论文获奖
针对“维数灾难”问题,分析传统矩阵降维方法的不足,从随机理论、张量分解、张量运算三个方面,分别提出空时联合张量采样、基于两层张量奇异值分解的主成分分析、基于张量缩并运算的紧凑张量链回归,高效稳健的提取高维数据的主要成分,逼近本征维度极限,在图像背景提取、图像增强、视频动作预测等应用获得优异性能。团队在该方向的论文主要发表在IEEE JSTSP、TKDE、TNNLS、TMI、TBME、TCSVT等期刊。
在电子科技大学工作的六年多时间,刘翼鹏主讲了全英文研究生基础课程“最优化理论与应用”,并将张量优化作为一个专题讲授。通过研究生基础课程推广张量计算方法和讨论电子工程与计算机科学中的应用。他曾获电子科技大学第八届研究生教学成果奖一等奖,培养优秀硕士学位论文3篇。
为了总结团队和同行近年的主要研究进展,刘翼鹏梳理了张量数据分析的技术体系,从理论、方法和应用层面系统性的构建张量计算推广数据分析技术的体系。近三年他陆续受邀在行业多个旗舰会议作讲习班报告,推广张量数据分析技术和应用,包括ISCAS 2019 (IEEE电路与系统国际会议:IEEE International Symposium on Circuits and Systems)、ICIP 2020 (IEEE图像处理国际会议:IEEE International Conference on Image Processing)、SSCI 2020(IEEE计算智能大会:IEEE Symposium Series on Computational Intelligence)等。
ICIP 2020 讲习班证书
撰写专著,推广张量
2019年5月,刘翼鹏在ISCAS 2019的讲习班报告受到了参会同行学者的关注和积极评价,还收到了国际著名出版机构斯普林格(Springer)出版集团主任编辑邀请,撰写有关张量数据分析方向的著作。
在研究张量数据分析期间,团队也意识到该方向缺少一本针对高年级本科生和研究生的入门书籍。计算数学和部分应用专题方面已经有一些不错的综述资料,但没有资料全面系统的总结张量计算在数据分析领域的应用,特别是近十年的一些最新进展。并且现存的不少资料缺乏系统的应用实例。
团队在张量数据分析领域近六年的积累的基础上,通过进一步的拓展进行全面布局。在总结最新的科研成果同时,此书力求降低背景知识和技术储备的要求,争取让每一个想要了解张量,对这个概念感兴趣的读者都能在阅读完后有所收益。除了专业参考书的作用,团队还希望他能作为张量计算的数据分析第一本入门书籍。为了达到这一效果,书籍的结构和内容进行了精心设计。此书前两个基础章节通过推广线性代数的基本概念帮助读者入门张量计算基础;每引入一种新的优化方法,都会先用矩阵的形式进行讲解,之后再过渡到张量计算的体系之中。每一个技术应用章节都会配套一些包含代码的应用数值实验方便读者理解与实践。
专著封面
在信号处理、机器学习、模式识别、数据挖掘、计算智能等领域,张量数据分析尚处于上升发展阶段。近年来,行业多个期刊IEEE SPM、IEEE JSTSP、SPIC 和会议CVPR、ICASSP、IJCAI、ICIP、ISCAS、GlobalSIP、KDD等先后组织了张量数据处理的专辑、专题研讨会和讲习班报告;Google X实验室、NVIDIA等也致力于张量计算的应用软件开发。除了目前已由Springer出版的《Tensor Computation for Data Analysis》,刘翼鹏还作为主编邀请了国内外14个知名专家团队共同编写了一本拓展书籍《Tensors for Data Processing》,预计于2021年年底由爱思唯尔集团(Elsevier)出版。团队希望通过这两本书籍结合其他同行资料,培养更多掌握张量数据分析技术的人才,推动张量计算理论和数据分析技术的发展,更深入和广泛的影响数据相关应用领域。
相关链接:
1、《Tensor Computation for Data Analysis》阅读网页地址:https://link.springer.com/book/10.1007%2F978-3-030-74386-4
2. 刘翼鹏副教授个人简介:https://faculty.uestc.edu.cn/yipengliu/zh_CN/index.htm
编辑:肖洁 / 审核:林坤 / 发布:陈伟