成电人物

分享到微信 ×
打开微信“扫一扫”
即可将网页分享至朋友圈
【成电新青年】全球前三!“编码英雄-Ⅱ”战队闪耀国际大赛
文:游晓鹏 徐镕杰 图:游晓鹏 来源:学生记者团 时间:2017-10-25 10641

  在刚刚闭幕的第24届IEEE ICIP大会上,计算机学院五位研究生组成的“编码英雄-Ⅱ”队代表我校参加IEEE ICIP 2017大会视频压缩挑战赛,最终荣获ICIP 2017 Video Compression Technology Grand Challenges Winner大奖。全球仅有3支队伍获奖,“编码英雄-Ⅱ”是国内唯一获奖的参赛队伍。这是继“编码英雄-I”队在2016年中国智慧城市视频编码比赛获得国家级竞赛奖励以来,取得新的突破。两次获奖表明我校在视频压缩编码,特别是优化和控制技术方面已经进入世界先进行列。

会场.jpg

这次得奖,让计算机学院2016级研究生王宏宇同学感到有些“意外”。他说:“在世界舞台上PK,高手如云,竞争激烈。我们提交的作品还未极致完美,没想到拿了大奖,真的是意外的惊喜,让人感到十分振奋!”在获奖的同时,王宏宇在ICIP 2017上发表了学术论文。在论文中对本次参赛的作品有详细的描述。

关键时候出意外:最终提交了“残缺”作品

  本次赛事由国际电信联合会ITU主办,由下一代视频编码标准H.266制定工作组JVC-VC的主席Jens-Rainer Ohm召集,并得到了Google旗下Netflix公司赞助支持。大赛吸引了英国布里斯托大学、德国亚琛工业大学等来自世界各地的21支队伍参赛。大赛的目的是激励视频压缩领域新技术的研发与优化算法的进步。参赛者要面向最新的4K超高分辨率、10bit高动态范围图像,基于当今业界最先进的编码平台进行算法研发和优化,力争逼近视频信号冗余压缩的极限。

  王宏宇跟随计算机学院周益民副教授专门从事视频编码方面的研究。长期以来,他关注各代编码标准的相关控制优化技术,有一些独到的见解和技术手段。与产业界长期项目合作奠定了良好的工业实战经验。2017年3月,当IEEE ICIP 2017大会召集队伍参加视频编码大赛时,王宏宇联合冷龙韬、曾鹏等核心技术成员筹建了“编码英雄-Ⅱ”并担任队长。2017年4月15日主办方发布了比赛视频测试集,全队上下随即展开了研发工作。

  “视频源的内容比较复杂,含有水面和树叶等难以进行优化的部分,尤其是,水面的运动不规则,波纹又细又多,树叶也是一样,这就增加了视频编码压缩的难度!”王宏宇说,“以前还从没有碰见过这么难解决的问题。”

  5月,他们对视频源进行编码改善。由于超高压缩比的视频编码复杂度极高,完整地编码一趟测试集需要至少一周时间。往常他们在做视频编码时,常常是24小时内可采集测试结果并反馈至算法参数调整。这一次,由于测试平台和测试集同时提高了复杂度门槛,他们的研发工作遇到了不小的挑战。为了加快工作进度,他们设计出多种测试方案,不断改进测试流程以优化时间效率。在编码测试的过程中不断研发、调试、改进和优化,以逐步逼近超高分辨率下低比特率视频编码压缩极限。

  一个多月的努力之后,难关逐步攻克,胜利在望。不料世事难料,意外突发来袭——原本预留了10天时间用于服务器测试作品的最终版本,因2017年的夏天太过炎热,服务器竟然过热挂机,一段最长的视频序列没有完成最后的编码。当时间来到截止日期6月30号,仍然缺失一片测试数据,最终提交了一份未竟之作,甚是遗憾。为了详细展现作品的性能,他们专门撰写了作品的测试评价结果与分析报告并提交至大会。

金子总会发光:出色算法赢大奖

  8月,大赛主办方发邮件通知他们“通过海选”,邀请他们去北京ICIP大会现场参加答辩,令他们感到惊喜和意外。与此同时,王宏宇投递的学术论文也被采纳。虽然对最终的获奖并无十足信心,但是“编码英雄-II”的队员们仍然群策群力用心制作了一份参赛作品技术方案的PPT介绍。

  9月,王宏宇、冷龙韬前往北京参会答辩。比赛的评价体系为主观质量和客观质量评分。主观评价部分主要是用人的肉眼看视频的内容显示和传递效果。这个环节,几乎所有的作品都“惨不忍睹”。在客观评审环节,主办方根据压缩效率的高低进行排序,压缩效率高的队伍排名靠前。“编码英雄-II”提出的名为Optimization Approaches on Lambda and QP for JEM的算法,压缩效率高达33%。比赛结果公布:电子科技大学参赛队居德国亚琛工业大学和英国布里斯托大学参赛队之后,排名第三。

证书.jpg

  “编码英雄-II”的算法到底厉害在哪里?在投递给大会并被采用的题为Temporal Correlation based Hierarchical Quantization Parameter Determination for HEVC Video Coding的论文中,他们对我校此次参赛获奖作品所采用的算法新技术作了详细的阐述。据介绍,该文主要基于自适应理论,通过对视频量化算法的调节进行压缩优化,并用数学方法对画面前后两帧之间的内容和梯度等进行比较,判断对每一帧画面的量化因子大小,从而让视频的内容尽可能保留下来,并实现最大化的压缩视频量。

  “以前的视频压缩采用的是一种固定准则,没有对视频内容进行有针对性的优化,比如在奇数帧画面设置的量化步长大一点,省略的东西较多,在偶数帧画面设置的量化步长小一点,省略的东西较少,这就会造成在某些视频压缩后画面效果比较差。”王宏宇说,“我们的算法尽量克服了这一不足。”

  “我们最开始采用的是20多年前提出来的一个理论,但推导了很久发现还是推不出来,因为现在面临的情况和以前的情况完全不同,所以,我们不得不自行推导公式,通过对大量的实验数据进行分析,对公式进行拟合和建立,也查阅了大量的信号论方面的资料,终于完成了论文。”

论文首页.jpg

视频编码前景无限:解决高清视频传输难题或将迎刃而解

  王宏宇本科期间开始接触视频压缩技术,至今已有4年时间。他所在的团队长期从事视频图像编解码研究,积极参与国际、国内视频标准的制定工作,特别擅长视频编解码器的优化与码率控制技术研发。

  据介绍,网上直播VR高清视频,观众最多只能看到720p的画面,原因就是视频压缩效率太低。如果用户想看1080p的画面,原生视频大小就要达到原先的一倍以上。“很多人可能会说,720p的视频已经够用了,何必去做1080p的画面?”王宏宇说,“当1080p的画面还未全面普及的时候,我们会觉得720p的画面也很清晰了。如果你惯了4K、8K的视频,再去看1080p的视频,就会觉得很不习惯。”

  周益民表示,“现代社会在很多地方、很多领域对高分辨率画面的需求正在越来越大,而目前的技术依然无法满足这种需求。在目前用户带宽依然有限的情况下,视频压缩技术将在未来给我们的生活带来更多的方便和改善。”

  “随着4K、8K等超高清视频的快速发展,下一代视频编码H.266标准将会更多地面向大分辨率和VR设备,这将对视频编码的需求越来越大。”王宏宇表示,“目前传输静止场景的高清视频画面,2M带宽勉强能扛得住,一旦画面内容有剧烈变化,对带宽的要求就会大大增加,而且视频看起来会比较花。这就需要我们在视频压缩技术方面更有作为,破解这个难题!”


编辑:张茜  / 审核:罗莎  / 发布:一戈