资讯详情

26岁从计算机视觉界“黄埔军校”博士毕业,他想为车打造一双慧眼

站在一个新的起点上,如何开始?如何发挥价值,为公司做出贡献?当越来越多的优秀人才加入华为时,他的故事可能会给我们一些灵感。

做一朵奔腾的浪花

在过去的28年里,黄青秋的头上总是有许多光环:

  • 从小就是学霸,以692分和全省40名成绩考入清华大学自动化系;
  • 作为队长,带领清华大学火神机器人队获胜RoboCup(机器人足球世界杯)第四名;
  • 26岁毕业于香港中文大学多媒体实验室,被誉为计算机视觉领域的黄埔军校,发表了10多篇顶级会议论文;
  • 2020年入选华为天才少年计划,加入智能汽车解决方案BU在不到两年的时间里,新员工迅速成长为领导近50人的团队leader。
  • ……

你觉得这些光环怎么样?你害怕别人用放大镜看你吗?我会尽量忘记这些,不怕质疑。黄青秋平静地笑着说:不要夸大或美化它们。实事求是。世界是多样化的,不可能要求每个人都同意你。

进入华为公司,没有‘天才青年’这个词,没有医生,没有学士学位,没有年轻专家,没有老专家。如何从一个新的起点开始?如何发挥价值,为公司做出贡献?当越来越多的优秀人才加入华为时,他的故事可能会给我们一些灵感。

以下是我们和他的对话。

从足球到电影,与计算机视觉的不解之缘

问:你什么时候开始对计算机视觉感兴趣?

答:高中看《黑客帝国》《变形金刚》的时候,被机器人控制人类、机器人和人类战斗的场景震惊了,对机器人产生了浓厚的兴趣。大学毕业后,我成为清华大学火神机器人团队的一员

队伍每年都会参加RoboCup(机器人足球世界杯)。作为全球机器人领域最具影响力、综合技术水平最高的竞赛之一,来自世界各地数十个国家、数百家科研机构和大学的科学家和研发人员将参加每场比赛。

我们参加的分组是一对一的技,每队派出一米五高的大家伙,分为攻防两方。攻击机器人要完成带球绕障和射门,守方机器人要当守门员。整个机器人系统还包括感知、决策、规划和控制,实际上与自动驾驶系统非常相似。我负责感知系统,主要任务是识别足球、球门、边线和机器人,这是我第一次接触计算机视觉。

对人来说,我们习惯了有一双强大的眼睛,“所见即所得”对我们来说是非常自然的事情,但是在计算机系统里,从图像到机器可感知的三维信息,转化过程其实非常复杂。而我要做的就是为机器人打造一双强大的眼睛,这是一件很有挑战但也很酷的事情。

参加机器人足球世界杯

问:你在计算机视觉领域的黄埔军校经历了什么魔鬼训练?听说看了100遍泰坦尼克?

答:我博士期间研究的课题很有意思,是用的AI技术对电影进行结构化分析,即让机器理解电影,从电影中分析人物关系、故事情节等。因为这个研究课题在计算机视觉研究领域相对不受欢迎,以前的研究很少,一切都应该从头开始。但我还是决定试试,因为我认为电影本身就是一件更艺术、更人性化的事情,用技术来分析艺术,理性和情感的碰撞可能会有不同的火花。

从零开始,我和几个朋友收集了当时学术界第一个、最大、最丰富的电影研究数据集,通过电影、剧本、影评等各种渠道。MovieNet,大约有十万部电影。基于这个数据集,我们做了很多有趣的研究,包括演员的识别、精彩片段的自动编辑、用文字搜索片段等。

这些课题的研究成果具有很大的应用价值,如演员识别和人物关系识别,即现在很多视频网站都会看到只看他CP功能的核心技术,如视频自动编辑,可以用于许多视频编辑软件,帮助用户自动编辑短视频。但与此同时,这些话题也非常具有挑战性,比如演员的识别。虽然人脸识别是一项相对成熟的技术,但在一部电影中,演员清晰正面的镜头往往不到30%。在更多的场景中,角色的识别不能依赖于面部。例如,在战斗中,脸是糊状的,例如,当夜间光线非常暗时,脸往往看不完整,例如,有时你只能看到背部。在这样做的过程中,我们也看到了这些困难,通过引入服装、环境、人物关系等信息,加上渐进的推理模型,解决了大部分问题。

在博士学位的前两年,由于研究方向不受欢迎,我的论文提交经常碰壁。事实上,我发表第一篇论文的时间比实验室里的大多数学生晚。但经过一轮又一轮的打磨,我们终于得到了学术界的认可。在整个博士期间,我发表了十多篇顶级会议论文。我还记得每篇论文我们都是用《泰坦尼克》做demo,在整个博士期间,我估计看了100多遍这部电影,台词都快背下来了。

跳出来,换个解题思路。

问:你在华为学到的第一课是什么?

答:刚到车BU,我加入了智能驾驶的视觉感知小组。我们的目标是让汽车通过相机感知周围的物理世界,包括检测道路上的车辆和行人,并判断他们的运动状态。

来了之后,我最大的感受就是工业界解决问题的想法和学术界很不一样。学术界追求创新,发明方法要有novelty(专利新颖性),太简单直接的方法,往往是因为太naive”而被拒稿。但工业界唯一的目标就是解决问题。我的导师说了一句话,这让我很难忘。他说:如果你用一种非常复杂的方法解决问题,那就很好了,但如果你用一种非常简单的方法解决问题,那就更好了。”

当时导师给我的第一个问题是,在自动驾驶中,如何判断其他车道的车要塞?这是自动驾驶在高速场景中退出的最常见原因。原来的解决方案是基于测量加规则的判断。首先测量前部转动程度,车辆离车道线有多少厘米,然后根据这些测量值和设计规则判断是否会堵塞。但一方面,做这些准确的测量是非常困难的,这相当于你引入了一个更困难的问题来解决一个问题。此外,面对这种复杂的行为,规则很难覆盖所有场景。

当时我们想知道是否可以直接一步到位,用视觉神经网络来判断加塞。因此,我们从视频研究领域的一些神经网络模型中学习,设计了一个基于时间网络的插入判断网络,开发了一套完整的数据挖掘过程,自动找到各种插入场景,供网络学习。最后,该模型取得了良好的效果,解决了许多无法解决的问题。

从这件事开始,我意识到自动驾驶的许多问题实际上是由于我们过于依赖精确的测量。事实上,当人们开车时,他们不需要知道我离前面的车有多少厘米,它的速度是每小时多少公里。这样的精确测量不仅使问题变得非常困难,而且大大降低了系统的鲁棒性。为了使自动驾驶系统更聪明,我们应该把更多的计算问题变成选择问题,然后使用神经网络作为选择问题的大师,巧妙地解决复杂的问题。

问:两年来,你最有成就感的事情是什么?

2021年3月的一天,极狐项目遇到了一个非常棘手的问题。在算法开发和验证的早期阶段,我们使用高精度的机械激光雷达。然而,为了满足汽车规则,半固态激光雷达需要用于大规模生产的汽车。更换后,我们发现算法性能严重下降,这可能直接影响我们的重要演示。导师希望我能带领激光感知算法团队解决问题,确保演示的成功。

听了很久,我惊呆了,因为我以前从来没有做过激光雷达算法,也不熟悉激光感知团队。但经过一段时间的思考,我决定接受挑战,并接受这个命令。

我花了两天时间快速了解整个激光感知算法的链路和团队中每个人的专长。当时,团队中激光感知的方案还是有不同意见的。我会和你一起拿出两个方案,分析它们的优缺点,最后把所有的决定都转向其中一个。然后拆解该方案的每个模块,分析可以改进的点。最后,根据大家的特长,给大家分工,让大家开始冲锋到各自的位置。

那段时间,我每天早上和大家开会梳理任务,每天晚上写总结,安排第二天的工作。说实话,压力很大,每天睁开眼睛都在想,然后直到凌晨睡觉,神经一直处于紧张状态。幸运的是,团队的合作伙伴非常强大。在短短一个月内,我们大大提高了激光感知算法模块的性能,解决了许多严重问题,并按时完成了任务。当我看到极狐演示的视频在全网引起轰动时,我觉得戴月所有的努力和努力都是值得的。

攻关后,我成了激光感知团队leader,开始带领团队在这个领域冲锋陷阵。激光雷达作为一种非常新的传感器,可以提供更准确的测量,让我们对环境的测量更准确,但也会带来很多问题。就像武侠小说里的绝世武器一样,控制好也不容易。只有内力深厚的人才能发挥巨大的力量。

比如下雨天其他车从你身边开过,会溅起很多水花。从激光的角度来看,它看到了无数的点,有的会跨过两条车道跑到你面前。从激光的角度来看,它会误以为面前有一个巨大的障碍物,需要刹车。但是这个时候,摄像头捕捉到了另一张图片。在这种情况下,需要制定很多复杂的规则。什么时候相信摄像头会严重影响雨天自动驾驶的性能?为此,我们设计了前融合算法,将相机捕获的图像和激光雷达捕获的点云输入神经网络进行融合感知,以获得更准确的结果。

在过去的一年里,我们努力练习内力,做了一个又一个实验,设计了一个又一个版本的解决方案,最终使激光感知算法的性能稳定高效,使激光雷达在自动驾驶系统中发挥了巨大的作用。随着极狐的大规模生产,我们终于可以自豪地说,我们是业内第一个将激光雷达作为传感器而不是装饰品安装在大规模生产乘用车上的团队。

ADS激光&毫米波感知组上海团队

ADS激光&深圳团队深圳毫米波感知组

带领团队,以解决问题为导向

问:你团队有什么不同的方法?

答:随着业务的扩大,我们的团队从一开始的十几个人增长到现在的近50个人,横跨上海、北京、深圳。作为一名新手,我没有很强的管理经验,但我坚信团队文化是管理的核心。例如,在算法团队中,一个常见的现象是,每个人都想开发新的算法,享受从零到一的成就感。而一些数据清洗、算法迭代、软件优化的工作常常被视为“脏活累活”。但在我们的团队中,我会告诉你,解决问题是第一个方向。如果一个问题的核心是缺乏新算法,那么我们应该研究新算法,但如果一个问题的核心是数据问题,那么清理数据和提高标记效率是最有价值的。最快、最有效地解决问题是有价值的。

同时,我会让大家的所有工作都保持透明,让大家可以相互学习。我也会和每个人聊他自己的兴趣点,在业务目标允许的范围内,尽量让大家能发挥所长。我相信,一个导向明确、透明、公开的团队,并不需要很多条条框框的管理手段约束,大家也一定能“事成人爽”。

“天才少年”不是光环,也不是包袱

问:你是怎么入选“天才少年计划”的?

答:从香港中文大学多媒体实验室博士毕业后,一个偶然的机会,刚成立不久的华为车BU联系上我。经过了几轮面试,我成功拿到了天才少年的offer。当时我非常纠结:到底是去我熟悉的视频分析领域继续深耕,还是转到自动驾驶这个方向上?经过了一番思考,我最终还是决定加入车BU。我觉得,文娱产业虽然也在丰富精神生活上起到非常重要的作用,但远不如智能汽车这样的“硬科技”是国家社会的基石产业。而且汽车产业正处于一个变革时代,就类似于手机从功能机到智能机的演进,而自动驾驶又是这个变革中的核心之一,它极大可能会改变整个人类社会。

能够入选我很荣幸。后来看到很多相关的热搜,才意识到这是一个自带热度的话题。但我是个实用主义者,我并不会把“天才少年”当成一个光环或者一个包袱,而是会尽量忘掉它,只在有需要用到的时候把它拿出来,比如需要这个title去吸引应届生的时候,哈哈。就像任总说的,进入华为公司,就没有“天才少年”这个名词了,也没有博士、学士之分,也没有年轻专家、老专家之分,大家都是在一个起跑线上的,都要踏踏实实做好本职工作。

问:你对公司在人才培养方面有什么建议?

答:我觉得有能力的人通常也是比较有想法的。所以我觉得最好的方式就是给予人才充分的资源、足够的空间,让每个人得以发挥自己的长处。更多的可能是给一些大方向上的指引,而不需要去限制对方一定要做什么,这样大家才能更好地发挥主观能动性,做出更好的东西。

问:来公司前后,对华为的印象有不同吗?

答:我觉得还是蛮不一样的,比如之前会说华为采取的是军事化管理,工作氛围可能会比较压抑,动不动就贴各种“打鸡血”的横幅等等。但来了以后发现根本不像说的那么什么夸张。车BU成立不久,给我的感觉有点像一个创业公司。我们整个团队绝大部分也都是90后,团队氛围还是比较活跃轻松的。不过也有些是和传闻比较一致的,比如外界常说的“狼性”。进来之后发现确实很多人都是不达目的不罢休,有一种要跟难题“拼命”的感觉,非常“凶狠”。

青梅竹马的爱情,伴我前行

问:能说说生活中的你嘛?再替我们的读者八卦一下有没有对象?

答:我是一个爱好比较广泛的人,基本大家喜欢玩的我都能跟着玩一点,打羽毛球啊,唱歌啊之类的。至于对象,我已经结婚了,哈哈哈,而且已经有了一个女儿,十个月大了。我和老婆从小学就认识了,算是青梅竹马的爱情吧!

问:下一步,你的目标是什么?

答:一方面,我们会持续打磨现在的激光感知和毫米波感知算法,去解决大规模商用之后客户遇到的各种问题,目标是让我们的体验不断提升,让客户越来越喜欢用我们的自动驾驶功能。另一方面,在经过几年的迭代之后,我们当前的感知系统也走到了一个瓶颈期,遇到了一些系统性的难题。比如我们当前系统的时延还是偏高。所谓时延,就是指从传感器接收到数据到车做出决策的时间差,类似于人的反应时间,是越短越好。所以我们也正在开发下一代感知系统,希望解决之前遇到的很多系统性问题。

智能驾驶也许会是信息时代中,继互联网、移动互联网之后的第三次技术变革浪潮,我希望能作为一朵小小的浪花,在时代洪流的裹挟下奔腾向前,同时也为推动这滚滚洪流贡献自己的一份力量。

标签: 自感性传感器

锐单商城拥有海量元器件数据手册IC替代型号,打造 电子元器件IC百科大全!

锐单商城 - 一站式电子元器件采购平台