本期主人公:FG
90后,处女座
本硕博毕业于电子科大,EE(电子工程)专业
关于FG的关键句:渴望引领技术的前进,是我的价值观
不知道你们身边是不是有这样一群人,亦或者你就是他们之一。高高瘦瘦,戴着眼镜,平时不太爱笑,在人群中也不怎么吱声。生活中,除了打游戏和频次不多的运动之外,就没有特别的喜好了。除了两样东西——技术和女票。
这类人,他们生活简单,对技术有着迷一样的执着和专注。我们称他们是:技术直男。好奇他们的执着来源于什么,他说“想要挑战前沿技术”。
本科在电子科大,学的是电子工程专业。花了两年时间,发现自己只对数字电路有感觉,对模拟电路丝毫不感冒的他,确定自己不适合做电子工程师。由于从小对编程的兴趣,选择了电子工程学院里看起来最为接近的“模式识别”方向,在那时,模式识别和机器学习能做的事情还不多,但隐约间FG觉得人工智能一定会有很大的发展。“就赌它了,那时候我就觉得人工智能肯定是未来“。
可话又说回来,为什么只对数字电路有感觉?“只用0和1来回答的问题,对我来说更简单。”
就这样,FG在大三、大四阶段,把精力放在了模式识别上,也就顺理成章考上了本学院模式识别实验室的研究生。
研一下学期,一位老师从美国博士毕业加入了实验室,跟实验室的同学说,现在大家都在研究深度学习技术。那也是FG第一次听说“深度学习”这个词,那一年是2013年,”深度学习“正迎来大爆发的时期。
早在1943年,由神经科学家W.S.McCilloch和数学家W.Pitts在论文<A Logical Calculus of the Ideas Immanent in Nervous Acitivity>中提出了MCP模型,这个模拟大脑工作原理的数学模型,就是现在人工智能的一切基础。
所有新事物的发展史,都是充满崎岖的,这也是科学探索的迷人之处。”深度学习“的发展更是如此。在经历过缓慢发展、停滞这些阶段之后,终于在2012年迎来爆发。
2012年,机器学习领域的泰斗级人物Geoffrey Hinton,为了证明深度学习的潜力,带领课题组首次参加ImageNet图像识别比赛,其通过构建的CNN网络AlexNet一举夺得冠军,且碾压第二名(SVM方法)的分类性能。也正是由于该比赛,CNN吸引到了众多研究者的注意,在此后的5年里,关于深度学习是否是人工智能的未来的讨论,就一直没有停息过。直到现在。
时间拉回到2013年,那个在电子科大读研一的FG,在听完实验室老师对深度学习未来的描绘之后,回到实验室随即在网上搜了Andrew NG的课,开始了自学。在完成了课程学习后,他就决定读博了。
是偶然吗?或许是吧。但是对于一个对技术和科学拥有绝对痴迷的他来讲,又是一种必然。
挑战Facebook
2014年,Facebook曾经发表了一篇文章<DeepFace: Closing the Gap to Human-Level Performance in Face Verification>,在一个很不起眼的段落里,提到了“提取特征需要进行归一化”,FG当下在这句话上,就泛起了嘀咕:为什么要在测试阶段才做规一化,而不是在网络训练的时候就把它规一化好呢?
带着这样的疑问,FG开始了第一次尝试,即在网络训练时候就开始进行规一化操作,过程当然不是那么顺利,不论怎么调整网络参数,网络始终不收敛,在多次尝试失败后,只能选择暂时放弃。
博三的时候,FG获得去JHU(约翰霍普金斯大学)交流的机会。在JHU,FG又想起了之前暂时的放弃的实验,这次在分析了网络的输出结果分布之后,发现了问题的原因所在。其实只需要加入一个尺度系数,网络不但可以收敛,而且取得了更好的结果。
于是他把这个发现,写成了论文,发表在了ACM MM上。(感兴趣的同学可以搜来一读:<NormFace: L2 Hypersphere Embedding for Face Verification>)
网友奔现
读博期间,在一个深度学习交流群认识了naiyan,那时候还没有图森未来。2015年在成都VALSE上与naiyan面基,互相的欣赏与信任为日后FG的加入,打下了基础。
直到2018年FG博士即将毕业,回到国内。听说到FG已经回国,naiyan便找到他,“他说他们在做无人驾驶,问我要不要来试试”FG说道来图森未来的契机。
2018年完成博士学位回国的FG,因为自己博士期间的课题是人脸识别,毕业来到工业界,发现人脸识别这一市场几乎已经饱和,市场上有上百家公司都在做人脸识别。而对于一个对技术有着绝对执着的FG来说,他不想把一个已经相对成熟的技术领域当作是自己未来的发展,而是想着在一个更前沿的技术领域,找到自己的位置。那么无疑,无人驾驶,刚好是个机会。
加入图森未来之前,FG一直和naiyan在网上讨论技术问题,FG对naiyan的信任和好感,也促使他加入了图森未来。“前景更好、觉得团队技术更强更容易进步”,FG说起最终决定加入的理由,也颇直男。
加入之后
刚开始来图森未来,FG主要负责做车的ReID,因为之前一直在做人的ReID,回过头再来做车,就没有那么难。随着项目需求的不断增多,FG要负责的项目也越来越多。加入短短半年,他已经置身在三个项目中了。
这种快节奏的工作方式和博士期间显然不一样。但是会更有在“工作”的感觉。“学校里大多都是跑公开数据集,公司里要自己制定采集数据的方案,帮助修订数据方案。”
另外,在公司里要充分了解下游的需求,根据需求来制定判断模型好坏的指标。有的时候下游可能根本不关心学术界的指标,反而对一些细节非常关注,这时就根据将下游的需求来设计指标。指标一旦确定,就决定了模型的优化方向,后面的事情就回到了熟悉的节奏:提出改进,优化模型性能。
除此之外,他并不满足于只做之前熟悉的领域。对于无人驾驶技术,激光雷达数据的处理一直也是一个难解的课题之一。而FG现在,正渴望在这个领域,交出令自己满意的答卷。FG认为,在图像检测分割的领域,大部分问题都已被解决的差不多了,能做的只有修补的工作。而在点云的处理方面,还有很大的探索空间。
ALL IN 无人驾驶
FG对于自己的认知是:平时不爱说话,但是讨论技术会比较活跃。而的确,打开他的知乎,你会发现他很爱在技术这件事上“较真”。
问起他未来的职业规划,他说进行职业规划时要考虑整个职业生涯,看清未来10到20年会有巨大发展的领域,毕竟一个人的职业生涯长达30年。“那个时候,身边一定都是无人驾驶了,现在进入,刚好合适”,带着这样的信念,他选择了all in。
FG现在同时也担任感知算法研究员的面试官。下面也一起听听他在候选人的筛选上,都有哪些标准。
Q&A
Q:对于感知算法研究员的岗位候选人,比较看重哪些特质?
我对高质量的论文会非常欣赏,一些主流AI公司的实习的经验也会比较加分。如果以上都没有,至少要接触过前沿的技术,并且试图挑战这些前沿技术。候选人一定要有能够改变现有技术的想法,哪怕目前还做不出创新的工作,但是我会更欣赏有这样决心的人。
所以当面试官问你一些开放性的问题时,一定要打开脑洞畅所欲言,千万别只是说“对不起,没考虑过这个问题”了。
全部评论
(1) 回帖