今天我想谈谈计算机视觉,谈谈做事的前言与后语,方法与决断。
复盘,思考,修正,慨叹与前进。更多详情参见微信公众号:九州的云梦泽。
- 前言
说起计算机视觉(Computer Vision),不得不提起算法。大概在2015年,我进入大学学习,开始逐渐了解计算机科学与技术专业的出路有开发与算法两种。当时我凭着自己朦胧的臆断与不甚丰富的资料,觉得不会从事普通的开发岗位,算法岗毕竟高大上。
三年后我参加了学校的本硕联培项目,面临实验室的选择问题。我被迫在很不扎实的基础上,努力向我以为的前方靠拢。具体来说,大三下学期我开始学习机器学习的书本知识,为后续进入实验室做尽可能多的准备。
- 初入
选拔竞争相对激烈,不过我幸运地来到了如今的实验室。我还记得当初面试聊到了遗传算法,线性规划,以及口述了SVM推导过程。
那是2018年的9月,日本在盛夏之末,阳光燥热让人不安,路边有硕大的乌鸦闲庭闲步,优哉游哉。狭小的学校里涌动着激情四射的年轻人们,像是福冈港的海潮。
生活的脚步忙乱,事情纷至沓来,充实的课程,以及本科毕设。
与两方导师商讨后,我去实验室的官网浏览往届学长学姐的硕士论文,希望可以找到比较好的范本。
善于讨巧的性格令我先去看实验室毕业出路,找到了一位在阿里达摩院的学长。我向他咨询了情况,并且决定跟随他做我的毕业课题。
在这段短暂而使人迷惘的过程中,我考虑过这次毕设关系到未来的发展方向。CV,NLP,推荐系统,SVM等等,使我目不暇接而心神交困。我不得不承认一件向来厌恶的客观事实。人生中总是有许多这样的节点,获取的信息永远不足而选择的结果万般重要,如高考选择学校与专业,研究课题与未来择业。最终,在交际圈与知识范围作用下,我假定将在这片不熟悉的原野上播种,期待丰收。
本科毕设是痛苦的。
一方面,我的工程能力欠佳,面对caffe这样经典而不够友好的框架力不从心,网上的资料与学长的解答也往往不能解决当下遇到的困难。另一方面,尚不理解对一个领域如何开拓知识面的我迷失于相关资料中,直到毕设基本完成才较为准确的明白手上的东西,如它的前景,问题,核心与意义。
磕磕绊绊之后,算是入门了吧。我叹了口气,彼时五月秀蔓却胜过精阳,订了机票,准备再次拥抱那个湿润如蒸笼,炽热而温柔的金陵。在飞机上我昏沉睡去。图书馆前翠绿的草坪上,一群白鹤翩翩而起,路过我的梦境。
- 正文
本科毕业后,硕士课题要开题了。
一个头两个大的我决定暑期蹲在实验室,把课题想出个所以然。
读文献,看代码,想idea,循环往复,终而复始。经过了一个多月的纠结,敲定了硕士课题。追随的一篇论文源码基于tensorflow,我开始了尝试。它的作者是谷歌大脑的研究员,因此代码被放到了tf的官方库,却没有任何指南。readme只有短短一句话,本代码为某论文源码。
代码十分晦涩难懂,毫无意义的readme与作者的消极回应加剧了我的困难,我甚至一度想到放弃。
直到晚秋的一天,又一次瞎搜的时候找到了别人的Pytorch复现代码,效果要差一些。
得,凑合来吧。いただきます。即将秃头的我如是想。
经过几个月的折腾,项目算是做出来了,与此同时,试探性的秋招进展不顺,面试被啪啪打脸。我开始投递冬天的日常实习。
运气很好,通过了一家独角兽的考核,收拾行李出发。
出于多种原因,细节不再赘述。
几点感悟:
1.CV岗很简单也很难。
2.我的工程能力弱。
3.在有可能的情况下,我不愿意总是加班。
- 尾声
在后来的求职中,我仍然拿到了一些CV岗的offer,有的甚至是SP。可是我从心里怀疑自己与这项工作的匹配性。两年时间说长不长,说短不短。我擅长寻找做事的方法,确定到达目标的最短路径,而困于实践。这样的做事习惯使得我可以在一个说不上热爱的领域取得一定的成果,但是又难以获得坚实的基础与足够的经验。
恰巧此时出现了别的机会,我看到了另一条也许更为适合自己的路。周旋良久,我选择了与CV说再见,当然这不意味着与算法彻底决裂。基础的思想,以及大量的传统算法在未来都有可能派上用场,只是可能不会再与各种Cascade,RCNN,以及YOLO一家人们产生交集了。
复盘,思考,修正,慨叹与前进。
那天我在路口久久伫立。
全部评论
(6) 回帖