首页 > 网易云音乐音频算法工程师,透心凉心飞扬,经
头像
牛客855493144号
编辑于 2020-08-15 15:37
+ 关注

网易云音乐音频算法工程师,透心凉心飞扬,经

面试官小哥哥气场非常好,也非常友善。虽然感觉自己是挂定了,但是确实了解了很多不足,也对之后会有很大帮助。
我是音频算法工程师,但是之前看一堆面筋,准备了TCP/IP,多线程的东西,没考。
那么分块介绍吧:
(1)项目
我做的项目主要是连续语音切分、识别、重构、降噪,因为和网易云音乐不是特别搭配,面试官也主要问了几方面
①用到的模型,以及对Kaldi和端到端的了解
答:因为实验室主要重视语音切分与语音分离(多人、含噪),语音识别主要是为了验证切分与分离的可靠,所以用的模型相对简单
②在语音降噪过程中,怎样实现噪声估计(自己的代码,个人觉得还是能讲出来的)
③使用模型降噪的原理
答:有点懵,但是个人理解,降噪无非是两类:通过信号本身加减去噪,以及构造滤波器提取人声,模型应该是根据输入的信号构造滤波器筛选基频与谐波信号
④语音识别用到的模型
答:GMM-HMM,以及最近一直在用的CNN,实验室同学用的DNN(人声分离),看了但是没掌握的RNN和LSTM
⑤OMLSA?MCRA?似乎是两种降噪算法,但是我没了解。(温度-5℃)
(2)音乐的了解
①FIR和IIR
老题目了,区别和优缺点基本背下来了。
但是,面试官似乎看穿了这点,问我如何使用IIR卷积,我就懵了。似乎是差分方程。(温度-5℃)
②重采样
16K重采样到8K,怎么做
我的答案:目前想到两种(1)隔点采样(2)化离散为连续,再按照8K采样
面试官看我中套了,就指出:你觉得第一种方法得到的信号,频谱会怎样?
我意识到问题了,答:会失真,因为帧与帧的连续性丢失
面试官:会频谱混叠(别的忘了),正确的好像是...先低通滤波然后怎样怎样(温度-5℃)
③MFCC
原理
我答:(一直是直接调用的)根据人耳的听觉感应,一般与频率呈现对数
好像一笔带过了
④频率分辨率
之前有准备,应该答对了
⑤卷积(要我命了)
两个长为512的信号,时域卷积,长度:正确应该是1023,我以为是1024
如何用频域卷积:(我是一脸懵逼的)好像是先补0再做FFT,当时脑子已经糊涂了,好比玩游戏0/8
(3)编程语言
我主要用的是MATLAB,Python(TensorFlow)和C++(写实验室项目)
①C++用到的stl:vector,map,pair.set...
②stl容器分类:(懵了)
面试官:你刚才说的就是两类了,一个是顺序容器,一个是关联容器
③vector排序:sort
④K个最大值:堆排序
⑤:析构函数的基类为什么是虚函数
当时懵了,卡了一会儿,努力思考看过的概念,好像是内存错乱,就一边胡言乱语(从概念说起)拖时间,一边在草稿纸上疯狂打草稿
大概应该是:基类的析构函数如果不是虚函数,会让内存泄漏
最后面试官表示,问的很多都是音频的基础问题,高难的比如“自适应信号处理”还没问(所以我估计已经是干冰级别的凉了)
还有什么要问的:
我:网易云公司最重视的音频信号理论是?
面试官:讲了很多,但是我脑子已经浆糊了。
last:非常感谢您,确实让我意识到了很多不足。

第一场面试,感觉就像是过了新手关直接见最终BOSS,不过我觉得能给自己50分,毕竟也答出了一些问题。以后的面试应该不会比这个再难了。
PS:我准备好了手撕代码,包括各种排序,多线程,但是没考,可能我堆排序说的比较流畅吧。

更多模拟面试

全部评论

(8) 回帖
加载中...
话题 回帖

相关热帖

历年真题 真题热练榜 24小时
技术(软件)/信息技术类
查看全部

近期精华帖

热门推荐