牛客855493144号

编辑于 2020-08-15 15:37

+ 关注

网易云音乐音频算法工程师，透心凉心飞扬，经

面试官小哥哥气场非常好，也非常友善。虽然感觉自己是挂定了，但是确实了解了很多不足，也对之后会有很大帮助。

我是音频算法工程师，但是之前看一堆面筋，准备了TCP/IP，多线程的东西，没考。

那么分块介绍吧：

（1）项目

我做的项目主要是连续语音切分、识别、重构、降噪，因为和网易云音乐不是特别搭配，面试官也主要问了几方面

①用到的模型，以及对Kaldi和端到端的了解

答：因为实验室主要重视语音切分与语音分离（多人、含噪），语音识别主要是为了验证切分与分离的可靠，所以用的模型相对简单

②在语音降噪过程中，怎样实现噪声估计（自己的代码，个人觉得还是能讲出来的）

③使用模型降噪的原理

答：有点懵，但是个人理解，降噪无非是两类：通过信号本身加减去噪，以及构造滤波器提取人声，模型应该是根据输入的信号构造滤波器筛选基频与谐波信号

④语音识别用到的模型

答：GMM-HMM，以及最近一直在用的CNN，实验室同学用的DNN（人声分离），看了但是没掌握的RNN和LSTM

⑤OMLSA？MCRA？似乎是两种降噪算法，但是我没了解。（温度-5℃）

（2）音乐的了解

①FIR和IIR

老题目了，区别和优缺点基本背下来了。

但是，面试官似乎看穿了这点，问我如何使用IIR卷积，我就懵了。似乎是差分方程。（温度-5℃）

②重采样

16K重采样到8K，怎么做

我的答案：目前想到两种（1）隔点采样（2）化离散为连续，再按照8K采样

面试官看我中套了，就指出：你觉得第一种方法得到的信号，频谱会怎样？

我意识到问题了，答：会失真，因为帧与帧的连续性丢失

面试官：会频谱混叠（别的忘了），正确的好像是...先低通滤波然后怎样怎样（温度-5℃）

③MFCC

原理

我答：（一直是直接调用的）根据人耳的听觉感应，一般与频率呈现对数

好像一笔带过了

④频率分辨率

之前有准备，应该答对了

⑤卷积（要我命了）

两个长为512的信号，时域卷积，长度：正确应该是1023，我以为是1024

如何用频域卷积：（我是一脸懵逼的）好像是先补0再做FFT，当时脑子已经糊涂了，好比玩游戏0/8

（3）编程语言

我主要用的是MATLAB，Python（TensorFlow）和C++（写实验室项目）

①C++用到的stl：vector,map,pair.set...

②stl容器分类：（懵了）

面试官：你刚才说的就是两类了，一个是顺序容器，一个是关联容器

③vector排序：sort

④K个最大值：堆排序

⑤：析构函数的基类为什么是虚函数

当时懵了，卡了一会儿，努力思考看过的概念，好像是内存错乱，就一边胡言乱语（从概念说起）拖时间，一边在草稿纸上疯狂打草稿

大概应该是：基类的析构函数如果不是虚函数，会让内存泄漏

最后面试官表示，问的很多都是音频的基础问题，高难的比如“自适应信号处理”还没问（所以我估计已经是干冰级别的凉了）

还有什么要问的：

我：网易云公司最重视的音频信号理论是？

面试官：讲了很多，但是我脑子已经浆糊了。

last：非常感谢您，确实让我意识到了很多不足。

第一场面试，感觉就像是过了新手关直接见最终BOSS，不过我觉得能给自己50分，毕竟也答出了一些问题。以后的面试应该不会比这个再难了。

PS：我准备好了手撕代码，包括各种排序，多线程，但是没考，可能我堆排序说的比较流畅吧。

已采纳

采纳

精彩回帖

精彩

全部评论

(8) 回帖

加载中...

话题同步到我的动态回帖

网易云音乐音频算法工程师，透心凉心飞扬，经

更多模拟面试

已采纳

精彩回帖

全部评论

近期热帖

近期精华帖

热门推荐

网易云音乐音频算法工程师，透心凉心飞扬，经

更多模拟面试

已采纳

精彩回帖

全部评论

相关热帖

近期热帖

近期精华帖

热门推荐