应届生薪资水平浮动很大,大厂普遍30w年薪起步,而大部分小公司10w都不到。
当然也要看自己实力如何,应届生有薪资高的,也有薪资低的,不能一概而论,而且不同行业,不同岗位薪资都不一样。
如何拿到薪资高的工作,看公司,主要看自己,当然学历也有部分原因,像腾讯这样的企业二本很难,专科几乎不可能。
如果你在学历OK的条件下,然后自身实力不错的条件下,去个大厂不成问题,拿个不错的薪资也是可以的。
那么进大厂拿高薪需要怎样的技术实力呢?这里以音视频流媒体技术领域作为参考。
🎵 1. 音视频流媒体
🌐 2. 开源框架
2.1 实时音视频开源项目
实时音视频应用共包括几个环节:采集、编码、前后处理、传输、解码、缓冲、渲染等很多环节。每一个细分环节,还有更细分的技术模块。
比如,前后处理环节有美颜、滤镜、回声消除、噪声抑制等,采集有麦克风阵列等,编解码有VP8、VP9、H.264、H.265等。
采集->前处理编码->传输->解码后处理->渲染
实时音视频开源项目思维导图:
2.1.1 编解码开源项目
project | website | introduce |
---|---|---|
WebRTC | webrtc.org | WebRTC实现了基于网页的视频会议,标准是WHATWG 协议,目的是通过浏览器提供简单的javascript就可以达到实时通讯(Real-Time Communications (RTC))能力。WebRTC提供了视频会议的核心技术,包括音视频的采集、编解码、网络传输、显示等功能,并且还支持跨平台:windows,linux,mac,android。 |
x264 | www.linuxfromscratch.org | H.264是ITU(International Telecommunication Union,国际通信联盟)和MPEG(Motion Picture Experts Group,运动图像专家组)联合制定的视频编码标准。而x264是一个开源的H.264/MPEG-4 AVC视频编码函数库,是最好的有损视频编码器之一。 |
FFmpeg | ffmpeg.org | FFmpeg是一套可以用来记录、转换数字音频、视频,并能将其转化为流的开源计算机程序。采用LGPL或GPL许可证。它提供了录制、转换以及流化音视频的完整解决方案。FFmpeg提供了编码、解码、转换、封装等功能,以及剪裁、缩放、色域等后期处理。 |
ijkplayer | bilibili/ijkplayer | ijkplayer 是一个基于 ffplay 的轻量级 Android/iOS 视频播放器。实现了跨平台功能,API易于集成;编译配置可裁剪,方便控制安装包大小;支持硬件加速解码,更加省电;提供Android平台下应用弹幕集成的解决方案。 |
JSMpeg | jsmpeg.com | JSMpeg is a Video Player written in JavaScript. It consists of an MPEG-TS Demuxer, WebAssembly MPEG1 Video & MP2 Audio Decoders, WebGL & Canvas2D Renderers and WebAudio Sound Output. JSMpeg can load static files via Ajax and allows low latency streaming (~50ms) via WebSocktes. |
Opus | opus.nlpl.eu | Opus是一个有损声音编码的格式,由Xiph.Org基金会开发,之后由IETF(互联网工程任务组)进行标准化,目标是希望用单一格式包含声音和语音,取代Speex和Vorbis,且适用于网络上低延迟的即时声音传输,标准格式定义于RFC 6716文件。Opus格式是一个开放格式,使用上没有任何专利或限制。 |
live555 | www.live555.com | live555是一个为流媒体提供解决方案的跨平台的C++开源项目,它实现了标准流媒体传输,是一个为流媒体提供解决方案的跨平台的C++开源项目,它实现了对标准流媒体传输协议如RTP/RTCP、RTSP、SIP等的支持。Live555实现了对多种音视频编码格式的音视频数据的流化、接收和处理等支持,包括MPEG、H.263+ 、DV、JPEG视频和多种音频编码。 |
2.1.2 服务端开源项目
project | website | introduce |
---|---|---|
jitsi | jitsi/jitsi | Jitsi is an audio/video and chat communicator that supports protocols such as SIP, XMPP/Jabber, IRC and many other useful features. |
JsSIP | jssip.net | JsSIP是一个简单易用的JavaScript库,它利用SIP和WebRTC的最新发展,在任何网站上提供全功能的SIP端点。通过JsSIP ,只要几行代码,任何网站都可以通过音频,视频等获得实时通信功能。 |
SRS | www.ossrs.net | SRS定位是运营级的互联网直播服务器集群,追求更好的概念完整性和最简单实现的代码。SRS提供了丰富的接入方案将RTMP流接入SRS,包括推送RTMP到SRS、推送RTSP/UDP/FLV到SRS、拉取流到SRS。SRS还支持将接入的RTMP流进行各种变换,譬如将RTMP流转码、流截图、转发给其他服务器、转封装成HTTP-FLV流、转封装成HLS、转封装成HDS、录制成FLV。SRS包含支大规模集群如CDN业务的关键特性,譬如RTMP多级集群、源站集群、VHOST虚拟服务器、无中断服务Reload、HTTP-FLV集群、Kafka对接。此外,SRS还提供丰富的应用接口,包括HTTP回调、安全策略Security、HTTP API接口、RTMP测速。 |
JRTPLIB | j0r1/JRTPLIB | jrtplib是一个基于C++、面向对象的RTP封装库, jrtplib支持定义于RFC3550中的RTP协议,它使得发送和接收RTP报文变得异常简单,用户不用担心SSRC冲突,也不用考虑如何传输RTCP数据,因为RTCP功能完全在内部实现。 |
OPAL | opalvoip | Open Phone Abstraction Library (OPAL) is a C++ multi-platform, multi-protocol library for Fax, Video & Voice over IP and other networks. Also included is the Portable Tool Library (PTLib) which is a C++ multi-platform abstraction library. |
Kurento | www.kurento.org | Kurento 是一个WebRTC流媒体服务器以及一些客户端API,开发WWW及智能手机平台的高级视频应用就变得更加容易。可以利用Kurento开发的应用类型包括,视频会议,音视频广播,音视频录制、转码等。 |
Janus | janus.conf.meetecho.com | Janus 是由Meetecho设计和开发的开源、通用的基于SFU架构的WebRTC流媒体服务器,它支持在Linux的服务器或MacOS上的机器进行编译和安装。 |
2.1.3 质量传输开源项目
project | website | introduce |
---|---|---|
callstats.io | callstats | Callstats.io致力于监控和管理WebRTC应用中的音频和视频通话性能。提供Javascript客户端库,可以监测浏览器终端性能,从而帮助服务供应商准确定位那些媒体质量较低的终端用户,并进行性能问题的诊断。该信息主要是用于产品经理和工程师来提高客户体验质量,主动解决潜在的瓶颈障碍。 |
Meetecho | meetecho/janus-gateway | Meetecho Janus是Meetecho公司的一款WebRTC(网页即时通信)服务器。 |
Agora | agora.io | 声网Agora提供了一套简单而强大的SDK,开发者可以利用其中的资源在任何手机或电脑应用中加入高清语音和视频通讯功能。 |
2.1.4 视频前后处理开源项目
2.1.4.1 音频
project | website | introduce |
---|---|---|
soundtouch | soundtouch | SoundTouch是一个开源的音频处理库,主要实现包含变速、变调、变速同时变调等三个 功能模块,能够对媒体流实时操作,也能对音频文件操作。采用32位浮点或者16位定点,支持单声道或者双声道,采样率范围为8k~48k。 |
2.1.4.2 视频
project | website | introduce |
---|---|---|
SeetaFace6 | SeetaFace6Open | SeetaFace6是中科视拓最新开源的商业正式版本。包含人脸识别的基本部分,如人脸检测、关键点定位、人脸识别。同时增加了活体检测、质量评估、年龄性别估计。并且响应时事,开放了口罩检测以及戴口罩的人脸识别模型。 |
GPUImage2 | GPUImage2 | GPUImage是个功能十分强大、又十分易用的图像处理库。提供各种各样的图像处理滤镜,并且支持照相机和摄像机的实时滤镜。 |
open nsfw | open_nsfw | open nsfw是雅虎开源项目caffeonspark,使用深度学习训练得到caffe模型。nsfw翻译为不可在工作中看的图片。主要是针对黄图的,恐怖,血腥图片不能识别。 |
2.2 其他音视频开源项目
project | website | introduce |
---|---|---|
Speex | xiph.org | Speex是一套主要针对语音的开源免费,无专利保护的音频压缩格式。 |
FLAC | xiph.org | FLAC中文可解释为无损音频压缩编码。FLAC是一套著名的自由音频压缩编码,其特点是无损压缩。不同于其他有损压缩编码如MP3及AAC,它不会破坏任何原有的音频信息,所以可以还原音乐光盘音质。 |
Xvid | xvidmovies | Xvid是一个开放源代码的MPEG-4视频编解码器,它是基于OpenDivX而编写的。 |
Lagarith | lags.leetcode.net | Lagarith,是一种由Ben Greenwood所撰写的影片编解码器(video codec)。 |
Thor | wwww.thor.com | Thor是思科开源的视频编码解码器,Thor拥有适当复杂度的高压缩率视频编码解码器,使用众所周知的 motion-compensated 预测的混合视频编码方法和变换编码。 |
🧿 3. 视频
👀 4. 业界大神
No. | author | introduce |
---|---|---|
1 | 刘岐 | FFmpeg官方代码维护者之一,十余年一线技术研发与技术管理经验,人称“大师兄”。现任职于OnVideo公司,担任CTO,公司联合创立人,负责在线音视频云编辑与创作平台的开发和建设。曾任职蓝汛、高升、金山云等公司,担任视频部门架构师及技术专家。 |
2 | 赵文杰 | 擅长音视频编解码和渲染技术,客户端技术专家,开源流媒体服务器SRS开发者之一,现任好未来网校事业部高级架构师一职,负责端开发。 |
3 | 廖庆富 | 主要从事音视频驱动,多媒体中间件,流媒体服务器的高级开发,主导开发过即时通讯+音视频通话的大型项目。曾就职于联发科,现任职于零声教育,资深音视频讲师。主讲WebRTC,ffmpeg,流媒体。 |
4 | 雷霄骅 | 两届CSDN博客之星、微软MVP。主要从事与广播电视有关的视音频技术的研究。包括视音频质量评价,视音频编解码,流媒体,媒资检索等。 |
5 | 栗伟 | 资深音视频技术专家,曾任职于中科院计算所、CC视频,任职期间利用WebRTC技术开发了直播、在线课堂、视频会议等商业产品,并发用户数达到500万。开源社区的积极参与者,在GitHub上开源了视频会议项目WiLearning,免费供中小企业使用。 |
6 | 杨成立 | 阿里云RTC服务器团队负责人。负责中国最大CDN蓝汛科技流媒体分发系统开发项目。主导研发转码、P2P、流媒体服务器, 开源项目SRS主要开发者之一。 |
🍀 5. paper
5.1 ffmpeg
5.1.1 aac
5.1.2 ffplay
5.1.3 H264
5.2 流媒体
5.2.1 RTSP
5.2.2 rtmp
5.2.3 HLS
📙 6. 书籍
6.1 音频
No. | book name | author | introduction |
---|---|---|---|
1 | 《WebRTC技术详解:从0到1构建多人视频会议系统》 | 栗伟 | 全面讲解WebRTC各项技术,案例代码可直接用于视频会议、在线教育场景,开源商用视频会议系统。 |
2 | 《音视频开发进阶指南:基于Android与iOS平台的实践》 | 展晓凯 魏晓红 | 书中介绍音视频的物理现象与基础概念,帮助读者建立模拟信号到数字信号转化的过程,然后重点介绍了如何在移动端开发音视频项目,其中包括开发中所需要了解的各种知识,如音视频的解码与渲染,采集与编码,音视频的处理与性能优化等。 |
3 | 《Android音视频开发》 | 何俊林 | 本书着重介绍音视频基础知识、MediaPlayer、MediaPlayerService、StagefrightPlayer、NuPlayer、OpenMAX框架、FFmpeg项目、FFmpeg源码分析及实战、直播技术、H.264编码及H.265编码、视频格式分析内容。 |
4 | 《FFmpeg从入门到精通》 | 刘歧 | 本书围绕着音视频处理的FFmpeg的发展过程、FFmpeg的组成、FFmpeg的命令行使用、FFmpeg的API使用等内容,由浅入深地介绍了使用FFmpeg进行音视频处理的方法,并辅以大量实例,从而帮助对音视频处理感兴趣的读者对FFmpeg有更多的了解。 |
6.2 视频
No. | book name | author | introduction |
---|---|---|---|
1 | 《在线视频技术精要》 | 晓成 | 本书着重介绍在线视频行业的基础——音视频技术,从行业的历史、文件格式、标准组织开始,依次介绍了音视频技术的框架、编码、流媒体、播放等知识。 |
🌅 7. 面试题
1. 为什么巨大的原始视频可以编码成很小的视频呢?这其中的技术是什么呢?
2. 怎么做到直播秒开优化?
3. 直方图在图像处理里面最重要的作用是什么?
4. 数字图像滤波有哪些方法?
5. 图像可以提取的特征有哪些?
6. 衡量图像重建好坏的标准有哪些?怎样计算?
7. AAC和PCM的区别?
8. H264存储的两个形态?
9. FFMPEG:图片如何合成视频?
10. 常见的音视频格式有哪些?
11. 请指出“1080p”的意义?
12. 请解释颜色的本质及其数字记录原理,并说出几个你所知道的色域。
13. 请解释“矢量图”和“位图”的区别?
14. 请从“光圈”“快门速度”“感光度”“白平衡”“景深”中任选2个进行叙述?
15. 视频分量YUV的意义及数字化格式?
16. 在MPEG标准中图像类型有哪些?
17. 列举一些音频编解码常用的实现方案?
18. 请叙述MPEG视频基本码流结构?
19. sps和pps的区别?
20. 请叙述AMR基本码流结构?
21. 预测编码的基本原理是什么?
22. 说一说ffmpeg的数据结构?
23. 说一说AVFormatContext 和 AVInputFormat之间的关系?
24. 说一说AVFormatContext, AVStream和AVCodecContext之间的关系?
25. 说一说视频拼接处理步骤?(细节处理,比如分辨率大小不一,时间处理等等)
26. NV21如何转换成I420?
27. DTS与PTS共同点?
28. 影响视频清晰度的指标有哪些?
29. 编解码处理时遇到什么困难?
30. 如何秒开视频?什么是秒开视频?
31. 如何降低延迟?如何保证流畅性?如何解决卡顿?解决网络抖动?
32. 需要把网络上一段视频存储下来(比如作为mp4 ), 请实现并说出方法(第一个视频需要***才能进)?
33. 需要把网络上一段语音存储下来(比如作为mp3 ), 请实现并说出方法?
34. 为什么要有YUV这种数据出来?(YUV相比RGB来说的优点)
35. H264/H265有什么区别?
36. 视频或者音频传输,你会选择TCP协议还是UDP协议?为什么?
37. 平时说的软解和硬解,具体是什么?
38. 何为直播?何为点播?
39. 简述推流、拉流的工作流程?
40. 如何在直播中I帧间隔设置、与帧率分辨率选定?
41. 直播推流中推I帧与推非I帧区别是什么?
42. 常见的直播协议有哪些?之间有什么区别?
43. 点播中常见的数据传输协议主要有哪些?
44. RTMP、HLS协议各自的默认端口号是?
45. 简述RTMP协议,如何封装RTMP包?
46. m3u8构成是?直播中m3u8、ts如何实时更新?
47. 何为音视频同步,音视频同步是什么标准?
48. 播放器暂停、快进快退、seek、逐帧、变速怎么实现?
49. 说说你平时在播放过程中做的优化工作?
50. 你研究过哪些具体的流媒体服务器,是否做过二次开发?
51. 什么是GOP?
52. 音频测试的测试点,音频时延如何测试?
53. 美颜的实现原理,具体实现步骤?
54. 如何直播APP抓包过来的文件,如何过滤上行,下行,总码率?
55. 如何测试一个美颜挂件?
56. 为什么要用FLV?
57. 如何测试一个美颜挂件?
58. 平常的视频格式?
59. 何为homebrew?你用它安装过什么?常用命令有哪些?
60. RTMP、HLS协议各自的默认端口号是?
📰 8. 文章
🥌 9. 实践项目
9.1 音视频通话项目
实现了多人语音/多人视频项目, 房间号Id一致,用户Id不一致,即可实现多人语音/多人视频。
9.2 Android/iOS 视频播放器
ijkplayer 是一个基于 ffplay 的轻量级 Android/iOS 视频播放器。实现了跨平台功能,API易于集成;编译配置可裁剪,方便控制安装包大小;支持硬件加速解码,更加省电;提供Android平台下应用弹幕集成的解决方案。
9.3 仿网易云音乐安卓版客户端
仿网易云音乐 安卓版,netease android,音乐播放器 在线 下载。
9.4 Timber
Timber是一个设计漂亮,功能完善,Material Design风格的音乐播放器。
9.5 WebRTC入门项目
WebRTC初学者的启动演示,包括一个基于Socket.IO的简单信号服务器,以及一些客户端演示Web/Android/IOS/Windows平台。
WebRTC入门项目部署步骤
9.6 getStats
使用WebRTC getstats APL返回对等连接状态的微小JavaScript库,如带宽使用、数据包丢失、本地)远程IP地址和端口、连接类型等。
9.7 MPlayer
跨平台的视频播放器,可在Linux和其他类Unix系统、Windows及Mac OS X系统使用。
9.8 KxMovie
IOS平台基于FFMPEG播放器
9.9 Vitamio
Android/IOS平台上的多媒体框架,带有硬件加速解码和渲染.
9.10 YUV2RGB
YUV转RGB.
9.11 TSDemux
将TS流解码为PES或ES.(下载这个源码需要FQ)
9.12 VLC
跨平台的视频播放器。现在也有安卓版本。也可以作为流媒体服务器。
9.13 FFDshow
免费的编解码软件,基于windows平台。原因就是directshow就是微软开发的,只能用于windows平台。
全部评论
(0) 回帖