2021.6.21 更新 -------------------------
内推码 AGcK6 欢迎各位骚扰
----------------------------------------------
更新一下,21届校招内推已经开始,欢迎投递简历
职位表参考:
------------------------------------------------------------------
本人2021届应届生,算法方向,获得 腾讯 阿里 百度 美团 滴滴 快手 虾皮等公司的算法方向offer(所有offer 均为ssp),入职新加坡shopee (deep组)
欢迎各位算法方向(工程的同学也可以内推,不过应该指导不了)的同学找我内推,简历请发送到 woyijkl1@gmail.com (本人qq:1193933744 内推qq群:959220710 ) 备注虾皮内推,以及想要去的岗位方向
岗位:
算法方向的搜索 推荐 广告 nlp cv均可联系我。
关于新加坡:
吃喝:
一开始刚来吃没有空调的食阁感觉不太适应,后面吃有空调的食阁感觉尚可,价格一般在35人民币左右
消费:
公交地铁一趟5块人民币左右,打车较贵,得要50左右吧,房租一个人5k(房子还可以,便宜的有4k多,感觉比深圳租房价格贵20%)
人均月消费应该可以控制在1w以内。
新加坡税收很低,个人所得税最高22%(国内45%)。 不过新加坡没有公积金,个人感觉,新加坡的税收优惠成度可以覆盖消费成本+国内的住房公积金(国内住房公积金每个月有上限)
天气:
中午稍热,早晚凉***觉不输深圳的舒适程度
住宿:
新加坡住宿比较贵,一般合租,价格参考消费中内容
加班:
基本没有国内的加班文化,pm们下班挺早的,一般10点上班,7点下班,要蹭公司的晚饭就工作到7点30不到,然后下去吃饭
本人一般吃完饭就回家,工作内容偏少(工作不饱和 哈哈哈)
附2021届国内各大公司的算法面经:
XX公司面经:
1面:
没问啥,没什么深度,广度有一点吧
dropout
树模型
数据过拟合
fm
问简历
两个题:
第一个:二叉树层次遍历
第二个:求1到n中每一个数 在二进制表达中1的个数
二面:
扯了一下auc的计算方法,大概是 (piar-对中正例prob>负例prob的个数)/(正例个数*负例个数)
sigmoid 求导 优点
树模型说一下
算法题:
1面:
没问啥,没什么深度,广度有一点吧
dropout
树模型
数据过拟合
fm
问简历
两个题:
第一个:二叉树层次遍历
第二个:求1到n中每一个数 在二进制表达中1的个数
二面:
扯了一下auc的计算方法,大概是 (piar-对中正例prob>负例prob的个数)/(正例个数*负例个数)
sigmoid 求导 优点
树模型说一下
算法题:
求链表倒数第k个节点值
XX公司:
一面:
问项目和实习,偏介绍干了什么,bert中的kqv在XX项目中的对应
机器学习部分:
问lr 与softmax的区别
softmax 减去最大数字不变的证明
booting和baging 在物理上的意义
crf hmm图
问题:
开根号n的近似计算
二面:
问了下crf为什么比bert效果好(XX项目)
其他的偏介绍
试题:
固定长度(3,4,5)的青蛙过河[1 4 5 7 10] [1 6 7 10]
三面:
主要介绍实习,偏重于问为什么这么做
问题:
区间[a,b]里面不包含数字 3,5 ,7 的数字的个数
((a+b)*c) 中不包含*/的括号的个数。
四面:
bert训练过程,一个例子,两个loss
分词问题对分类问题有什么帮助
普通机器学习模型为什么不用二阶信息
全正的数据,预测出来了负样例,为什么
算法题: 最小乘积子数组
五面:
算法复杂度
加入词典信息的ner具体做法
算法题: 100w个数求中位数
问项目和实习,偏介绍干了什么,bert中的kqv在XX项目中的对应
机器学习部分:
问lr 与softmax的区别
softmax 减去最大数字不变的证明
booting和baging 在物理上的意义
crf hmm图
问题:
开根号n的近似计算
二面:
问了下crf为什么比bert效果好(XX项目)
其他的偏介绍
试题:
固定长度(3,4,5)的青蛙过河[1 4 5 7 10] [1 6 7 10]
三面:
主要介绍实习,偏重于问为什么这么做
问题:
区间[a,b]里面不包含数字 3,5 ,7 的数字的个数
((a+b)*c) 中不包含*/的括号的个数。
四面:
bert训练过程,一个例子,两个loss
分词问题对分类问题有什么帮助
普通机器学习模型为什么不用二阶信息
全正的数据,预测出来了负样例,为什么
算法题: 最小乘积子数组
五面:
算法复杂度
加入词典信息的ner具体做法
算法题: 100w个数求中位数
XX公司:
l1是损失函数,有哪些优化方法,能用sgd么?为什么?
l1是不可导的,真的可以用么?
adam用到二阶矩的原理是什么
初始化除了用__init_用过__new__么?
了解过rpc么?
给定一个数组,求连续子序列乘积为完全平方数的最大长度
判断给定序列是否为二叉搜索树的前序遍历
LightGBM的直方图排序后会比xgboost的效果差吗,为什么
比较两个样本分布均值的差异,t检验,具体哪些指标(
A/B test的实验时长设计,在统计中如果选择实验时长
2. 给一个01二项分布的随机器,参数为p,用它设计一个0-1的均匀分布的随机器(连续的)
如何提升LR的模型性能?
L1有什么缺点?
推荐算法 :
fm
在做特征工程时采用了哪些方法呢? 常见的筛选特征的方法有哪些?
xgb和lgb的区别?他们的应用场景有哪些呢?
问我auc计算并写出来。
auc介绍一下,给出计算公式
xgb怎么并行运算(除了自带的并行找特征分裂点,还说了一般模型的按数据和按特征并行)
进程线程的区别?进程和线程相比有什么好处?
用户态和内核态
逻辑回归 为啥要做特征离散化
l1是不可导的,真的可以用么?
adam用到二阶矩的原理是什么
初始化除了用__init_用过__new__么?
了解过rpc么?
给定一个数组,求连续子序列乘积为完全平方数的最大长度
判断给定序列是否为二叉搜索树的前序遍历
LightGBM的直方图排序后会比xgboost的效果差吗,为什么
比较两个样本分布均值的差异,t检验,具体哪些指标(
A/B test的实验时长设计,在统计中如果选择实验时长
2. 给一个01二项分布的随机器,参数为p,用它设计一个0-1的均匀分布的随机器(连续的)
如何提升LR的模型性能?
L1有什么缺点?
推荐算法 :
fm
在做特征工程时采用了哪些方法呢? 常见的筛选特征的方法有哪些?
xgb和lgb的区别?他们的应用场景有哪些呢?
问我auc计算并写出来。
auc介绍一下,给出计算公式
xgb怎么并行运算(除了自带的并行找特征分裂点,还说了一般模型的按数据和按特征并行)
进程线程的区别?进程和线程相比有什么好处?
用户态和内核态
逻辑回归 为啥要做特征离散化
XXXXXX公司:
在小样本上,字粒度ner和词粒度ner谁的效果好,然后 用更加细粒度的ner,比如声母 韵母好处是什么
python set底层实现。
10个词 用50维的向量表示合不合适,数据大小足够
大数据读文件,建立堆,直接读文件一部分是不是可以,读大文件的过程。
二面:
lru实现
三面:
新词发现
协同过滤做法
电商场景下,有一些商品的描述(都是词 描述),怎么打tag(无tag体系)
python set底层实现。
10个词 用50维的向量表示合不合适,数据大小足够
大数据读文件,建立堆,直接读文件一部分是不是可以,读大文件的过程。
二面:
lru实现
三面:
新词发现
协同过滤做法
电商场景下,有一些商品的描述(都是词 描述),怎么打tag(无tag体系)
XX公司:
一面:
(语义匹配中)为什么线上用表示模型。
做题:dp 矩阵中的路径数量,左上到右下
二面:
色情检测怎么做,无数据
考察场景题
做题:快排 归并改了下:[ 2 1 3 5 4 ] 左边的数小于当前数的个数 求总和
(语义匹配中)为什么线上用表示模型。
做题:dp 矩阵中的路径数量,左上到右下
二面:
色情检测怎么做,无数据
考察场景题
做题:快排 归并改了下:[ 2 1 3 5 4 ] 左边的数小于当前数的个数 求总和
XX公司:
xlnet中怎么做的attention
crf的loss具体过程
pmi计算
tfidf公式, 演变到bm25公式
bert处理超过512长度的句子
crf的loss具体过程
pmi计算
tfidf公式, 演变到bm25公式
bert处理超过512长度的句子
大杂烩:
XX公司: auc计算方法
XXX公司:单调栈、严格递增子序列,不用dp,时间复杂度nlogn 做法、 模型蒸馏、压缩
XX公司:const指针 python lambda表达式求偶数,hadoop spark 学习
XX公司: sigmoid优点为什么用在最后一层、
XXX公司:lru、 cf协同过滤做法、新词发现、电商场景 一堆词 描述 下打tag的过程(tag体系的构建)
XX公司: const 用法 虚函数
XX公司:不同概率的硬币,获得等概率事件
XXXX公司: 给定3n个整数,和为4A,是否存在集合的和分别为A,A,2A的情况
XX公司:二叉树非递归遍历
XX公司:二叉树之字形遍历
XXXX公司:稀疏矩阵乘法(直接乘了加上去)、多卡训练时候norm怎么做、nn.module 和nn.function区别、dataloader和datasampler区别
XX公司 三数之和变种,所有不重复数字的下表组合、transformer-xl其他
XXXX公司 lc原题:011234 找1开始、结束的位置、 fm时间复杂度的优化计算
XX公司 python 如何实现switch
XXX公司:单调栈、严格递增子序列,不用dp,时间复杂度nlogn 做法、 模型蒸馏、压缩
XX公司:const指针 python lambda表达式求偶数,hadoop spark 学习
XX公司: sigmoid优点为什么用在最后一层、
XXX公司:lru、 cf协同过滤做法、新词发现、电商场景 一堆词 描述 下打tag的过程(tag体系的构建)
XX公司: const 用法 虚函数
XX公司:不同概率的硬币,获得等概率事件
XXXX公司: 给定3n个整数,和为4A,是否存在集合的和分别为A,A,2A的情况
XX公司:二叉树非递归遍历
XX公司:二叉树之字形遍历
XXXX公司:稀疏矩阵乘法(直接乘了加上去)、多卡训练时候norm怎么做、nn.module 和nn.function区别、dataloader和datasampler区别
XX公司 三数之和变种,所有不重复数字的下表组合、transformer-xl其他
XXXX公司 lc原题:011234 找1开始、结束的位置、 fm时间复杂度的优化计算
XX公司 python 如何实现switch
全部评论
(7) 回帖