首页 > 小鹏汽车 数据分析 一面凉经
头像
Brickleberry
发布于 2021-09-10 17:55
+ 关注

小鹏汽车 数据分析 一面凉经

1、

表有四个字段:

A B C D

1 2 3 1

3 4 2 2

1 2 6 3

1 3 3 4

如果 任意两行的A 列 B 列是相同的,保留其中任意一行,即输出

A B C D

1 2 3 1

3 4 2 2

1 3 3 4
【这里把题目理解错了 害 看成任意2列相同了 】
2、

表有三个字段:

A B C

1 2 3

3 4 2

1 2 6

1 3 3

用一条 SQL 统计表的行数及 C 字段等于3的行数,即输出

4 2
【很简单】
3、

推荐中的排序的效果一般使用 AUC 这个指标来计算,例如对于以下排序:

样本排序号   得分   是否正样本

4  0.98   1

3  0.93   0

2  0.85   1

1   0.65   1

 

AUC 是计算 所有正样本和负样本两两对比,正样本得分比负样本得分大的概率,

计算公式为

(S-M*(M+1)/2) /(M*N)

其中 M 为正样本个数,N 为负样本个数,S 为所有正样本排序号之和

上述例子,AUC 为  1/3

请推导这个公式怎么来的?

【这题懵了,脑子没转过来 感觉面试好像没办法很冷静的思考 】

更多模拟面试

全部评论

(6) 回帖
加载中...
话题 回帖