Machine Learning Engineer (Ads) Interview Questions

A Guide to Pass the MLE interview.

tutorial

Published

January 27, 2023

1 你之前的项目是做股票的，为什么想来做广告？

2 CTR预估为什么是个分类而不是回归问题/为什么分类要用softmax而不是sigmoid

3 embedding层是选择end2end模式还是预训练模式

4 推荐广告场景下，模型中采用双向循环网络，效果比单向循环网络效果好，分析好的原因在那

5 如何验证引入DIN,DIEN等序列化模型后，序列化建模是有效的

6 现有纸质资料:训练册，每本训练册前面是题目，后面是答案。在线时如何快速根据题目找到相对应的答案，意思是想训练一个模型/提出某种架构，输入一个题目就能快速匹配他对应的答案，避免前期在数据库中人工手动输入每个问题对应的答案

7 类似YoutubeDNN，双塔等向量化召回与协同过滤的区别

8 使用传统的dropout在RNN中效果不是很好，因为RNN会有放大噪音的功能，所以该如何在LSTM中使用dropout

9 如何使用一个通用的pattern，将某一个分布转换为另一个分布，参数和非参数方法均可

10 DIN、LSTM的时间复杂度

11 FM中隐向量的作用

12 NDCG的计算公式

13 训练和推理有什么区别

14 推荐中数据不平衡，采样后，需要对点击率进行校准，如何校准？

15 对推荐算法的了解、对推荐模型的了解、推荐算法由哪几部分组成

16 如何对item的id做embedding

17 模型上线后严重下滑怎么办？有哪些原因？

18 解释业务指标，以及如何业务指标的提升是怎么量化到变现上面的

19 为什么在做CTR预估的时候需要加入一些固定的用户特征

20 如何解决推荐系统的冷启动问题

21 怎么给用户推荐内容（可以利用浏览历史等等）

22 场景题：如何在用户检索时补全比如（j->jd, c++,j -> c++,java）

23 抖音业务相关的问题，follow行为的预测

24 你了解元学习吗？说一下你的理解。

25 千万的用户量和万级的广告，设计一个推荐系统，会对每个细节问的很详细，loss设计，embedding，模型优化等等

26 推荐算法基础，以及怎样优化排序和召回，怎样推荐给用户更合适的广告。