小红书PE后端二面

字节跳动 · AI算法工程师 · 一面 · 上海 · 2026-06

《面试题目》

  1. 3二面,6.9排序挂
  2. 球球了,🍠收了我吧,我以后不刷抖音、快手、B站好吗
  3. 自我介绍
  4. 开源项目是什么?(这里面试官应该是想说项目是什么,我介绍了 GSoC 是什么,他就说那我们还是问一点技术问题吧)
  5. 介绍一下你的 Oncall Agent 项目(反问环节面试官说我需要多了解业界常见的 Agent 模式,多自己思考)
  6. 有没有统计什么指标可以看出增长(从零实现的项目,统计了转人工拦截率)
  7. Plan-Execute-Replan 这个模式为什么需要有一个监管 Agent,什么时候使用 ReAct、什么时候用 Plan-Execute-Replan、什么时候 Multi-Agent?
  8. BM25算法实现原理
  9. 项目主要用的是哪些模型?除了公司内部提供的模型,有没有考虑过自己微调(说了大模型有温度这样的参数
  10. 什么 Java 线程模型(回答的 JMM 内存模型,应该是问的这个)
  11. MySQL 事务隔离级别?默认是哪个?可重复读比前面一个级别多解决了什么问题?怎么解决的?
  12. AI Coding 提效是怎么做的,有没有经验可以分享(我说封装了两个 Skill,反问环节面试官说 AI Coding 不太行,应该是这里没回答好)
  13. 知道 SDD 吗,Spec Drived Development(我说的就是使用 AI 的 plan 模式,是这里说错了导致面试官觉得我不懂 AI coding)
  14. 算法:求一个数组中除了自己其余所有数的乘积(好简单的题,边界条件没处理好写了25分钟😭)
  15. 组里做什么的,你做的和一面面试官一样吗?(最后发现组里不只有风控,而是很多东西);
  16. 觉得我有哪些可以提升的?(AI Coding 需要看看;Agent 开发要多去了解业界的方案,多思考;多刷算法题

《参考解析》

  1. MySQL深度:MySQL InnoDB使用B+树索引,支持ACID事务。关键知识点:聚簇索引(主键索引)叶节点存完整行数据;辅助索引叶节点存主键值(需回表);MVCC通过undo log版本链+ReadView实现多版本并发控制,解决脏读/不可重复读;事务隔离级别从低到高:读未提交→读已提交→可重复读(默认)→串行化。

  2. RAG与大模型:RAG(检索增强生成)流程:文档切片→向量化(Embedding)→存向量数据库→检索时将query向量化→TopK语义检索→将相关文档拼入prompt→LLM生成。优化:混合检索(语义+关键词)、重排序Rerank、查询改写、上下文压缩。评估:召回率(relevant docs retrieved/total relevant)、精确率、Answer相关性。

  3. 算法题解析:常用算法思路:动态规划(状态转移方程,自底向上);BFS/DFS(图遍历,BFS找最短路,DFS回溯);双指针(有序数组去重/两数之和);滑动窗口(子串/子数组问题);二分查找(有序或单调性)。时间复杂度分析:关注最坏情况和平均情况。