携程二面 - Java后端开发暑期实习
《面试题目》
面试官比较严肃,面试全程40min,没有考察算法,问的问题都不是很深,有时候想聊深一点面试官又换问题,大部分围绕个人素养进行提问,都比较稳的接住了,以下是面经:
- 一、项目
- RAG项目介绍。
- RAG项目中遇到什么问题,怎么解决的?
- 向量数据库用的是什么?
- 分块是怎么做的,有其他方案吗?
- 为什么要做向量化,直接文本匹配不行吗?
- 问题重写拆分是怎么做的?为什么需要术语归一化?
- 你的回答是业务上常见的解决方案,有没有其他比较特殊的业务或者解决了市面上少见的痛点。
- 项目是真实的吗?
- 在项目开发中是怎么进行权衡利弊或者方案选择的?
- 二、偏生活问题
- 有没有遇到过一些困难,怎么解决?
- 平时是怎么学习的?为什么要学?
- 看过什么书进行学习?为什么选这本书来学习?
- 从文档/书中学到什么思想?
- 自己有什么优点,有什么不足?
- 有没有面试过其他的公司?有没有从面试中收获到什么?
- 三、八股
- 除了MySQL有没有用过其他数据库?
- MySQL是什么场景下合适使用,什么场景下不合适使用,还是说MySQL是万能的?
- 和面试官争论 MySQL 的redolog机制是否一定安全,如果不安全,那怎么保证一定安全?
- 平时缓存是用在什么地方?
- 为什么要用延迟双删?什么场景下可以用?
- 四、反问
- 项目组中有没有涉及agent开发的业务?
- 项目组对一个实习生的要求是什么?
《参考解析》
-
MySQL深度:MySQL InnoDB使用B+树索引,支持ACID事务。关键知识点:聚簇索引(主键索引)叶节点存完整行数据;辅助索引叶节点存主键值(需回表);MVCC通过undo log版本链+ReadView实现多版本并发控制,解决脏读/不可重复读;事务隔离级别从低到高:读未提交→读已提交→可重复读(默认)→串行化。
-
Redis核心:Redis常用数据结构:String/Hash/List/Set/ZSet。持久化:RDB(定期快照,恢复快,数据可能丢失)和AOF(追加日志,数据安全,文件大)。缓存穿透用布隆过滤器;缓存雪崩加随机过期时间+多级缓存;缓存击穿用互斥锁或逻辑过期。分布式锁用SET key value NX PX + Lua脚本保证原子释放。
-
RAG与大模型:RAG(检索增强生成)流程:文档切片→向量化(Embedding)→存向量数据库→检索时将query向量化→TopK语义检索→将相关文档拼入prompt→LLM生成。优化:混合检索(语义+关键词)、重排序Rerank、查询改写、上下文压缩。评估:召回率(relevant docs retrieved/total relevant)、精确率、Answer相关性。
-
算法题解析:常用算法思路:动态规划(状态转移方程,自底向上);BFS/DFS(图遍历,BFS找最短路,DFS回溯);双指针(有序数组去重/两数之和);滑动窗口(子串/子数组问题);二分查找(有序或单调性)。时间复杂度分析:关注最坏情况和平均情况。