百度安全与效率平台java搜索一面

百度 · 软件开发实习生 · 一面 · 山东 · 2026-06

《面试题目》

实习拷打

  1. rag用了什么向量库,为什么
  2. 会话记忆压缩策略,滑动窗口和摘要压缩,怎么触发的
  3. 一个场景,1000个用户同时对话10轮,各自触发摘要压缩,从延迟,成本,一致性,限流方面设计

慢查询怎么优化


《参考解析》

  1. RAG与大模型:RAG(检索增强生成)流程:文档切片→向量化(Embedding)→存向量数据库→检索时将query向量化→TopK语义检索→将相关文档拼入prompt→LLM生成。优化:混合检索(语义+关键词)、重排序Rerank、查询改写、上下文压缩。评估:召回率(relevant docs retrieved/total relevant)、精确率、Answer相关性。

  2. 算法题解析:常用算法思路:动态规划(状态转移方程,自底向上);BFS/DFS(图遍历,BFS找最短路,DFS回溯);双指针(有序数组去重/两数之和);滑动窗口(子串/子数组问题);二分查找(有序或单调性)。时间复杂度分析:关注最坏情况和平均情况。