百度安全与效率平台java搜索一面
《面试题目》
实习拷打
- rag用了什么向量库,为什么
- 会话记忆压缩策略,滑动窗口和摘要压缩,怎么触发的
- 一个场景,1000个用户同时对话10轮,各自触发摘要压缩,从延迟,成本,一致性,限流方面设计
慢查询怎么优化
《参考解析》
-
RAG与大模型:RAG(检索增强生成)流程:文档切片→向量化(Embedding)→存向量数据库→检索时将query向量化→TopK语义检索→将相关文档拼入prompt→LLM生成。优化:混合检索(语义+关键词)、重排序Rerank、查询改写、上下文压缩。评估:召回率(relevant docs retrieved/total relevant)、精确率、Answer相关性。
-
算法题解析:常用算法思路:动态规划(状态转移方程,自底向上);BFS/DFS(图遍历,BFS找最短路,DFS回溯);双指针(有序数组去重/两数之和);滑动窗口(子串/子数组问题);二分查找(有序或单调性)。时间复杂度分析:关注最坏情况和平均情况。