钉钉暑期实习 Java 研发一面面经

钉钉 · Java 研发工程师 · 一面 · 2026-04

OCR与图表提取：OCR通过CNN/Transformer提取视觉特征，再配合序列解码。图表理解通常先进行目标检测（识别图表区域），再针对特定图元（如柱、饼）进行坐标映射与占比计算，评估多用IoU、WER（识别准确率）及语义对齐度。
RAG架构（ES+Milvus）：ES处理结构化关键词查询（BM25），Milvus处理向量语义召回。融合通常通过加权融合或Rerank（重排序模型，如BGE-Rerank）对召回结果进行二次排序，以提升Top-K相关性。
Embedding与Token：768维是BERT-Base的产物，平衡了性能与计算开销。Token是模型处理的最小单位（子词），受上下文窗口限制主要是因为Attention机制的计算复杂度是O(n²)。
Prompt/Context/Harness Engineering：Prompt Engineering是单轮指令优化；Context Engineering侧重RAG流水线，解决幻觉；Harness Engineering指复杂Agent的工作流编排与逻辑控制。
JVM：标记清除适合存活对象少的场景，标记整理（Mark-Compact）用于避免内存碎片，适合存活对象多的老年代。存活时间通过对象头部的GC分代年龄（Age）字段记录。

相关面经