遇到的问题:一是PRD中给出的知识卡片模板与晋强前期使用的模板存在不一致,需要明确以哪个为准(会议中确认以PRD版本为准,但允许根据实际需要修改)。二是甲方提供的文件中有大量历史性数据(如过往年份的名额分配、历史分数线等),这些内容是否需要全部入库存在疑问——全量入库工作量巨大且部分内容对当前系统意义有限。三是表格类文件的处理效果不理想,尤其是格式不规范的Excel表格,使用MinerU等工具解析后效果较差。张文辉目前的变通方案是将规范格式的Excel先另存为CSV文件,再将逗号分隔符替换为Markdown表格的竖线分隔符,手动添加表头后转为Markdown表格。