你需要独立或协作完成以下四个核心模块的开发与拼装 1 编写高性能分布式爬虫,实时抓取并清洗政企公开招投标讯息,要求能有效对抗主流的反爬虫机制(IP 墙、滑块验证、动态 Token 逆向等) 2 基于文本格式的 DXF 文件,编写空间几何计算脚本,自动提取多边形顶点坐标、计算闭合面积与延米,并与标准定额数据库进行映射 3 搭建本地向量数据库(如 Chroma/Milvus),对历史标书进行切片