想要优化算法团队,并在构建内部竞争机制基础上,沉淀出具有高竞争力的算法策略。
主要职责:
项目目标:
构建类似于 Kaggle、阿里天池的算法竞赛平台,能同时进行多个算法比赛,支持整个算法团队提交策略进行打榜 PK,并通过一定的反馈机制辅助算法团队改良策略。
主要职责:
-
从 0 到 1 负责竞赛平台的后端建设,涵盖后端服务的数据库设计、服务接口设计到整个系统流程设计,与 Docker 以及后来 K8S、ceph、juicefs 等组件的交互。
-
扩展竞赛平台功能,对接标注平台、模型平台等平台,以满足不同的比赛评估需求。
-
优化竞赛平台使用方体验,包括策略运行的反馈机制优化、前端请求优化、评估机制优化、运行顺序与排队机制优化等等。
构建一个类似于 Kaggle 的算法竞赛平台,包括创建算法比赛、提交被测服务、被测服务评估、日志查看、排行榜统计等功能。区别于其他平台的是,本平台主要使用 Docker 镜像进行评测,同时支持 Helm Chart 等其他形式的评测服务。
主要职责:
-
从 0 到 1 负责平台的后端建设,涵盖接口设计、数据库设计、评测机制、异步处理和权限管理等。
-
构建和优化评测服务的测试机制,确保系统稳定性和高效性。
工作内容:
-
评测服务容器化及调度:
- 为了实现评测程序在 Kubernetes 集群上的运行,选择使用 Helm Chart 部署评测服务,配置了评测程序的 CI 流程,并要求评测程序提交 Helm Chart 形式的被测服务,确保部署的灵活性和可迁移性。
-
资源优化与并行处理:
- 针对评测程序的资源利用率,优化了评测数据集的运行模式,从串行处理多个数据集改为并行处理单个数据集,显著提升了评测效率和资源利用率。
-
异步评测结果处理:
- 设计并实现了评测结果的异步处理机制,通过 MaxWell 读取 MySQL binlog 并写入 Kafka,使用定时任务消费 Kafka 数据以合并多数据集的评测结果,确保系统的可靠性。
-
权限管理功能:
- 综合考虑不同用户的接口权限需求,选择使用 RBAC 权限管理机制,通过请求头中的 Bearer Token 识别用户并进行接口权限控制,确保系统