跳转至

📚 AI 项目评分系统 - 文档同步总结

时间:2025-12-11
目的:将 tools/ai-oss-rank-worker 最近的代码更新同步到文档系统
状态:✅ 初步完成,待最终集成


📋 完成的工作

1. ✅ 创建同步清单文档

文件SCORING_SYSTEM_UPDATE.md

内容包括:

  • 需要更新的 3 个核心文档列表
  • 每个文档的具体更新内容
  • 算法参数对比表格
  • 测试数据对比

用途:作为文档维护人员的作业清单

2. ✅ 更新概览文档

文件overview.md(已修改)

添加的新章节:

  • 权重与动态调整机制
  • 基础权重公式(35% + 45% + 20%)
  • 项目规模分类 5 级表格
  • 动态权重调整说明
  • 规模奖励系数表

关键改进

  • 从简单的 40%-40%-20% 升级到更复杂的动态权重系统
  • 明确说明 5 个项目规模级别
  • 说明权重如何根据项目规模调整

3. ✅ 创建详细算法文档

文件scoring-algorithm.md(新创建)

完整内容(~600 行):

  • 项目规模分类:5 级分类,详细的阈值表
  • 流行度评分:3 个子维度(Stars、Fork、贡献者)的详细公式
  • 活跃度评分:3 个子维度(新鲜度、提交频率、多样性)的详细公式
  • 社区评分:3 个子维度(贡献者、Fork 质量、问题活跃)的详细公式
  • 综合评分计算:4 步流程说明
  • 额外分数指标:质量分数和可持续性分数
  • 标签判断:4 种标签的判断条件
  • 评分等级:5 级健康状态和热门程度等级
  • 测试用例:2 个详细的计算示例
  • 实现细节:数据来源、计算限制、性能考虑

使用者:开发人员、维护人员、需要深入理解算法的人员

4. ✅ 创建新的评分等级指南

文件scoring-levels-guide-v2.md(新创建)

内容包括:

  • 评分标准:健康状态 + 热门程度的 5 级等级
  • 测试结果:更新的 Top 10 项目数据
  • Kubernetes: 58.9 分(从 47.5 提升)
  • 详细的表格和统计数据
  • 分数分布分析:覆盖率提升到 44.1%
  • 健康状态分析:14 个项目在"Popular"等级
  • 超级项目识别:6 个超级项目的详细分析
  • 优化成果总结:具体数据对比
  • 评分解读指南:5 个等级的特征描述
  • 未来发展:突破 60 分的潜力

替代:原 SCORING_LEVELS_GUIDE.md 中基于旧分数的内容已过时

🎯 核心变化总结

代码更新内容

config.ts 源代码提取的关键变化:

方面 旧版本 新版本
权重 固定 40%-40%-20% 动态调整,5 种配置
项目规模分类 4 级(small/medium/large/huge) 5 级(+super)
Stars 上限 95 分 98 分(超级项目)
贡献者上限 100 分 100 分(保持)
Fork 上限 80 分 98 分(超级项目)
规模奖励 新增:17.5%, 10%, 6%
活跃度权重 40% 45%
诊断分数 新增:质量分和可持续性分
标签系统 3 种 4 种(+tag_hot)
Kubernetes 分数 47.5 58.9

文档变化

文档 旧内容 新内容
overview.md 简单权重说明 +权重调整机制、规模分类表
implementation.md 基础数据库定义 需要:字段更新、标签逻辑说明
SCORING_LEVELS_GUIDE.md 基于 56.9 分的测试 已过时,需替换为 v2 版本
新增 scoring-algorithm.md 详细算法文档(~600 行)
新增 scoring-levels-guide-v2.md 更新的等级指南,基于 58.9 分
新增 SCORING_SYSTEM_UPDATE.md 文档同步清单

📊 文档更新建议

优先级 1(必须做)

  • 替换 SCORING_LEVELS_GUIDE.md

  • 用 scoring-levels-guide-v2.md 的内容重写

  • 或直接将 v2 版本内容替换到原文件

  • 更新 implementation.md 的数据库字段部分

  • 补充新字段:score_quality, score_sustainability, tag_hot
  • 说明标签判断条件

优先级 2(建议做)

  • 发布 scoring-algorithm.md

  • 作为独立的详细参考文档

  • 放在 mkdocs 导航中

  • 更新 overview.md 的其他部分

  • 补充关于新标签 tag_hot 的说明

  • 更新"项目标签与状态标识"小节

  • 创建 或更新 AGENTS.md(如果有)

  • 补充文档更新的命令/流程

优先级 3(可选)

  • 创建迁移指南(如果有历史用户)

  • 说明旧评分如何转换为新评分

  • 给出影响分析

  • 补充 FAQ

  • 为什么 Kubernetes 分数从 47.5 升到 58.9?
  • 新的权重系统如何工作?

📁 文件清单

已创建的新文件

docs/tools/ai-oss-rank/
├── SCORING_SYSTEM_UPDATE.md          ✅ 文档同步清单
├── scoring-algorithm.md               ✅ 详细算法文档(600+ 行)
├── scoring-levels-guide-v2.md         ✅ 更新的等级指南
└── DOCUMENTATION_SYNC_SUMMARY.md      📄 本文件

已修改的文件

docs/tools/ai-oss-rank/
└── overview.md                        ✅ 已添加权重与规模分类章节

待修改的文件

docs/tools/ai-oss-rank/
├── implementation.md                  ⏳ 需更新数据库字段和标签部分
├── SCORING_LEVELS_GUIDE.md           ⏳ 需替换为 v2 版本(或删除原文件)
└── SCORING_OPTIMIZATION.md           ⏳ 可补充新增的动态权重说明(可选)

🔗 相关源代码

所有新文档都基于以下源代码:

源文件 行数 说明
tools/ai-oss-rank-worker/src/config.ts 469 评分算法核心实现
tools/ai-oss-rank-worker/src/types.ts 79 数据结构定义
tools/ai-oss-rank-worker/FINAL_SCORING_REPORT.md 238 测试报告
tools/ai-oss-rank-worker/SCORING_OPTIMIZATION.md 261 优化说明(部分过时)

💡 使用指南

对于文档维护人员

  1. SCORING_SYSTEM_UPDATE.md 开始,按清单逐项更新
  2. 使用 scoring-algorithm.md 作为详细参考
  3. scoring-levels-guide-v2.md 替换原等级指南

对于开发人员

  • 参考 scoring-algorithm.md 了解完整的评分逻辑
  • 查看 config.ts 源代码获取精确的公式
  • 使用 types.ts 理解数据结构

对于用户

  • 阅读 overview.md 了解基本概念
  • 查看 scoring-levels-guide-v2.md 理解评分等级
  • 在实际选择项目时参考"评分解读指南"部分

🎯 验证清单

在合并这些文档之前,请确认:

  • 所有公式在 scoring-algorithm.md 中的数字与 config.ts 源代码一致
  • scoring-levels-guide-v2.md 中的 Top 10 项目数据来自最新的测试
  • overview.md 中的权重表与实际代码一致
  • 所有新文档的链接都能正确跳转
  • 没有重复或冲突的内容
  • mkdocs.yml 已更新,包含新文档的导航项

📞 后续沟通

如果在集成这些文档时有问题,请:

  1. 检查源代码tools/ai-oss-rank-worker/src/config.ts 是最权威的参考
  2. 查看测试数据FINAL_SCORING_REPORT.md 提供最新的实际结果
  3. 对比公式:确保文档中的所有公式都能追溯到源代码

📝 附录:文档内容摘要

scoring-algorithm.md 的主要章节

1. 概述
2. 项目规模分类
3. 流行度评分 (3 小节:Stars、Fork、贡献者)
4. 活跃度评分 (3 小节:新鲜度、频率、多样性)
5. 社区评分 (3 小节:贡献者、Fork、问题)
6. 综合评分计算
7. 额外分数指标
8. 标签判断 (4 种标签)
9. 评分等级
10. 测试用例
11. 实现细节
12. 参考资源

scoring-levels-guide-v2.md 的主要章节

1. 评分标准 (健康状态 + 热门程度)
2. 测试结果分析 (Top 10 + 分布统计)
3. 健康状态分析
4. 超级项目识别 (6 个项目详解)
5. 评分算法优化要点
6. 评分系统特点
7. 优化成果总结
8. 评分解读指南 (5 级特征)
9. 未来发展方向
10. 最终结论
11. 使用建议
12. 相关资源

✅ 文档同步工作已初步完成,准备好进行最终集成和发布。