GitHub Star明码标价5毛/颗，AI项目刷假星最猛

348 0 0

文章摘要

卡内基梅隆大学的研究揭示，GitHub 平台上存在严重的虚假标星现象，这项被顶会收录的研究把造假产业扒了个底朝天。研究团队开发的检测工具识别出约 600 万颗假星，涉及超过 1.8 万个仓库及 30 万个造假账号。人工智能与大语言模型项目成为假星重灾区，造假行为导致平台数值膨胀，几万像素的项目不再稀罕。检测准确率高达 81%，部分仓库甚至九成以上标星均为虚假，原来是因为买得起且产业化程度高。

造假已形成成熟产业链，售卖渠道公开且支持程序化购买，市面上至少有十二个网站公开售卖。假星价格分层明显，廉价版每颗仅 0.03 至 0.10 美元，主打极致性价比，高端版则接近 1 美元以模拟真人行为。更有甚者专门培养带有多年贡献记录的高价账号，售价可达 5000 美元。这种精细化伪装路线附带售后保障，承诺长期锁星以避免被平台清理，使得虚假热度难以被普通用户察觉，伪装逻辑达到了极致。

创业者购买标星的主要动机在于获取融资，单纯的技术优势很难快速打动投资人。投资机构常将星数作为筛选项目的核心硬指标，种子轮与 A 轮融资均有明确的星数中位数门槛。粗略核算下来，刷星投入的投资回报率最高能达到 117000 倍，极低的包装成本对应着百万美元级的融资收益，驱使创业者通过计算器算账后选择造假。权威榜单中的明星项目也被发现近半标星疑似造假，导致恶性闭环形成，更多人跟进买星。

研究显示假星仅有两个月左右的短期效果，时间一长反而会拖累真实热度，造成负向影响。面对不可信的星数，投资者与开发者应关注更硬核的指标，先看提交日期再看项目年龄和更新频率。判断项目好坏最终还是得回头看提交日期、更新频率、问题处理及代码质量等硬指标，毕竟虚假数据无法带来真正的代码贡献与修复。开源生态的健康发展需要摆脱对单一流量指标的依赖，回归技术价值本身，虽然可以买星但买不来修漏洞的贡献。