随着AI公司走向成熟,高质量数据的争夺已经成为整个行业最激烈的战场之一,催生了Mercor、Surge等公司,其中最引人注目的是Alexandr Wang创立的Scale AI。但如今Wang已经转身执掌Meta的AI业务,许多投资人看到了机会,愿意为那些在训练数据收集方面拥有令人信服新策略的公司提供资金。

Y Combinator毕业生Datacurve就是这样一家公司,专注于为软件开发提供高质量数据。周四,该公司宣布完成1500万美元A轮融资,由Chemistry的Mark Goldberg领投,来自DeepMind、Vercel、Anthropic和OpenAI的员工参与投资。此前该公司还完成了270万美元种子轮融资,前Coinbase首席技术官Balaji Srinivasan参与了投资。

AI训练数据争夺战升级:Datacurve融资1500万美元,用赏金猎人模式抢夺高质量数据

Datacurve采用赏金猎人系统来吸引熟练的软件工程师完成最难获取的数据集。公司为这些贡献付费,迄今已分发超过100万美元的赏金。

但联合创始人Serena Ge表示,最大的动力并非金钱。对于软件开发这样的高价值服务来说,数据工作的报酬总是远低于传统雇佣关系,因此公司最重要的优势是积极的用户体验。

Ge说,我们把这当作一个消费产品来对待,而不是数据标注操作。他们花了大量时间思考如何优化,让他们想要的人感兴趣并进入平台。

这一点在训练后数据需求变得更加复杂的当下尤为重要。早期模型在简单数据集上训练,而今天的AI产品依赖复杂的强化学习环境,这些环境需要通过特定和战略性的数据收集来构建。随着环境变得更加复杂,数据要求在数量和质量上都变得更加严苛,这一因素可能会让Datacurve这样的高质量数据收集公司获得优势。

作为一家早期公司,Datacurve目前专注于软件工程领域,但Ge表示这种模式同样适用于金融、营销甚至医学等领域。

Ge解释说,他们现在正在做的是为训练后数据收集创建一个基础设施,吸引并留住各自领域的高水平人才。

在AI模型训练进入新阶段的背景下,数据质量的重要性正在超越数据数量。Scale AI曾经凭借规模化的数据标注服务占据市场主导地位,但随着Wang离开去Meta担任要职,市场格局开始松动。Datacurve的赏金猎人模式和消费产品思维,为这个竞争激烈的赛道带来了新的可能性。从投资阵容来看,来自顶级AI实验室员工的参与,本身就是对Datacurve数据质量和战略方向的最好背书。这场围绕高质量训练数据的争夺战,才刚刚进入新的回合。