Reppo 将 AI 训练数据转化为一个实时市场。
参与者发布内容、投入资本、对质量进行投票,并在此过程中生成可用的学习信号。
Reppo 由以下部分组成 datanets.
每个数据网都定义自己的访问规则、发布费用、激励措施和质量标准。这使不同的市场能够围绕不同的任务、领域和买家进行专业化分工。
发布者将文本、图像、视频、音频、标注或智能体生成的输出提交到选定的数据网中。
提交并非免费。发布费用迫使贡献者就哪些内容值得投入市场做出经济决策。
3. 投票者锁定 REPPO 以获得 veREPPO
投票者锁定 REPPO 以获得 veREPPO,这赋予他们投票权。
这种投票权存在于网络层面。随后可以将其分配到各个数据网和周期中。
4. 市场在每个周期内持续重新定价
投票者运用有质押支持的判断来支持或反对他们认为有价值的内容。
在一个周期内,投票权会随时间线性衰减。较早的投票比后来的投票权重更高,这奖励的是早期的坚定判断,而不是后期的跟风势头。
由于投票是持续进行的,随着新信息出现,较弱的立场可以被挑战。见 对抗鲁棒性 以了解更深入的机制设计。
每一次提交、排名、选择和投票都会生成结构化的人类反馈。
这些反馈会成为 AI 系统有用的训练数据。见 收集方法 以获取示例。
6. 费用、激励和声誉强化质量
奖励可以来自网络发行和数据网层面的激励计划,具体取决于市场的配置方式。
与此同时:
数据网所有者可以为他们希望发展的市场提供资金并塑造其发展方向
随着时间推移,表现出色的参与者会建立起声誉和绩效记录。这提升了发现效率、信任度以及下游需求。
Reppo 不只是收集反馈。它正在把经济上的坚定判断转化为一个用于学习信号的实时市场。
随着时间推移,这个市场旨在奖励信号发现并惩罚低质量噪声,不是通过静态审核,而是通过开放的经济竞争。