headphones
树立 Crypto AI 新标杆:Cyber、EigenLayer、Sentient 等携手推出 Crypto AI Benchmark Alliance
行业速递
行业速递
authIcon
加密之眼
06-04 10:47
Follow

Cyber、EigenLayer、Sentient 等 14 家区块链与人工智能项目方今日共同宣布成立 Crypto AI Benchmark Alliance(CAIBA)。这一开源、社区驱动的联盟将致力于为加密行业的 AI 模型与智能体建立透明、可信的评测标准。

首批发起成员——Alchemy、Cyber、Dune、EigenLayer、Goldsky、IOSG、LazAI、Magic Newton、Metis、MyShell、OpenGradient、、Sentient 与 Thirdweb——会一起合作贡献数据集、工具与专业知识,共同搭建评测框架。每一套基准将包含任务、参考答案及评分脚本,并在 GitHub、Hugging Face 等平台以开放许可证(许可范围允许时)发布。

随着 AI 在加密领域的应用不断扩张,从交易策略到研究助手无所不包,传统 AI 基准已难以反映该行业的独特需求。CAIBA 旨在弥补这一空白,推出面向加密场景的专业评测。

“透明而严格的测试至关重要,”Cyber 联合创始人 Ryan Li 表示,“模型不仅要答对题,还必须可靠执行,让用户在决策时更有信心。”

联盟首个成果 a Benchmark for Crypto AI Agents(CAIA) 现已上线,它从三大维度衡量 AI 能力:

  • 知识(Knowledge):精准回答协议、代币等问题
  • 规划(Planning):制定多步骤任务方案
  • 行动(Action):借助区块浏览器和 API 完成操作

CAIA 覆盖了代币经济学、链上分析、项目研究及交易流程等场景,评测对象包括 GPT-4o、Claude 4、Gemini 2.5、DeepSeek-R1 等通用大模型,以及多款加密原生模型。

通过在真实任务中检验模型,CAIBA 为加密 AI 建立了统一、可复现的衡量标准,助力行业构建更可信的智能应用。联盟已在开发更多基准,并欢迎新成员加入。开发者、研究者和协议团队可提交模型参与评测,或提出全新任务。


关于 Crypto AI Benchmark Alliance(CAIBA)

Crypto AI Benchmark Alliance 是一个社区治理的开放联盟,专注于制定面向加密场景的 AI 评测标准。通过开放数据集、可复现任务与公共排行榜,CAIBA 为开发者、研究者和协议提供工具,衡量并改进区块链应用中的 AI 系统。了解详情,请访问 caiba.ai

Open the app to read the full article
DisclaimerAll content on this website, hyperlinks, related applications, forums, blog media accounts, and other platforms published by users are sourced from third-party platforms and platform users. BiJieWang makes no warranties of any kind regarding the website and its content. All blockchain-related data and other content on the website are for user learning and research purposes only, and do not constitute investment, legal, or any other professional advice. Any content published by BiJieWang users or other third-party platforms is the sole responsibility of the individual, and has nothing to do with BiJieWang. BiJieWang is not responsible for any losses arising from the use of information on this website. You should use the related data and content with caution and bear all risks associated with it. We strongly recommend that you independently research, review, analyze, and verify the content.
Comments(0)

No comments yet

edit
comment
collection
like
share