开云kaiyun体育:北京人工智能数据运营平台公布 已集聚700万亿字节通用数据

  澳门威尼斯人     |      2024-06-20 05:04

  公民网北京6月15日电 (记者董兆瑞)6月14日下昼,行动2024北京智源大会主旨论坛之一,“人工智能+数据新基修”主旨论坛召开。论坛上,北京人工智能数据运营平台正式公布。记者理会到,目前平台已会聚赶过700万亿字节的通用数据集和4.33万亿字节的行业数据集,为大模子行业生长供应数据支柱。

  据先容,北京人工智能数据运营平台是正在邦度生长更动委、邦度数据局指引下,由北京市生长更动委主导,正在市委网信办、市科委、市经信局、海淀区政府、中邦搜集空间安闲协会人工智能安闲解决专委会等单元维持下开云kaiyun体育:,由智源商讨院牵头与京能数产等单元共修推进树立盛开型数据运营平台。

  数据平台正在完成数据的会聚办理、收拾与加工等效力根源上,或许供应众种模态的数据标注效力,维持众种数据会聚和运用式样。目前平台已会聚赶过700万亿字节的通用数据集和4.33万亿字节的行业数据集,改日将络续扩凑数据周围,为大模子行业生长供应坚实的数据支柱。

  目前,数据运营平台维持“开源盛开”“积分共享”“数算一体”三种数据运营形式。“开源盛开”形式承诺用户正在恪守运用契约的条件下自正在下载运用;“积分共享”形式面向数据任务组内的成员,按照数据奉献实行积分制,即成员单元奉献数据,依照计分轨范获取相应积分,同时获取共享数据的权利;“数算一体”形式针对高价钱数据,仅正在平台前进行数据加工、熬炼运用,保障数据不出安闲域。

  海淀区闭系掌握人吐露,依托数据运营平台,海淀区会同智源商讨院等单元主动推进政务、社会与企业数据盛开共享,打垮数据孤岛。同时探求成立北京数据根源轨制先行区,兼顾结构算力与数据存储根源步骤,为数据资源改进利用供应手艺与轨制保护。

开云kaiyun体育:北京人工智能数据运营平台公布 已集聚700万亿字节通用数据(图1)

  公民日报社概略闭于公民网报社任用任用英才广告任职配合加盟供稿任职数据任职网站声明网站讼师音讯爱惜闭系咱们

  人 民 网 股 份 有 限 公 司 版 权 所 有 ,未 经 书 面 授 权 禁 止 使 用