北京人工智能數據運營平台發布 已匯聚700萬億字節通用數據集
2024年06月15日13:11 | 來源:人民網-北京頻道
小字號
人民網北京6月15日電 (記者董兆瑞)6月14日下午,作為2024北京智源大會主題論壇之一,“人工智能+數據新基建”主題論壇召開。論壇上,北京人工智能數據運營平台正式發布。記者了解到,目前平台已匯聚超過700萬億字節的通用數據集和4.33萬億字節的行業數據集,為大模型行業發展提供數據支撐。
據介紹,北京人工智能數據運營平台是在國家發展改革委、國家數據局指導下,由北京市發展改革委主導,在市委網信辦、市科委、市經信局、海澱區政府、中國網絡空間安全協會人工智能安全治理專委會等單位支持下,由智源研究院牽頭與京能數產等單位共建推動成立開放型數據運營平台。
數據平台在實現數據的匯聚管理、處理與加工等功能基礎上,能夠提供多種模態的數據標注功能,支持多種數據匯聚和使用形式。目前平台已匯聚超過700萬億字節的通用數據集和4.33萬億字節的行業數據集,未來將不斷擴充數據規模,為大模型行業發展提供堅實的數據支撐。
目前,數據運營平台支持“開源開放”“積分共享”“數算一體”三種數據運營模式。“開源開放”模式允許用戶在遵守使用協議的前提下自由下載使用﹔“積分共享”模式面向數據工作組內的成員,根據數據貢獻實行積分制,即成員單位貢獻數據,按照計分標准獲取相應積分,同時獲得共享數據的權益﹔“數算一體”模式針對高價值數據,僅在平台上進行數據加工、訓練使用,保証數據不出安全域。
海澱區相關負責人表示,依托數據運營平台,海澱區會同智源研究院等單位積極推動政務、社會與企業數據開放共享,打破數據孤島。同時探索建設北京數據基礎制度先行區,統籌布局算力與數據存儲基礎設施,為數據資源創新應用提供技術與制度保障。
(責編:董兆瑞、高星)
分享讓更多人看到
- 評論
- 關注