近日,中國石化建設的“石油化工行業(ye) 通用高質量數據集”成功通過工業(ye) 和信息化部電子工業(ye) 標準化研究院測評,成為(wei) 國內(nei) 首個(ge) 通過國家標準測評的行業(ye) 高質量數據集。
此次測評依據國家標準《高質量數據集 質量評測規範》(TC609-5-2025-04),通過“數據+模型”相結合的測評方法,涵蓋數據集說明文檔、數據質量、模型應用3大維度17項指標,對數據集進行多維度全鏈條質量評估。“石油化工行業(ye) 通用高質量數據集”包含行業(ye) 特定術語、公式、分子式等,在格式規範性、內(nei) 容一致性、內(nei) 容幹淨性指標上得分均超90分,數據質量達到行業(ye) 領先水平,充分驗證其在支撐人工智能深度應用方麵可靠性。
該數據集有力支持了中國石化長城大模型訓練,以及分子理解、分子生成、審計等專(zhuan) 業(ye) 大模型訓練,自主研發的高質量數據集全鏈路工具套件為(wei) 係統內(nei) 86家單位近900個(ge) 用戶開展數據加工處理工作提供支撐。同時,其標準化構建方法也為(wei) 石油化工行業(ye) 提供了可參考的建設範本。




新手指南
我是買家
我是賣家

