各市工業和信息化局,相關單位:
為貫徹落實《山東省“十四五”數字強省建設規劃》《山東省“十四五”大數據產業發展規劃》《山東省關于加快大模型產業高質量發展的指導意見》等文件要求,加快推動工業領域重點行業數據匯聚流通和創新應用,以“產業大數據+行業大模型”賦能特色優勢行業數智化轉型,現組織開展2025年工業領域重點行業產業數據倉和知識語料庫征集工作。有關事項通知如下:
一、申報方向
(一)產業數據倉
申報單位面向全省高端裝備制造、新材料、新能源、新一代電子信息、綠色化工、生物醫藥、智能家電、食品加工等重點工業行業,選擇其中一個或多個細分行業,以產業數智轉型場景為驅動,通過采集、合成、治理等數據處理過程,匯聚公共數據、產業數據和企業數據,形成行業高質量數據集,包括行業通識和行業專識數據集。數據集類型包括結構化數據、文本、視頻、音頻、圖形圖像等多模態形式。
(二)知識語料庫
申報單位聚焦工業研發、設計、生產、管理、服務等關鍵環節和特定場景,通過收集生產流程描述、設備運行數據、工藝參數、質量檢測報告、故障診斷記錄、供應鏈信息、企業管理文檔等語料資源,對語料進行清洗、去噪和統一格式,并對整理后的語料進行標注,形成直接用于行業大模型或場景大模型開發、訓練和微調的高質量語料庫。語料庫類型包括各類文本、表格、圖像、音頻、視頻等格式。
二、申報條件
(一)申報單位為依法設立并具有獨立承擔民事責任能力的企事業單位,聯合申報單位應包含大模型開發重點企業、傳統行業龍頭企業、科研實力雄厚的高校院所等。
(二)申報單位經營狀態正常,符合產業發展方向;近三年內未發生過較大以上安全生產事故,無嚴重失信記錄,未被列入經營異常名錄;符合財政涉企資金“綠色門檻”制度要求。
(三)產業數據倉申報單位應具備行業核心數據積累,包括生產制造、供應鏈、市場消費、技術創新等全鏈條數據,數據規模、質量及標準化程度較高,應用區塊鏈、隱私計算、數據沙箱等安全可信技術實現數據確權、分級分類管理和安全共享。
(四)知識語料庫申報單位應具備較強的工業領域專業知識和技術實力,熟悉工業生產流程和數據處理方法,具備語料收集、整理、標注所需的軟硬件設施和專業團隊。申報的大模型語料庫應具有較高應用價值,能夠支持業務應用場景落地,支撐人工智能大模型開發和訓練,并具備定期更新機制,符合國家數據安全與合規相關要求。
三、工作流程
(一)組織申報。各市工信局統籌轄區內項目申報工作,組織有關單位填報《項目申報書》(附件1),并于3月20日前將推薦匯總表及項目申報書材料(word版和蓋章掃描件各一份)報送至郵箱:cytjc@shandong.cn。
(二)評審公布。省工業和信息化廳將組織專家或第三方專業機構對申報項目進行評審,重點評估產業數據倉和知識語料庫的完整性、可用性和應用價值等,確定符合條件的申報項目及承擔單位,經公示無異議后予以公布。
(三)動態跟蹤。申報單位按照數據倉和語料庫更新要求,定期提交更新進展。省工業和信息化廳將建立項目庫,對未覆蓋的細分行業和領域,滾動開放補報通道。
(四)成果推廣。省工業和信息化廳聯合行業協會、產業聯盟等舉辦“人工智能應用專場對接會”系列活動,將符合推廣條件的數據倉和語料庫面向大模型企業進行全省推廣,并擇優推薦申報國家級示范項目。
四、聯系方式
聯系人:陳倩倩 0531-51782725
郵 箱:cytjc@shandong.cn
附件:申報表.docx
山東省工業和信息化廳
2025年2月19日