(資料圖片)
人民網上海7月 7日電 (記者唐小麗)今天下午,正值2023世界人工智能大會舉辦期間,由語言智能科技企業蜜度主辦的“語言智能與內容生成高峰論壇”在上海世博展覽館舉行。論壇現場,蜜度發布了自研的國內首個專為智能校對領域打造的垂直大語言模型——蜜度文修。
蜜度文修正式發布。蜜度供圖
“‘唐宋八大家’之一的歐陽修曾任館閣校勘,校對,亦有修文之意,文修便取名于此。”蜜度智能校對事業部總經理張曉娟一語道出了名字的由來。
張曉娟介紹,蜜度文修以大語言模型為技術底座,通過運用高質量數據學習多種特色子任務,可以大幅度提升中文校對和潤色能力的智能化程度。“聚焦新聞出版、媒體稿件、政府公文等專業領域,蜜度文修能夠輔助專業用戶提高校對質量、提升校對速度、降低差錯率,為新時代語言文字工作高質量發展賦能。”
早在2020年,蜜度就推出了智能文本檢測服務,并以深度學習模型為方向,嘗試智能化解決基礎校對問題。蜜度還成立了多語言校對檢測實驗室,圍繞“文字標點差錯”“知識性差錯”“內容導向風險識別”三個主要能力開展建設。在去年的世界人工智能大會上,蜜度發布了支持本地化部署的蜜度校對通AI-Box,這也是首個通過華為昇騰AI生態認證的自然語言處理智能文本校對應用解決方案。今年年初,蜜度智能校對系統成功入選國家新聞出版署2022年出版業科技與示范創新項目“科技創新成果”。
今年4月,蜜度智能校對多語言版正式上線,除了漢字、英文之外,還覆蓋了蒙古文、藏文、維吾爾文、朝鮮文等12種少數民族語言文字。6月,蜜度正式推出中文潤色服務,重點解決用詞不當、句式雜糅等措辭與表述問題。
而今天,在世界人工智能大會的現場,蜜度推出全新的蜜度文修,讓大模型時代的全新工作范式走入校對場景,除了刷新多類校對任務的最佳效果之外,完善了過去較為薄弱的易混詞細微語義辨析難題,同時在尊重原意表達的基礎上,更好地修正句式雜糅、邏輯錯亂等問題,使句子表達更流暢,實現對句子的潤色功能。蜜度文修的發布,可以視為蜜度在大模型時代,采用與時俱進的前沿科技積極賦能垂直辦公場景的一次實踐。
關于全新發布的蜜度文修,張曉娟認為,創新點主要集中在兩個方面:一是引入多任務學習策略提升校對能力,設計了與校對任務密切相關的多種子任務,讓模型進行自監督學習,通過做關聯任務提升校對的智能化程度;其次,大幅度提升模型學習的數據質量,引入自動化手段對大規模數據進行質量評估,解決噪音數據對校對任務影響更為敏感的問題。
“其實,蜜度的產品一直深度活躍在各類辦公和業務發展場景里。”蜜度首席技術官劉益東談到,在前大模型時代,蜜度就用當時的新銳計算機技術幫助用戶實現辦公場景的數字化、智能化轉型升級,“現在,大模型讓我們的產品和服務更為強大,我們從客戶那里感知到的是,經由AI大幅度提升的效率和精準度,不僅讓用戶體驗更好,也讓業務增速更快。”