close
臺灣之音立刻下載官方APP
開啟
:::

不讓簡體中文獨占 國科會今釋出具台灣特色大型語言模型

  • 時間:2024-04-15 17:50
  • 新聞引據:採訪
  • 撰稿編輯:楊文君
不讓簡體中文獨占 國科會今釋出具台灣特色大型語言模型
國科會吳政忠。(資料照/國科會)

ChatGPT持續深入民間,但中文的訓練資料以簡體中文最多,國科會主委吳政忠今天(15日)宣布釋出 TAIDE-LX-7B模型,這是一款結合台灣文化的大型語言模型,具有繁體中文的文本生成能力,並且更具有「台灣特色」與「可信任性」,現在即可以進入TAIDE官方網站下載使用。

國科會發布新聞稿指出,國科會自去(2023)年初推動可信任生成式AI發展先期計畫(Trustworthy AI Dialogue Engine,簡稱TAIDE),透過此次模型釋出,將能更進一步協助我國政府在生成式AI模型發展路上,提供更多元與多樣化的服務,幫助產學研快速導入生成式AI。

國科會解釋,與現今其他大型語言模型不同之處,TAIDE-LX-7B模型具有繁體中文的文本生成能力,在Meta Llama-2-7B的基礎上,透過額外擴充繁體中文字元、字詞,使得生成的文本更加流暢、精準,並且更具有「台灣特色」。TAIDE-LX-7B模型釋出版相當於汽車的引擎,後續搭配各式零件、組裝車殼,就可以化身成不同用途的車輛運具,提供消費者使用。

國科會強調,訓練模型所使用的文本資料,皆以合法取得授權的文本數據進行訓練,此一過程確保模型本身強調的「可信任性」,透過「可信任性」的文本協助TAIDE-LX-7B模型加強台灣文化、用語與國情等知識,從而產生豐富多樣的文本內容。另加強訓練5大功能,包括自動摘要、寫信、寫文章、中翻英、英翻中等,並開發出多輪問答的對話能力,讓模型可以透過已生成的文本內容,接續使用者的指令,產出更符合需求的文本。

至於如何下載應用?國科會說,現在即可以進入 TAIDE官方網站(https://taide.tw/),了解模型發展目標與歷程,並點入網站上「TAIDE模型」連結(https://taide.tw/index/download-model),再進入該頁面中提供的Huggingface連結下載,就可開始使用並體驗具有台灣特色的大型語言模型。

相關留言

本分類最新更多