发展台版 ChatGPT,国科会最快 4 月中旬开源 TAIDE-7B 版本

发展台版 ChatGPT,国科会最快 4 月中旬开源 TAIDE-7B 版本

国际大型语言模型多以简体中文资料进行训练,容易发生资讯偏误或不符中国台湾文化和价值观,为此国科会自去年 4 月启动 TAIDE(Trustworthy AI Dialogue Engine,可信赖 AI 对话引擎)计划,打造专属中国台湾的大型语言模型。

TAIDE 团队盘点公私部门资料并个别洽商授权,整理出共 89.4GB 优质繁体中文资料,并建置 GPU 运算资源,去年 12 月已与中国台湾杉二号完成整合,提供运算服务。TAIDE 团队目前开发出 TAIDE-7B(可商用版本)和 TAIDE-13B(学研用版本)模型,具备多轮对话和阻绝产生不恰当回应的能力。

TAIDE 在写文章、写信、摘要、英翻中、中翻英五大任务表现与背后采用 GPT 3.5 模型的 ChatGPT 相当,尤其写文章、写信、摘要的测试得分比 ChatGPT 更好。

TAIDE 团队将与合作伙伴探讨新应用,重点包括支援公部门导入 TAIDE。国科会主委吴政忠 20 日向媒体表示,最快今年 4 月中旬开源释出 TAIDE-7B 版本,不仅可供外界自由运用,未来有望将模型内建在电脑、手机等装置内。

吴政忠也强调,无论民众询问 ChatGPT 或者 TAIDE,都要有自己判断的能力。“最后负责任的还是真正的人,是自己,这个观念一定要有,不要问完就丢出去,这是完全不对的”,他表示。

除此之外,中研院院长廖俊智 20 日赴立法院业务报告也表示,为丰富 TAIDE 资料库,会在不违反智慧财产权法规限制下,会尽量开放中研院资料库协助训练 AI 模型。

发展中国台湾专属的大型语言模型极为重要,最终目标将是整合 TAIDE 让 AI 应用落地、让全民有感。

(首图为国科会主委吴政忠,首图来源:AI资源网)

延伸阅读:

  • 肯定 TAIDE 最新测试版,唐凤:可用来回中英文邮件
  • 中国台湾可信任 AI 对话引擎,参数量拼扩增至 700 亿
  • 吴政忠:中国台湾须有 AI 基本法,台版 ChatGPT 资料库拼多元
  • 台版 AI 对话引擎年底释出大模型,奠定商业版发展基础
  • 繁体中文语料为基础,台版 AI 对话引擎初步已具 4 大实用功能

   特别声明    本页内容仅供参考,版权终归原著者所有,若有侵权,请联系我们删除。