会员登录 - 用户注册 - 设为首页 - 加入收藏 - 网站地图 海天瑞声推千万轮对话预料库 7.9亿定增募资拟投向AI大模型训练数据集建设等项目!

海天瑞声推千万轮对话预料库 7.9亿定增募资拟投向AI大模型训练数据集建设等项目

时间:2024-05-05 17:35:19 来源:煊昱头条 作者:探索 阅读:961次
7月27日,海天海天瑞声宣布正式推出‘中文千万轮对话语料库DOTS-NLP-216’。瑞声

  海天瑞声方面分析认为,推千当前在中文对话领域,对话定增公开的预料数据集往往量少、分布有偏、库亿价格昂贵甚至不能商用。募资模型导致一些大模型在中文对话方面的拟投能力,相比英文对话略逊一筹。向A训练项目尤其是数据设在一些需要比较深的中文语言理解能力的对话场景,无论开源的集建还是闭源的大模型,都往往表现不佳。海天

  海天瑞声方面表示,瑞声真实场景采集,推千符合中文表达习惯的对话定增自然对话数据,将为中文大语言模型(LLM)带来新动能。

  据海天瑞声方面介绍,此次发布的数据集,是一个符合中国人表达习惯的自然对话数据集,共计约1000万轮,上亿级token(标记)。

  此前,海天瑞声发布公告称,拟定增募资不超过7.9亿元,其中,3.83亿元计划用于“AI大模型训练数据集建设项目”,4.07亿元计划投向“数据生产垂直大模型研发项目”。

  海天瑞声在公告中表示,在人工智能产业进入以大模型为代表的新的发展时期,通过本次募投项目的实施,公司将建设一批适用性较强的大模型训练数据集,拓展潜在高增长价值的新型业务板块,并藉此进一步扩大公司业务规模;同时,以研发海天瑞声数据生产垂直大模型为核心,升级海天瑞声一体化技术支撑平台,研发并引入多项新兴技术,促进公司科技创新水平的不断提升,巩固公司的核心技术壁垒,构建长期技术实力支撑,从而进一步增强公司核心竞争力。

(责任编辑:热点)

相关内容
  • 高雲地利 對 昆士柏流浪
  • 湖南丝袜门新进展:胡某用黑丝袜打开了一扇大门
  • 7月18日汇市观潮:欧元、英镑和日元技术分析
  • 美媒:TikTok变老滤镜风靡美国,有人焦虑有人惊讶
  • 表忠心! 德泽尔比:我想要留在布莱顿 我爱这座城市
  • 传智教育(003032.SZ):上海创稷、天津心意云后续拟减持合计不超2.20%股份
  • 消息称因拼写错误,数百万美国军方机密电子邮件被发送到马里
  • 只有一种可能的抵挡:不必认真对待|昆德拉读书笔记
推荐内容
  • 李斯特城 對 布力般流浪
  • 福特汽车跌超5% 电动F-150 Lightning皮卡降价至多1万美元
  • 微软收购动视暴雪交易扫清一大障碍:索尼终于与其达成《使命召唤》协议
  • 缩量三连阳,通富微电或将迎来大涨?看13次回测数据
  • 稳了!暴雪正式发布魔兽世界和炉石传说国服版本!网易继续游戏测试!
  • 侃股:秀强股份的股民不能吃哑巴亏