效果可达OpenAI同等模型96%,国产开源AI语言模型TigerBot
发布时间:2023-06-08 12:03 文章来源:IT之家 阅读量:11795
,国产多模态大语言模型 TigerBot 近日正式发布,包含 70 亿参数和 1800 亿参数两个版本,目前已经在 GitHub 开源。
据悉,TigerBot 带来的创新主要在于:
-
提出指令完成监督微调的创新算法提升模型可学习性
-
运用 ensemble 和 probabilistic modeling 的方法实现可控事实性和创造性
-
在并行训练上突破 deep-speed 等主流框架中的内存和通信问题
此外,该模型还针对中文语言更不规则的分布,从 tokenizer 到训练算法上做了更适合的优化。
据称,其中 TigerBot-7B-base 的表现“优于 OpenAI 同等可比模型” ,开源代码包括基本训练和推理代码,双卡推理 180B 模型的量化和推理代码。数据包括 100G 预训练数据,监督微调 1G 或 100 万条数据。
IT之家小伙伴们可以在这里找到 GitHub 的开源项目。
声明:本网转发此文章,旨在为读者提供更多信息资讯,所涉内容不构成投资、消费建议。文章事实如有疑问,请与有关方核实,文章观点非本网观点,仅供读者参考。
推荐阅读
-
支持DirectX12,苹果发布新工具:可在macOS上模拟运行...
,苹果在WWDC2023期间举办的一次日程安排中,直接提到了如何在macOS... -
苹果介绍VisionPro头显无障碍功能:为有特殊需求的用户提供...
,苹果VisionPro头显可以通过眼睛和手势来控制。不过,对于有特殊需求的... -
戴了30分钟后,苹果VisionPro头显在体验者额头上留下了红...
的头戴式设备VisionPro引起了业界和消费者的广泛关注,消费者对这类设备... -
华硕Chromebook14笔记本电脑开售:搭载AMDRyzen...
感谢IT之家网友华南吴彦祖的线索投递! ,华硕Chromebook14新款... -
宗申B1/蓝调2023款电动摩托车发布:文艺复古设计,可选铅酸/...
,宗申宣布推出B1/蓝调2023款电动摩托车,采用文艺复古设计,有三个版本,... -
华为发布全球首款800GE数据中心核心交换机:可高效支撑AI训练...
感谢IT之家网友肖战割割、乌蝇哥的左手的线索投递! ,IT之家从华为中国官... -
宁德时代市值一日缩水526亿...
受摩根士丹利下调目标价的影响,宁德时代6月7日股价出现大跌,当日盘中一度跌超... -
奥迪activesphere概念车将于6月8日国内首发,基于PP...
,据易车从奥迪官方获悉,奥迪activesphere概念车将于6月8日国内首... -
《仙剑奇侠传》开发商大宇资讯在印设子公司:开发FPS手游,目标4...
,据ctee报道,游戏公司大宇资讯已在孟买设立印度总部,今年将投资上亿元新台... -
海关总署:前5个月我国出口机电产品5.57万亿元,占出口总值57...
海关总署今日发布数据显示,今年1-5月,我国进出口总值16.77万亿元人民币... -
产能过剩风雨欲来,四大千亿光伏龙头却集体执意扩产,有何动机?...
6月6日晚,占据光伏产业链不同环节霸主地位的通威股份和隆基绿能(601012... -
TrendForce集邦:2023年第一季全球智能手机产量仅2....
感谢IT之家网友肖战割割、华南吴彦祖的线索投递! IT之家汇总相关全球市场...