北京智源发布悟道3.0大模型系列
感谢IT之家网友 华南吴彦祖、肖战割割 的线索投递!
,在“2023 北京智源大会”上,北京智源人工智能研究院发布悟道 3.0 大模型系列,包含悟道?天鹰语言大模型系列、“天秤(FlagEval)”大语言评测体系及开放平台以及悟道?视界视觉大模型系列。
IT之家附详细内容:
-
悟道?天鹰 Aquila 语言大模型是第一个中英文双语大模型,支持商用、符合数据合规要求,在中英高质量合规的语料数据库基础上从零开始训练。这次发布了该系列模型中的 7B、33B 和 AquilaChat 对话模型,即 70 亿参数、330 亿参数的基础模型,AquilaCode 文本代码生成模型。
7B、33B 在技术上继承了 GPT-3、LLaMA 等的架构设计优点,替换了一批更高效的底层算子实现、重新设计实现了中英双语的 tokenizer,升级了 BMTrain 并行训练方法,在 Aquila 的训练过程中实现了比 Magtron+DeepSpeed ZeRO-2 将近8倍的训练效率。
AquilaCode-7B 代码模型,是基于 Aquila-7B 基础模式的代码模型,它也是 7B,用小数据集、小参数量实现了高性能,支持中英双语。
-
大语言模型评测体系“天秤”在能力、任务、指标三个维度上建立了全方位的评测体系,包括 30 多种能力,加上 5 种任务,再乘以 4 大类的指标,总共差不多 600 维的评测体系。目前天秤开源大模型评测体系已经面向公众开放注册申请。在硬件方面支持英伟达、华为的昇腾、寒武纪、昆仑芯等多种芯片架构,以及 PyTorch 等多种深度学习框架。
-
视觉大模型方面,智源大会公布了在多模态序列中补全一切的多模态大模型 Emu、最强十亿级视觉基础模型 EVA、性能最强开源 CLIP 模型 EVA-CLIP、首创了上下文图像学习技术路径的通用视觉模型 Painter、分割一切的视界通用分割模型、以及首个零样本视频编辑方法 vid2vid-zero 等成果。
声明:本网转发此文章,旨在为读者提供更多信息资讯,所涉内容不构成投资、消费建议。文章事实如有疑问,请与有关方核实,文章观点非本网观点,仅供读者参考。
推荐阅读
-
华硕5月营收363.16亿元新台币,环比增长16.1%...
,华硕公布5月营收,单月集团合并营收363.16亿元新台币,环比增长16.1... -
机构:中国大陆Q1半导体设备销售额58.6亿美元同比降23%...
,SEMI的最新全球半导体设备市场统计报告为市场利益相关者带来了谨慎的好消息... -
广东推出10条非遗旅游精品线路...
南方财经全媒体记者程浩东莞报道6月10日,在“非遗潮未来bull;龙腾大湾区... -
黄益平:欧美之间也有差异,美国想“脱钩”并不一定能干成...
北京大学国家发展研究院副院长黄益平今天出席第三届金融四十人曲江论坛演讲表示,... -
屠光绍:在金融助力西部地区形成高质量发展、高水平开放的新格局中,...
6月10日,CF40常务理事、SFI理事长屠光绍在第三届“金融四十人曲江论坛... -
让传统美食“秀”出现代范儿...
在四川省眉山市,听当地人自豪地讲起他们把小泡菜做成了大产业,年销售收入能达2... -
中汽协:5月我国汽车产销环比同比双增长,新能源汽车市占率突破30...
感谢IT之家网友航空先生、华南吴彦祖的线索投递! ,中汽协今日公布了我国最... -
功耗800W,16核英特尔SapphireRapids处理器超频...
,根据国外科技媒体PCGamer报道,Level1Techs在华擎性能团队的... -
第三届浙商促进会硕博会年中家宴举行...
6月3日,浙商促进会硕博分会第三届年会在杭州西溪湿地举行。本次活动有200位... -
酷比魔方iPlay502023平板今日上市:配备10.4英寸全贴...
感谢IT之家网友雨雪载途的线索投递! ,酷比魔方现推出了2023款iPla... -
消息称三星将推83英寸OLED电视,采用LG面板...
感谢IT之家网友软媒新友1933769、雨雪载途的线索投递! ,据韩国媒体... -
“China,创时代” — 第十九届文博会国瓷永丰源分会场盛大启...
6月9日,以“China,创时代”为主题的第十九届中国(深圳)国际文化产业博...