阿里达摩院联合高德发布多模态地理文本预训练模型MGeo,已在魔搭社区开放
2月21日,达摩院联合高德发布业界首个多模态地理文本预训练模型MGeo,其可充分理解地图上的每一个元素,并精准完成地图搜索、地理位置分析等任务。MGeo是阿里通义模型系列旗下的新模型,目前已在魔搭社区开放。
地理文本信息处理是导航软件、物流以及零售等行业的基础。然而,目前传统地理文本AI算法对于地理信息的理解仍局限在经纬度以及经纬度的远近上,无法像人类一样理解地图上的元素,该方法难以精准表示景区、园区、商业街等大型地理实体的具体形状,以及不同地图元素之间复杂的临近、包含等关系。
针对上述问题,达摩院联合高德提出地理文本多模态模型,使用对抗MLM预训练、句子对预训练及多模态预训练三大技术,并用多任务预训练将这三种预训练任务进行动态组合,最终训练得到适合于多类地理文本任务的预训练底座MGeo。该模型拥有丰富的地理知识,能像人类一样跨模态理解地图与地理文本的信息,相关研究成果已被EMNLP、AAAI等国际顶级会议收录。
MGeo像人类一样具备跨模态理解能力,可识别地图元素之间的位置关系
据悉,高德基于MGeo研发了全新的模型,不仅显著提高泛化语义的表示能力,还可准确识别不同地图元素之间的位置关系,有效提升用户的搜索体验。例如,当用户在杭州输入“星光荟对面中国美术”时,MGeo能根据位置关系准确定位到中国美术学院象山校区,而传统BERT模型则给出了错误定位结果;此外,在用户书写有误的情况下,该模型也能匹配正确的结果。该能力已逐步在高德灰度上线。
在四平市搜索“佣兵小区”,高德可准确定位“拥军社区”
达摩院语言技术实验室负责人黄非表示:“地理信息与AI的融合已是业界公认的趋势,但传统AI比如文本处理在地理信息应用场景中有一定局限性 ,我们需要让AI学习人类对于空间信息的理解范式,例如,通过地图中的地理实体以及他们之间的关系来判定地理文本中各个元素的归属以及指向。”
作为最早投入预训练语言模型研究的团队之一,达摩院研发了阿里通义AliceMind,该体系涵盖预训练模型、多语言预训练模型、超大中文预训练模型等,具备阅读理解、机器翻译、对话问答、文档处理等多种能力,该模型体系已斩获36项国际赛事冠军。
声明:本网转发此文章,旨在为读者提供更多信息资讯,所涉内容不构成投资、消费建议。文章事实如有疑问,请与有关方核实,文章观点非本网观点,仅供读者参考。
推荐阅读
-
三星已在韩国开始预售2023年款NeoQLED和OLED电视,8...
感谢IT之家网友华南吴彦祖的线索投递! ,三星在今年的CES大展上发布了N... -
盈通RTX4080“樱瞳水着”显卡上架:白色PCB,9499元...
,盈通日前发布的RTX408016GD6X樱瞳水着SUGAR显卡现已上架,二... -
如何推进社会保障高质量发展?业内专家:关注“一老一小”“中间层”...
2月18-19日,由中国社会保障学会主办、《社会保障评论》编辑部协办主题为“... -
吉利参与投资,全球首个十万吨级绿色低碳甲醇工厂投产...
感谢IT之家网友航空先生的线索投递! ,从吉利控股官方获悉,由吉利控股集团... -
七彩虹将星X16Pro游戏本评测:升级VC均热板,性能释放突破2...
不知不觉,七彩虹已经杀进笔记本市场好几年了。在这几年里,七彩虹的将星系列凭借... -
三星已连续17年称霸电视市场,Omdia报告称去年市场份额为29...
,根据市场调查机构Omdia的统计数据,三星电子在2022年占据了全球电视市... -
卡西欧发布黄金配色G-SHOCK手表:金属材质,支持蓝牙连接...
,卡西欧在日本发布了黄金配色款G-SHOCK“GM-B2100GD-9A”手... -
互动铂科新材:目前已经推出了多个芯片电感系列型号,并已实现小批量...
铂科新材2月21日在互动平台表示,随着AI人工智能、新能源汽车自动化智能化和... -
《英雄联盟手游》明日开启无限火力模式,大乱斗新赛季上线...
,据《英雄联盟手游》官方消息,娱乐模式克隆大作战即将结束,无限火力模式将在2... -
消息称苹果iPhone15Pro机型有望配8GB内存,标准机型内...
感谢IT之家网友华南吴彦祖的线索投递! ,市场调查机构TrendForce... -
互动福龙马:公司环卫服务运营区域已覆盖21个省市自治区,近84个...
福龙马今日在互动平台称,公司是我国环卫服务的主要供应商之一,多年来坚持专业化... -
汉和资本17只基金年内小幅上涨去年均下跌约两成...
年初至今,百亿私募北京汉和汉华资本管理有限公司业绩略有回暖,旗下17只基金全...