当前位置：首页 > 软件库 > 神经网络/人工智能 > 机器学习/深度学习 >

CINO

少数民族语言预训练模型

授权协议 Apache-2.0

开发语言 Python

所属分类神经网络/人工智能、机器学习/深度学习

软件类型开源软件

地区国产

投递者锺离马鲁

操作系统跨平台

开源组织无

适用人群未知

软件官网

软件文档

官方下载

软件概览

在自然语言处理领域中，预训练语言模型（Pre-trained Language Model, PLM）已成为重要的基础技术，在多语言的研究中，预训练模型的使用也愈加普遍。为了促进中国少数民族语言信息处理的研究与发展，哈工大讯飞联合实验室（HFL）发布少数民族语言预训练模型CINO (Chinese mINOrity PLM)。

本项工作的主要贡献：

CINO (Chinese mINOrity PLM) 基于多语言预训练模型XLM-R，在多种国内少数民族语言语料上进行了二次预训练。该模型提供了藏语、蒙语（回鹘体）、维吾尔语、哈萨克语（阿拉伯体）、朝鲜语、壮语、粤语等少数民族语言与方言的理解能力。
为了便于评价包括CINO在内的各个多语言预训练模型性能，我们构建了基于维基百科的少数民族语言分类任务数据集Wiki-Chinese-Minority（WCM）。具体见少数民族语言分类数据集。
通过实验证明，CINO在Wiki-Chinese-Minority（WCM）以及其他少数民族语言数据集：藏语新闻分类 Tibetan News Classification Corpus (TNCC) 、朝鲜语新闻分类 KLUE-TC (YNAT) 上获得了最好的效果。相关结果详见实验结果。

该模型涵盖：

Chinese，中文（zh）
Tibetan，藏语（bo）
Mongolian (Uighur form)，蒙语（mn）
Uyghur，维吾尔语（ug）
Kazakh (Arabic form)，哈萨克语（kk）
Korean，朝鲜语（ko）
Zhuang，壮语
Cantonese，粤语（yue）

使用案例

cino蓝牙扫描仪连接

网速真是够慢的了，本来最近就有好些郁闷的事情，烦的很，。。 cino蓝牙扫描仪一.连接WINDOWS系统：安装软件（SL-BA10.rar）打开SumlungScanPC打开文件夹找到这个程序。（1）点击setting ：配对的时候会分配一个传出端口选那个传出的就行刚刚setting最后一步会提示传入传出端口是多少如果你没注意可以在蓝牙设备属性里查看到

CINO

同类工具

相关阅读

相关文章

相关问答

相关文档