当前位置: 首页 > 软件库 > 程序开发 > 中文分词库 >

CC-CEDICT

中文词典开源项目
授权协议 CC BY-SA 3.0
开发语言
所属分类 程序开发、 中文分词库
软件类型 开源软件
地区 不详
投 递 者 戚升
操作系统 未知
开源组织
适用人群 未知
 软件概览

CC-CEDICT 是一个中文词典开源项目,提供一份以汉语拼音为中文辅助的汉英辞典,截至2009年2月8日,已收录82712个单词。其词典可以用于中文分词使用,而且不存在版权问题。Chrome中文版就是使用的这个词典进行中文分词的。

CEDICT本身提供纯文字档,并由其他程式对其进行搜寻与显示单词。该计划成果为其他汉英计划作为一份参考来源而使用:Unihan数据库的中文复合字资讯大部分来自CEDICT,但仅作为参考之用,且特别声明其并非Unicode主数据库的一部分。Unihan的单字定义和发音不使用CEDICT。

CEDICT的基本格式如下:

Traditional Simplified [pin1 yin1] /American English equivalent 1/equivalent 2/
中國 中国 [Zhong1 guo2] /China/Middle Kingdom/

CEDICT目前主要以UTF-8编码,亦提供GB2312Big5的相容版,两版各省略了繁体字与简体字。 特色:

  • 繁体与简体中文并蓄

  • 提供汉语拼音

  • 美式英语释义

  • The word dictionary of this website is based on CC-CEDICT. CC-CEDICT is a continuation of the CEDICT project started by Paul Denisowski in 1997 with the aim to provide a complete downloadable Chinese

  • L1-049. 天梯赛座位分配  天梯赛每年有大量参赛队员,要保证同一所学校的所有队员都不能相邻,分配座位就成为一件比较麻烦的事情。为此我们制定如下策略:假设某赛场有 N 所学校参赛,第 i 所学校有 M[i] 支队伍,每队 10 位参赛选手。令每校选手排成一列纵队,第 i+1 队的选手排在第 i 队选手之后。从第 1 所学校开始,各校的第 1 位队员顺次入座,然后是各校的第 2 位队员…… 以此

  • 从名字上看,老的unix系统 的CC程序叫做C Compiler。但GCC这个名字按GNU的说法叫做Gnu Compiler Collection。因为gcc包含很多编译器(C, C++, Objective-C, Ada, Fortran,and   Java)。所以它们是不一样的,一个是一个古老的C编译器,一个是编译器的Gnu的编译器的集合(Gcc里的C编译器比CC强大太多了,所以你没必要用

  •         在网络安全中,CC 攻击是非常常见的一种攻击方式,属于 DDoS 攻击的一种,通过发送大量的请求数据来导致服务器拒绝服务,是一种连接攻击。   CC 攻击是指通过控制大量的 “僵尸” 计算机 (也称为 “肉鸡”) 向目标服务器发送大量的恶意流量,从而造成服务器的过载和瘫痪。   CC 攻击通常包括以下几个阶段:   扫描:攻击者使用一些软件工具扫描互联网上的 IP 地址,找到容易受

  •     CC认证全称是“信息技术安全评估通用标准” (Common Criteria for Information Technology Security Evaluation)。它是一组国际准则和规范说明,由CCRA维护,为IT产品提供了一致的、高标准的评估方法。评估保护等级(EAL)规定产品检测的程度,评估保护等级从1级到7级,1级为最低级别,7级为最高级别,通常智能卡软件产品的安全等级可以

  •  //SCRIPT_START function  processArticle( strChaos,strHref ) {       this.thisObj = this;       this.strChaos = strChaos;       this.strHref = strHref;       this.ndComment = null;       this.ndArticl

  • HTML5 <progress value="30" max="100"></progress> 进度条 form表单内 required 必填项 placeholder =“框内提示” autofocus 焦点 autocomplete 自动完成 on开 off关 <form action="" method="get" autocomplete="on"> <input

  • 1、vmware workstation  --lisence 使用vmware workstation 12安装centos7,选择经典安装,安装"GNOME Desktop",在image加载完成后,提示reboot,reboot后命令行提示:   1>   Lisenceinformation  Please make your choice fromabove [‘1’ accept **

  • 一、什么是CC攻击? CC主要是用来攻击页面的。大家都有这样的经历,就是在访问论坛时,如果这个论坛比较大,访问的人比较多,打开页面的速度会比较慢,对不?!一般来说,访问的人越多,论坛的页面越多,数据库就越大,被访问的频率也越高,占用的系统资源也就相当可观。 一个静态页面不会占用服务器多少资源,甚至可以说直接从内存中读出来发给你就可以了。但是论坛就不一样了,我看一个帖子,系统需要到数据库中判断我是否

  • 在Linux下一会看到cc,另一会又看到gcc,感觉又点混乱的样子。它们是同一个东西么,有啥区别呢 一分为二地看: 首先,如果讨论范围在Unix和Linux之间,那么cc和gcc不是同一个东西。cc来自于Unix的c语言编译器,是 c compiler 的缩写。gcc来自Linux世界,是GNU compiler collection 的缩写,注意这是一个编译器集合,不仅仅是c或c++。 其次,

  •   1 Server: 5, win: 20pkt, SRU: 256KB, link_buf: 32pkt, Seed: 1, 2 Block_trans: 1350200B, RTT: 100us, RTT_rand: 20us, SYN_del: 0-0us 3 4 0.99759999999998927 1 5 0.99769999999998926 1

  • JavaScript  var cc=cc ||{} 1、在js里面,||运算符,比如(A||B)有个很有意思的用处: 2、系统先判断A表达式的布尔值,是真是假。如果为真,直接返回A。如果为假,直接返回B(不会判断B是什么类型)。 所以,var a=a||{},这样写的意图就是,先考虑右侧的表达式 a||{}, 根据规则,先判断a的值是否为真(也就是判断a本身是否存在),如果a本身存在,则返回a。

  • 4CC

    0~9 1978 2VUY 3IV0:3ivx 3IV1:3ivx 3IV2:3ivx 3IVD:FFmpeg DivX(MS MPEG-4 v3) 3IVX:3ivx 8BPS:平面RGB编解码器 A AAS4:Autodesk Animator编解码器(RLE) AASC:Autodesk Animator编解码器(RLE) ABYR:肯辛顿编解码器 ACTL:Streambox ACT-L2

 相关资料
  • Covirt中国社区志在为大家打造一个稳定、开源、持续更新、中文、符合国人使用习惯的虚拟化管理软件版本,社区完全公益开放! convirt是基于 KVM,XEN开发的一套虚拟化产品。其特点是每一次对服务器的操作都是通过原生的linux命令模拟人工ssh登录来完成的,所以具有很好的稳定性,灵活性和可扩展性。后台系统基于python语言开发,使用python中轻量级的Turbogears框架使得整个系

  • 问题内容: 给定一个像这样的字典: 如何创建一个字典列表,该列表结合了第一个字典键的各种值?我想要的是: 问题答案: 我认为您想要笛卡尔积,而不是排列,在这种情况下可以提供帮助:

  • 本项目并非 Google 官方项目, 而是由国内程序员凭热情创建和维护,如果你关注的是 Google 官方英文版,请移步 Google Style Guide。 每个较大的开源项目都有自己的风格指南:关于如何为该项目编写代码的一系列约定 (有时候会比较武断),当所有代码均保持一致的风格, 在理解大型代码库时更为轻松。 “风格” 的含义涵盖范围广,从 “变量使用驼峰格式 (camelCase)” 到

  • 本章介绍 Docker 开源的项目。随着 Docker 功能的越来越多,Docker 也加快了开源的步伐,Docker 未来会将引擎拆分为更多开放组件,对用于组装 Docker 产品的各种新型工具与组件进行开源并供技术社区使用。

  • 项目分析 功能描述 英译汉和汉译英的单词查询功能 收藏功能 显示收藏词语功能 显示查询信息功能 项目实现 项目设计 数据结构设计 词典词条数据结构 #aardvark Trans:n. 土猪 #aardwolf Trans:n. 土狼 #aasvogel Trans:n. 秃鹰之一种 #abaci Trans:n. 算盘 #aback Trans:ad. 向后地;朝后地 变量声明 功能描述 ch

  • 网页版 http://h5.m.taobao.com/borrowbook/braille.html  联系作者:刘学炜 liu.xuewei@hotmail.com 简介: toBraille是一个Java盲文翻译库目前支持简体、繁体中文、字母、数字、图片中的文字换为盲文,而且还能智能识别数据源中的拼音串转换成对应发音的盲文,并能将数据源通过TTS语音合成技术朗读出来。 (暂时不支持外文,但已加