现代分词都是基于统计的分词,而统计的样本内容来自于一些标准的语料库。假如有一个句子:“小明来到荔湾区”,我们期望语料库统计后分词的结果是:"小明/来到/荔湾/区",而不是“小明/来到/荔/湾区”。那么如何做到这一点呢? 从统计的角度,我们期望"小明/来到/荔湾/区"这个分词后句子出现的概率要比“小明/来到/荔/湾区”大。如果用数学的语言来说说,如果有一个句子S,它有m种分词选项如下:$$A_{11
在数理统计里面,我们都知道相关系数这个概念。假设有两组一维的数据集X和Y,则相关系数$$rho$$的定义为: $$ rho(X,Y) = frac{cov(X,Y)}{sqrt{D(X)}sqrt{D(Y)}} $$ 其中$$cov(X,Y)$$是X和Y的协方差,而D(X), D(Y)分别是X和Y的方差。相关系数$$rho$$的取值为[-1,1], $$rho$$的绝对值越接近于1,则X和Y的线性
LLE属于流形学习(Manifold Learning)的一种。因此我们首先看看什么是流形学习。流形学习是一大类基于流形的框架。数学意义上的流形比较抽象,不过我们可以认为LLE中的流形是一个不闭合的曲面。这个流形曲面有数据分布比较均匀,且比较稠密的特征,有点像流水的味道。基于流行的降维算法就是将流形从高维到低维的降维过程,在降维的过程中我们希望流形在高维的一些特征可以得到保留。 一个形象的流形降维
这个章节描述内核中所有的同步原语。 自旋锁简介 - 这个章节的第一部分描述 Linux 内核中自旋锁机制的实现; 队列自旋锁 - 第二部分描述自旋锁的另一种类型 - 队列自旋锁; 信号量 - this part describes impmentation of semaphore synchronization primitive in the Linux kernel. 这个部分描述 Linu
作为开放平台,必须要提供API文档。 SOP采用微服务架构实现,因此文档应该由各个微服务各自实现。难点是如何归纳各个微服务端提供的文档信息,并统一展示。 SOP的解决思路如下: 各微服务使用swagger定义自己的接口信息 sop-website项目在启动时向注册中心获取所有服务实例,分别调用各个服务提供的swagger文档信息,保存到本地 sop-website前端页面负责展示swagger提供
Spring Cloud Gateway通过一系列的Filter来进行数据的传输,如下图所示: SOP网关在此基础上新增了几个Filter用来处理自己的逻辑,如:前置校验、结果返回。 过滤器 类型 Order 功能 IndexFilter 自定义 -2147483648 入口过滤器,获取参数、签名校验 ParameterFormatterFilter 自定义 -2147482647 格式化参数 L
使用指南 - 疑难问题 - 数据准确性问题 - 抵达率过低什么原因 抵达率的计算 抵达率=实际到达网站首页,能够正常浏览的访问次数/账户总推广点击量 能够正常流量的访问较少的原因 根据以上计算原理,抵达率低是由于“能够正常流量的访问”较少导致的。有以下两种情况导致: 较多点击未能抵达网站。需要查看网站url是否正常打开,速度是否够快,或者是否推广匹配、网站内容较差导致访问者提前关闭网站 用户在百度
"层"的概念 一个游戏里面包含了许多个元素,包括图片、声音、对象模型、相关数据(比如"游戏得分")、方向行为控制等等。游戏编程的实质就是把这些元素按照剧本有序的组合在一起,把这些元素“可控“化。 跟影视制作一样,游戏的每一个场景里面都有"背景"、"主角"、"配角"、"路人甲乙丙丁"、"道具"等。在影视拍摄中,导演指挥剧务布置场景,指挥演员按剧本表演动作和对话,后期制作中加入各种道具使用时产生的特效
PHP代码无法实现的特性,必须扩展底层支持,优先级P0 PHP代码可以实现,但性能较差。如协议解析、密集计算的功能,优先级P1 PHP代码可以实现,无性能瓶颈,但功能使用频率较高,属于通用特性,优先级P2 非上述情况,原则上不应该在扩展中进行支持
人工神经网络 人工神经网络又叫神经网络,是借鉴了生物神经网络的工作原理形成的一种数学模型。下面是一张生物神经元的图示: 生物神经网络就是由大量神经元构成的网络结构如下图: 生物的神经网络是通过神经元、细胞、触电等结构组成的一个大型网络结构,用来帮助生物进行思考和行动等。那么人们就想到了电脑是不是也可以像人脑一样具有这种结构,这样是不是就可以思考了? 类似于神经元的结构,人工神经网络也是基于这样的神
这是这本书介绍的唯一一个原则专门讲一个你应该尽量避免的函数。 GetHashCode() 只用在一个地方:定义基于哈希 key 集合,典型地, HashSet<T> 或者 Dictionary<K,V> 容器。值得称赞的是很多问题会随着实现基类的 GetHashCode() 而解决。对于引用类型,是能起作用但是低效。对于值类型,基类版本的总是不正确的。所以这很糟糕。写一个既高效又正确的 GetHa
支持和小程序的原生自定义组件混用,使用方式和原生的使用方式没有区别。在引用时在页面 js 入口配置 config.usingComponents。 export default { config: { usingComponents: { comp: 'path/to/components/comp/index' } } } 另外还需要在 webpack 中配
2017年9月,Mesos宣布支持Kubernetes,而在2017年10月份的DockerCon EU上,Docker公司宣布官方同时支持Swarm和Kubernetes容器编排,Kubernetes已然成为容器编排调度的标准。 作为全书的开头,首先从历史、生态和应用角度介绍一下Kubernetes与云原生应用,深入浅出,高屋建瓴,没有深入到具体细节,主要是为了给初次接触Kubernetes的小
在以太坊兼容的浏览器中使用web3.js时,web3.givenProvider属性将返回浏览器设置的原生 服务提供器,否则返回null。 调用: web3.givenProvider web3.eth.givenProvider web3.shh.givenProvider web3.bzz.givenProvider ... 返回值: Object: 浏览器设置好的提供器,或者null;