问题列表 《深度学习》 8.4 参数初始化策略 一般总是使用服从(截断)高斯或均匀分布的随机值,具体是高斯还是均匀分布影响不大,但是也没有详细的研究。 但是,初始值的大小会对优化结果和网络的泛化能力产生较大的影响。 一些启发式初始化策略通常是根据输入与输出的单元数来决定初始权重的大小,比如 Glorot and Bengio (2010) 中建议建议使用的标准初始化,其中 m 为输入数,n 为输出
加速训练的方法 内部方法 网络结构 比如 CNN 与 RNN,前者更适合并行架构 优化算法的改进:动量、自适应学习率 ./专题-优化算法 减少参数规模 比如使用 GRU 代替 LSTM 参数初始化 Batch Normalization 外部方法 深度学习训练加速方法 - CSDN博客 GPU 加速 数据并行 模型并行 混合数据并行与模型并行 CPU 集群 GPU 集群
相关专题 《深度学习》整理 CNN 专题 RNN 专题 优化算法专题 随机梯度下降 动量算法 自适应学习率算法 基于二阶梯度的优化算法 《深度学习》 5.2 容量、过拟合和欠拟合 欠拟合指模型不能在训练集上获得足够低的训练误差; 过拟合指模型的训练误差与测试误差(泛化误差)之间差距过大; 反映在评价指标上,就是模型在训练集上表现良好,但是在测试集和新数据上表现一般(泛化能力差); 降低过拟合风险的
Index 基本遵从《统计学习方法》一书中的符号表示。 除特别说明,默认w为行向量,x为列向量,以避免在wx 中使用转置符号;但有些公式为了更清晰区分向量与标量,依然会使用^T的上标,注意区分。 输入实例x的特征向量记为: 注意:x_i 和 x^(i) 含义不同,前者表示训练集中第 i 个实例,后者表示特征向量中的第 i 个分量;因此,通常记训练集为: 特征向量用小n表示维数,训练集用大N表示个数
Reference CS229 课程讲义(中文) - Kivy-CN - GitHub 超参数选择 Grid Search 网格搜索 在高维空间中对一定区域进行遍历 Random Search 在高维空间中随机选择若干超参数 相关库(未使用) Hyperopt 用于超参数优化的 Python 库,其内部使用 Parzen 估计器的树来预测哪组超参数可能会得到好的结果。 GitHub - https
偏差与方差 《机器学习》 2.5 偏差与方差 - 周志华 偏差与方差分别是用于衡量一个模型泛化误差的两个方面; 模型的偏差,指的是模型预测的期望值与真实值之间的差; 模型的方差,指的是模型预测的期望值与预测值之间的差平方和; 在监督学习中,模型的泛化误差可分解为偏差、方差与噪声之和。 偏差用于描述模型的拟合能力; 方差用于描述模型的稳定性。 导致偏差和方差的原因 偏差通常是由于我们对学习算法做了错
机器学习 概述 机器学习(Machine Learning,ML) 是使用计算机来彰显数据背后的真实含义,它为了把无序的数据转换成有用的信息。是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。 它是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及
机器学习是人工智能的一个分支,它是一门研究机器获取新知识和新技能,并识别现有知识的学问。机器学习的精确定义为: It’s a computer program learning from experience E with respect to some task T and some performance measure P, if its performance on T as measur
你可能已经接触过编程,并开发过一两款程序。同时你可能读过关于深度学习或者机器学习的铺天盖地的报道,尽管很多时候它们被赋予了更广义的名字:人工智能。实际上,或者说幸运的是,大部分程序并不需要深度学习或者是更广义上的人工智能技术。例如,如果我们要为一台微波炉编写一个用户界面,只需要一点儿工夫我们便能设计出十几个按钮以及一系列能精确描述微波炉在各种情况下的表现的规则。再比如,假设我们要编写一个电子邮件客
Visual C++提供了一个名为Enroll的例子来作为学习MFC数据库编程的教程.Enroll分为四步,本节的任务就是指导读者完成前三步的Enroll例程,并对其进行较彻底的剖析.通过学习这三步例程,读者将掌握用AppWizard和ClassWizard创建MFC数据库应用程序的方法. 在开始学习Enroll例程时,读者也许会感到用AppWizard创建数据库应用很容易,似乎不用学习前面几节的
操控浏览器的能力 广泛的使用领域 易学性 强大的性能 开放性 社区支持 每当我开始阅读一本很厚的书,总是先问自己,它值得我这样做吗? 读完一本书,就像完成一段旅程。有些旅程会让你终身回忆,而另一些旅程让你后悔不迭,不应该将宝贵的生命浪费在它之上。 所以我想,在读者开始阅读这本教程之前,我最好也谈谈为什么要学JavaScript,它有什么用?一方面,我不希望有人因为读了我的书而后悔;另一方面,这本教
以下服务属于“应用服务”部分 - 亚马逊CloudSearch 亚马逊简单队列服务(SQS) 亚马逊简单通知服务(SNS) 亚马逊简单电子邮件服务(SES) 亚马逊SWF 在本章中,我们将讨论Amazon SWF。 Amazon Simple Workflow Service (SWF)是一种基于任务的API,可以轻松协调跨分布式应用程序组件的工作。 它提供了一种编程模型和基础结构,用于协调分布式
Amazon Machine Learning是一种服务,允许通过使用算法,基于用户数据的数学模型开发预测应用程序。 Amazon Machine Learning通过Amazon S3,Redshift和RDS读取数据,然后通过AWS管理控制台和Amazon Machine Learning API可视化数据。 可以通过S3存储桶将此数据导入或导出到其他AWS服务。 它使用“行业标准逻辑回归”算
机器学习(Machine Learning,ML) 是使用计算机来彰显数据背后的真实含义,它为了把无序的数据转换成有用的信息。
机器学习无疑是当前数据分析领域的一个热点内容。很多人在平时的工作中都或多或少会用到机器学习的算法。