当前位置：首页 > 专题 >

《机器学习面试》专题

十八、强化学习
强化学习（RL）如今是机器学习的一大令人激动的领域，也是最老的领域之一。自从 1950 年被发明出来后，它被用于一些有趣的应用，尤其是在游戏（例如 TD-Gammon，一个西洋双陆棋程序）和机器控制领域，但是从未弄出什么大新闻。直到 2013 年一个革命性的发展：来自英国的研究者发起了 Deepmind 项目，这个项目可以学习去玩任何从头开始的 Atari 游戏，在多数游戏中，比人类玩的还好，它仅
十六、强化学习
强化学习（RL）如今是机器学习的一大令人激动的领域，当然之前也是。自从 1950 年被发明出来后，它在这些年产生了一些有趣的应用，尤其是在游戏（例如 TD-Gammon，一个西洋双陆棋程序）和及其控制领域，但是从未弄出什么大新闻。直到 2013 年一个革命性的发展：来自英国的研究者发起了一项 Deepmind 项目，这个项目可以学习去玩任何从头开始的 Atari 游戏，甚至多数比人类玩的还要好，它
如何学习文档
我们在查看vue-js的文档的时候，会发现它跟我们真正使用的项目的代码完全不一样。例如，vuejs的官方文档的讲解，都是这样：（完全是把所有代码都写在了js中） var Child = { template: ' A custom component! ' } new Vue({ // ... components: { // 将只在父模板可用 'my-compo
《深度学习》整理
问题列表《深度学习》 8.4 参数初始化策略一般总是使用服从（截断）高斯或均匀分布的随机值，具体是高斯还是均匀分布影响不大，但是也没有详细的研究。但是，初始值的大小会对优化结果和网络的泛化能力产生较大的影响。一些启发式初始化策略通常是根据输入与输出的单元数来决定初始权重的大小，比如 Glorot and Bengio (2010) 中建议建议使用的标准初始化，其中 m 为输入数，n 为输出
深度学习实践
加速训练的方法内部方法网络结构比如 CNN 与 RNN，前者更适合并行架构优化算法的改进：动量、自适应学习率 ./专题-优化算法减少参数规模比如使用 GRU 代替 LSTM 参数初始化 Batch Normalization 外部方法深度学习训练加速方法 - CSDN博客 GPU 加速数据并行模型并行混合数据并行与模型并行 CPU 集群 GPU 集群
深度学习基础
相关专题《深度学习》整理 CNN 专题 RNN 专题优化算法专题随机梯度下降动量算法自适应学习率算法基于二阶梯度的优化算法《深度学习》 5.2 容量、过拟合和欠拟合欠拟合指模型不能在训练集上获得足够低的训练误差；过拟合指模型的训练误差与测试误差（泛化误差）之间差距过大；反映在评价指标上，就是模型在训练集上表现良好，但是在测试集和新数据上表现一般（泛化能力差）；降低过拟合风险的
深度学习简介
你可能已经接触过编程，并开发过一两款程序。同时你可能读过关于深度学习或者机器学习的铺天盖地的报道，尽管很多时候它们被赋予了更广义的名字：人工智能。实际上，或者说幸运的是，大部分程序并不需要深度学习或者是更广义上的人工智能技术。例如，如果我们要为一台微波炉编写一个用户界面，只需要一点儿工夫我们便能设计出十几个按钮以及一系列能精确描述微波炉在各种情况下的表现的规则。再比如，假设我们要编写一个电子邮件客
10.7 学习Enroll例程
Visual C++提供了一个名为Enroll的例子来作为学习MFC数据库编程的教程．Enroll分为四步，本节的任务就是指导读者完成前三步的Enroll例程，并对其进行较彻底的剖析．通过学习这三步例程，读者将掌握用AppWizard和ClassWizard创建MFC数据库应用程序的方法．在开始学习Enroll例程时，读者也许会感到用AppWizard创建数据库应用很容易，似乎不用学习前面几节的
为什么学习JavaScript
操控浏览器的能力广泛的使用领域易学性强大的性能开放性社区支持每当我开始阅读一本很厚的书，总是先问自己，它值得我这样做吗？读完一本书，就像完成一段旅程。有些旅程会让你终身回忆，而另一些旅程让你后悔不迭，不应该将宝贵的生命浪费在它之上。所以我想，在读者开始阅读这本教程之前，我最好也谈谈为什么要学JavaScript，它有什么用？一方面，我不希望有人因为读了我的书而后悔；另一方面，这本教
强化学习（Reinforcement Learning）
在本章中，您将详细了解使用Python在AI中强化学习的概念。强化学习的基础知识这种类型的学习用于基于评论者信息来加强或加强网络。也就是说，在强化学习下训练的网络从环境中接收一些反馈。然而，反馈是有评价性的，而不是像监督学习那样具有指导性。基于该反馈，网络执行权重的调整以在将来获得更好的批评信息。这种学习过程类似于监督学习，但我们的信息可能非常少。下图给出了强化学习的方框图 - 构建
Spring Boot 学习笔记
Spring Boot 是由 Pivotal 团队提供的全新框架，其设计目的是用来简化新Spring应用的初始搭建以及开发过程。该框架使用了特定的方式来进行配置，从而使开发人员不再需要定义样板化的配置。
Linux Mint 学习笔记
Linux Mint 是一份基于 Debian 和 Ubuntu 的 Linux 发行版。其目标是提供一种更完整的即刻可用体验，这包括提供浏览器插件、多媒体编解码器、对 DVD 播放的支持、Java和其他组件，它也增加了一套定制桌面及各种菜单，一些独特的配置工具，以及一份基于web的软件包安装界面。 Linux Mint 是对用户友好而功能强大的操作系统。它诞生的目的是为家庭用户和企业提供一个免费
学习 RxJS 操作符
意在通过每个操作符的清晰示例及解释来进行 RxJS 的学习。希望各位喜欢，另外配合官方中文文档操作符篇来学习效果更佳。
学习设计模式
设计模式代表了经验丰富的面向对象软件开发人员使用的最佳实践。设计模式是软件开发人员在软件开发过程中遇到的一般问题的解决方法。
Django Girls 学习指南
这份学习指南适合所有 Django 初学者，为了更好的学习效果，我们希望你能具备，Web 的初步认识，了解如何使用 Command Line，略懂 Python 基础语法，看得懂简单的 HTML / CSS。

首页

29

30

31

32

33

34

35

36

37

尾页

最新发布

天翼云-技术支持一面我的面试经历 Minimax算法研发实习一面滴滴三面半凉经百度广告算法策略实习一面

推荐文章

算法是什么 java学习路线架构师需要哪些素质？C/C++进阶路线 JavaScipt进阶之路

相关问答

视频处理 - 如何使用VLC录制RTMP实时流并分块保存文件？javascript - vue3怎么遍历一个组件中的所有项？mysql添加联合索引之后排序发生变化？python - 求助：为什么whl包在容器环境安装失败？flutter - 如何在Flutter中实现隐私合规的权限调用流程？

推荐题库

小牛知识库超值大礼包总结C语言和Python区别 Python和C语言优劣势对比 JWT介绍？为什么JWT可以防止篡改？HBase数据表查询操作和获取多版本数据

工具软件

Spiped OPMS Apache Lucy JQuery4JSF react-native-context-menu-view IndieLib CLTableWithFooterViewController worktop

文档资料

GitHub 漫游指南 Django Book 2.0 中文版 QAP 千牛开发者套件 Scrapy 中文文档 Rails 风格指南