读取执行的scikit学习中tensroflow:http://learningtensorflow.com/lesson6/和scikit学习:http://scikit-
learn.org/stable/modules/generated/sklearn.cluster.KMeans.html
我努力决定使用哪种实现。
scikit-learn作为tensorflow docker容器的一部分安装,因此可以使用任何一种实现。
使用scikit-learn的原因:
与tensorflow实现相比,scikit-learn包含的模板更少。
使用tensorflow的原因:
如果在Nvidia GPU上运行,则算法将并行运行,我不确定scikit-learn是否会利用所有可用的GPU?
阅读https://www.quora.com/What-are-the-main-differences-between-TensorFlow-and-
SciKit-Learn
TensorFlow是更底层的;基本上,乐高积木可以帮助您实现机器学习算法,而scikit-
learn可为您提供现成的算法,例如,用于分类的算法,例如SVM,随机森林,逻辑回归等。如果您想实施深度学习算法,TensorFlow确实很出色,因为它使您可以利用GPU进行更有效的培训。
该声明进一步证实了我的主张:“ scikit-learn所包含的样板少于张量流实现”,但也暗示scikit-learn不会利用所有可用的GPU?
如果Tensorflow是针对Cuda和CuDNN构建的,则仅使用GPU。默认情况下,两者都不会使用GPU,尤其是在Docker内部运行的情况下,除非您使用nvidia-
docker
和具有此功能的映像。
Scikit-learn不打算用作深度学习框架,并且似乎不支持GPU计算。
为什么在scikit-learn中不支持深度学习或强化学习?
深度学习和强化学习都需要丰富的词汇来定义架构,而深度学习还需要GPU才能进行有效的计算。但是,这些都不符合scikit-
learn的设计约束。结果,深度学习和强化学习目前超出了scikit-learn力求实现的范围。
摘录自http://scikit-learn.org/stable/faq.html#why-is-there-no-support-for-deep-
or-reinforcement-learning-will-there-be-support-for-deep-
或在Scikit学习中加强学习
您将在scikit-learn中添加GPU支持吗?
不,或者至少在不久的将来不会。主要原因是GPU支持会引入许多软件依赖关系,并会引入特定于平台的问题。scikit-
learn旨在易于安装在各种平台上。在神经网络之外,GPU在当今的机器学习中并未发挥重要作用,通过谨慎选择算法,通常可以大大提高速度。
摘录自http://scikit-learn.org/stable/faq.html#will-you-add-gpu-
support
scikit-learn 是一个 Python 的机器学习项目。是一个简单高效的数据挖掘和数据分析工具。基于 NumPy、SciPy 和 matplotlib 构建。 Installation 依赖 scikit-learn 要求: Python (>= 2.7 or >= 3.3) NumPy (>= 1.8.2) SciPy (>= 0.13.3) 运行示例需要 Matplotlib >= 1
Introduction to Machine Learning with scikit-learn This video series will teach you how to solve Machine Learning problems using Python's popular scikit-learn library. There are 10 video tutorials tot
你可以使用 Keras 的 Sequential 模型(仅限单一输入)作为 Scikit-Learn 工作流程的一部分,通过在此找到的包装器: keras.wrappers.scikit_learn.py。 有两个封装器可用: keras.wrappers.scikit_learn.KerasClassifier(build_fn=None, **sk_params), 这实现了Scikit-Le
校验者: @小瑶 翻译者: @片刻 Note 如果你想为这个项目做出贡献,建议你 安装最新的开发版本 . 安装最新版本 Scikit-learn 要求: Python (>= 2.7 or >= 3.3), NumPy (>= 1.8.2), SciPy (>= 0.13.3). 如果你已经有一个安全的 numpy 和 scipy,安装 scikit-learn 最简单的方法是使用 pip pip
TF-IDF TF-IDF(Term Frequency and Inverse Document Frequency),是一种用于信息检索与数据挖掘的常用加权技术。它的主要思想是:如果某个词或短语在一篇文章中出现的频率(term frequency)高,并且在其他文章中很少出现,则认为此词或者短语具有很好的类别区分能力,适合用来分类。 计算公式是TF * IDF 而这里的: scikit-lea
二类分类问题 逻辑回归最广泛的应用就是二类分类,我们以脏话判别为例来利用逻辑回归,对一句话做脏话分析判断 输入样本如下: 是脏话:fuck you 是脏话:fuck you all 不是脏话:hello everyone 我们来预测以下两句话是否是脏话: fuck me hello boy # coding:utf-8 import sys reload(sys) sys.setdefault