JB的Python之旅-人工智能篇-TensorFlow基础概念

巫马善

2023-12-01

前言

犹记得一周前，对图形验证码有点想法，自信满满的去做破解的工作，但是实际被各种打脸，不接触这行，真不懂里面的套路；

关于图形验证码这块，不管后面行还是不行，都会写一篇出来，当做经验总结也好,但总不能停留在这里，因为后面还有滑动验证码，点触验证码等着去学习；

开篇

当今在互联网混，不随口说出深度学习，人工智能，机器学习，神经网络等词，人家都怀疑是个假的互联网人了，但不知道是否有同学跟JB一样，傻傻分不清？

犹记得，自从阿法狗那波，业界似乎对机器学习推到一个新的高度？？
本来是不太想沾这趟水的，毕竟知道自己不是那个料，但是最近被验证码折腾的够累的，而图形验证码的确是深度学习的一个点，于是乎还是想写下，了解下，至少对概念有点印象，也不枉此行了；
小白用户，如果对这块有不对的地方，请各位同学及时提出哈，谢谢啦~

扫盲

深度学习，人工智能，机器学习，神经网络，这4个词出现的比较多，但是它们之间有什么关系呢？尤其，机器学习跟深度学习区别在哪里？？

人工智能，英文Artificial Intelligence，简称AI，那人工智能的目的是什么？
网上一大堆，好听的叫解放/发展生产力，解放人类，总的来说是提高效率
但更好理解就是：偷懒!

比如当你说一句话时，机器能够识别成文字，并理解你话的意思，进行分析和对话等。

人工智能的核心在于智能两字，那智能怎么来的？主要归功于一种实现人工智能的方法--机器学习；

那目前人工智能的应用场景有哪些：
OCR、语音技术（比如Siri）、大数据应用等~

机器学习：一种实现人工智能的方法
机器学习最基本的做法，是使用算法来解析数据、从中学习，然后对事件做出决策和预测。
需要用大量的数据来“训练”，通过各种算法从数据中学习如何完成任务。

举个例子，当浏览网上商城时，经常会出现商品推荐的信息。
这是商城根据往期的购物记录和冗长的收藏清单，识别出这其中哪些是真正感兴趣，并且愿意购买的产品。
这样的决策模型，可以帮助商城为客户提供建议并鼓励产品消费。

【机器学习有三类】：

第一类是无监督学习，指的是从信息出发自动寻找规律，并将其分成各种类别，有时也称"聚类问题"。

第二类是监督学习，监督学习指的是给历史一个标签，运用模型预测结果。
如有一个水果，我们根据水果的形状和颜色去判断到底是香蕉还是苹果，这就是一个监督学习的例子。

最后一类为强化学习，是指可以用来支持人们去做决策和规划的一个学习方式，它是对人的一些动作、行为产生奖励的回馈机制，通过这个回馈机制促进学习，这与人类的学习相似，所以强化学习是目前研究的重要方向之一。

深度学习：一种实现机器学习的技术
深度学习是机器学习的一个子领域，是利用深度的神经网络，将模型处理得更为复杂，从而使模型对数据的理解更加深入；

深度学习的核心是，我们现在有足够快的计算机和足够的数据来实际训练大型神经网络

三者的区别和联系
机器学习是一种实现人工智能的方法，深度学习是一种实现机器学习的技术。

按照JB的理解，深度学习最终可能会渗透在其他所有机器学习算法；

当然，并不是说深度学习就是万能的，也并不一定比机器学习牛逼，要根据场景来区别；

人工神经网络：一种机器学习的算法
以“停止（Stop）标志牌”为例，将一个停止标志牌图像的所有元素都打碎，然后用神经元进行“检查”：八边形的外形、消防车般的红颜色、鲜明突出的字母、交通标志的典型尺寸和静止不动运动特性等等。神经网络的任务就是给出结论，它到底是不是一个停止标志牌。神经网络会根据所有权重，给出一个经过深思熟虑的猜测——“概率向量”。

神经网络是需要调制、训练的，不然会很容易出错的~

ok，讲到这里，感觉对这块信息已经有所了解~至少知道这些是什么东西了；
简单总结下：

机器学习是一种实现人工智能的方法，深度学习是一种实现机器学习的技术，神经网络是一种实现机器学习的算法

TensorFlow 简介

TensorFlow是Google在2015年11月份开源的人工智能系统Github项目地址,该系统可以被用于语音识别、图片识别等多个领域。

官网上对TensorFlow的介绍是，
一个使用数据流图技术来进行数值计算的开源软件库。

数据流图中的节点，代表数值运算；
节点节点之间的边，代表多维数据(tensors)之间的某种联系。
可以在多种设备（含有CPU或GPU）上通过简单的API调用来使用该系统的功能。

TensorFlow是由Google Brain团队的研发人员负责的项目。

什么是数据流图
数据流图是描述有向图中的数值计算过程。有向图中的节点通常代表数学运算，但也可以表示数据的输入、输出和读写等操作；有向图中的边表示节点之间的某种联系，它负责传输多维数据(Tensors)。

节点可以被分配到多个计算设备上，可以异步和并行地执行操作。因为是有向图，所以只有等到之前的入度节点们的计算状态完成后，当前节点才能执行操作。

TensorFlow的特性

灵活性，TensorFlow不是一个严格的神经网络工具包，只要你可以使用数据流图来描述你的计算过程，你可以使用TensorFlow做任何事情。你还可以方便地根据需要来构建数据流图，用简单的Python语言来实现高层次的功能。
可移植性，TensorFlow可以在任意具备CPU或者GPU的设备上运行，你可以专注于实现你的想法，而不用去考虑硬件环境问题，你甚至可以利用Docker技术来实现相关的云服务。
提高开发效率，TensorFlow可以提升你所研究的东西产品化的效率，并且可以方便与同行们共享代码- 支持语言选项，目前TensorFlow支持Python和C++语言。
充分利用硬件资源，最大化计算性能

TensorFlow安装

找了很多方式，最终无奈放弃，因为都不可行，依赖的东西太多了，最后JB选择了用pycharm来安装TensorFlow；

pycharm是python 的IDE软件，安装库起来比较方便，而且写代码也不错；

打开pycharm，在菜单栏里flie-settings，直接搜索project inter，选择你用的编译器，直接点击+：

输入tensorflow，install package，然后就是等待漫长的安装过程了；

当然，喜欢高难度的同学，可以看github的官网介绍，祝你好运~
https://github.com/jikexueyuanwiki/tensorflow-zh/blob/master/SOURCE/get_started/os_setup.md

验证
直接import tensorflow，运行试试看有没有问题即可；如果有问题，会直接报错的~

第一个例子

官网有个例子，直接拿来用了：

import tensorflow as tf

hello = tf.constant("Hello,TensorFlow")
#创建了图，里面放入hello，TensorFlow
sess = tf.Session()
#定义了一个会话
print(sess.run(hello))
#执行图计算

a = tf.constant(10)
b = tf.constant(32)
#创建了图，里面放两个节点，两个Constant()ops
print(sess.run(a+b))
#执行图计算，此处是相加
复制代码

运行结果：

2018-06-14 18:48:55.967672: I T:\src\github\tensorflow\tensorflow\core\platform\cpu_feature_guard.cc:140] Your CPU supports instructions that this TensorFlow binary was not compiled to use: AVX2
b'Hello,TensorFlow'
42
复制代码

上面第一行还是红色的，虽然不影响结果输出，但是看着不爽啊；
怎么做？直接屏蔽就好了~

import os
os.environ["TF_CPP_MIN_LOG_LEVEL"]='2'
复制代码

import os，加上上面那句即可；不懂什么意思？来来来~

os.environ["TF_CPP_MIN_LOG_LEVEL"]='1' # 这是默认的显示等级，显示所有信息    
os.environ["TF_CPP_MIN_LOG_LEVEL"]='2' # 只显示 warning 和 Error     
os.environ["TF_CPP_MIN_LOG_LEVEL"]='3' # 只显示 Error    
复制代码

看了上面的例子，看不出特别的，先来了解下基础知识吧~

基本使用

需要理解在TensorFlow中，是如何：

将计算流程表示成图；
通过Sessions来执行图计算；
将数据表示为tensors；
使用Variables来保持状态信息；
分别使用feeds和fetches来填充数据和抓取任意的操作结果；

TensorFlow的基础概念

图（Graph）：用来表示计算任务，也就我们要做的一些操作。
会话（Session）：建立会话，此时会生成一张空图；在会话中添加节点和边，形成一张图，一个会话可以有多个图，通过执行这些图得到结果。如果把每个图看做一个车床，那会话就是一个车间，里面有若干个车床，用来把数据生产成结果。
Tensor：用来表示数据，是我们的原料。
变量（Variable）：用来记录一些数据和状态，是我们的容器。
feed和fetch：可以为任意的操作(arbitrary operation) 赋值或者从其中获取数据。相当于一些铲子，可以操作数据。

形象的比喻是：把会话看做车间，图看做车床，里面用Tensor做原料，变量做容器，feed和fetch做铲子，把数据加工成我们的结果。

图计算
TensorFlow程序中图的创建类似于一个 [施工阶段]，
而在 [执行阶段] 则利用一个session来执行图中的节点。
很常见的情况是，在 [施工阶段] 创建一个图来表示和训练神经网络，而在 [执行阶段] 在图中重复执行一系列的训练操作。

创建图和运行图

第一个例子那有说明图是怎么创建的，这里再举例说明下：

matrix1 = tf.constant([[3.,3.]])
matrix2 = tf.constant([[2.],[2.]])
product = tf.matmul(matrix1,matrix2)
#创建一个矩阵乘法
#默认的图，有3个节点，两个constant和一个matmul
sess = tf.Session()
#定义一个会话
result = sess.run(product)
#运算乘法，得到结果
print(result)
sess.close()
#关闭会话
复制代码

如果需要使用GPU，则如下处理：

with tf.Session() as sess:
    with tf.device("/cpu:0"):
        matrix1 = tf.constant([[3,3]])
        #这是一行2列
        matrix2 = tf.constant([[2],[2]])
        #这个是两行1列
        product = tf.matmul(matrix1,matrix2)
        #创建一个矩阵乘法
        #默认的图，有3个节点，两个constant和一个matmul
        sess = tf.Session()
        #定义一个会话
        result = sess.run(product)
        #运算乘法，得到结果
        print(result)
        sess.close()
        #关闭会话
复制代码

device中的各个字符串含义如下：

"/cpu:0": 你机器的CPU；
"/gpu:0": 你机器的第一个GPU；
"/gpu:1": 你机器的第二个GPU；

常量
tf.constant(value, dtype=None, shape=None, name='Const', verify_shape=False),value为值，dtype类型，shape为张量形状，name名称、verify_shape默认False，这些项可选。作用创建一个常量。

a = tf.constant(2, name="a") # print(a) = 2
b = tf.constant(2.0, dtype=tf.float32, shape=[2,2], name="b") # 2x2矩阵，值为2
c = tf.constant([[1, 2], [3, 4]], name="c") # 2x2矩阵,值1,2,3,4
复制代码

是不是懵逼了？没事，留个大概影响就好了~

第二个例子--创建变量

num = tf.Variable(0,name = "count")
#创建一个变量num
new_value = tf.add(num,10)
#创建一个加法操作，把当前的数字+10
op = tf.assign(num,new_value)
#创建一个赋值操作，把new_value赋值给num

with tf.Session() as sess:
    sess.run(tf.global_variables_initializer())
    #初始化变量
    print(sess.run(num))
    for i in range(5):
        #创建一个for循环，循环5次
        sess.run(op)
        #执行op的赋值操作
        print(sess.run(num))
        #输出num

输出的结果：
0
10
20
30
40
50
复制代码

第三个例子--填充

有的时候，会在声明变量的时候不赋值，计算的时候才进行赋值，这个时候feed就派上用场了

input1 = tf.placeholder(tf.float32)
#创建一个变量占位符input1
input2 = tf.placeholder(tf.float32)
#创建一个变量占位符input2
mul = tf.multiply(input1, input2)
#乘法操作

with tf.Session() as sess:
    
  result = sess.run([mul], feed_dict={input1:[7.], input2:[2.]})
  #在运算时，用feed设置两个输入的值
  print(result)
复制代码

综合例子

import tensorflow as tf
import os
os.environ["TF_CPP_MIN_LOG_LEVEL"]='2'
import numpy as np


x_data = np.random.rand(100).astype("float32")
y_data = x_data * 0.1 + 0.3
# 模拟生成100对数据对, 对应的函数为y = x * 0.1 + 0.3
# numpy是Python的一个科学计算库，提供矩阵运算的功能
# astype是转换数组的数据类型

W = tf.Variable(tf.random_uniform([1], -1.0, 1.0))
b = tf.Variable(tf.zeros([1]))
#产生尺寸为1的张量
y = W * x_data + b
# 指定w和b变量的取值范围（注意我们要利用TensorFlow来得到w和b的值）
# tf.random_uniform，TensorFlow随机值函数,返回1矩阵，数值产生于-1.0跟1.0之间


loss = tf.reduce_mean(tf.square(y - y_data))
#reduce_mean求平均值
#square是对里面的值求平方操作
optimizer = tf.train.GradientDescentOptimizer(0.5)
#这个类是实现梯度下降算法的优化器，第一个参数是要使用的学习率 
train = optimizer.minimize(loss)
# 最小化均方误差

init = tf.global_variables_initializer()
# 初始化TensorFlow参数

sess = tf.Session()
sess.run(init)
# 运行数据流图（注意在这一步才开始执行计算过程）

for step in range(201):
    sess.run(train)
    if step % 20 == 0:
        print(step, sess.run(W), sess.run(b))
# 观察多次迭代计算时，w和b的拟合值
# 最好的情况是w和b分别接近甚至等于0.1和0.3
复制代码

输出的结果：

0 [-0.39065683] [0.66207296]
20 [-0.0082044] [0.3498935]
40 [0.07841039] [0.30995506]
60 [0.09569232] [0.3019863]
80 [0.09914052] [0.30039632]
100 [0.09982852] [0.30007908]
120 [0.09996579] [0.30001578]
140 [0.09999318] [0.30000314]
160 [0.09999864] [0.30000064]
180 [0.09999974] [0.30000013]
200 [0.09999995] [0.30000004]
复制代码

每执行20次输出一次数据，从上面的结果可以看到，随着次数的增加，w跟b的值越来越靠近0.1跟0.3；
JB很好奇，为什么会这这样？从上面的代码，没做什么吗？这个呢？估计要看TensorFlow的源码了，感兴趣的同学，看完后记得分享下~

本章就介绍到这里了，本来还想介绍hello world的，但是考虑整体章节会比较长，就放下文吧~

小结

来个例行总结，本文主要讲解人工智能的相关概念，以及TensorFlow的基础用法，也结合一个例子来证明TensorFlow的效果，至于源码嘛，JB也不懂，就是觉得TensorFlow很牛逼的感觉~

而我们最终的目的，是希望用TensorFlow来训练自己的模型，来提高图形验证码的识别率；

谢谢大家~