寒假的时间,没做成什么事,就把deeplearning.ai在coursera上深度学习系列课程,完成第一个课程和第二个课程的第一周。
第一个课程的主要内容为神经网络及多层神经网络的前向传播计算和反向传播计算。重点讲解了如何用python实现,前向传播过程,计算过程中,将一些中间量存为cache。然后在BP的时候,用于计算,主要推导了单层网络,两层网络和多层网络的情况下,各个梯度值如何计算。这是重点。然后就是结合python具有自动向量化功能的一些函数来实现计算,避免使用多层for循环。这样的结果是只对每次迭代使用for循环,对于多个样本的计算,使用向量化。各个权值梯度计算的使用使用了链式法则,这部分属于数学上的推导。
第二个课程主要是对于一些超参数的解释,以及一些优化方法,比如regularization(避免过拟合),dropout(避免过拟合),gradient checking等方法的原理和作用。
目前感觉用不到了解这么详细,因此暂时停止对其学习。