machine learning (4)---learning rate

  • degugging:make sure gradient descent is working correctly
  1. cost function(J(θ)) of Number of iteration 
  2. 运行错误的图象是什么样子的
  3. 运行正确的图象是什么样子的
  • how to choose learning rate(∂)
    1. 若learning rate太小
    2. 若learning rate太大
    3. 可供选择的一些learning rate值
    4. 如何选择最佳的learning rate

郑重声明:本站内容如果来自互联网及其他传播媒体,其版权均属原媒体及文章作者所有。转载目的在于传递更多信息及用于网络分享,并不代表本站赞同其观点和对其真实性负责,也不构成任何其他建议。