Difference between revisions of "Optimization Methods"

Revision as of 06:24, 24 October 2018

Methods:

@@ Line 4: / Line 4: @@
 * [[Long Short-Term Memory (LSTM), Gated Recurrent Unit (GRU), and Recurrent Neural Network (RNN)]]
 * [[Average-SGD Weight-Dropped LSTM (AWD-LSTM)]]
+* [[Gradient Boosting Algorithms]]
 Methods:
-* SGD (with and without momentum)
+* Stochastic gradient descent (SGD) (with and without momentum)
 * L-BGFS
 * Adagrad
 * Adadelta
-* RMSprop
+* Root Mean Squared (RMSprop)
 * Adam
 * Hessian-free (HF)
+<youtube>JXQT_vxqwIs</youtube>
-<youtube>-13yIXiyFAs</youtube>
+<youtube>k8fTYJPd3_I</youtube>
+<youtube>_e-LFe_igno</youtube>
+<youtube>kK8-jCCR4is</youtube>
+<youtube>VINCQghQRuM</youtube>