chainer v1.11.0 ptb example training with --test option
See original GitHub issueI run ptb example with --test option:
./train_ptb.py -g 0 --test
Screen during training:
#vocab = 10000
total [##############################################################] 125.64%
this epoch [..................................................] 0.00%
7 iter, 49 epoch / 39 epochs
0.15797 iters/sec. Estimated time to finish: -1 day, 23:59:50.956683.
result is:
#vocab = 10000
epoch iteration perplexity val_perplexity
70 10 3918.07 43725.3
total [###############################################################################################################################################] 287.18 total [####################################################################################################################################################### total [####################################################################################################################################################### total [#######################################################################################################################################################140 20 1003.55 45304.3
total [####################################################################################################################################################### total [####################################################################################################################################################### total [####################################################################################################################################################### total [####################################################################################################################################################### total [####################################################################################################################################################### total [####################################################################################################################################################### total [####################################################################################################################################################### total [####################################################################################################################################################### total [####################################################################################################################################################### total [#######################################################################################################################################################210 30 205.992 13718.8
total [####################################################################################################################################################### total [####################################################################################################################################################### total [####################################################################################################################################################### total [####################################################################################################################################################### total [####################################################################################################################################################### total [########################################################################################################################################################################################################################################################################################################################## total [########################################################################################################################################################################################################################################################################################################################## total [########################################################################################################################################################################################################################################################################################################################## total [########################################################################################################################################################################################################################################################################################################################## total [##########################################################################################################################################################################################################################################################################################################################test
test perplexity: 28380.350504
But when the number of epochs is multiple of 7 (e.g. 35), training is a success:
./train_ptb.py -g 0 --test -e 35
result:
#vocab = 10000
test
test perplexity: 4670.25469318
Issue Analytics
- State:
- Created 7 years ago
- Reactions:1
- Comments:5 (3 by maintainers)
Top Results From Across the Web
Chainer Documentation
The returned train and test can be seen as lists of image-label pairs (strictly speaking, they are instances of TupleDataset).
Read more >MNIST training with Multi Layer Perceptron - corochannNote
Training MNIST. You already studied basics of Chainer and MNIST dataset. Now we can proceed to the MNIST classification task.
Read more >Introduction to Knet
In this example we build a simple classification model for the MNIST handwritten digit recognition dataset. MNIST has 60000 training and 10000 test...
Read more >Electrocardiogram lead conversion from single-lead blindly ...
Beyond the training and testing on the widely used PTB database, ... In their study, chest leads (V1 to V6) were synthesised from...
Read more >Placeto: Learning Generalizable Device Placement ... - arXiv
arXiv:1906.08879v1 [cs. ... For example, high device placement overhead is ... the placement policy in §2.2, and the training/testing ...
Read more >Top Related Medium Post
No results found
Top Related StackOverflow Question
No results found
Troubleshoot Live Code
Lightrun enables developers to add logs, metrics and snapshots to live code - no restarts or redeploys required.
Start FreeTop Related Reddit Thread
No results found
Top Related Hackernoon Post
No results found
Top Related Tweet
No results found
Top Related Dev.to Post
No results found
Top Related Hashnode Post
No results found
Top GitHub Comments
This is also a problem when it comes to the proper training as well, not just
--test
, so it’s likely an issue with the epoch iterator or similar?Until this is fixed, the PTB example seems entirely broken. If I get time I’ll look into debugging it further.
Although the 42/39 problem remains, this topic different from the one addressed in this issue. I made a new issue about the problem and close this issue. Thank you.