data ready

2019-06-05 00:13:32 +08:00
parent bbf8928e7a
commit 919d89af4b
23 changed files with 364 additions and 68 deletions
--- a/readme.md
+++ b/readme.md
@@ -27,7 +27,13 @@

 **更新**:
 实际上，由于单个汉字图片其实很小，差不多也就最大80x80的大小，这个大小不适合转成图片保存到本地，因此我们将hwdb原始的二进制保存为tfrecord。同时也方便后面训练，可以直接从tfrecord读取图片进行训练。
+![](https://s2.ax1x.com/2019/05/29/VKSEZt.png)

+在我们存储完成的时候大概处理了89万个汉字，总共汉字的空间是3755个汉字。由于我们暂时仅仅使用了1.0，所以还有大概3000个汉字没有加入进来，但是处理是一样。使用本仓库来生成你的tfrecord步骤如下：
+
+- `cd dataset && python3 convert_to_tfrecord.py`, 请注意我们使用的是tf2.0；
+- 你需要修改对应的路径，等待生成完成，大概有89万个example，如果1.0和1.1都用，那估计得double。
+  

 ## Model