data ready

This commit is contained in:
Your Name
2019-06-05 00:13:32 +08:00
parent bbf8928e7a
commit 919d89af4b
23 changed files with 364 additions and 68 deletions

6
readme.md Normal file → Executable file
View File

@@ -27,7 +27,13 @@
**更新**:
实际上由于单个汉字图片其实很小差不多也就最大80x80的大小这个大小不适合转成图片保存到本地因此我们将hwdb原始的二进制保存为tfrecord。同时也方便后面训练可以直接从tfrecord读取图片进行训练。
![](https://s2.ax1x.com/2019/05/29/VKSEZt.png)
在我们存储完成的时候大概处理了89万个汉字总共汉字的空间是3755个汉字。由于我们暂时仅仅使用了1.0所以还有大概3000个汉字没有加入进来但是处理是一样。使用本仓库来生成你的tfrecord步骤如下
- `cd dataset && python3 convert_to_tfrecord.py`, 请注意我们使用的是tf2.0
- 你需要修改对应的路径等待生成完成大概有89万个example如果1.0和1.1都用那估计得double。
## Model