data ready
This commit is contained in:
6
readme.md
Normal file → Executable file
6
readme.md
Normal file → Executable file
@@ -27,7 +27,13 @@
|
||||
|
||||
**更新**:
|
||||
实际上,由于单个汉字图片其实很小,差不多也就最大80x80的大小,这个大小不适合转成图片保存到本地,因此我们将hwdb原始的二进制保存为tfrecord。同时也方便后面训练,可以直接从tfrecord读取图片进行训练。
|
||||

|
||||
|
||||
在我们存储完成的时候大概处理了89万个汉字,总共汉字的空间是3755个汉字。由于我们暂时仅仅使用了1.0,所以还有大概3000个汉字没有加入进来,但是处理是一样。使用本仓库来生成你的tfrecord步骤如下:
|
||||
|
||||
- `cd dataset && python3 convert_to_tfrecord.py`, 请注意我们使用的是tf2.0;
|
||||
- 你需要修改对应的路径,等待生成完成,大概有89万个example,如果1.0和1.1都用,那估计得double。
|
||||
|
||||
|
||||
## Model
|
||||
|
||||
|
||||
Reference in New Issue
Block a user