有这么一种场景,我们需要对图片进行标注,比如打 tag 呀,分类呀……
可以用机器来完成吗?答案是可以的。
caffe 是一个深度学习的框架,
它提供了一些 models,
很方便让工程师或研究员重新训练和使用。
经过多次尝试,我们决定使用 CaffeNet 做图片分类的网络。
以花瓣发现为例子吧
首先我们要收集标注数据
然后执行 python get_huaban_images.py
接下来就是漫长的等待中……
准备训练数据和验证数据
我们把前面下载下来的数据分为两类 train.txt
和 val.txt
一样的执行 python create_train.py
, 这样就把数据集分成两部分, cats.txt 我们是用来保存分类的信息
将数据写到 lmdb 里面
计算训练数据集的均值
- 将 mean_file 改为 huaban_mean.binaryproto
- 将 TRAIN source 改为 huaban_train_lmdb
- 将 TEST source 改为 huaban_val_lmdb
训练网络
可恶又要进行漫长的等待……
训练结果
经过长达半个月的训练:
35.4% 的准确率,可以接受的。
预测图片的分类
最后
到此为止,你已经了解 Huaban Brain 的基本情况了。
当然在生产环境中还需要更多的考虑,这只是冰山一角而已。