Tensorflow是我接触阿里云PAI平台使用的第一个框架,不过在实现的时候,走了一些弯路,在这里分享出来,希望能有参考价值.
问题主要出在,demo中给的文件,要严格按照路径和文件名来存储,否则怎么都无法成功。
需要check_point cifar-10-batches-py predict_code train_code 四个文件夹,分别用来存训练结果、cifar数据、预测代码、训练代码。
具体内容可以参考我的github
https://github.com/hutcs/pai_tensorflow_cifar/
除了cifar数据太大以外,其他的都上传到了github中。
文章目录
第一个Tensorflow-1是用来训练数据
其详细参数如下:
Python代码文件
选择train_code目录下的cifar_pai.py 文件
Python主文件
留空即可
数据源目录
选择cifar-10-batches-py文件夹
配置文件超参及用户自定义参数
留空
输出目录
选择check_point文件夹
执行调优
根据自己需要,这个demo选择1即可,不需要太多的GPU资源来处理。
第二个Tensorflow-2是用来预测
Python代码文件
predict_code目录下的 cifar_predict_pai.py文件
Python主文件
留空即可
数据源目录
选择cifar-10-batches-py文件夹
配置文件超参及用户自定义参数
留空
输出目录
选择check_point文件夹
实验结果
在logview中可以查看预测结果
另外,由于这个demo只是测试,所以预测的准确率比较低。
阿里云项目地址如下:
https://yq.aliyun.com/articles/72841?spm=5176.100239.0.0.bdr9iz