码迷,mamicode.com
首页 > 编程语言 > 详细

Python制作本地数据集

时间:2019-08-08 13:21:47      阅读:107      评论:0      收藏:0      [点我收藏+]

标签:util   ges   字符串   style   数据集   lis   序列   nump   个数   

技术图片
 1 #####################################################
 2 # 功能:Python制作本地数据集
 3 #####################################################
 4 
 5 # 导入相应包
 6 import os
 7 from PIL import Image
 8 import numpy as np
 9 from keras.utils import to_categorical
10 
11 dir_path = E:/prim/Sum  # 图片文件路径
12 labels = []
13 images = []
14 
15 dir_len = len(os.listdir(dir_path))   # os.listdir():返回指定目录下的所有文件和目录名   len() 方法返回对象(字符、列表、元组等)长度或项目个数
16 
17 # 直接读取单个中文文件夹
18 for i, name in enumerate(os.listdir(dir_path)):    # enumerate用于将一个可遍历的数据对象(如列表、元组或字符串)组合为一个索引序列,同时列出数据和数据下标,一般用在 for 循环当中。
19     print(%d/%d%(i+1, dir_len))
20 
21     if not name.endswith(.jpg):
22         continue
23     # 准备标签
24     label = np.array(int(name.split(_)[0][4:]))   # 以下划线取第一个数字
25 
26     # 准备图片
27     img = Image.open(os.path.join(dir_path, name)).resize((100, 100))  # 将每张图片固定成同样大小
28     img = np.array(img).astype(float32) / 0xff   # 转换成二进制数
29 
30     labels.append(label)
31     images.append(img)
32 
33 # 转numpy数组
34 images = np.array(images)
35 labels = np.array(labels)
36 labels = to_categorical(labels)
37 
38 print("images:", images.shape)
39 print("labels:", labels.shape)
40 
41 np.save(images, images)
42 np.save(labels, labels)
43 
44 print(done!)
Python制作本地数据集

Python制作本地数据集

标签:util   ges   字符串   style   数据集   lis   序列   nump   个数   

原文地址:https://www.cnblogs.com/Junlong/p/11320320.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!