高分辨率图像建筑物提取数据集制作

时间：2020-01-04 22:28:10 阅读：198 评论：0 收藏：0 [点我收藏+]

目录结构

/dataset/
 xxxx.tif  # 原始图像
 image-3000
     0.tif # 切割后的tif
     1.tif
     ........
     0.json # 生成的json文件也放在该文件夹下
     1.json
     .......
     0_json # 调用labelme_json_to_dataset 0.json 生成的0_json文件夹
         img.png # 原始图片的png格式
         info.yaml
         label.png # 标签图片
         label_names.txt 
         label_viz.png
     1_json
     .......
     0.png  # 将json文件夹中的label.png 提取出来
     1.png 
     .......
     label_0.tif # 将上边的png标签文件转换为tif格式

技术图片

收集数据，高分辨率图像
1. 无人机数据，航空数据等

图像切割，像素大小该为多少？

本数据集平均像素大小（40000*50000） tif格式，LZW压缩方式压缩

要考虑计算机显卡，目标建筑无尽量不被切割等问题，本利使用3000*3000

# data:2020-01-04
# user:dean
# desc:图像切割脚本
import tifffile as tiff  # 也可使用pillow或opencv 但若图片过大时可能会出问题
import os
image = r"I:\人工智能数据\DOM\裴庄村51-dom\裴庄村51-dom.tif"
target_dir = r"I:\人工智能数据\DOM\裴庄村51-dom\image-3000"  # 切割后图片存储位置
width = 1500*2   # 切割图像大小
height = 1500*2  # 切割图像大小
img = tiff.imread(image)  # 导入图片
print("导入图片完成",img.shape) # 原始图片大小
pic_width = img.shape[1]
pic_height = img.shape[0]
row_num = pic_width//width  # 纵向切割数量
col_num = pic_height // height  # 横向切割数量
print("开始进行切割，可切割总数为{}".format(col_num*row_num))
for j in range(col_num):
    for i in range(row_num):
        num = j * row_num + i
        print("正在进行第{}张切割".format(num + 1))
        row = i * width
        row_end = row + width
        col = j * height
        col_end = col + height
        # print(col,col_end,row,row_end)
        cropped = img[col:col_end,row:row_end]
        name = "{}.tif".format(num)
        image_path = os.path.join(target_dir,name)
        tiff.imsave(image_path, cropped)

标注工具 labelme

使用label标注每张图片
```
pip install labelme  # 安装labelme
```

每张图片标注后会生成对应name.json文件

labelme_json_to_dataset xxx.json

技术图片

# data:2020-01-04
# user:dean
# desc:批量将json文件转为 label
import os
dir = r"I:\人工智能数据\DOM\裴庄村51-dom\image-3000"
files = [os.path.join(dir,file) for file in os.listdir(dir) if file.endswith(".json")]
for file in files:
    cmd = "labelme_json_to_dataset {}".format(file)
    print(cmd)
    os.system(cmd)

将所有的json/label.png 提取到统一文件夹

# data:2020-01-04
# user:dean
# desc:将label文件夹中的laebl提取出来
import tifffile as tiff
from  PIL import Image
import os
target_dir = r"I:\人工智能数据\DOM\裴庄村51-dom\image-3000"  # json_label 所在的文件夹
files = [os.path.join(target_dir,file)  for file in os.listdir(target_dir)]
for i in files:
    if os.path.isdir(i):
        lables = os.listdir(i)
        for file in lables:
            if file == "label.png":
                imgae = Image.open(os.path.join(i, "label.png"))
                name = "{}.png".format(i.split("_")[0])
                imgae.save(os.path.join(target_dir,name))
                print("第{}个文件夹".format(i))
                break;

将所有的label.png转换为tif格式

# coding:utf-8
# file: change_format.py
# author: Dean
# contact: 1028968939@qq.com
# time: 2020/1/4 20:41
# desc:图片格式转换
from PIL import Image
import os
target_dir = "I:\人工智能数据\DOM\裴庄村51-dom\image-3000"  # png 图片所在文件夹
files = [os.path.join(target_dir,file) for file in  os.listdir(target_dir)]
print(files)
for file in files:
    if file.endswith(".png"):
        name = os.path.basename(file)
        new_name = "label_{}.tif".format(name.split(".")[0])
        image = Image.open(file)
        path = os.path.join(target_dir, new_name)
        image.save(path)
        print(path)

结束（根据需要提取相应数据即可）

高分辨率图像建筑物提取数据集制作

标签：import 标签文件 tac 取出 json mat 结构安装 spl

原文地址：https://www.cnblogs.com/Dean0731/p/12150524.html

踩

(0)

评论一句话评论（0）

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)

周排行

高分辨率图像建筑物提取数据集制作

目录结构

收集数据，高分辨率图像

图像切割，像素大小该为多少？

标注工具 labelme