标签:demo 运行 字幕 code not ring 发布 语义 dataset
对文章 COCO 数据集的使用 做了一些改动,抛去一些繁琐的操作,让 API 是使用更加方便和快捷。
微软发布的 COCO 数据库是一个大型图像数据集, 专为对象检测、分割、人体关键点检测、语义分割和字幕生成而设计。
COCO 数据库的网址是:
COCO API 提供了 Matlab, Python 和 Lua 的 API 接口. 该 API 接口可以提供完整的图像标签数据的加载, parsing 和可视化。此外,网站还提供了数据相关的文章, 教程等。
在使用 COCO 数据库提供的 API 和 demo 之前, 需要首先下载 COCO 的图像和标签数据(类别标志、类别数量区分、像素级的分割等 ):
coco/Images/
文件夹中coco/Annotations/
文件夹中下面我们来探讨一下如何利用 Python 来使用 COCO 数据集。
下面我们来看看如何更好、更方便的使用 COCO 数据集?
首先我先是 fork 了 COCO API,然后下载到本地,并切换到:D:\API\cocoapi\PythonAPI
。
cd D:\API\cocoapi\PythonAPI
打开 Makefile 可以看到 API 的安装和使用说明。
在 Windows 下直接运行 python setup.py build_ext --inplace
会报错:
标签:demo 运行 字幕 code not ring 发布 语义 dataset
原文地址:https://www.cnblogs.com/q735613050/p/10032687.html