当前位置: 首页 > 工具软件 > luna > 使用案例 >

LUNA16数据集简介

黄跃
2023-12-01

1. 简介

1.1 介绍

LUNA16,全称Lung Nodule Analysis 16,是16年推出的一个肺部结节检测数据集。数据集包括 888 个低剂量肺部 CT 影像(mhd格式)数据,每个影像包含一系列胸腔的多个轴向切片。每个影像包含的切片数量会随着扫描机器、扫描层厚和患者的不同而有差异。原始图像为三维图像。每个图像包含一系列胸腔的多个轴向切片。

LUNA16 数据集是最大公用肺结节数据集 LIDC-IDRI 的子集,LIDC-IDRI 它包括 1018 个低剂量的肺部 CT 影像。LIDC-IDR I删除了切片厚度大于 3mm 和肺结节小于 3mm 的 CT 影像,剩下的就是 LUNA16 数据集了。

1.2 网站

比赛官网:https://luna16.grand-challenge.org/

官方论文:Validation, comparison, and combination of algorithms for automatic detection of pulmonary nodules in computed tomography images: the LUNA16 challenge

数据集下载

百度云:https://pan.baidu.com/s/1OvwNP26SvupMoQmK49aD7w?pwd=sy93
提取码:sy93

CT影响

2. 组成

下载后文件包含

|--CSVFILES
|	|--annotations.csv
|	|--annotations_excluded.csv
|	|--candidates.csv
| 	|--sampleSubmission.csv
|	|--seriesuids.csv
|--seg-lungs-LUNA16
|--subset0~9 包含10个子集,每个大约有90个CT扫描,总共888个
|	|--xxx.mhd:
|	|--xxx.raw:

2.1 candidates.csv

包含所有可能看起来像结节的肿块信息,无论这些肿块是恶行肿瘤、良性肿瘤还是其他。

统计文件中的行数:

$ wc -l candidates.csv
551066 candidates.csv

输出文件的前几行:

$ head candidates.csv
seriesuid,coordX,coordY,coordZ,class
1.3.6.1.4.1.14519.5.2.1.6279.6001.100225287222365663678666836860,-56.08,-67.85,-311.92,0
1.3.6.1.4.1.14519.5.2.1.6279.6001.100225287222365663678666836860,53.21,-244.41,-245.17,0
1.3.6.1.4.1.14519.5.2.1.6279.6001.100225287222365663678666836860,103.66,-121.8,-286.62,0
1.3.6.1.4.1.14519.5.2.1.6279.6001.100225287222365663678666836860,-33.66,-72.75,-308.41,0
1.3.6.1.4.1.14519.5.2.1.6279.6001.100225287222365663678666836860,-32.25,-85.36,-362.51,0
1.3.6.1.4.1.14519.5.2.1.6279.6001.100225287222365663678666836860,-26.65,-203.07,-165.07,0
1.3.6.1.4.1.14519.5.2.1.6279.6001.100225287222365663678666836860,-74.99,-114.79,-311.92,0
1.3.6.1.4.1.14519.5.2.1.6279.6001.100225287222365663678666836860,-16.14,-248.61,-239.55,0
1.3.6.1.4.1.14519.5.2.1.6279.6001.100225287222365663678666836860,135.89,-141.41,-252.2,0

每行都有 seriesuid,coordX,coordY,coordZ,class

  • Seriesuid:文件的唯一标识
  • X, Y, Z:结节的坐标
  • 类别:0 表示非结节,1表示结节(恶行或良性)

一共有 1351 个候选结节被标记为结节。

2.2 annotations.csv

包含一些已标记为实际结节的候选者的信息

查看文件有多少行:

$ wc -l annotations.csv
1187 annotations.csv

输出文件前几行:

$ head annotations.csv
seriesuid,coordX,coordY,coordZ,diameter_mm
1.3.6.1.4.1.14519.5.2.1.6279.6001.100225287222365663678666836860,-128.6994211,-175.3192718,-298.3875064,5.651470635
1.3.6.1.4.1.14519.5.2.1.6279.6001.100225287222365663678666836860,103.7836509,-211.9251487,-227.12125,4.224708481
1.3.6.1.4.1.14519.5.2.1.6279.6001.100398138793540579077826395208,69.63901724,-140.9445859,876.3744957,5.786347814
1.3.6.1.4.1.14519.5.2.1.6279.6001.100621383016233746780170740405,-24.0138242,192.1024053,-391.0812764,8.143261683
1.3.6.1.4.1.14519.5.2.1.6279.6001.100621383016233746780170740405,2.441546798,172.4648812,-405.4937318,18.54514997
1.3.6.1.4.1.14519.5.2.1.6279.6001.100621383016233746780170740405,90.93171321,149.0272657,-426.5447146,18.20857028
1.3.6.1.4.1.14519.5.2.1.6279.6001.100621383016233746780170740405,89.54076865,196.4051593,-515.0733216,16.38127631
1.3.6.1.4.1.14519.5.2.1.6279.6001.100953483028192176989979435275,81.50964574,54.9572186,-150.3464233,10.36232088
1.3.6.1.4.1.14519.5.2.1.6279.6001.102681962408431413578140925249,105.0557924,19.82526014,-91.24725078,21.08961863

与 candidates.csv 相比,最后一列不同,表示结节的直径。

需要注意的是,annotations.csv 文件提供的位置信息并不总是与 candidates.csv 中的坐标精确对齐。

 类似资料: