AVA数据集官方网站,需要科学上网,AVA提供4类数据集:
AVA-Kinetics(v1.0)):时空动作检测,包含来自 AVA v2.2 的原始 430 个视频,以及来自Kinetics-700 数据集的238k 个视频 。
AVA-Actions(v2.2):时空动作检测,包含 430 个视频,其中235 个用于训练、64 个用于验证和 131 个用于测试。每个视频有 15 分钟的注释,间隔为 1 秒。
AVA Active Speaker(v1.0):说话人检测。
AVA Speech(v1.0)
Task介绍:http://activity-net.org/challenges/2019/tasks/guest_ava.html
包含 430 个视频,其中235 个用于训练、64 个用于验证和 131 个用于测试。每个视频有 15 分钟的注释,间隔为 1 秒。
AVA-Actions(v2.2)数据集下载,下载后会得到以下文件。
行为类别文件
:
行为标签文件
:
其他文件
:
包含来自 AVA v2.2 的原始 430 个视频,以及来自Kinetics-700 数据集的238k 个视频 。
AVA-Kinetics(v1.0)数据集下载,下载后会得到以下文件。
行为类别文件
:
行为标签文件
:
AVA提供80 个原子动作的注释:
id | 英文标签 | 中文标签 | id | 英文标签 | 中文标签 | id | 英文标签 | 中文标签 |
---|---|---|---|---|---|---|---|---|
1 | bend/bow (at the waist) | 弯/弓腰 | 2 | crawl | 爬行 | 3 | crouch/kneel | 蹲下/跪下 |
4 | dance | 舞蹈 | 5 | fall down | 摔倒 | 6 | get up | 起床 |
7 | jump/leap | 跳跃/跳跃 | 8 | lie/sleep | 说谎/睡觉 | 9 | martial art | 武术 |
10 | run/jog | 跑步/慢跑 | 11 | sit | 坐 | 12 | stand | 站立 |
13 | swim | 游泳 | 14 | walk | 走 | 15 | answer phone | 接电话 |
16 | brush teeth | 刷牙 | 17 | carry/hold (an object) | 拿/保持 (物体) | 18 | catch (an object) | 捕捉(物体) |
19 | chop | 劈 | 20 | climb (e.g., a mountain) | 攀登 (山) | 21 | clink glass | 碰杯 |
22 | close (e.g., a door, a box) | 关闭(门、盒子) | 23 | cook | 厨师 | 24 | cut | 切 |
25 | dig | 挖 | 26 | dress/put on clothing | 穿衣 | 27 | drink | 喝 |
28 | drive (e.g., a car, a truck) | 驾驶 | 29 | eat | 吃 | 30 | enter | 进入 |
31 | exit | 出口 | 32 | extract | 提炼 | 33 | fishing | 钓鱼 |
34 | hit (an object) | 击中(物体) | 35 | kick (an object) | 踢 | 36 | lift/pick up | 举起/捡起 |
37 | listen (e.g., to music) | 听 | 38 | open (e.g., a window, a car door) | 打开 (窗户、车门) | 39 | paint | 画 |
40 | play board game | 玩棋盘游戏 | 41 | play musical instrument | 演奏乐器 | 42 | play with pets | 和宠物一起玩 |
43 | point to (an object) | 指向(一个物体) | 44 | press | 按 | 45 | pull (an object) | 拉(物体) |
46 | push (an object) | 推(一个物体) | 47 | put down | 放下 | 48 | read | 读 |
49 | ride (e.g., a bike, a car, a horse) | 骑 | 50 | row boat | 划艇 | 51 | sail boat | 帆船 |
52 | shoot | 射击 | 53 | shovel | 铲 | 54 | smoke | 抽烟 |
55 | stir | 搅拌 | 56 | take a photo | 拍照 | 57 | text on/look at a cellphone | 发短信/看手机 |
58 | throw | 扔 | 59 | touch (an object) | 触摸 | 60 | turn (e.g., a screwdriver) | 转动(螺丝刀) |
61 | watch (e.g., TV) | 看(电视) | 62 | work on a computer | 在电脑上工作 | 63 | write | 写 |
64 | fight/hit (a person) | 打架/击打(人) | 65 | give/serve (an object) to (a person) | 把物给人 | 66 | grab (a person) | 抢(一个人) |
67 | hand clap | 拍手 | 68 | hand shake | 握手 | 69 | hand wave | 挥手 |
70 | hug (a person) | 拥抱 | 71 | kick (a person) | 踢(一个人) | 72 | kiss (a person) | 吻(人) |
73 | lift (a person) | 抬(人) | 74 | listen to (a person) | 听(一个人) | 75 | play with kids | 和孩子们一起玩 |
76 | push (another person) | 推(人) | 77 | sing to (e.g., self, a person, a group) | 唱歌(人,团体) | 78 | take (an object) from (a person) | 从(人)取(物) |
79 | talk to (e.g., self, a person, a group) | 与(人、团体)交谈 | 80 | watch (a person) | 看(一个人) |
一行的格式如下:video_id、middle_frame_timestamp、person_box、action_id、person_id。
video_id
:YouTube 标识符。middle_frame_timestamp
:从视频开始的秒数。person_box
:左上角 (x1, y1) 和右下角 (x2,y2) ,其中 (0.0, 0.0) 对应于左上角,而 (1.0, 1.0) 对应于右下角。action_id
:动作类标识符,见 ava_action_list_v2.2.pbtxtperson_id
:一个唯一的整数,允许此框链接到在此视频的相邻帧中描绘同一个人的其他框。AVA v2.2 在两个方面与 v2.1 不同。首先人工加入缺失的标签,将注释数量增加了 2.5%。其次,对宽高比远大于 16:9 的少量视频进行了框位置校正。
AVA v2.1 与 v2.0 的不同之处仅在于删除了少量被确定为重复的电影。类列表和标签映射与 v1.0 保持不变。
以前版本的 AVA 的文件可以在这里下载:
以下代码可以在我的github找到。
cd ava-actions
.
├── download.py
├── trainval_src.txt
├── test_src.txt
├── readme.md
trainval_url.txt
,test_url.txt
:训练集验证集、测试集可以直接下载的url文件,在win下可以直接使用迅雷,IDM批量下载;ubuntu下直接wget即可。
download.py
:如果不采用上述方法下载,亦可用download.py下载。
python download.py --url_txt <urlfile> --output_dir <output_dir>
https://github.com/cvdfoundation/ava-dataset
cd ava-kinetics
.
├── download.py
├── all.csv
├── test.csv
├── test.csv
├── train.csv
├── readme.md
all.csv
,train.csv
,test.csv
,val.csv
:训练集、验证集、测试集、所有数据集的Youtube ID,包括起止时间。
download.py
:使用download.py下载。
python download.py --input_csv <csvfile> --output_dir <output_dir>
https://github.com/gurkirt/kinetics-download-prep