百度联合清华,全球首个十亿像素数据集来了!
大脑小编 发布于29天前 浏览:291 回复:18
1
收藏

近日,百度智能云数据众包与清华大学开展项目合作,推进全球首个十亿像素级视频数据集 PANDA 的建设工作,用以支持未来在公共安全、智慧城市、虚拟现实等领域的各项研究及应用。

本次项目共完成7200余帧亿级像素图片,共计超过106万张切图的数据标注工作,包括物体间关系近2万组、交互行为近20万个、移动物体轨迹点近30万组,以及数十亿 3D 点云数据的语义分割及实例标注,极大地丰富了 PANDA 现有数据集,并为清华大学后续举办的 GigaVision(十亿像素级机器视觉)主题挑战赛提供数据支持。

清华大学 GigaVision 挑战赛PANDA 数据集视频演示

近年来,行人检测、轨迹跟踪、动作识别、异常检测、属性识别等计算机视觉分析,已广泛运用到无人驾驶、智能安防、智慧城市等多个领域。AI 算法应用的背后,离不开大批量、高质量的标注数据。百度数据众包作为国内最大的 AI 数据服务提供商,具备数据“采、标、存、管、训”一体化的服务能力,专注于为人工智能的发展与应用赋能。


据了解,PANDA 是全球首个十亿像素级视频数据平台,它突破了人眼视觉分辨率的极限,赋予视觉计算更高质、更真实、更全面的源数据,填补了国际上“宽视场、多对象、高分辨率”数据平台的空白,为新一代智能处理技术研究提供了不可或缺的数据基础。

主流图像及视频数据集对比

清华大学电子工程系副教授、PANDA 数据集项目负责人方璐介绍,此前清华大学团队曾围绕 PANDA 数据集,在计算机视觉顶级国际会议 ECCV 2020上,组织了 GigaVision 2020挑战赛并引起广泛关注。目前,团队正在筹办 ACMMM 2021会议的 GigaVision 主题挑战赛,以及全球人工智能技术创新大赛的相关赛道。

研究现实世界中大规模人群的复杂行为及交互方式,对于人工智能系统更好地理解人的行为与意图,进而提升智能决策能力有着重要意义。PANDA 数据平台的构建,使得对于大场景、多对象、复杂关系的建模与分析成为可能。未来,百度将持续与清华大学合作,以技术赋能,推进 PANDA 数据平台的建设与发展。

百度作为国内人工智能领军企业,也是中国唯一在智能交互、智能基础设施和产业智能化领域,都形成了优势的 AI 平台型公司。依托百度多年 AI 数据经验,百度数据众包专注以数据智能对外赋能,致力于提供优质数据服务,携手政府、企业、高校等更多合作伙伴,共同推进新一代人工智能的高质量发展。

收藏
点赞
1
个赞
共18条回复 最后由JavaRoom回复于9天前
#17JavaRoom回复于9天前

需要人肉标记不?物美价廉啊啊啊!

哈哈哈

0
#155153381回复于22天前

又是期待而担忧未来的一天!

0
#14189******30回复于23天前

以后应该只有新类型的增量数据才需要人工标注吧

0
#13189******30回复于23天前

现在标注应该也是越来越自动化了吧

0
#12189******30回复于23天前
#5 doubi渣渣回复
目测标注费用都老贵了

希望以后越来越高效

0
#11doubi渣渣回复于23天前
#10 xashagua回复
数据集没公开吗,没看到下载链接呀

通常来说需要申请的

0
#10xashagua回复于24天前

数据集没公开吗,没看到下载链接呀

0
#9何必固執回复于26天前

厉害

0
#8rose20135188回复于27天前

这要点费用哈

0
#7夜华丨骑灬士丨回复于27天前

这数据集绝对优质

0
#6doubi渣渣回复于28天前

不知平台上机器带的动嘛……

0
#5doubi渣渣回复于28天前

目测标注费用都老贵了

1
#4doubi渣渣回复于28天前

太厉害了

0
#3hellyhua回复于28天前

点赞

0
#2何必固執回复于28天前

厉害了

0
TOP
切换版块