资讯 社区 文档
眼前一亮|ta会给你一张精致的视频封面选图
发布日期:2017-05-16 09:08浏览量:2688次

众所周知,传统的视频平台针对视频封面的选取往往都是随机选取其中一帧,或者干脆就是首帧画面。这种结果怎么样全靠命的选取方式,怎么想都有点儿刺激呢!

小度随手举几个例子,看下图:

这是一个孩子,一个小孩子,但眉眼间流露出超越年龄的焦虑。他在惋惜什么?他在紧张什么?啊哈!是暑假最后一天才想起来作业没做完对吧!那肯定是家教学习机的广告咯?

 

其实,并不是的!

这是回到汪星球的微电影!

“汪汪”此刻小度的表情宛如图上这只老汪,这支命名为《回到汪星球》的感恩节影片想想就知道是围绕狗狗展开啊喂!可是封面里居然完全没有狗。

总而言之,无论多么精彩的视频,一般来说最后能否获取高关注,主要取决于配合标题的封面是否足够精准。由此产生两个问题:搜寻视频的人很难根据封面找到真正想找的视频,同时上传视频的人想要选出合适的封面也要耗费很大精力。

| 视频封面选图,人工智能的主场

想要选出贴切的视频封面,如果拒绝视频平台的随机抓取,那么似乎也就只剩下人工筛选这一条累心又耗时的老路?其实不然!

百度大脑的智能视频分析技术专门推出的视频封面选图功能,专治各种视频封面的疑难杂症

功能演示

如上边举的例子,经过视频平台自动生成(图左)与智能视频封面提取(图右),分别得到如下封面:

与视频平台随机生成的视频封面相比,显然智能提取的视频封面更加准确地表现了视频内容。(更多功能演示视频可登陆 http://ai.baidu.com/tech/video/vcs 观看。)

| 关于技术,看完全知道

它是怎样理解视频的?理解到了什么程度?一般而言选取需要多长时间?封面选取的主要依据有哪些?如何平衡贴合度吸睛程度?目前可以自动选取动态图片做封面吗? 

  

带着这些疑问,我们向百度大脑专门的技术人员进行了请教和询问,接下来就欢迎收听技术小哥的科技频道 

1.智能视频是怎样理解视频的?(智能视频如何分析一条视频?)

视频内容分析方案,基于视频流信息,提取视频中的音频和每帧的图像内容,应用AI的语音、图像、NLP技术,实现对音频的语音识别转文字,实现对图像中人物的人脸识别、字幕和文字的OCR识别、物体和场景的识别,输出一系列代表视频内容的文本、标签、人物信息,最后通过NLP的语义理解,抽取出最终的视频标签。

2.理解到了什么程度?(智能视频对视频的分析程度?)

视频内容分析方案,可以实现对视频中的对白、公众明星人物、字幕关键内容、视频场景和关键物体等各种内容元素的识别和理解。

3.一般而言选取需要多长时间?(智能视频在分析一条视频之后,经过多长时间的运算可以得出最佳封面的结果?)

一般情况下,对一段视频进行理解和分析,需要的时长不超过视频本身的时长。主要时间是花在多维的内容提取和识别上,识别后,模型计算形成最后的标签和封面图是实时生成的。

4.封面选取的主要依据有哪些?(智能视频分析视频之后,通过怎样的比较、依据什么条件得出最佳的封面结果?)

模型考量的主要是,从视频中抽取出的每帧图像的清晰度、美观度、内容丰富度、内容与主题的相关性等维度。

5.如何平衡贴合度吸睛程度?(选取视频封面的时候,是会优先选择符合视频内容的画面,还是优先选择吸引眼球但不那么符合视频内容的画面?)

贴合度主要含义是指封面图中的内容,能够很好的体现整段视频的核心内容;吸睛程度主要含义是指封面图本身的清晰度、美观度、内容的丰富度要足够吸引眼球,而不是一张枯燥无味的平淡的图片。模型会根据具体的case调整权重,选择最适合的一张。

6.目前可以自动选取动态图片做封面吗?(目前可以自动截取一段gif作为视频封面么?未来呢?)

目前已经开放的服务,还不能选取动态图片做封面。我们正在研发动图封面和视频精彩片段提取的模型,很快将会推出

| 广阔的应用前景

无论是自媒体创作短视频,亦或是综合视频网站的海量视频,都可以使用智能视频封面选图服务,快速为长/短视频选出最具代表性的高质封面,提升用户的视觉体验,同时便于用户快速筛选视频,帮助用户留存。

智能视频封面选图服务,为视频生成最精彩的封面,在最短的时间内把视频最具吸引力的内容呈现出来, 有效帮助提升视频的点击量、播放量和用户停留时长。

优化用户体验和提高视频播放量的同时,你的每一次调用其实都在切实体验着人工智能润物无声的完美服务。而这,不正是我们曾经向往的未来吗?

技术能力
语音技术
文字识别
人脸与人体
图像技术
语言与知识
视频技术