利用百度自然语言处理词法分析技术,快速、准确、全面地挖掘优质版权与优秀作者,发现当下用户最关注的选题内容。进而将重点选题内容进行超级IP孵化,并把发现和孵化的好故事推送给合适的制片方,推动版权的高价值转化,提高行业效率,提升客户价值。由云莱坞孵化的单部超级IP仅在剧集版权交易一项,金额已达到千万元以上。
核心诉求
“好故事”是文娱行业的核心竞争力,目前全网小说超过千万、写者数量数以百万。如果一篇篇去阅读、去审核,极大消耗了人力财力,而且还会出现信息不统一、标准不一致的副作用,如何快速、精准、高效、全面地发现优质版权,是云莱坞乃至整个文娱行业面临的棘手问题。
解决方案
云莱坞通过使用百度大脑词法分析技术解决了优质版权高效挖掘的问题,主要有以下几个步骤:
1、语料:基于云莱坞业务场景所产生的“优质版权+非优质版权”内容构建标注语料;
2、预处理:将版权正文通过百度词法分析技术获取处理结果;
3、特征提取:在词法分析基础上,基于优质版权的标准挖掘版权的内容特征;
4、模型训练:通过深度学习找到最佳输出方案,根据最佳输出方案判定版权质量分数;
5、应用:根据版权质量分数,确定优质版权和优秀作者。