各位大神,如何确定网站里一篇文章是广告还是正常的文章
使用PaddleNLP进行恶意网页识别 https://aistudio.baidu.com/aistudio/projectdetail/1812025,这系列项目开写中,感觉可以移植到广告识别的场景
如果涉及到多媒体的,就更麻烦了感觉
感觉这里面涉及好几个地方,假设这个网页是纯文字的,得先解析HTML把内容提取出来,然后做分类……于是就会发现这文章有点长
完整的说法应该是,拿到一个网页,让机器自己判断它是不是广告
哎哎哎,我的场景和你差不多
我甚至有点想搞个广告文生成器
有点意思,确实有业务场景
这个阅读就可以看出吧?
使用PaddleNLP进行恶意网页识别 https://aistudio.baidu.com/aistudio/projectdetail/1812025,这系列项目开写中,感觉可以移植到广告识别的场景
如果涉及到多媒体的,就更麻烦了感觉
感觉这里面涉及好几个地方,假设这个网页是纯文字的,得先解析HTML把内容提取出来,然后做分类……于是就会发现这文章有点长
完整的说法应该是,拿到一个网页,让机器自己判断它是不是广告
哎哎哎,我的场景和你差不多
我甚至有点想搞个广告文生成器
有点意思,确实有业务场景
这个阅读就可以看出吧?