图像识别怎样守护网络直播的底线？| 硬创公开课-每日电讯报中文版

本篇文章4808字，读完约12分钟

今年八月，雷锋。在空盛会召开之前，com将举办一场具有全球影响力的人工智能和机器人创新大会。那时，雷锋。搜索“雷锋”。将发布“人工智能与机器人创新企业25强”名单。目前，我们正在走访人工智能和机器人领域的相关公司，筛选最终入选的公司名单。如果您想加入我们的名单，请联系:2020@leiphone。

雷锋。com出版社:这篇文章是根据图普科技李在雷锋的演讲改编的。com。李是图普科技的创始人兼首席执行官。前腾讯t4技术专家、腾讯高级项目经理、qq邮箱项目负责人、微信项目创始人之一。

直播流行背后的问题是什么？1.监督直播内容有什么困难？

首先，网络广播的规模巨大，人工审计的成本很高

2015年，有近200个直播平台，用户数量达到2亿。在大型直播平台的每日高峰时段，数万个直播“房间”将同时上线，用户数量可达1000万。如果所有员工同时查看10，000个视频，为了确保网里没有鱼，至少需要数百人同时工作，每个员工需要配备1-2台监控设备。

例如，盈科投资800多人进行审计，占据7000平方米的审计基地，进行24小时人力审计。事实上，侵犯现场视频内容的比例并不高，只有0.04%，甚至更低。然而，为了实现“无鱼可逃”，企业需要投入大量的人力、物力和财力进行监管，这就增加了运营成本的压力。

二是直播流量集中在夜间，人工审核效率低

白天网播的“房间号”与晚上不同。目前，白天网络直播的高峰流量是数百个视频，晚上可以飙升到数千个。然而，“三班倒”的审计人员在夜间疲惫不堪，人眼识别的准确率下降，误判和漏判的概率增加，审计效率下降，难以满足网络直播的内容监管要求。

第三，很难实时验证主持人和直播的真实姓名

直播平台注册简单，主持人规模迅速扩大。如果实名认证完全依赖人工审核，人工成本会增加，难以实现真实有效的审核；此外，在一些稍微大一点的直播平台的高峰期，还会有成千上万的人。如果主持人每次现场直播，都要核实它是否属于自己，这就增加了一部分人工成本。对于一些中小型直播初创企业来说，运营难度上升。

图像识别怎样守护网络直播的底线？| 硬创公开课

2.该州的监管政策对直播平台有什么影响？

(1)从直播平台本身的角度来看，可以促进直播平台的自律:例如，一些直播平台要求主持人必须经过实名认证，且至少18岁；直播内容存储时间不少于15天；向所有直播房间添加水印；情节严重的主持人将被列入黑名单，直播内容将被实时监控24小时。

(2)从直播平台的发展来看，对于大型企业的发展具有优势。大型直播平台可以承担更高的监管成本，中小型视频直播平台在监管和审查成本不断增加的环境下将面临更多挑战。

(3)从直播平台的内容发展来看，依靠色情、暴力等“激进”内容来吸引用户越来越不可行，未来的热门和潜在主持人可能会更专业。

机器如何审核直播？1.有什么方法可以查看直播？

有两种传统的图像审计方法:

纯手工审核:员工“三班倒”；

传统智能审计:人眼识别图片或视频是否非法；传统的智能审计:例如，要识别色情图像，肤色比例基本上是通过图像的rgb值来识别的；通过建模识别异常动作和敏感部件。

但是，这两种审计方法都存在很大的漏洞，“三班倒”劳动容易导致审计效率低下、误判和漏判等主观问题；传统的色情图片智能识别准确率低，误报率高。此外，这三种审计方法更难以满足近两年流行的现场视频审计的需求。

目前，审计主要采用机器识别和人工审计相结合的方式。机器识别依赖于人工智能领域的最新算法:深度学习算法，它模拟人脑神经网络建立具有高级表现力的模型，能够很好地解释高复杂度的数据。通过不断的训练和大数据的频繁迭代，黄色识别的准确率不断提高，有效节省了人工审核工作。

2.查看直播内容，机器做了什么？

(1)机器检查直播内容是否与色情或非法相关

该机器主要用于判断哪些图片是色情或非法信息，需要过滤掉。它在这方面的智力水平可以取代人力。经机器审核后的数据将分为两部分:“确定”和“不确定”。某个部分的准确率可以达到99.5%，不确定的部分会如实告诉客户，客户会做出决定。不确定性零件可能只占总审核量的1 ~ 2%，原来需要100人审核，但机器识别服务后，只需1 ~ 2人即可完成。

图像识别怎样守护网络直播的底线？| 硬创公开课

(2)机器识别的工作原理

简而言之，深度学习可以被理解为一个空白大脑，这些大量的数据被灌输给经验。深度学习属于机器学习的范畴，是机器学习的最新技术，主要体现在“深度”一词上。

深度学习可以理解为“深度机器学习”，因为普通或传统的机器学习在神经网络的复杂性和层次上没有现在这样高。深度学习意味着层次一层一层增加，层次和复杂性加深很多，所以现在称之为深度学习。

例如，如果你想训练一只狗，如果它是对的，你会激励它，如果它是错的，你会惩罚它。随着时间的推移，它会知道什么是积极的或消极的激励，然后它会知道它应该做什么，它对错误事情的想法会逐渐被抵消。

当我们把大量色情、性感和正常样本的属性告诉深度学习引擎时，让引擎继续学习，然后奖励他们做对的事情，惩罚他们做错的事情。当然，这些奖惩都是数学上的。最后，空白脑袋将成为一个连接模型，它是为了区分色情和非色情而诞生的。

基于机器识别的图像识别技术如何像人脑一样了解和学习图像特征？

其核心是深度学习理论。深度学习是人工神经网络。为了理解安，让我们先来看看人脑是如何工作的。

人脑的视觉处理系统

上图所表达的是人们理解外部视觉信息的过程。

从视网膜开始，通过低层v1区域提取边缘特征，在v2区域提取目标的基本形状或部分，在更高层提取整个目标(如人脸)，在更高层提取pfc(前额叶皮层)进行分类和判断。也就是说，高级特征是低级特征的组合，从低级到高级的特征表达越来越抽象和概念化，也就是说，它越来越能表达语义或意图。

深度学习是通过组合低级特征来形成更抽象的高级特征(或属性类别)。然后，基于这些低级表达式，可以通过线性或非线性组合获得高级表达式。另外，不仅图像有这个规律，而且声音也是相似的。

让我们来看看深度学习的简单模型:

传统神经网络和深层神经网络

深度学习的主要优点之一是它可以利用大量的训练数据(即大数据)来不断提高学习过程中的识别精度，但它仍然需要大量的计算。近年来，由于计算机速度的提高、大规模集群技术的兴起、gpu的应用以及许多优化算法的出现，几个月的训练过程可以缩短到几天甚至几个小时，深度学习可以逐步用于产业化。

对于开发团队来说，在这个领域制作产品的困难在于如何获得大规模的标记数据，如何计算与gpu集成的集群，以及如何为自己的项目调整参数。团队需要不断输入新数据并不断迭代，以提高机器识别的准确性。

那么为什么机器学习以前没有出现，但是在过去的一两年里开始出现呢？

因为机器学习需要同时满足三个条件:

1.海量数据(众所周知，互联网发展了这么多年，积累了大量数据)；

2.高性能计算的能力(由于摩尔定律的发展，显卡和图形处理器已经积累了很多年)；

3.深度学习算法(这是2012年的一次imagenet竞赛，受到业界的广泛关注，并隆重登上历史舞台)

3.现场直播的数量如此之大，如何评论/推荐？

1)哪些公司进行形象识别，竞争有什么不同？

在智能审计的垂直领域，有腾讯Youtu和阿里吕望，他们主要为自己的平台客户提供审计服务，不属于第三方。

2)目前，直播客户包括焦赞、再铸宝、盈科、17直播、吴空tv等。

主要有两种服务类别:

标准审计服务:包括黄色识别、恐慌识别、广告识别、敏感人脸过滤等。；

个性化定制服务:根据客户的实际需求，定制专属的图像识别整体解决方案，如特定场景的回顾(吸烟、喝酒、打架、自残等)。)，人脸识别(锚面值、风格、表情、年龄、性别、其他外部特征等。)、场景识别(现场直播锚点的环境)、对象识别(现场直播平台中出现的对象)和其他图像识别。

直播平台的个性化推荐是在传统推荐系统的基础上，结合图像识别技术，基于用户的切身兴趣，智能推荐符合用户心理预期的内容。

例如，在场景的精确推送中，可以基于人脸、场景、产品识别和分析技术来捕获视频中的价值信息，以实现最精确的内容匹配；

在主持人风格的推荐中，可以自动对不同风格的男性女神进行分类，并根据用户平台数据和兴趣智能推送偏好类型；

还可以建立一个面值推荐系统，基于人脸识别，机器将自动向用户推荐高面值的锚。

现场直播很热，机器学习也很热。1.除了观看直播，机器学习还能做什么？

除了帮助直播平台避免内容风险，机器识别还可以通过以下形式优化直播平台:

首先，通过图像识别对主持人进行分类，我们可以了解直播平台的内容是否健康，或者给主持人贴上标签，以及平台是否需要培养和支持一些稀缺和热门的主持人。

第二，深入挖掘直播平台的图像识别云服务，比如主持人在做什么，唱歌、跳舞、抽烟、化妆、睡觉等等。未来，可以挖掘的信息量将会更大，包括识别视频中出现的所有东西、汽车、手机、玩具或其他东西，这些都反映了一个人的生活习惯和行为习惯。机器可以根据用户的喜好智能推送相应的直播视频，帮助直播企业更好地与用户互动。

图像识别怎样守护网络直播的底线？| 硬创公开课

第三，现场视频中发送出去的所有图像信息，包括人物、地点、活动、事物、背景等。，可以帮助用户智能地搜索所需信息，如ktv、餐厅、教室等。，这可以改善产品和用户体验，或者如果企业想要实现这些信息流，可以根据企业的需求对它们进行定制。

第四，基于人的智能搜索可以帮助直播平台连接用户和内容，连接相似的锚点，让用户找到他们想要的角色。比如，用户可以描述自己梦中情人的形象，然后智能搜索，或者上传自己的照片，找到和自己最般配的主持人，这些都是同质化直播平台目前做不到的。

今年8月，雷锋将在深圳举办“全球人工智能和机器人创新大会”。机器学习的未来趋势是什么？1.凯文·凯利说:“人工智能将很快成为一种商品。智能将像电力一样通过网络传输。”这意味着人们将生活在一个被人工智能包围的世界里。

在应用中，建立了一个更加实用的学习系统，特别是多种学习方法协同工作的集成系统的研究。机器学习将深入到各个行业，人工智能+的时代已经到来。

虽然人工智能不能在短时间内理解人类的情感，但在未来五年内，人工智能技术领域的初创企业数量将会成倍增长，一些功能性应用将会得到开发。人工智能将在这些专业功能上帮助人类或者直接取代人类。例如，人工智能可以为你推荐新闻，帮你扫地，帮你开车，甚至帮你管理健康。五年后，将会出现一批相对成熟的垂直人工智能企业，人工智能与传统企业的结合将会更加紧密。

图像识别怎样守护网络直播的底线？| 硬创公开课

2.技术上，现有的学习方法得到发展和改进，同时研究新的学习方法。特定应用或特定类型应用的特定学习方法将不断涌现，数据管理将得到更多关注，数据的价值将不断扩大，机器学习结果的解释将逐渐受到重视。

编者按:以下是雷锋精选公开课上一些精彩的问答分享

1.如何通过机器识别处理直播中的非法视频？

视频通过区间截图、关键帧截图等进行处理。，因为监控是旁路的，峰值可以是每秒5k并发，它将在1-2秒后返回，所以实时性能不会受到影响。检测到匹配信息后，机器会将结果实时反馈给客户。至于屏蔽、删除或禁止广播的处理，主要取决于业务方面，可以由机器自动处理，也可以人工干预。

2.图像识别在智能医学领域的应用是什么？

图像识别不仅应用于互联网行业，也广泛应用于其他行业。

例如，在智能医疗领域，有一个专门用于医学图像处理的小领域，就像通过病人的图像如肝脏来判断是否有癌症一样；比如眼睛的图像，判断是否有白内障等。；更详细地说，去血管图像判断是否有梗阻。此外，一些传统领域的应用，如基于图像的搜索，可以帮助商标局建立一个商标库，新注册的企业可以自动搜索同一商标是否注册；基于物体识别，可以辅助铁路运输部门自动检测线路的电闸是否损坏或油漆脱落，判断是否需要更换；它还可以帮助电视台做广告监管，监控某个品牌的曝光时间，以及某个商标在某个时间显示的时长。

标题：图像识别怎样守护网络直播的底线？| 硬创公开课

地址：http://www.j4f2.com/ydbxw/6918.html

图像识别怎样守护网络直播的底线？| 硬创公开课

每日电讯报推荐浏览

什么白酒好喝？酱香型白酒、浓香型白酒、清香型白酒哪种好？

黄台高速公路如何选用交通标志杆

腾讯微云还活着但是同步功能没了

煤矿洗轮机可用的范围-远远超出你的意料

AlphaGo开发者:不存在秘密协议请尊重李世石

女王最喜欢的孙子被妻子抛弃了。为什么所有嫁给英国王室的妻子都跑了？

从山东农村孩子到中国科学院外国院士！他是一所著名英国学校的首任中国校长

百度地图宣布国际化称目前国内市场份额第一

每日电讯报热文榜

深圳福田汽车抵押贷款-正规的车辆抵押

阿里云国际账号注册实名认证充值服务中心

八字算婚姻合婚风水

闵行区自动化防静电柜的日常使用事项_佰斯特POUSTO

二次结构泵-机械化施工效率有保障

高新区研修班开班

高级课程研修班劳动经济学

高级研修班推介会

高新技术研修班

什么样的防静电桌垫好？如何安装？_佰斯特POUSTO

每日电讯报最近更新

图像识别 怎样守护网络直播的底线？| 硬创公开课

每日电讯报推荐浏览

每日电讯报热文榜

每日电讯报最近更新

图像识别怎样守护网络直播的底线？| 硬创公开课