导航:首页 > 源码编译 > 基于业务特征区分号码的算法

基于业务特征区分号码的算法

发布时间:2022-10-28 08:45:37

A. 如何区分移动联通和电信的手机号码!

根据号段区分。

移动号段:

134,135,136,137, 138,139,147,150,151, 152,157,158,159,178,182,183,184,187,188,198,170,171,165

电信号段:

133,153,177,180,181,189,199,1700,1701,1702,162

联通号段:

130,131,132,155,156,185,186,145,146,166,176,1704,1707-1709,171(0-9)

(1)基于业务特征区分号码的算法扩展阅读:

2018年起工信部陆续将16号段号码批给三大运营商进行号码销售经营,这是继170和171之后又一批用于三大运营商转售业务的号段,也是我国通信市场市场化的又一举措。

随着携号转网,归属地异地服务打通,通信市场又会迎来新的气象。

其中162所有号段均为中国电信所有,165为中国移动公司所有,167为中国联通公司所有,专用于三大运营商开展手机号码转售业务。

162/165/167号段号码可以购买后实名制激活使用,属于国家工信部批示的正规手机号段。

B. 怎么区分移动,联通,电信的号码

不同运营商的号码是有区别的,分配到的号段(即手机号码前三位)不一样。
国内号码归属运营商情况如下:
中国移动:134(不含1349)、135、136、137、138、139、147、150、151、152、157、158、159、182、183、184、187、188
中国联通:130、131、132、145(上网卡)、155、156、185、186
中国电信:133、1349(卫星通信)、153、180、181、189
4G号段:170:[1700(电信)、1705(移动)、1709(联通)]、176(联通)、177(电信)、178(移动)

C. 怎么区分移动,联通,电信的号码

目前联通号段有:130、131、132、145、155、156、186、185、176等。
温馨提示:以上信息仅供参考,目前三大运营商已开通携号转网业务,号码具体归属哪家运营商运营,请以号码实际使用情况为准。

D. 什么是业务号码

就是个人通信业务号码

个人通信业务是允许任何用户在任何时间、任何地点与任何人进行任何形式(如语音、数据、图像)的通信,既支持终端移动性又支持个人移动性,以移动的人为通信对象的智能宽带多媒体通信业务,是通信发展的最高目标。

支持个人通信业务的个人通信网采用与网络无关的惟一的个人通信号码标识用户个人,是移动通信网与固定通信网相结合的智能化宽带综合业务网。

个人通信业务号码一个唯一地识别个人通信业务使用者的号码,用它来认定或发送呼叫给该使用者。个人通信业务号码是是个人通信业务的核心。

(4)基于业务特征区分号码的算法扩展阅读:

通用个人通信业务的实现方法

本发明提出了一种通用个人通信业务的实现方法,通过移动交换中心接收到呼叫申请有通用个人通信业务移动号码,将移动号码发送到业务控制点中以向业务控制点请求该移动号码的通用个人通信业务;业务控制点对所述请求进行响应,将所述移动号码通过移动交换中心接续至独立业务交换点;

独立业务交换点将移动号码发送到业务控制点以使业务控制点启动该移动号码的通用个人通信业务;业务控制点根据接收的所述移动号码,启动该移动号码的通用个人通信业务和其对应的接续属性,并把接续属性下发到独立业务交换点;独立业务交换点按照接续属性和被叫多个终端进行接续;从而实现通用个人通信业务能够在移动智能网络系统中运行的目的。

E. 787292值得申购吗

建议申购浩瀚深度(688292)、股吧】在7月27日发布了其发行招股书,其中浩瀚深度申购时间为2022年8月5日,浩瀚深度的发行价格是16.56元/股,网上发行数量是1001.8万股。目前浩瀚深度在海量数据采集、高速数据处理和深度信息挖掘等方面拥有超过二十年的先进经验和技术沉淀,已形成“大规模高速链路串接部署的DPI”等五大类核心技术,具备大规模高速网络环境下的深度包检测能力,能够有效实现高速数据处理、海量数据获取以及深度信息挖掘。 浩瀚深度值得申购吗.jpg 浩瀚深度值得申购吗从最近1个月的上市新股来看,获得收益性可能性比较低,出现破发的个股在7月中旬后增多的,因此申购需要谨慎的。 【申购信息】 股票简称 浩瀚深度 申购代码 787292 股票代码 688292 上市地点 上海证券交易所 网上顶格申购需配市值 10.00万元 网上发行数量 1001.8万股 发行总股数量 3928.6667万股 发行价格 16.56元 浩瀚深度申购日期 2022年8月5日 浩瀚深度自设立以来始终聚焦于互联网流量的智能化管控和数据应用领域,通过持续研发掌握了以 DPI 技术(即深度包检测技术)为核心的一系列自主知识产权,公司在海量数据获取、高速数据处理和深度信息挖掘等方面拥有超过 20 年的实务积累和技术沉淀。 报告期内,公司主要从事网络智能化及信息安全防护解决方案的设计实施、软硬件设计开发、产品销售及技术服务等业务。公司采用“以采集管理系统为基础,全方位拓展延伸”的业务发展模式,在持续迭代升级智能采集管理系统的同时,纵向拓展各类智能化应用系统,横向延伸开发信息安全防护类产品,致力于为电信运营商等各类客户提供全方位、高性能、跨平台的网络智能化及信息安全防护解决方案,为各层级网络的高效、稳定、安全运行提供保障。 经过多年发展,公司相关产品已广泛部署于中国移动、中国联通、【中国电信(601728)、股吧】等主要国内电信运营商的骨干网、城域网/省网、IDC 出口等各层级网络节点,报告期内公司新增链路带宽管理规模接近 400Tbps,公司产品在各层级网络节点。 市场地位 公司目前业务已扩展至全国范围,产品广泛部署于国内三大运营商各级网络,在关键网络位置发挥重要作用。根据公开数据,发行人在【中国移动(600941)、股吧】总部 2018-2021 年互联网 DPI 集中采购招投标的中标总份额超过 50%。截至报告期末,公司已获授权发明专利 23 件、实用新型专利 10 件、外观设计专利 5 件;计算机软件着作权 108 件。凭借雄厚的研发实力,公司多年来获得多项荣誉,包括“中国通信学会科技进步一等奖”、“北京市软件和信息服务业新领域高成长企业”、“中国通信工业 100 强”等。 公司技术水平及特点 (1)公司网络智能化解决方案能够实现“高速网络环境下的深度包检测” 公司成立于 1994 年,是国内较早认识到深度包检测技术的原理和重要性, 并且专注其设计与产业化实现的企业,公司已熟练掌握“大规模高速链路串接部署的 DPI 技术”等五大类核心技术,产品广泛部署于运营商关键网络节点,具备大规模高速网络环境下的流量管控、数据获取和信息挖掘能力。目前,互联网中承载着海量用户及应用的上网信息和行为记录,政府部门、企事业单位等各行各业的数字化信息都在网络和链路上进行传输及信息交换。根据 2020 年 8 月发布的《中国禁止出口限制出口技术目录》,“高速网络环境下的深度包检测技术”被我国列为限制出口技术。 (2)公司采用专用硬件架构、并基于 FPGA 芯片增强计算力,通过串接控制技术应对大规模高速网络环境 针对大规模高速网络环境下的流量及数据智能化需求,公司以深度包检测通用技术为基础,选择采用专用硬件架构、并基于 FPGA 芯片增强计算力,通过串接控制技术作为主要技术路径,以最终实现大规模高速网络流量及数据的实时、全量采集和多维度高精度智能管控。 (3)公司采用多级多维度并发策略匹配和控制技术实现大规模高速网络的管控及智能化应用 公司智能采集管理系统可同时支持三大类 11 种 4~7 层的控制策略,所有策略的内部控制、状态更新、并行运算、综合判决等全部由自主设计的高速逻辑和外部存储器协同实现。系统内各种策略均可支持以下报文动作:丢弃或封堵、令牌桶限速、改变 QoS 类型、优先转发、质量劣化、白名单和镜像分发。此外,公司网络智能化解决方案可以根据用户要求任意组合数据采集的多个特征参数,基于业务区分的流控算法能够有效限制低优先级业务的带宽占用率,即使在网络拥塞的情况下也能保证高优先客户的服务质量,保证链路的合理利用。 看完了浩瀚深度的公司简介以及主要产品发展和浩瀚深度申购信息,下面为大家拓展关于什么是新股申购、申购建议和申购最佳时间。 新股申购是为获取股票一级市场、二级市场间风险极低的差价收益,不参与二级市场炒作,不仅本金非常安全,收益也相对稳定,是稳健投资者理想投资选择。新股申购是股市中风险最低且收益稳定的一种投资方式。新股发行是指首次公开发行股票(英文翻译成Initial Public Offerings,简称IPO),是指企业通过证券交易所首次公开向投资者发行股票,以期募集用于企业发展的资金的过程。 新股申购业务适合于对资金流动性有一定要求以及有一定风险承受能力的投资者,如二级市场投资者、银行理财类投资者以及有闲置资金的大企业、大公司。 申购建议 1、新股申购预先缴款改为中签后再缴款。对此,业内人士普遍认为,按照持有股票的市值进行配售,而且不用预缴款,相当于持有流通市值的股民都有机会申购新股,但是中签率会更低。 2、三次中签不缴款挨罚调整后的规则,增加了“投资者连续12个月累计3次中签后不缴款,6个月内不能参与打新”的惩戒性措施。 申购新股最佳时间 投资者通过证券公司交易系统下单申购是要注意时间段,原因是一只新股只能下单一次,需要避开下单申购的高峰期,这样不仅申购中签几率大,而且成功率高。经过研究,投资者委托最密集的时间段且中签最多的时间段是在上午10:30-11:30和下午1:00-2:00时,中签概率相对较大。

F. 数仓建模分层理论

这篇文章较为完整、清晰的讲述了数仓建模分层理论,要点如下:

1、分层的意义:清晰结构体系、数据血缘跟踪、减少重复开发、复杂问题简单化及统一数据口径

2、ODS:用作缓冲,可以存一周左右,跟DWD大多重复,留存的目的还在于保持跟源端一致,方便追溯

3、DWD:针对ODS做数据的清洗和整合,在DWD层会根据维度模型,设计事实表和维度表,DWD层是一个非常规范的、高质量的、可信的数据明细层

4、DWS:基于DWD层形成某一主题的轻度汇总表或分析宽表,DWS形成大量维度退化的事实表以提高易用性,DWS层应覆盖80%的应用场景

5、TDM:标签层,通过统一的ID-Mapping 把各个业务板块,各个业务过程中同一对象的数据打通,形成对象的全域数据标签体系,方便深度分析、挖掘、应用,大家注意,这个ID不仅仅指客户或用户ID,也包括其它的主数据ID,其是全流程分析的基础

6、ADS:数据应用层ApplicationDataService面向业务定制的应用数据,主要提供给数据产品和数据分析使用的数据,一般会放在ES,MYSQL,Redis等前端系统供线上系统使用,也可以放在Hive中供数据分析和数据挖掘使用

7、DM:主要是提供数据产品和数据分析的数据,主要解决部门用户报表和分析需求而建立数据库,数据集市就代表数据仓库的主题域。DM 是面向单个主题的,所以它不会从全局考虑进行建设。

强烈推荐阅读!

正文开始

简单点儿,直接ODS+DM就可以了,将所有数据同步过来,然后直接开发些应用层的报表,这是最简单的了;当DM层的内容多了以后,想要重用,就会再拆分一个公共层出来,变成3层架构,这个过程有点类似代码重构,就是在实践中不断的进行抽象、总结。

数仓的建模或者分层,其实都是为了更好的去组织、管理、维护数据,所以当你站在更高的维度去看的话,所有的划分都是为了更好的管理。小到JVM 内存区域的划分,JVM 中堆空间的划分(年轻代、老年代、方法区等),大到国家的省市区的划分,无一例外的都是为了更好的组织管理

所以数仓分层是数据仓库设计中十分重要的一个环节, 优秀的分层设计能够让整个数据体系更容易理解和使用

这一节,我们主要是从整体上出发进行分析和介绍,就和上一节数仓建模方法论一样,进度对比分析,更多细节的东西我们后面会单独拆分出来,用案例进行演示,例如维度建模,维度表的设计,事实表的设计、以及如何设计标签、如何管理标签等等。

每一个数据分层都有它的作用域,这样在使用表的时候能更方便的定位和理解。

由于最终给业务呈现的是一个能直接使用的业务表,但是表的数据来源有很多,如果有一张来源表出问题了,我们希望能够 快速准确的定位到问题,并清楚它的影响范围,从而及时给到业务方反馈,从而将损失降到最低

将一个复杂的任务分解成多个步骤来完成,每一层只处理单一的步骤,比较简单和容易理解。而且便于维护数据的准确性,当数据出现问题之后,可以不用修复所有的数据,只需要从有问题的步骤开始修复。

过数据分层提供统一的数据出口,统一对外输出的数据口径,这往往就是我们说的数据应用层。

前面我们说到分层其实是为了更好更快更准的组织管理,但是这个是从宏观上来说的,接下来我们从微观上也来看一下分层。

越靠上的层次,对应用越友好,比如ADS层,基本是完全为应用设计,从数据聚合程度来讲,越上层的聚合程度越高,当然聚合程度越高可理解程度就越低。

数仓层内部的划分不是为了分层而分层, 分层是为了解决 ETL 任务及工作流的组织、数据的流向、读写权限的控制、不同需求的满足等各类问题 ,当然我们常说的分层也是面向行业而言的,也是我们常用分层方法,但是你需要注意的是分层仅仅是手段而已。

ODS 全称是 OperationalDataStore, 操作数据层存储的是面向业务系统的数据 ,也是最接近数据源中数据的一层,数据源中的数据,经过抽取、洗净、传输,也就说传说中的 ETL 之后,装入本层。

本层的数据,总体上大多是 按照源头业务系统的分类方式而分类的 ,前面我们说到为什么在数仓主要用维度建模的情况下,我们依然要学习范式建模呢,因为我们的数据源是范式建模的,所以学习范式建模可以帮助我们更好的理解业务系统,理解业务数据,所以你可以认为我们的ODS 层其实就是用的实范式建模。

这里的数据处理,并不涉及业务逻辑,仅仅是针对数据完整性以及重复值和空值的处理,其实就是做的是数据规约,数据清洗,但是为了考虑后续可能追溯数据源问题,因此 对这一层不建议做过多的数据清洗工作 ,原封不动接入源数据即可,至于数据的去噪,去重,异常值处理等过程可以放在后面的DW层

表名的设计 ODS_业务系统_表名_标记 ,这样的设计可以保持与业务表名一致,又可以有清晰的层次,还可以区分来源。标记一般指的是其他数仓特有的属性,例如表是天级的还是小时的,是全量的还是增量的。

ods 的设计可以保证所有的数据按照统一的规范进行存储。

DW是数据仓库的核心,从ODS层中获得的数据按照主题建立各种数据模型。DW又细分数据明细层DWD 和轻度汇总层DWS

这一层和维度建模会有比较深的联系,业务数据是按照 业务流程方便操作的角度 来组织数据的,而统一数仓层是 按照业务易理解的角度或者是业务分析的角度 进行数据组织的,定义了一致的指标、维度,各业务板块、数据域都是按照统一的规范来建设,从而形成统一规范的 标准业务数据体系 ,它们通常都是基于Kimball的维度建模理论来构建的, 并通过一致性维度和数据总线来保证各个子主题的维度一致性

公共层的维度表中相同维度属性在不同物理表中的字段名称、数据类型、数据内容必须保持一致,因为这样可以降低我们在使用过程中犯错误的概率,例如使用了不正确的字段,或者因为数据类型的原因导致了一些奇怪的错误

将维度所描述业务相关性强的字段在一个物理维表实现。相关性强是指经常需要一起查询或进行报表展现、两个维度属性间是否存在天然的关系等。例如,商品基本属性和所属品牌。

公告明细数据层,可以说是我们数仓建设的核心了。

DWD层要做的就是将 数据清理、整合、规范化、脏数据、垃圾数据、规范不一致的、状态定义不一致的、命名不规范的数据都会被处理 。然后加工成面向数仓的基础明细表,这个时候可以加工一些面向分析的大宽表。

DWD层应该是覆盖所有系统的、完整的、干净的、具有一致性的数据层。在DWD层会根据维度模型,设计事实表和维度表,也就是说DWD层是一个非常规范的、高质量的、可信的数据明细层。

DWS层为 公共汇总层 ,这一层会进行轻度汇总,粒度比明细数据稍粗, 基于DWD层上的基础数据,整合汇总成分析某一个主题域的服务数据 ,一般是也是面向分析宽表或者是面向某个注意的汇总表。DWS层应覆盖80%的应用场景,这样我们才能快速响应数据需求,否则的话,如果很多需求都要从ods开始做的话,那说明我们的数仓建设是不完善的。

例如按照业务划分,例如流量,订单,用户等,生成字段比较多的宽表,用于后续的业务查询,OLAP分析,数据分析等。

一般采用维度模型方法作为理论基础,更多的采用一些维度退化手法,将维度退化至事实表中,减少维度表与事实表的关联,提高明细数据表的易用性;同时在汇总数据层要加强指标的维度退化,采用更多的宽表化手段构建公共指标数据层,提升公共指标的复用性,减少重复加工

维表层,所以其实维度层就是大量维表构成的,为了统一管理这些维度表,所以我们就建设维度层,维度表本身也有很多类型,例如稳定维度维表,渐变维度维表。

维度指的是观察事物的角度,提供某一业务过程事件涉及用什么过滤和分类的描述属性 ,"谁、什么时候、什么地点、为什么、如何"干了什么,维度表示维度建模的基础和灵魂。

所以可以看出,维度表包含了业务过程记录的业务过程度量的上下文和环境。维度表都包含单一的主键列, 维度表设计的核心是确定维度字段,维度字段是查询约束条件(where)、分组条件(group)、排序(order),与报表标签的基本来源

维度表一般为 单一主键 ,在ER模型中,实体为客观存在的事务,会带有自己的描述性属性,属性一般为文本性、描述性的,这些描述被称为维度。维度建模的核心是 数据可以抽象为事实和维度 ,维度即观察事物的角度,事实某一粒度下的度量词, 维度一定是针对实体而言的

每个维度表都 包含单一的主键列 。维度表的主键可以作为与之关联的任何事实表的外键,当然,维度表行的描述环境应与事实表行完全对应。维度表通常比较宽,是扁平型非规范表,包含大量的低粒度的文本属性。例如customer(客户表)、goods(商品表)、d_time(时间表)这些都属于维度表,这些表都有一个唯一的主键,然后在表中存放了详细的数据信息。

维度表通常比较宽 ,包含多个属性、是扁平的规范表 ,实际应用中包含几十个或者上百个属性的维度并不少见,所以 维度表应该包括一些有意义的描述,方便下游使用

维度表的维度属性,应该尽可能的丰富,所以维度表中,经常出现一些反范式的设计,把其他维度属性并到主维度属性中, 达到易用少关联的效果。

维度表的设计包括维度选择,主维表的确定,梳理关联维度,定义维度属性的过程。

维度的选择一般从报表需求和从业务人员的交谈中发现,主要用于过滤、分组、排序,主维度表一般从业务库直接同步,比如用户表,但是数仓的本身也会有自己的维度,这是因为数仓是面向分析的,所以会有很多从分析的角度出发的维度。

关联维度主要是不同业务系统或者同一业务系统的表之间存在关联性(范式建模),根据对业务表的梳理,确定哪些表和主维度表之间存在关联关系,并选择其中的某些表用于生成维度属性。

随着互联网的普及,获客成本越来越高,这也使得公司对用户运营提出了更高的要求,不仅需要精细化更需要个性化。解决这一问题的办法之一就是建立相对完备的标签系统,而数仓的标签层对于标签系统而言就像数据仓库对于数据系统一样,有着举足轻重的地位,这样的标签系统需要与业务进行紧密结合, 从业务中获取养分—用户标签,同时也要服务于业务—给用户提供更加精准和个性的服务

底层的标签系统就像一个索引,层层展示大千世界,而用户就从这大千世界中不断选择一些东西表明自己的身份和喜好,也不断反哺,使得这个大千世界更加丰富多彩。 其实到最后用户就是一些标签的集合。

对跨业务板块、跨数据域的特定对象进行数据整合,通过统一的ID-Mapping 把各个业务板块,各个业务过程中 同一对象的数据打通 ,形成对象的全域数据标签体系,方便深度分析、挖掘、应用。ID-Mapping 可以认为是通过对象的标识对不同数据体系下相同对象进行关联和识别。对象的标识可以标识一个对象,一般是对象的ID,比如手机号,身份证,登录账号

完成对象的ID 打通需要给对象设置一个超级ID,需要根据对象当前业务体系的ID和获取得到或者计算得到超级ID,进而完成所有业务标识的ID打通一般来说ID打通是建设标签体系的前提,如果没有ID打通就无法收集到一个对象的全面信息,也就无法对这个对象进行全面的标签刻画。

传统的计算方法要有 ID-ID之间的两两关系,例如邮箱和手机号可以打通,手机号和身份证号可以打通,那么邮箱就和身份证号可以打通,但是当数据量非常大,且业务板块非常多的时候,例如有上一个对象,每个对象有数十种ID,这个时候打通就需要非常漫长的计算

那么什么是标签呢,利用原始数据,通过一定的逻辑加工产出直接能被业务所直接使用的、可阅读的,有价值的数据。标签类目,是标签的分类组织方式,是标签信息的一种结构化描述,目的是管理、查找,一般采用多级类目,一般当一个对象的标签个数超过50个的时候,业务人员查找标签就会变得非常麻烦,这个时候我们往往会通过标签类目进行组织管理

标签按照产生和计算方式的不同可分为属性标签,统计标签,算法标签,关联标签。

对象本身的性质就是属性标签,例如用户画像的时候打到用户身上的标签。

对象在业务过程中产生的原子指标,通过不同的计算方法可以生成统计标签。

对象在多个业务过程中的特征规律通过一定的算法产出的标签。

对象在特定的业务过程会和其他对象关联,关联对象的标签也可以打在主对象上。

我们的标签一定是针对用户的,而不是一些虚假、高大上、无用的标签,一定要真实反映用户行为喜好的,所以我们不能只依赖人工智能算法的分析,来完成对一个用户标签的建立与定期维护,我们需要走出去和用户交互,引导用户使用,要抓住用户痛点,及时获取用户反馈,形成闭环。

如何引导使用呢?这个方式有很多我们就不再这里介绍了,后面我们会专门介绍这一层的建设细节。

数据应用层ApplicationDataService面向业务定制的应用数据,主要提供给数据产品和数据分析使用的数据,一般会放在ES,MYSQL,Redis等系统供线上系统使用,也可以放在Hive中供数据分析和数据挖掘使用,或者使用一下其他的大数据工具进行存储和使用。

数仓层,DIM 层,TDM 层是相对稳定的,所以无法满足灵活多变业务需求 ,所以这和数仓层的规范和划分相矛盾,所以我们在此基础上建立了另外一个层,这就是ADS 层,解决了规划稳定和灵活多变之间的矛盾。其实到这里你也就慢慢的看明白了,分层和分类其实没多大差别,其实就是相似的放在一起,有点代码重构的意味啊。

数据应用层,按照业务的需要,然后从统一数仓层和DIM进行取数,并面向业务的特殊需求对数据进行加工,以满足业务和性能的需求。ADS 层因为面向的实众多的需求,所以这一层没有太多的规范,只需要按照命名规范来进行就可以了。

前面也说了,ADS 层因为面向的实众多的需求,所以这一层没有太多的规范,但是ADS 层的建设是强业务推动的,业务部门需要参与到ADS 的建设中来,至少我们得了解用户的痛点才能对症施药啊。

理清需求,了解业务方对数据内容、使用方式(怎么交互的,报表、接口、即席查询、在线查询、指标查询、搜索)、性能的要求。

盘点现有的数仓表是否可以支持,看以前有没有类似的需求,有没有可以复用的接口、报表什么的。

代码实现,选择合适的存储引擎和查询引擎,配置线上监控然后交付。

主要是提供数据产品和数据分析的数据,一般会存放在ES、Mysql、也可能直接存储在hive中或者druid供数据分析和数据挖掘使用。主要 解决部门用户报表和分析需求 而建立数据库,数据集市就代表数据仓库的主题域。

DM 是面向单个主题的,所以它不会从全局考虑进行建设,只专注于自己的数据、往往是某个业务线,例如流量主题、社交主题、电商主题等等。

G. 人工智能鉴黄的原理是什么

人工智能鉴黄是通过深度学习目标检测、图像分类、特征检索等技术对图像中的局部和全局信息进行分析,捕获不同类型的色情内容,此外系统还会通过OCR、标志识别、水印检测等技术手段协助判断隐藏在图像视频中的敏感内容,包括色情微信推广、色情APP、个人联系方式等。

在算法类型上,图像识别中最常见的就是图像分类算法,从AlexNet到VGG,从ResNet到DenseNet,目前的图像分类算法可以较为准确地区分ImageNet的1000类数据,鉴黄本身也是对输入图像做分类,因此采用图像分类算法就是顺其自然的事。

其次,目标检测算法可以用来检测色情图像中的露点部位,也是比较可靠的手段。此外,还有基于业务层面构造的特征和逻辑,比如是否有人、皮肤的面积等,用来辅助判断,在一些情况下确实是有效的。

鉴黄的历史:

在计算机的“远古时代”,其实也就是十几年前吧,我们识别黄图的做法简单粗暴:人工审核。别小看了这个方法,其实针对当时的网络环境(带宽小,产品少,图片数据也少),效果还是很不错的。一天几万的图片量,安排几个人肉眼盯着看,发现有不良的图片人工删掉就好了。

后来,互联网产品普及率高了,网络数据量暴增,一个产品一天出现几百万的图片量也是很正常的情况,这个时候想要靠堆人力去完成审核几乎不可能了。幸好相应的计算机视觉技术也有进步了,我们用肤色识别算法过滤掉一些没那么多“黄色”内容的图片,剩下的再进入到人工审核,可以大大节约审核量。据统计,经过机器肤色识别过滤后大约只有20%的图片还需要人工审核。

等到移动互联网普及,各种类型的网络数据量暴增,人工审核连20%的数据量也无法承受了,加上视频、直播等业务和数据的爆发式增长,迫切需要一个更加有效的方案来解决审核的问题。很自然的,我们也紧跟人工智能的技术热潮开始研发机器学习的鉴黄系统,并且取得了显着成果。

H. 如何区分电信的手机号码

不同运营商的手机号段是有区别的,根据号码段即可区分,中国电信的号码段有
199、191、189、181、180、177、173、153、133。不过目前已经开通了携号转网业务,这个方式并不是百分百准确的。

客服157为您解答。
全城千兆,C位出道。5G双千兆套餐,1000M宽带,60G流量全家共享,详情可登录广西电信网上营业厅查看。
http://wx8102.gstai.com/UrlDispenseApp/index.php

I. 怎么区分移动,联通,电信的号码

联通的号段目前有:130、131、132、155、156,以及3G专用号段186、185,无线上网卡号段为145。另外还有虚拟运营商专属号段170号段。移动目前开通的号段有:134、135、136、137、138、139、147、150、151、152、157、158、159、182、183、187、188。

阅读全文

与基于业务特征区分号码的算法相关的资料

热点内容
pdf劈开合并 浏览:15
不能修改的pdf 浏览:740
同城公众源码 浏览:475
一个服务器2个端口怎么映射 浏览:283
java字符串ascii码 浏览:62
台湾云服务器怎么租服务器 浏览:462
旅游手机网站源码 浏览:317
android关联表 浏览:930
安卓导航无声音怎么维修 浏览:322
app怎么装视频 浏览:424
安卓系统下的软件怎么移到桌面 浏览:81
windows拷贝到linux 浏览:757
mdr软件解压和别人不一样 浏览:889
单片机串行通信有什么好处 浏览:326
游戏开发程序员书籍 浏览:849
pdf中图片修改 浏览:275
汇编编译后 浏览:480
php和java整合 浏览:835
js中执行php代码 浏览:447
国产单片机厂商 浏览:63