延云行业搜索数据库 在大数据生态中位置和重要性

延云行业搜索数据库 在大数据生态中位置和重要性

延云行业搜索数据库

在大数据生态中位置和重要性

大数据的挑战

随着大数据在各行业的应用,互联网及物联网技术的迅猛发展,数据正在大量产生、被存储并被快速的利用,很多行业的每天的数据增量就达到了千亿级,总量则超过了数万亿。比如,在公共安全行业,海量的上网行为被记录,电子围栏系统时刻采集海量移动设备信息;在交通行业,一个中等城市的卡口系统,每天采集的过车记录到达数百万条到千万条不等;在电信行业,每天时刻记录着数亿人的通话及信息记录;在金融行业,每天产生数以亿计的交易记录和支付信息等等。而各行业所面临的一个关键问题就是,如此大规模的数据如何被快速地有效地利用,让数据产生足够大的价值。

大数据技术的现状

目前在大数据生态中,有三种方式来解决以上问题,分别是:批处理(Batch),即席查询与分析(Ad-hoc),流计算(Stream)。(1)批处理是大数据生态中成熟的技术,其优势是又稳又准,但时效性极差,无法满足交互式应用的要求。(2)流计算技术也比较成熟,在数据流入的时候即把相应的计算操作完成,有极高的时效性,但只能计算设定好的模型,灵活度方面有极大限制。(3)而目前大数据业内呼声最高应用前景最为广泛的即是即席查询与分析,既具有良好的时效性,又兼顾了很好灵活性。简单来说,就是在海量数据在产生后的1~2分钟内,就可以对海量数据集进行任意维度的查询和分析,真正地实现大数据的交互式查询与分析,想查什么就查什么,想算什么就算什么,从而实现高效地挖掘大数据背后的潜在价值。

公安、军队、交通交警等监管机构需要在海量数据中做大量的搜索与数据碰撞工作。(1)传统ORACLE数据库在搜索上已经满足不了性能要求,而开源的搜索引擎在功能上较弱,只能进行一些简单的像百度那样的全文搜索,无法支撑复杂的查询逻辑.(2)目前的监管需求逻辑均比较复杂,为了构建一个这样的系统,往往需要4~5种不同系统共同完成一个产品,除了整体部署硬件成本很高外,每个系统的接口类型与风格也完不同, SQL统一接口,开发人员需要学习每个系统的使用,安装,配置与调优,而这些往往需要在行业积累多年的技术专家才能做到.

 延云行业搜索数据库

延云行业搜索数据库简称延云YDB是由延云独立研发,自主可控的实时、多维、大数据即席查询与分析引擎.(1)延云独特的搜索与分词技术,在搜索性能与搜索准确定上比传统的开源搜索引擎更高。(2)延云YDB能同时满足高性能的搜索与数据碰撞,又能进行复杂的业务逻辑计算,只需要一个产品即可满足现有的监管产品大部分需求.(3)对外统一的SQL接口,对开发人员来说学习成本很低,懂大数据的开发人员很少,但是可以说几乎每个开发人员都懂SQL

延云是大数据即席查询与分析领域的先行者,也是领导者,从20167月,延云搜索数据库产品YDB稳定版本发布以来,受到了大数据业界的广泛关注,并在公安,交通,军队,运营商,互联网等行业的数十个生产系统中上线运行,并取得良好的应用效果。目前有数十个项目正在进行深度体验和测试,延云的发展正在进入快车道。

延云在大数据领域有深厚的积淀和技术储备,延云创始人母延年曾就职于阿里巴巴,腾讯及新浪等互联网公司,曾任多个大数据项目的技术负责人, 在千亿级大数据搜索与即系分析方面积累的丰富的实战经验,是开源项目Mdrill(千亿数据即席分析),JStorm(分布式实时计算引擎)的Committer,也是腾讯Hermes(即席查询多维分析平台)的原作者。延云在大数据即席分析与查询领域保持着业内绝对领先。业内同领域其他产品,比xxxxxxxxx等产品,目前均处于项目的孵化期或者仅限于公司内部使用,距离产品的真正商用还有相当大的距离,而延云的产品已经得到数个关键行业的认可,已经进入了商业拓张期,在此阶段延云需要资本力量的助推,在大数据生态中占据重要位置,并在大数据时代成就辉煌。