摘要:

云计算已经成为了近些年我国科学技术领域高速发展的重要推动力来源,对于互联网科技、云技术以及IT通信领域来说通过众多领域的不断云化,已经让很多应用开始变得更加灵活和高效,我们都知道,随着当前每日数据量的递增,用户对于海量数据的服务能力已经开始变得十分关注,同时也有一些业内专家表示,网络大数据已经带给我们机遇以及困扰。

网络大数据应用

网络大数据应用广泛,无论是经济发展领域还是军事、文化发展领域,网络大数据都发挥着重要作用。加强网络大数据研究对维护国家网络空间数字主权,保证经济、文化稳定持续发展,提高国民经济竞争力,实现科技突破等都有着至关重要的作用。无论是直接影响还是间接影响,加强网络大数据研究十分必要。

大数据研究助力数字主权保护

随着近些年我国逐渐步入信息化时代,同时我国的综合实力的竞争也正在大数据的推动下加快了脚步,作为一个发展大国重要的博弈空间,若我国网络大数据应用落后,就会直接影响我国占领产业战略制高点,出现网络空间发展不足的情况,影响国家数据使用安全。

“人、机、物”三元世界的交互发展产生了大量数据,为充分实现对网络大数据的感知和利用,国民经济发展过程中要有效解决对大规模数据的测量和应用,以促进经济发展中各行业数字化和信息化,解决行业发展过程中出现的网络大数据爆炸阻碍。因此加强网络大数据研究,解决大数据基本共性问题十分重要。

信息时代背景下在科学技术上实现网络大数据技术研究突破,能促进数据服务以及数据材料等相关战略性新兴产业的兴起与发展。实现网络大数据的技术研究和科技突破,能使人们更清楚地认识数据交互连接的复杂问题,并准确把握数据冗余与缺失等不确定性特性,以更好地实现对高速增长数据的驾驭。

网络大数据如何感知?

这是一个令业界十分关注的问题,按照网络空问中数据的蕴藏深度,整个网络空间可划分为Surface Web和Deep Web,或称作Hidden Web。Surface Web是指Web中通过超链接可被传统搜索引擎获取到的静态页面,而Deep Web则由Web中可在线访问的数据库组成。Deep Web的数据隐藏在Web数据库提供的查询接口后面,只有通过向查询接口提交查询才能获得。

与Surface Web相比,Deep Web所包含的信息更丰富。同时,Deep Web具有规模大、实时动态变化、异构性、分布性以及访问方式特殊等特点。

网络大数据的复杂性使其诸多环节操作运行难度增加,包括数据存储、数据分析处理以及数据深度挖掘等。大数据的复杂性又包括其类型的复杂,如社交网络与传统文本数据的相互发展,使其类型更加丰富;数据结构复杂,包括移动技术以及社交技术发展下形成的结构数据流以及非结构化数据流,具体形式包括文本、图像等,这给网络大数据管理与分析带来了难度。

海量数据存储问题

就我们目前所掌握的数据处理规模和存储能力方面来说,我们已经实现了从TB级别到PB甚至是EB级别的跨越,在实现等级上升后,为更好地实现对数据存储成本的控制,实现计算资源优化利用,以及提高系统整体的并发吞吐率,要积极探究出更加有效的存储模式,实现目前网络大数据分布式数据存储方式。

Hadoop系统在Yahoo、IBM、百度、Facebook等公司得到了大量应用和快速发展,但作为新兴的技术体系,分布式数据处理技术在支持大规模网络信息处理及应用等大数据计算应用能力方面还存在很多不足。

企业云

分布式数据存储是网络大数据应用的一个重要环节。但之前的研究工作仍存在一些局限性。针对海量数据存储和处理所面临的数据总量超大规模、处理速度要求高和数据类型异质多样等难题,需要开发支持扩展度高、深度处理的PB级以上分布式数据存储框架,同时需要研究适应数据布局分布的存储结构优化方法,以提高网络大数据存储和处理效率,降低系统建设成本,从而实现高效、高可用的网络大数据分布式存储。

总结

海量数据以及各种应用的全面云化已经正在成为未来IT信息化发展的必然趋势,同时从很多企业用户角度我们也不难发现,通过云计算技术在应用端的不断壮大,已经使得用户的感知程度大大提升,同时这对于技术的不断创新也具有重要的推动意义。