当大资料带给世界更多位元,这些实时产生的海量资料成为了一座开采难度巨大的矿山。大家都知道通过这些碎片化的资料能够挖掘出更多价值,但是就目前的整体发展来看,大资料的应用远没有达到预期的效果,其原因有几个:
1、资料的获取难度增加
从早期PC端各种型别的cookie资料及使用者网站浏览、点选、停留等资料,到使用者移动端装置相关的型号、位置及应用使用时长、次数、型别等资料,再到应用内的点选、停留、浏览、搜寻等资料,资料量虽然越来越大,可获取变得越来越难。早期,使用者对这些所谓的“不敏感资料”并不了解,或著不太在意。但随着各种型别的资料商业模式兴起,一些资料收集方过度、越线收集使用者资料,又有人利用这些资料进行过度营销,严重损害了使用者体验和信任度。使用者的资料保护意识快速提升,而资料收集方也有保护自身资料资产的需求,这就产生了多方面的矛盾,使得大规模的资料收集和应用变得更加困难。
为解决这些问题,应该建立全面的机制和标准,使得资料的获取、加工、储存、应用、共享更加规范和有序,打破资料孤岛困境,共同构建生态健康、持续成长的市场。
2、资料应用与个人隐私的问题没有很好的解决
大资料时代,每个人通过互联网留下了大量的各种型别的资料,综合这些资料资讯能够反映出人的行为模式:包括应用兴趣偏好、常去地点、工作及居住地、社交关系、收入水平、消费偏好、品牌偏好等。善用这些资料原本能够更好的为使用者服务,比如提供更符合使用者偏好的产品及服务,能够有效降低使用者的选择时间,甚至规划建设更高效的城市、让生活更便捷。但是,一方面频繁的操作系统升级和装置更替让使用者更加注重资料的安全问题;同时,某些资料收集行为越过了对个人互联征资料的红线,资料是否会造成个人隐私的泄露、是否会带来过度的营销、是否有可能被精准的侵入,给使用者造成大量的困扰,甚至是经济损失。
为解决资料隐私问题,在对已有法律法规继续进行完善的基础上,也应该有行业规范和行业自律要求,双管齐下,促使资料产业链各方参与者共同打造良好的网络资料空间,增加对使用者隐私和资料安全的保护,也通过更加人性化的服务产生资料应用的价值。
3、资料加工处理的速度与资料产生的速度不同步
大资料时代,每人每天产生的资料高达数GB,围绕社交、金融交易、网络购物、生活记录等各种应用,全世界每天能够产生数ZB的资料,这庞大的资料量需要更加庞大的处理能力才能实现有效利用。但是以目前的计算方法和计算能力,每秒处理的速度远小于资料产生的速度,只能选择小范围的尝试,像Spark/Hadoop/Flink/Kafka等广泛应用的计算方法均有待提升。同样的,对于所需的硬件基础设施,目前最快的CPU/GPU/NPU其每秒所能提供的计算速度仅达数百MB/s,也无法更快的提升计算能力。这些都限制了资料处理的快速发展。
鉴于此,应该针对不同型别的资料提供不同的处理算法,比如专门针对常规结构化资料或文字资料、音视讯等非结构化资料等的专用计算方法。通过基于各类资料的特点进行平行计算,如结构化资料的小资料、文字资料的资料块资料、音视讯的取样压缩资料等,针对每一种资料进行专门的效率提升。同时,在现有计算芯片的基础上增加各种型别的协处理器,有效提升资料计算任务的并行处理能力,提升芯片的利用率。
4、资料应用落地难度增加
虽然我们处在大资料时代,但能够得到有效应用的资料还不足1/10,而其应用方向大部分仅仅是围绕营销、风控等方面。这些主要面向市场的应用虽然帮助企业提升了收入,但是越来越多人对这种缺少选择空间的应用充满怀疑,也导致应用水平的下降。而且,这些只看一时、不看长远的应用方式也有可能导致效果适得其反,使用者被教育之后就会明显的进行反抗,将会影响到资料的未来应用。
资料应用落地目前显然受到了环境发展及资料孤岛等方面的影响,很多好的想法无法付诸实践。但是可以考虑通过新兴的区块链技术实现行业合作、资源互换、消费者互利等,促进各方的信任,以开放心态,在保护资料安全的前提下更多的释放资料价值,打造智慧空间的各种应用。
5、资料价值发掘方向不明确
大资料的发展离不开各方参与者,其价值的实现也需要各方通力合作。但是目前大量掌握资料的企业圈地自封,而生产资料的使用者却成为了被收割的物件。这也引发了围绕资料价值的喋喋不休的争论——到底是为了提升使用者体验,还是收割所剩无几的互联网流量红利?但是这些都无法阻挡历史前进的车轮。在资料应用领域,诸如快速响应客户各类需求、降低产品设计成本、降低制造及仓储成本、降低运输及配送成本、精准预判投资规划、围绕使用者行为的预测快速迭代更新、预测竞品营销策略及市场变化等提升自身竞争力水平的应用,有着巨大的市场空间。
综上,相信有远见的企业得以一窥未来的轮廓,也会积极布局未来的主要赛道。基于精细化的行业属性、资料特征、消费场景的各类应用会层出不穷,届时将进入崭新的数字世界——即智慧空间。
作者:TalkingData 房龙江
封面图来源于网络,如有侵权,请联络删除