大数据概念
1.大数据概念
大数据(Big Data):指内部传统软件工具捕获、管理和处理的数据集需要新的处理模式才能具有更强的决策、洞察力、发现和流程优化能力和多样化的。
大数据主要解决,数据的和问题
数据存储单数据存储单元:bit、Byte、KB、MB、GB、、ZB、YB、BB、NB、DB。
1Byte = 8bit 1K = 1024Byte 1MB = 1024K 1G = 1024M 1T = 1024G 1P = 1024T
2.大数据特征(4)V)
1、Volume(大量)
大数据的第一个特点是大量。随着技术的发展,数据量开始爆炸性增长,达到了TB甚至PB级别。例如,淘宝通常每天大约有20个商品交易数据TB(1TB=1024GB),世界上最大的设计平台Facebook用户每天生成300多个日志数据TB(日志数据是记录用户操作记录的,并非发帖内容) 。
大数据量如此之大,无法手动处理。处理这些大数据需要智能算法、强大的数据处理平台和新的数据处理技术。
2、Velocity(高速)
这是大数据区别于传统数据挖掘的最显著特征。IDC预计到2025年,全球数据使用量将达到163ZB。面对如此庞大的数据,处理数据的效率就是企业的生命。
2017年3分01秒,天猫双1秒,天猫交易额超过100亿 2020年96秒,天猫的交易超过100亿
实时分析而不是批量分析,数据输入、处理和丢弃立即生效,几乎没有延迟。数据的增长速度和处理速度是大数据高速度的重要体现。
3、Variety(多样)
这种类型的多样性也使数据分为结构化数据和非结构化数据。与以往易于存储的数据相比包括网络在内的网络越来越多 等等,这些多种数据对数据处理能力提出了更高的要求。
4、Value(低价值密度)
价值密度与数据总量成反比。 如何快。价值性是大数据的核心特点。实际上,大量数据是无效的或低价值的。大数据最大的价值在于从大量不相关的数据中挖掘有价值的数据,预测和分析未来趋势和模式。例如,宝藏电子商务平台每天生成的大量交易数据(大数据)可以通过一些算法分析具有某些特征的人喜欢什么类型的商品,然后根据客户的特点推荐TA喜欢的商品。
3.大数据应用场景
3.1 抖音:推荐你最喜欢的视频
3.2 电子商务站广告推荐:向用户推荐可能喜欢的商品
3.3 零售:分析用户的消费习惯,方便用户购买商品,提高商品销售。经典案例,尿布 啤酒。
3.4 物流仓储:JD.COM物流,上午下单,下午送达,下午下单,第二天上午送达。
3.5 保险:海量数据挖掘和风险预测,帮助保险业精准营销,提高精细定价能力。
3.6 金融:多维度反映用户特征,帮助金融机构推荐优质客户,防范欺诈风险。
3.7 房地产:大数据全面帮助房地产行业,创造准确的投资政策和营销,选择更合适的土地,建造更合适的建筑,卖给更合适的人。
3.8 人工智能 5G 物联网 虚拟与现实
组织结构的大数据部门
下一个风口
2020年是5G元年,国家大力铺设5G2021年设备为5G手机应用的开始也是大数据爆发的一年。5G每秒10g每家公司都会带来大量的数据。那么传统的Java该工具根本无法解决大量数据的存储问题。更不用说计算海量数据了。如果你对5G感觉不够深,可以回忆3G和4G的区别。3G当时只能打电话发短信,当时感觉很好,感觉3G不错。但是4G来了之后,大家很少打电话发短信,都改成了语音、视频、直播、网购等生活方式,给淘宝、JD.COM、美团、字节跳动等企业带来了火灾。百度跟不上节奏,有点摇摇欲坠。