-
可算有人把 Hadoop 生态的主要讲明白了!
所属栏目:[大数据] 日期:2021-11-24 热度:112
Hadoop是一个由Apache基金会开发的分布式系统基础架构。开发人员可以在不了解分布式底层细节的情况下开发分布式程序,充分利用集群的威力进行高速并行运算以及海量数据的分布式存储。Hadoop大数据技术架构如图1所示。 然而,Hadoop不是一个孤立的技术,而是一[详细]
-
HDFS 基层交互原理,看这篇就够了
所属栏目:[大数据] 日期:2021-11-24 热度:149
HDFS全称是 Hadoop Distribute File System,是 Hadoop最重要的组件之一,也被称为分步式存储之王。本文主要从 HDFS 高可用架构组成、HDFS 读写流程、如何保证可用性以及高频面试题出发,提高大家对 HDFS 的认识,掌握一些高频的 HDFS 面试题。本篇文章概览如[详细]
-
Hadoop、Spark、Hive究竟是什么,做算法要不要学?
所属栏目:[大数据] 日期:2021-11-24 热度:119
最近我发现,很多萌新说着想要做算法工程师,但是却对这个岗位的要求以及工作内容一无所知。以为学一个Python,再学一些机器学习、深度学习的模型就可以胜任了。工作就是用Python不停地写模型。 显然,这样的想法是有问题的,如果真这么干,即使通过了面试成[详细]
-
Excel函数公式:制止在Excel单元格中输入空格,你真的会吗?
所属栏目:[大数据] 日期:2021-11-24 热度:54
Hello,大家好,今天给大家分享的内容是:禁止在Excel单元格中输入空格的技巧看到这个标题,相信大家都有所感触,都被空格坑过,那在数据处理和分析的过程中,如何避免空格了?其实,最根本的方法还是【数据验证】,但是,需要借助两个函数来实现。 一、Len函[详细]
-
Flink执行流程与源码解析
所属栏目:[大数据] 日期:2021-11-24 热度:104
ink执行流程与源码分析 整体的流程与架构可能三两张图或者三言两语就可以勾勒出画面,但是背后源码的实现是艰辛的。源码的复杂度和当初设计框架的抓狂感,我们只有想象。现在我们只是站在巨人的肩膀上去学习。 作者: 王了个博 来源:大数据左右手|2021-09-08[详细]
-
一篇学会了Hadoop3数据容错技术
所属栏目:[大数据] 日期:2021-11-24 热度:53
随着大数据技术的发展,HDFS作为Hadoop的核心模块之一得到了广泛的应用。为了数据的可靠性,HDFS通过多副本机制来保证。在HDFS中的每一份数据都有两个副本,1TB的原始数据需要占用3TB的磁盘空间,存储利用率只有1/3。而且系统中大部分是使用频率非常低的冷数[详细]
-
大数据的数据整治与应用场景
所属栏目:[大数据] 日期:2021-11-24 热度:62
医疗大数据治理 医疗大数据的采集及管理、分析等环节的统称,目的是妥善管理有用的数据并从海量数据中挖掘价值。 02医疗大数据采集及管理 目前,医疗数据大多散落在各个系统,碎片化、低质量、孤立分类、类型多样、标准不一,而优质的数据采集手段可以实现异[详细]
-
如何使用技术解决方案做出数据驱动的决定
所属栏目:[大数据] 日期:2021-11-24 热度:156
数据驱动决策(DDDM)是一种基于可量化目标或关键绩效指标(KPI)的方法,可以收集信息、从发现中评估模式和事实,并以各种方式实施有利于企业的战略和行动。一般来说,数据驱动的决策需要依靠经过验证和研究的数据,而不是利用未处理的数据来实现重要的业务目标[详细]
-
大数据集群开始 kerberos 认证后 Hive 作业执行失败
所属栏目:[大数据] 日期:2021-11-23 热度:108
大数据集群开启 kerberos 安全认证后,HIVE ON SPARK 作业执行失败。通过客户端 beeline 提交作业,报错 spark client 创建失败,其报错信息是: Failed to create spark client for spark session xxx: java.util.concurrent.TimeoutException: client xxx t[详细]
-
因HIVE元数据与HDFS上的数据不一致引起的问题修补
所属栏目:[大数据] 日期:2021-11-23 热度:155
客户端报错如下: Unable to move source xxx to destination xxx 客户端报错 问题分析 客户端的报错信息,并没有完全展现问题背后的全貌。我们进入 hiveserver2 所在节点查看hiveserver2的日志,可以看到如下相关信息: 2021-09-01 11:47:46,795 INFO org.ap[详细]
-
简谈大数据风控平台的功能需要
所属栏目:[大数据] 日期:2021-11-23 热度:118
大数据风控业务的开展依赖智能风控平台,智能风控平台的技术基础是大数据技术,智能风控系统技术架构也是以大数据系统技术架构为基础演进而来的。 智能风控系统技术架构主要分为访问层、展现层、系统层、大数据平台四部分,其中大数据平台又分为接入层、清洗[详细]
-
数据研发,如何平衡效率与质量
所属栏目:[大数据] 日期:2021-11-23 热度:52
数据开发的效率,是如何尽快的将产品设计、业务过程,转换为数据模型;数据开发的质量,则是如何尽快的将数据加工过程中的问题,识别出来。向业务交付的内容,是开发的内容;而如果开发的时候,忽略质量的问题,虽然交付的时候不会有感知,但往往会在排查问题阶[详细]
-
浅谈人工智能、大数据等技术在交通行业的应用
所属栏目:[大数据] 日期:2021-11-23 热度:155
我们将浅谈一下人工智能、大数据、云计算、物联网等技术将会给交通行业带来哪些便利与变革: 1.数据资源整合 由于我国线路众多,与交通相关的绝大多数部门都有自己的信息化平台,并产生着海量数据,但是现在的每个部门及单位内的系统平台大都是独立的,信息与[详细]
-
时代大数据安全和隐私
所属栏目:[大数据] 日期:2021-11-23 热度:52
随着大数据的发展,大数据的安全问题越来越受到行业的重视。 日前,中国信息通信研究院指出了目前大数据发展面临的安全问题,提出了促进大数据安全技术发展的具体建议。 大数据已经严重影响了经济运行机制、社会生活方式和国家治理能力,需要从大安全的角度认[详细]
-
从技术视角看大数据行业的发展走势
所属栏目:[大数据] 日期:2021-11-23 热度:56
关于该趋势,明哥在前期发布过一篇博文,大数据与云计算深度融合的趋势体现在哪些方面? 对该趋势做了自己的解读,这里再次简要描述下。该博文链接如下: 大数据与云计算深度融合的趋势体现在哪些方面? 云原生(Cloud Native)理念,本质上是一套利用云计算技术为[详细]
-
Hdfs 相对路径和静态代码块引起的问题
所属栏目:[大数据] 日期:2021-11-23 热度:124
HIVE 作为大数据生态的数仓解决方案,因为历史的原因在很多行业很多公司都有着广泛的应用。对于比较复杂的业务逻辑,HIVE SQL 往往比较难以表达,此时大家在开发中往往会辅以 HIVE UDF。所以充分理解和掌握 HIVE UDF正确的表写和使用方式,是大数据从业人员[详细]
-
大数据时代,移动联通大数据技术的价值,你知道了多少
所属栏目:[大数据] 日期:2021-11-23 热度:164
大数据时代,移动联通大数据技术的价值,你掌握了多少 大数据技术就是在多种类型的大量数据信息中,快速获得有使用价值信息的技术性,然后做到大数据精准营销。拥有大量信息本身并不能造就出多少使用价值,必须选用具体方法进行处理分析才能够获得其智能化的[详细]
-
大数据与云计算之间的联系
所属栏目:[大数据] 日期:2021-11-23 热度:50
大数据处理大量的结构化,半结构化或非结构化数据,以进行存储和处理以进行数据分析。大数据有五个方面,通过5V来描述 数量数据量 种类不同类型的数据 速度系统中的数据流率 价值 基于其中包含的信息的数据价值 准确性 数据保密性和可用性 云计算以按需付费的[详细]
-
工信部:增强和规范特定频段无线电管理
所属栏目:[大数据] 日期:2021-11-23 热度:128
工业和信息化部发布了关于加强和规范2400MHz、5100MHz和5800MHz频段无线电管理有关事宜的通知。通知规范了每个频段可使用的设备类型。 2400MHz频段可用于宽带无线接入(含无线局域网)、蓝牙、点对点传输等无线电通信系统; 5100MHz频段可用于宽带无线接入([详细]
-
高丝化妆品有限公司:智能化精准营销,科学化深入管理
所属栏目:[大数据] 日期:2021-11-23 热度:111
大数据作为时下最时髦的词汇,开始向各行业渗透辐射,颠覆着很多特别是传统行业的管理和运营思维。在这一大背景下,大数据也触动着化妆品行业。 在这个成熟行业里,竞争异常激烈,企业要想在无硝烟的市场中分得一杯羹,需要架构大数据战略,拓宽化妆品行业调[详细]
-
数字化转型的根本目标是何?
所属栏目:[大数据] 日期:2021-11-23 热度:54
数字化转型的根本目标是什么,这是一个触及灵魂的问题。数字化转型的根本目标是为了让企业在数字化时代的趋势下,现在能够活得更好,未来能够活得下去。数字化转型就是为了实现这一根本目标而实行的改革行动。现在能够活得更好,意味着数字化转型能够帮助企业[详细]
-
数字化转型投资的趋势——将来的和过时的
所属栏目:[大数据] 日期:2021-11-23 热度:165
事实证明,此次疫情已成为数字化转型的催化剂,迫使各种规模的企业重新思考其运营方式、为客户提供什么,以及他们对员工的数字化体验进行哪些投入。 Gartner副总裁兼杰出分析师豪尔赫洛佩兹(Jorge Lopez)表示,在2020年3月之前,许多企业只是在改进其当前的工[详细]
-
麦肯锡有关于人才数字化转型的思考
所属栏目:[大数据] 日期:2021-11-23 热度:131
制造业的数字化转型是大势所趋,不可逆转。所谓时代潮流,浩浩荡荡;顺之则昌,逆之则亡。企业只有积极地拥抱变革、应对挑战,才可以走得更远。 然而,积极参与只是万里长征的第一步。数字化转型是一项长期的系统性工程。麦肯锡的调研发现,在已经启动数字化[详细]
-
腾讯数字化转型思考:究竟哪些才是数字化转型的底层逻辑
所属栏目:[大数据] 日期:2021-11-23 热度:119
去年年末在公司内部刊物上曾发表过一篇文章,就未来宏观环境给出了个人判断,大致可以总结为三点- 世界充满高度不确定性、全真互联网时代、又一场大洗牌开始。先简单谈谈我对这三个判断的理解: 1、不确定性高度不确定性在业界早已达成共识。过去一年我们经历[详细]
-
企业怎样才能不被数字化转型内卷
所属栏目:[大数据] 日期:2021-11-23 热度:135
仿佛一夜之间,内卷这个词铺天盖地覆盖了近乎所有我们能够认知的领域和场景,它像一个放之四海而皆准的词,所用之处,细想之后,皆能思索出道理。 内卷,原意是用来形容某个领域中发生了不健康的竞争或者消耗,导致多数人付出更多也失去更多,最终无人受益或[详细]