大数据工程师培训技巧

痴情之人太傻绝情之人太狠
  • 回答数

    5

  • 浏览数

    4260

首页> 工程师报名> 大数据工程师培训技巧

5个回答默认排序
  • 默认排序
  • 按时间排序

念想太多失了空

已采纳

众所周知的,大数据是一门很高端的新兴技术,学习的门槛与就业门槛都是存在的,要不然怎么会有那么高的薪资待遇呢!很多对于大数据技术感兴趣的朋友,都纷纷留言问笔者,学大数据要学代码吗,好学吗,这样的问题。广东计算机学习就详细讲讲,学大数据要学代码吗,好学吗,这个话题,来解答大家心中的疑问。1:首先跟大家讲清楚,学大数据,是要学代码的哦!学大数据需要编程语言的基础,不然往后的深层技术根本无法学习,因为大数据的开发基于一些常用的高级语言,比如java和.Net。这样一来,代码知识是大数据工程师必须掌握的知识,这是无法避免的哦!2:一名合格的大数据工程师,不仅需要掌握代码知识,还需要熟悉Mongodb集群、高性能、高可用技术方案;熟悉常用的Java开发框架及消息中间件;具备GIS理论知识,、熟悉Linux或Unix操作系统,具备perlphppythonshell一种或多种脚本语言编程能力。3:除此之外,大数据工程师还需要熟悉Hadoop生态圈(包括常用的Hive、HBase、Spark、Zookeeper、Storm);熟悉Oracle、SQLServer、MySQL至少其中一种以上数据库;熟悉搜索引擎中的常用算法,熟悉ElasticSearch或Solr的程序结构等等。

178评论

你的束缚让人窒息

大数据技术体系庞大,包括的知识较多

1、学习大数据首先要学习Java基础

Java是大数据学习需要的编程语言基础,因为大数据的开发基于常用的高级语言。而且不论是学hadoop

2、学习大数据核心知识

Hadoop生态系统;HDFS技术;HBASE技术;Sqoop使用流程;数据仓库工具HIVE;大数据离线分析Spark、Python语言;数据实时分析Storm;消息订阅分发系统Kafka等。

3、学习大数据需要具备的能力

数学知识,数学知识是数据分析师的基础知识。对于数据分析师,了解一些描述统计相关的内容,需要有一定公式计算能力,了解常用统计模型算法。而对于数据挖掘工程师来说,各类算法也需要熟练使用,对数学的要求是最高的。

4、学习大数据可以应用的领域

大数据技术可以应用在各个领域,比如公安大数据、交通大数据、医疗大数据、就业大数据、环境大数据、图像大数据、视频大数据等等,应用范围非常广泛。

18评论

等待只是个笑话

1. 数学及统计学相关的背景只有具备一定的理论知识,才能理解模型、复用模型甚至创新模型,来解决实际问题。2. 计算机编码能力实际开发能力和大规模的数据处理能力是作为大数据工程师的一些必备要素。大数据工程师的职责以商业分析为主,但也要熟悉计算机处理大数据的方式。3. 对特定应用领域或行业的知识大数据工程师这个角色很重要的一点是,不能脱离市场,因为大数据只有和特定领域的应用结合起来才能产生价值。

119评论

心魔控

1.找出过去事件的特征大数据工程师一个很重要的工作,就是通过分析数据来找出过去事件的特征。比如,腾讯的数据团队正在搭建一个数据仓库,把公司所有网络平台上数量庞大、不规整的数据信息进行梳理,总结出可供查询的特征,来支持公司各类业务对数据的需求,包括广告投放、游戏开发、社交网络等。找出过去事件的特征,最大的作用是可以帮助企业更好地认识消费者。通过分析用户以往的行为轨迹,就能够了解这个人,并预测他的行为。“你可以知道他是什么样的人、他的年纪、兴趣爱好,是不是互联网付费用户、喜欢玩什么类型的游戏,平常喜欢在网上做什么事情。”腾讯云计算有限公司北京研发中心总经理郑立峰说。下一步到了业务层面,就可以针对各类人群推荐相关服务,比如手游,或是基于不同特征和需求衍生出新的业务模式,比如微信的电影票业务。2.预测未来可能发生的事情通过引入关键因素,大数据工程师可以预测未来的消费趋势。在阿里妈妈的营销平台上,工程师正试图通过引入气象数据来帮助淘宝卖家做生意。“比如今年夏天不热,很可能某些产品就没有去年畅销,除了空调、电扇,背心、游泳衣等都可能会受其影响。那么我们就会建立气象数据和销售数据之间的关系,找到与之相关的品类,提前警示卖家周转库存。”薛贵荣说。在百度,沈志勇支持“百度预测”部分产品的模型研发,试图用大数据为更广泛的人群服务。已经上线的包括世界杯预测、高考预测、景点预测等。以百度景点预测为例,大数据工程师需要收集所有可能影响一段时间内景点人流量的关键因素进行预测,并为全国各个景点未来的拥挤度分级—在接下来的若干天时间里,它究竟是畅通、拥挤,还是一般拥挤?3.找出最优化的结果根据不同企业的业务性质,大数据工程师可以通过数据分析来达到不同的目的。以腾讯来说,郑立峰认为能反映大数据工程师工作的最简单直接的例子就是选项测试(AB Test),即帮助产品经理在A、B两个备选方案中做出选择。在过去,决策者只能依据经验进行判断,但如今大数据工程师可以通过大范围地实时测试—比如,在社交网络产品的例子中,让一半用户看到A界面,另一半使用B界面,观察统计一段时间内的点击率和转化率,以此帮助市场部做出最终选择。

129评论

趁你还在抓紧爱

参加大数据开发培训需要掌握以下几个方向的内容。

阶段一:JavaSE基础核心

1、深入理解Java面向对象思想

2、掌握开发中常用基础API

3、熟练使用集合框架、IO流、异常

4、能够基于JDK8开发

阶段二:Hadoop生态体系架构

1、Linux系统的安装和操作

2、熟练掌握Shell脚本语法

3、Idea、Maven等开发工具的使用

4、Hadoop组成、安装、架构和源码深度解析,以及API的熟练使用

5、Hive的安装部署、内部架构、熟练使用其开发需求以及企业级调优

6、Zookeeper的内部原理、选举机制以及大数据生态体系下的应

阶段三:Spark生态体系架构

1、Spark的入门安装部署、Spark Core部分的基本API使用熟练、RDD编程进阶、累加器和广播变量的使用和原理掌握、Spark SQL的编程掌握和如何自定义函数、Spark的内核源码详解(包括部署、启动、任务划分调度、内存管理等)、Spark的企业级调优策略

2、DophineScheduler的安装部署,熟练使用进行工作流的调度执行

3、了解数据仓库建模理论,充分熟悉电商行业数据分析指标体系,快速掌握多种大数据技术框架,了解认识多种数据仓库技术模块

4、HBase和Phoenix的部署使用、原理架构讲解与企业级优化

5、开发工具Git&Git Hub的熟练使用

6、Redis的入门、基本配置讲解、jedis的熟练掌握

7、ElasticSearch的入门安装部署及调优

8、充分理解用户画像管理平台的搭建及使用、用户画像系统的设计思路,以及标签的设计流程及应用,初步了解机器学习算法

9、独立构建功能完全的企业级离线数据仓库项目,提升实战开发能力,加强对离线数据仓库各功能模块的理解认知,实现多种企业实战需求,累积项目性能调优经验

阶段四:Flink生态体系架构

1、熟练掌握Flink的基本架构以及流式数据处理思想,熟练使用Flink多种Soure、Sink处理数据,熟练使用基本API、Window API 、状态函数、Flink SQL、Flink CEP复杂事件处理等

2、使用Flink搭建实时数仓项目,熟练使用Flink框架分析计算各种指标

3、ClickHouse安装、使用及调优

4、项目实战。贴近大数据的实际处理场景,多维度设计实战项目,能够更广泛的掌握大数据需求解决方案,全流程参与项目打造,短时间提高学生的实战水平,对各个常用框架加强认知,迅速累积实战经验

5、可选掌握推荐和机器学习项目,熟悉并使用系统过滤算法以及基于内容的推荐算法等

6、采用阿里云平台全套大数据产品重构电商项目,熟悉离线数仓、实时指标的阿里云解决方案

阶段五:就业指导

1、从技术和项目两个角度按照企业面试、

2、熟悉CDH在生产环境中的使用

3、简历指导

以上为大数据培训所要掌握的内容,当然也可以尝试自学的。

50评论

相关问答

    向你推荐

      热门问题