返回

新华互联网科技

获取
学费
为什么学习大数据软件开发工程师?
大数据浪潮席卷全球,应用领域宽广,产业规模空前
就业口径宽广,价值堪比黄金石油,“钱途”无量
应用范围广
岗位天花板
岗位起薪
大数据时代,大数据几乎没有行业限制
物流
医疗
科技
新能源
农业
金融
工业
大数据
应用广泛
交通
医疗
教育
信用
传媒
电信
时代大趋势,未来前景好,职场双渠道发展
P线
数据科学家
大数据研究员
大数据架构师
大数据专家
M线
CTO
数据总监
项目经理
大数据高级工程师
大数据中级工程师
大数据人才缺口大,人才薪资待遇好
大数据近年来薪资变化趋势
12.0K
2017年
18.4K
2018年
22.8K
2019年
21.9K
2020年
21.8K
2021年
24.9K
2022年
27.7K
2023年
此处数据来源职友集,样本选取截止日期为2024年3月23日
仅作内容展示,不作效果承诺
更多大数据行业前景
新华互联网科技大数据课程特色优势
零基础免试入学
无需具备任何编程或相关领域的先验知识,简单易学手把手教学
大厂实战项目
大厂实际业务场景与案例,理论到实践项目 1:1 引进课堂,多类型联合项目,沉浸式学习
特色课程体系
实战项目贯穿教学过程,理论+实战+就业,一站式培养优秀人才
实战老师授课
新华互联网科技总监级导师授课,丰富实战及教学经验,实力助力学习
丰富学习资源
大厂授课平台,线上云实验环境、企业级数据集、项目案例、毕业设计案例等
未来职场赋能
老学员一次学习长期职场赋能,定期直播、论坛、讲座,多方位职场进阶
更多课程优势
课程全新升级 重构业务知识体系
第一阶段
基础课
前端基础,页面设计
mysql数据库
Java面向对象
计算机组装与维护
WEB前端设计与布局
javaScript特效制作
jQuery应用开发
vue框架基础与进阶
第二阶段
软件开发
Python+PHP+小程序开发
Python入门
Python进阶
单体架构项目
javaWeb核心开发
PHP开发
微信小程序开发
职业素质课程
第三阶段
深度学习
大数据技术生态源码深入
java框架高级开发(SSM)
MySQL数据库开发
JavaWeb核心开发
JavaWeb项目应用
分布式技术
微服务技术
中小型企业网构建与维护
Linux 服务器配置与应用
第四阶段
项目实战
鸿蒙生态应用开发学习
HarmonyOS 开发入门
借助ArkUI快速构建App界面
经典界面布局场景与实战应用
利用ArkUI组件构建复系功能界面
ArkUl开发实战
了解升级课程
引进大厂项目 在实战中夯实大数据技能
专注大数据中、高阶工程师技能
学科协作
平台实施
场景实操
流程参与
标准验收
广行业覆盖
电商数据分析与可视化
电商离线数据仓库
基于ODPS离线数据仓库
云学习平台用户画像(三选一)
电商平台自研项目(三选一)
问答大数据平台
企业级工程推荐系统
电商数据分析与可视化
数据BI与可视化项目是大数据典型的应用之一,也是大数据中非常重要的项目,本项目主要使用:Kettle、MySQL和FineBI等相关技术构建,对数据仓库已经加工好的数据进行报表展示、趋势研判和数据大屏展示等,为企业高层决策提供支持。
技术架构
Kettle+MySQL+FineBI+FineReport
项目职责
1.商数据报表和看板需求分析
2.电商数据库连接,使用Kettle进行数据ETL加工处理
3.对用户和订单等主题域的数据进行报表和看板制作
4. 全国地图图表数据加工和数据绑定
5.电商的复购分析、RFM和留存等常见模型分析开发
6.可视化看板域报表的权限配置、分享和发布
电商离线数据仓库
离线数据仓库是大数据中的一个基础性项目,几乎有数据的企业都需要的一个项目。离线数仓有很多实现方式,项目主要基于:DataX、Hadoop、Flume、Hive、Spark、DolphinScheudler、Python、Shell等技术搭建。整个项目包括商城数据同步、数仓分层、数据清洗、数据ETL和数据可视化应用等。
技术架构
MySQL+Hadoop+DataX+Flume+Hive+Spark+DolphinScheudler+Python+Shell+Superset等
项目职责
1.基于电商的业务数据需求分析和指标体系建立
2.原始数据(业务数据和日志数据)探索
3.用户、商品、订单、订单详情、订单支付、收获地址、供应商、时间维度、地区维度等相关业务数据全量和增量同步
4.业务数据同步任务开发、上线、测试及数据同步问题的数据补跑
5.用户浏览、点击、交互、启动、安装、滑动、输入和搜索等相关行为数据采集和任务上线运行
6.广告投放外部数据采集和任务上线运行
7.用户、订单、交易、营销等主题的DWD、DWS和ADS层开发
8.维度层数据加工与开发处理
9.ADS层数据导出到MySQL,配置相关任务,上线运行
10.使用Superset BI可视化工具实现各个主题报表配置、看板配置与看板发布
基于ODPS离线数据仓库
当前,一站式商业大数据服务繁多,ODPS采用抽象的作业处理框架将不同场景的各种计算任务统一在同一个平台之上,共享安全、存储、数据管理和资源调度,将不同用户需求的各种数据处理任务提供统一的编程接口和界面。基于ODPS的电商大数据是将电商相关用户、订单、交易、营销、商品、店铺和活动等业务数据和用户行为数据进行集成、转换和分析等处理,最终使用QuickBI进行BI报表展示和挖掘其它价值,辅助运营,实现商城健康发展。
技术架构
ECS、RDS、DataHub、MaxCompute、DataWorks、QuickBI
项目职责
1 部署一站式ODPS大数据环境
2 探索商城多种C端、B端和物流端等业务与数据,梳理相关业务指标体系
3 ODS层建立对应模型,应用ODPS的数据集成模块,将业务数据同步至ODS层
4 DWD和DIM层数据建模,将ODS层数据加工处理到DWD和DIM层
5 构建DWS层用户行为、商品、购物车和订单等宽表模型,并将DWD层数据加工到对应的宽表
6 ADS面向应用构建需求模型,将DWS层的数据再次加工到ADS层各个表中
7 使用QuickBI制作数据报表与可视化看板操作
8 数据质量监控开发和数据权限控制设置
云学习平台用户画像(三选一)
学习平台用户画像是基于学习平台数据仓库之上的项目,即需要先搭建学习平台的数据仓库,然后基于数据仓库,再扩展用户、课程等画像标签体系。本项目使用 Hadoop、Hive、Spark、DolphinScheudler、Hue 等技术构建,主要解决画像标签计算,实现标签设计、人群定位和用户精细化运营等。
技术架构
Hadoop、Hive、Spark、DolphinScheudler、Hue、Shell
项目职责
1 用户和课程标签体系建设
2 ID-Mapping打通
3 用户基础标签与聚合标签模型构建与加工
4 物品基础标签与聚合标签的模型构建与加工等
5 画像标签落盘与维护
6 画像标签的应用与服务
电商平台自研项目(三选一)
随着互联网发展,电商累积了订单、用户、流量等各类数据,但数据分散在各个业务系统中,随着业务发展,新主题模型不断产生,数据量不断增加,如何管理各类主题模型以及海量数据,需要对数据仓库进行科学架构。另外,数据仓库是数据挖掘技术的关键和基础,良好的数仓结构能够帮助用户快速理解现有数据能力,并且在当前信息基础上,对未来企业状况做出预测。
技术架构
MySQL、Kafka、Hadoop、Hive、Spark、ClickHouse、Superset、Hue、DolphinScheduler 或采用阿里云大数据服务
项目职责
1 电商业务需求讨论与评审
2 业务评审、架构评审和技术评审
3 电商相关指标体系,用户、订单、交易和商品等主题划分
4 相关类别、地域和品牌等维度层数据加工,数据仓库各层模型构建
5 电商业务数据同步和指标计算的任务排期、任务测试与上线部署
6 使用BI工具进行主题数据报表和看板制作与发布
7 企业级大屏数据抽取、加工、推送、露出全流程数据加工流转方式
问答大数据平台
问答系统近些年发展迅猛,尤其最近ChatGPT类及似产品流行,这将会积累海量问、答和互动数据,需要运用大数据技术进行数据加工、处理和分析,从而回馈用户更佳的答案,保持问和答等核心模块健康良好发展。
技术架构
MySQL、Kafka、Hadoop、Hive、Spark、ClickHouse、SuperSet、Hue、DolphinScheduler 等
项目职责
1 问答系统业务需求讨论与评审
2 问答系统数据仓库架构构建
3 问答系统相关指标体系,用户、问答和互动等主题划分及各层模型建设
4 业务数据和行为数据的同步与采集
5 用户、问答、互动和行为相关指标的计算
6 使用可视化工具对相关指标和数据进行展示
7 相关任务调度与上线配置
推荐系统企业工程实战项目作为大数据基础应用的延伸,构建于用户画像项目之上,旨在让学员学习企业级推荐系统构建的基本思路,深入讲解推荐系统中的两个最重要的环节召回和排序 ,各环节基于Spark-Mllib引入相关算法,比如召回层ItemCF,ALS两路召回算法,融合排序层引入GBDT+LR,在理解算法的同时更偏重工程实战,我们会从原始数据的特征抽取,转换,算法模型设计到编程实现做深入的讲解,同时也会对算法模型的跨平台部署方案做实际的案例,让学员学习到算法模型是如何在实际工程中部署运用的。
丰富的校园生活 学习不再枯燥
校园生活
军训汇演
企业研学游
校外 拓展活动
了解更多就业服务
关于大数据培训问题