双非数学硕士零基础转大数据开发，收割腾讯字节百度等10个大厂 SP offer-技术圈

点击上方 "大数据肌肉猿"关注, 星标一起成长

后台回复【加群】，进入高质量学习交流群

2021年大数据肌肉猿公众号奖励制度

今天分享学习和面试经验的是学习群一位广东双非数学硕士，他研一开始零基础学习大数据开发，学习了几个月后，拿了几家大厂的offer并进行实习，这次秋招也收割了十几个大厂offer，基本都是SP，以下是部分offer，还有一些意向书直接拒了。

自我介绍：

本科：广东普通一本数学硕士，秋招拿了广东这边大部分大厂的大数据开发offer。

学习经历：

背景

在19年保送至本校硕士后，开始思考未来研究生毕业该从事什么样的工作，以及如何规划未来2.5年研究生涯。
因为从小对数字敏感以及从小接触互联网，觉得互联网的工作环境很高级，对大厂憧憬，感觉做这个工作很体面。因此希望从事数据挖掘、数据分析和数据开发的工作。

规划

由于我研究生期间为2019年-2022年，属于22届的应届生。那么我需要在2021年7月-2021年10月份参加秋招。因此我的准备时间为2019年7月-2021年7月，共有2年时间。由于2019年9月份-2020年6月份需要在校上课。因此19年9月-20年6月只能一边上课一边学习工作相关的知识。2020年7月-2021年7月可以在外实习，为秋招增加竞争力。
19年7月在网上搜索，网友说数据开发的门槛比较低，因此19年9月-20年3月在网上学习javaSE、数据结构与算法、hadoop、刷算法题。虽然疫情期间有大量的学习时间，但是学习过程发现学习艰难，没有指导，没有反馈，不知道自己学习效果如何。leetcode上浩如烟海的算法题让人怀疑人生。

开始

因此在20年4月份找峰哥帮忙规划学习路线、学基础、学项目、刷算法题。
从20年4月-20年6月，开始学习项目，刷剑指offer，背java、JVM、数据库等八股文理论。
两个月搞定了两个项目后，20年6月份开始应聘数据开发的工作，一开始面试很艰难，疫情慢慢结束，但是数据开发实习仍然很少。一开始只拿到广州的化妆品电商数据开发实习，去了3天。
公司的服务器持续被攻击，感觉这个氛围不行，无法接受。另外也拿到老百姓大药房数据开发实习，第四天提离职。
后来到7月份实习机会多起来，疫情管控变弱。又拿到吉比特数据开发实习。
实习了一段时间，又去面了腾讯，通过了，一直实习到春季实习，春季实习也拿了oppo、顺丰、Shopee，阿里lazada等offer。
这次秋招也在腾讯转正，并拿了字节百度等SP offer。

部分面试题参考：

介绍订单的开发过程
这个项目是你一个人在做，还是有老员工带着你做
除了后台开发，还有进行数仓方面的开发，是吗
主要负责哪一块的内容
只是从日志服务器取数据吗？
从日志服务器是直接用flume导入到HDFS吗?
为什么要分两层flume，不直接flume导入HDFS？
讲一下flume里面拦截器
为什么要分成两个topic传到kafka，后面不还是传到flume里消费吗？
有用到spark stream的一些操作吗？
数仓分几层？每层做什么？
数据可视化是自己开发吗？还是用工具？
有解析字段的函数，为什么要用UDF？怎么定位错误日志？
自定义UDF的步骤？
需求的指标是你倡议的？还是给的？
最近七天连续三天登录用户的指标代表什么含义？
除了简历上的指标，还分析过哪些指标？
有进行过优化吗？
为什么要压缩数据？对数据的压缩是在HDFS上进行吗？
hive上有优化吗？sql语句上有优化吗？
有用代码实现mapjoin吗？
熟悉linux吗？awk怎么用？
全调度流程怎么实现？
azkaban里面的job支持什么格式？
你觉得azkaban有什么优点？
有没有参与运维？
单例模式
工厂模式
Tar
Zip
spark学到什么东西
人员配置
有多少台服务器（集群规模多大）
简述提交mapreduce流程的8个步骤
hive分区和分桶技术，有什么用
hive的架构
使用多线程要怎么使用
稍微介绍一下这个项目做了什么
项目用什么做的
人员配置
报表怎么开发
导师会带着做什么项目
导师有多少个学生
面试轮数=1
问题：
校园：
项目1：
java的基础知识：
Hadoop
数仓项目：
linux：压缩的命令：
设计模式：
学习方法
为什么想来深圳工作
如何看待游戏行业
实习过程中最大的收获是什么
说说自己是怎样的一个人
自我介绍
主要做了什么工作
数据量有多大，人员组织架构
指标日活怎么定义，怎么计算
其他指标怎么计算
新增指标是n*n的join，你是怎么保证正常运行的
大数据量的复杂sql计算如何保证不崩溃，正常高效运行
实习生可以做这些的吗？
介绍一下项目
用一个指标举例子，介绍一下整个数据流的过程，是如何计算的
在计算指标的过程中遇到什么难题
数据量有多大，所有表有多大
可以看数据库的数据吗
用到了什么数据仓库模型
为什么要用星型模型，不用雪花模型？之前为什么要用雪花模型？
报表怎么开发，是什么样的
面试轮数=3
问题
一面（同事）
二面（组长）
三面（HR）

总结：

提前规划很重要

提前规划秋招需要构造的壁垒和门槛，例如熟练的理论和工具使用；丰富的大厂实习经验，含金量的项目经验等等。
等到秋招时，其他学生已经反应不过来了，想抄袭都来不及了。这样胜券在握

目标拆解

对总目标进行拆解成小目标
小目标更容易实现，有成就感

放平心态

结合1和2，规划何时达成各个目标
一步一脚印，脚踏实地

效果评估

通过面试评估自己的水平，让自己有反馈，刺激自己做的更好

--end--

扫描下方二维码

添加好友，备注【交流】

可私聊交流，也可进资源丰富学习群

更文不易，点个“在看”支持一下👇

双非数学硕士零基础转大数据开发，收割腾讯 字节 百度等10个大厂 SP offer

自我介绍：

学习经历：

背景

规划

开始

部分面试题参考：

总结：

提前规划很重要

目标拆解

放平心态

效果评估

双非数学硕士零基础转大数据开发，收割腾讯字节百度等10个大厂 SP offer