我，大专毕业2年，从前端转型大数据开发，薪资涨了10K！-技术圈

点击上方 "大数据肌肉猿"关注, 星标一起成长

点击下方链接，进入高质量学习交流群

今天分享学习群一位同学的转型经历，他19年大专毕业后从事了前端开发，今年顺利转到大数据，从薪资8K涨到18.5K，分享一下他的学习经历给大家参考。

一、自身情况

大家好，做个简单的自我介绍。本人今年23了，98年生人，没有经历过高考，所以直接是去上了一所大专，专业是移动互联，也是打小对互联网比较感兴趣报了这个专业。

因为是大专毕业，算起来工作时间应该是两年多了。大学里基本没能学到啥东西，学校也是基本是属于啥都教的状态，像什么安卓开发，苹果开发，C语言，java，前端，嵌入式，低代码平台等等...不过也意味着一个问题，啥都教就等于啥都学的很浅，我记得当时的前端只教了html还有css，js都没有去学过，就离谱...

二、工作经历

再讲讲工作经历，得益于上学的时候自学过微信小程序的开发，找了一份前端开发的实习工作，小声逼逼一下很感谢当时的公司并没有嫌弃我。

后来干了一年多公司黄了。又找了一个游戏开发的工作，主要是做安卓端app的开发，然后干了没半年，老板跑路了，被社会上了第一堂课，劳动仲裁了两三个月，直到现在钱也还没拿回来....

再后来同学内推我进了一家医疗公司，主要干sql运维的活，当然，也就是这样，了解到还有大数据这个行业，我又从网上了解了下大数据行业的薪资，当时就是一句卧槽，于是决定转行到大数据。

三、转行过程

转行过程相对于来说还是比较痛苦的吧，当时也是没有目的的去网上找一些资料去看，后来就刷到了峰哥，加进去了学习群，然后就跟着群里的学习资料慢慢来，还记得当初在本地搭虚拟机，就搭了一周，心态快崩了23333。

因为我是大专学历，总怀疑自己学了之后能不能转成功，但每当我低落的时候就看看峰哥发的这些转型案例：《大数据转型案例合辑》，顿时就打了鸡血，能不能行得自己努力了才知道。

因为是边上班边学习，效率是有点低下。本来想裸辞报培训班，后面混入了一个培训班学生建的群了，里面都是各种吐槽培训班，什么学习进度太快，学完之后老师也不管，直接丢给你简历让你照抄，收到面试通知之后培训班老师帮忙面试等等。

于是我打消了报培训班的念头，让峰哥帮忙规划了学习路线和给到我一些资料，峰哥也让我别这么早裸辞，可以先把基础学完再说。

按照峰哥给的学习计划和资料，我利用业余时间把基础学的大差不差。于今年年前辞职，然后过年后在家脱产学习了两个月，感觉到差不多了。一个人北上去找工作，不负这半年多来的学习，当时收到offer的时候都快哭了。

四、面试

刚开始投简历的时候也怕没有面试机会，但担心多余了，中小公司的面试机会多的让我猝不及防。

当时心理也很自卑吧差不多，因为是学历问题，还有就是初入这个行业，很紧张，基本临场就脑子一片空白。刚开始面得几家，基本都是属于被面试官吊打，一问三不知的状态。

不过多面面就好了，项目上面多花一点心思，跟面试官多聊聊，有不会或者有疑问的还可以问问面试官，面试完总结复盘，然后再让峰哥把把关，没有什么其他的技巧了，多总结，查漏补缺就是了....就是多面试，多总结，可以先拿小公司练练手hhh。

总结一下我当时面试的情况吧：

1）技术框架部分：

（1）会根据面试者简历上的技能点进行考察。注意技能点描述用词，不要随便用熟悉，觉得特别熟的可以说熟练使用

（2）常用的大数据框架是肯定会问的，比如Hive、Spark、Kafka等。常见的如Kafka精准消费问题的多种解决办法对比，Spark的Task调度规则

（3）Java，MySQL，Redis必问，MySQL的索引及优化，Redis数据结构、集群、缓存淘汰

2）项目部分：

（1）一般会让你挑你最熟的一个项目讲。考察从项目背景到实现的把控

（2）重点是参与的部分，遇到的难点

（3）常见业务难题的解决和优化，层层递进，追求做到极致

（4）没有做过的项目、模块不要乱讲，容易被问懵逼或者被太简单被鄙视

3）算法部分：

（1）数据结构必考，手写代码，大一点的公司每一面都会考。常见数组、链表、二叉树、跳表的题。有些部门会先笔试（电脑实际编码运行）再面试

（2）算法部分常见动态规划、概率题、二进制一类

（3）SQL题目，行列转换。分区函数，统计连续登陆天数这一类问题

（4）多刷Leetcode，题都是有套路的

4）HR部分：

（1）想好跳槽理由，一般注重抗压能力和稳定性

五、部分面试题

因为我学习时间比较仓促，学了一个数仓项目和一个实时项目，但实时项目还不太熟悉，把数仓写在了第一个，所以面试基本都问数仓。

1. 自我介绍？

2. 你是怎么接触的大数据？

3. 你们的数仓模型是什么样的？

4. 星型模式、雪花模型、星座模型各有什么好处？

5. 数仓分层架构的设计及每一层干什么的？

6. 你们数仓中拉链表怎么设置的？

7. 你们拉链表有分区吗？拉链表分区是怎么控制的？（我说的是每天全量刷新，他接着问如果你们数据量特别大呢？怎么解决的？）

8. 事实表有哪些？事实表中的历史数据怎么修改？（这个没答上来，面试官说你们没有做过快照表吗？这个没听说过）

9. 你们工作中实际的工作流程是怎么样的？

10. 如果给你提一个需求，需要将ods、dwd、dws层数据全部都要用到，并且需要全部都要重新在做一遍，然后为了生成这个ads层数据的结果，你是怎么避免这种烟囱式式开发的？（这个我没太懂意思，然后说的没遇到过）

11. 你们元数据管理怎么做的？

12. 你们数仓部门几个人？

13. 你们集群是什么规模？每台服务器什么配置？

14. 数仓中用的存储格式是什么？ORC和Parquet一般是什么场景下用？

15. Hive中的UDF和UDTF？

16. 开窗函数的介绍？排序的函数？

17. Sort by和Order by的区别？

18. 行转列和列转行用的哪些函数？

19. Hive中Join的工作原理？

20. mapJoin的工作原理？

21. 你们工作中Azkaban怎么实现的跨工作流？比如说ads层的一个指标需要依赖于一个宽表，肯定不在一个工作流中，你们是怎么处理这种情况的？

22. 工作中如果做一个指标需要依赖于别人开发设计好的一张宽表，这种场景你们是怎么处理的？

23. 你为什么要离职？

24. 你是主动提出离职的还是公司不给你续签合同了？

25. 你们公司在哪个地方？

26. 你住在哪个地方？去公司要多久时间？

27. 数仓怎么搭建起来的？

28. 你们数仓怎么建模型的？怎么分层的？

29. 如果要让你设计一个模型的话，你会怎么设计？（可以随便举个例子来说）

30. 指标分析你们主要是用的什么？

31. 谈谈你对Hive的优化以及写SQL过程中的优化？

32. Select * 与Select 写全部列名这两个有什么区别吗？

33. 一个SQL题：如何去求这一天24小时每隔5分钟的股票的一个峰值和低估值？（不是实时的，数据可以是昨天一天的数据）

34. 你有什么问我的吗？

六、总结

这次的转型学习和面试让我觉得大数据也没想象中的那么可怕，另外就是原本我一直担心的学历问题，会影响一些大公司的面试，但中小公司好像没什么影响，等工作稳定了之后还是需要再升个本，也补补实时和计算机基础，争取下一次能进大厂，干就完了！

--end--

扫描下方二维码

添加好友，备注【交流】

可私聊交流，也可进资源丰富学习群

更文不易，点个“在看”支持一下👇