疫情过后,这几个大数据技能会很香,高薪机会来了!
小詹学Python
共 1500字,需浏览 3分钟
· 2020-02-20
此次抗击新冠肺炎疫情,可以说是举国之力,每个人都积极投入到防御工作中,但相较于“非典”时期,还是发生了很多显著的变化。
但是现在每天产生的大量数据,有很多是没有价值的。如何让数据发挥应有的威力,医疗行业尤其是流行病的疾控和预警表现的最为明显也最急切,因此对“慢数据”的挖掘显得尤为重要。
大数据时代真正的大数据技术应该是可以提前预测疾病情况,并在防疫和疫情控制当中产生更大的作用。
如果你恰好从事数据分析相关工作,或者掌握Python基础语法,熟悉Numpy,Pandas,Scikit-learn库的简单使用,那么确认过眼神,你是对的人,下面集成模型应用项目非常适合你来了解。
一、大数据在新冠肺炎疫情中的应用
简单的说就是通过血压、血氧、胸部CT等医学指标,实现机器学习的分类情况,挖掘和不断优化模型,最终初步筛选是否患有新冠肺炎。
其中涉及到架构系统项目的流程、特征对于模型的变化趋势,逻辑回归(LR)和随机森林分类算法(RF)的应用,模型解释工具包等问题。具体内容欢迎关注金子老师带来的《抗疫当前,用集成模型告诉你如何提升安全感》。
公开课介绍抗疫当前,用集成模型告诉你如何提升安全感2月20日(周四)20:00-22:00讲师介绍金子老师:
原新浪广告事业部支撑架构师,中国移动数据挖掘总工程师。
知识要点1. 架构系统项目流程
2. 特征对于模型的变化趋势
3. 逻辑回归和随机森林分类算法的应用
4. 竞赛利器:模型解释工具包
获得技能1. 实现逻辑回归算法(LR)、随机森林算法(RF)在项目中应用
2. 掌握特征在建模前后变化趋势
3. 掌握在竞赛和企业中的工具包
4. 熟练使用模型解释工具包:eli5、shap和pdpbox
二、RF 、LR算法在项目中的应用与企业人才需求
随机森林算法(RF)
作为一种高度灵活的机器学习算法,RF拥有广泛的应用场景。既可以用来做市场营销模拟的建模,统计客户来源、保留和流失,也可用来预测疾病的风险和病患者的易感性,因此可广泛应用于市场营销和医疗行业。
逻辑回归算法(LR)
“逻辑回归算法”的名字里虽然带有“回归”二字,但实际上逻辑回归算法是用来解决分类问题的算法,主要有以下特点:LR能以概率的形式输出结果,而非只是0,1判定、可解释性强,可控度高、训练快,feature engineering之后效果赞、因为结果是概率,可以做ranking model。
LR可应用于CTR预估、推荐系统的learning to rank各种分类场景。如:某搜索引擎厂的广告CTR预估基线版,某电商搜索排序、广告CTR预估基线版均是LR,某电商的购物搭配推荐用了大量LR、某现在一天广告赚1000w+的新闻app排序基线是LR(无需备注名字,你懂得)。
左右滑动查看更多
更多从事数据相关专业或者拥有一定基础的人都选择不断提升,以期能有更好的职业发展。更多精彩内容欢迎关注公开课原价 199 元粉丝专享价仅需 0.01 元
评论
李彦宏:开源大模型不如闭源,后者会持续领先;周鸿祎:“开源不如闭源” 的言论是胡说八道
架构师大咖
架构师大咖,打造有价值的架构师交流平台。分享架构师干货、教程、课程、资讯。架构师大咖,每日推送。
公众号该公众号已被封禁0、李彦宏:开源大模型不如闭源,后者会持续领先当今
源码共读
0
五一Python抢票神器来了
还在为五一回家抢不到火车票发愁吗?今天介绍一个Python抢票神器,希望对你有帮助。Py12306是一个流行的开源项目,旨在帮助用户更便捷地查询和预订中国铁路12306网站上的火车票。以下是使用Py12306的基本步骤和一些注意事项:安装与环境准备安装Python: 确保你的系统中安装了Python
Python小二
1
IntelliJ IDEA 2024 首个大版本发布,好用到爆!
关注我们,设为星标,每天7:40不见不散,架构路上与您共享回复架构师获取资源大家好,我是你们的朋友架构君,一个会写代码吟诗的架构师。JetBrains 为多款 IDE 发布了 2024 年度首个大版本更新 (2024.1),包括 IntelliJ IDEA 、WebSt
Java架构师社区
0
香港大利好!重磅政策来了!
导读中国证监会4月19日发布5项措施,进一步拓展优化沪深港通机制,助力香港巩固提升国际金融中心地位,共同促进两地资本市场协同发展。据了解,这五项措施主要围绕:放宽沪深港通下股票交易型开放式指数基金(ETF)合资格产品范围;将基础设施证券投资基金(REITs)纳入沪深港通;支持人民币股票交易柜台纳入港
区块链头条
0
小美播报|3月IPTV数据排行榜发布!
小美播报3月IPTV数据排行榜:《与凤行》登顶连续剧榜榜首拥有4.05亿家庭用户的中国IPTV平台已经成为国内主流视听平台,IPTV平台数据对视听产业各环节都具有重要意义。截至2024年4月,全国已有29个省级IPTV加入“看中国”,覆盖全国超2.25亿户家庭、辐射近7亿人。点击查看详情湖南广电与马
流媒体网
0
又一国产灭霸,要来了
据透露,vivo X100 Ultra确定会在今年5月份发布,这款机型基本可以锁定“vivo X系列有史以来最强的影像旗舰”。vivo推出自研影像品牌BlueImage,也意味着继华为XMAGE后,手机行业第二个独立影像品牌的诞生。vivo X100 Ultra后置三摄,将会搭载一枚2亿像素潜望式超
放毒
2
神作《凤凰架构:构建可靠的大型分布式系统》PDF来了
今天给大家带来了一本大作:周志明老师的 《凤凰架构:构建可靠的大型分布式系统》PDF版来了,文末直接获取周志明是谁?这可是真大佬,或许有些朋友没有听过,但是你们一定听过:《深入理解 Java 虚拟机》这本神书,没错就是这本书的作者,出过多本书,豆瓣评分如下,全是高分,尤其是《深入理解Java虚拟机》
路人甲Java
0
python读取一个文件里面几百个csv数据集然后按照列名合并一个数据集
点击上方“Python爬虫与数据挖掘”,进行关注回复“书籍”即可获赠Python从入门到进阶共10本电子书今日鸡汤但使龙城飞将在,不教胡马度阴山。大家好,我是Python进阶者。一、前言前几天在Python最强王者交流群【FiNε_】问了一个Python自动化办公,问题如下:python 读取一个文
Python爬虫与数据挖掘
3