Python来分析,堪比“唐探系列”!B站9.5分好评如潮!《扬名立万》编剧太牛了!
新年宅在家,煲剧看电视已经是每天必打卡的活!菜鸟哥很喜欢逛B站里面有很多非常好看的原创动漫,还有一些不错的up的视频。比如最爱的斗破苍穹系列!
最近一部非常不错的悬疑+侦探+喜剧 电影,登上B站热榜!菜鸟哥看完之后,大呼过瘾,简直就是一本非常棒的"剧本杀"!演员都是实力派,演技超级好,剧情设计太有节奏感了!尤其是片尾的大反转,亮点很多。
【主角团人物简介】
陆子野——上海滩投资大亨
郑千里—烂片导演
关静年——惜命默片之王
苏梦蝶——过气女明星
李家辉——挖掘真相刺头编剧
陈小达—好莱坞功夫替身
两位“顾问”
大海——初出茅庐文职警察
齐乐山——三老案的杀人凶手
故事发生在民国时期,月黑风高之夜,一群失意电影人不约而同地受到上海滩大亨陆子野的邀请,来到一栋神秘大别墅,参加电影剧本讨论会。试图将一桩轰动上海的重大命案改编成电影。而随着讨论的逐渐深入,他们发现这栋别墅就是案发现场,齐头扎进了一个巨大的迷局,暗处的黑势力也在虎视眈眈,而凶手就在他们中间。。
豆瓣影评
B站弹幕
对于弹幕的数据抓取,程序如下图所示:
上述的程序内容非常的简单,利用requests库来提取网页数据后,利用BeautifulSoup来解析网页数据后,获取到弹幕的内容、颜色以及字体等内容,最后将数据保存到本地。
程序中最为关键的点是cid数值的获取。如下图所示:
在网页当中,点击“F12”,打开开发者模式后,在网络下,通过搜索cid的关键词,来找到cid的数值。
接下来我们首先来分析一下弹幕数据。
对于观影者来说,弹幕的发送时间往往跟用户的观影时间呈现强相关性。
如上视频所示,弹幕的数量有两个高峰时间段,分别是晚上八点到凌晨以及下午的一点到六点。
假期期间,大家有着充分的观影时间,无论是白天或者是晚上,都可以随时随地观看电影发送弹幕。
而在大家的弹幕词云,如下图所示。
在弹幕当中,大家发送最多的弹幕当然是“新年快乐”,并且包含了“前方高能”等常见的弹幕用语。弹幕更多的是观影用户的随手发送的信息,不能很好体现对于电影本身的评价。
因此接下来我们来进一步的来抓取B站的影评数据:
上图是抓取B站影评的全部程序,程序的主入口是run函数。
58-72行函数,利用requests库来请求数据后,解析返回的json数据,并提取data数据,然后利用get_detial_data函数来获取详细的数据内容。
对于获取的影评数据,我们先看一下大家的评分数据。
从大家的评分数据可以看出,接近87%的影评给出了满分10分的评价。超过九成的用户给出了8分以上的评分。足以见得用户对于该部影片的喜爱和支持。
在用户的影评当中。对该部影片给予了高度的评价,“好看”、“不错”等褒义词成为了高频关键词。错过电影院观看的小伙伴们,非常值得花6块钱在B站看一下这部电影。
菜鸟学Python视频号
推荐阅读:
入门: 最全的零基础学Python的问题 | 零基础学了8个月的Python | 实战项目 |学Python就是这条捷径
干货:爬取豆瓣短评,电影《后来的我们》 | 38年NBA最佳球员分析 | 从万众期待到口碑扑街!唐探3令人失望 | 笑看新倚天屠龙记 | 灯谜答题王 |用Python做个海量小姐姐素描图 |碟中谍这么火,我用机器学习做个迷你推荐系统电影
趣味:弹球游戏 | 九宫格 | 漂亮的花 | 两百行Python《天天酷跑》游戏!
AI: 会做诗的机器人 | 给图片上色 | 预测收入 | 碟中谍这么火,我用机器学习做个迷你推荐系统电影
小工具: Pdf转Word,轻松搞定表格和水印! | 一键把html网页保存为pdf!| 再见PDF提取收费! | 用90行代码打造最强PDF转换器,word、PPT、excel、markdown、html一键转换 | 制作一款钉钉低价机票提示器! |60行代码做了一个语音壁纸切换器天天看小姐姐!|