当前位置 博文首页 > Python是世界上最好的语言的博客:《扫黑风暴》全网爆火!用Pyth

    Python是世界上最好的语言的博客:《扫黑风暴》全网爆火!用Pyth

    作者:[db:作者] 时间:2021-09-11 16:48

    前言

    ? ? ?《扫黑风暴》最近被刷屏了,所以我也去看了,发现看过一集是根本停不下来!在豆瓣上的评分高达8.0!豆瓣大家应该都清楚它的严格性,能达到8.0就证明这部剧没得说,当然文后我会吐槽一下滴!这部剧没看的小伙伴估计不清楚,这里就给大家简单的介绍一下:讲述了中央的扫黑除恶督导组进驻中江省绿藤市,在督导组和人民警察不懈的努力之下,将盘踞在中江市十几年的两大黑恶势力团伙一网打尽,并将黑恶势力的保护伞和腐败的政府官员绳之以法的故事。还是真实改编的哦!所以剧里的这些其实都是发现在现实生活中的!

    ?

    ????

    ?导入相关的库

     
    
    import pandas as pd import cutecharts.charts as ctc

    之前小编一直都是使用pyecharts模块来进行数据的可视化,这次咱使用一个别的库叫做cutecharts,能够帮助我们绘制出手绘风格的图表,同时还兼具交互性和动态性,每当鼠标在图表上悬停时,数据就会自动的显示出来

    ?

    ????


    评级的可视化

    ?我们来对剧迷们对该剧的一个评分做一个可视化,代码如下

    chart = ctc.Pie("某瓣上《扫黑风暴》的评分等级(%)")
    
    chart.set_options(
      labels=["5星", "4星", "3星", "2星", "1星"],
      inner_radius=0,
      colors=['#1DEFD3','#ECF30E','#F31D0E', '#1D0EF3', '#E11DEF'],
     )
    chart.add_series([29.8, 46.4, 17.3, 4.4, 2.0]) 
    
    # Calling the load_javascript function when rendering chart first time.
    chart.load_javascript()
    
    #Display the Chart
    chart.render_notebook()
    

    标签label上分别对应的是“5星”评级、“4星”评级、“3星”评级等等,然后在add_series()方法上面填上相对应的数据,出来的效果如下图

    ?

    ????

    ?可以看到评级主要是集中在“5星”和“4星”当中,总计占到了76%,可见观众朋友们还是给该剧给予了高度的认可和肯定。

    评部分的可视化

    ? ? ? ?另外小编也对观众朋友们的评论做了一个数据的抓取,将爬下来的数据进行进一步的处理与整合,计算出各位主演被提及的次数,数据抓取的代码如下,

    ## 发送请求
    page = requests.get(url, headers=headers, timeout=5, proxies=proxies).text
    soup = BeautifulSoup(page, "lxml")
    ## 定位到相应的位置
    content_lists = soup.select("div.review-content.clearfix p")
    for content in content_lists:
        print(content.get_text())
        contents.append(content.get_text())
    

    我们使用requests模块发起请求,然后用BeautifulSoup模块对返回的相应内容进行进一步的数据处理,提取出我们想要的内容,导出到txt文件当中去

    该剧的主演分别有“孙红雷”、“张艺兴”、“刘奕君”、“吴越”、“江疏影”、“王志飞”等一众实力派演员,他们被观众朋友们提及到的次数分别是

    chart = ctc.Bar("标题")
    
    chart.set_options(
        labels=[X轴的标签],
        x_label='X轴',
        y_label='Y轴',
        colors=['#FFF1C5','#F7B7A3','#EA5F89','#9B3192','#57167E'],
     )
    chart.add_series('多少',对应Y轴的数字) 
    
    # Calling the load_javascript function
    chart.load_javascript()
    # output
    chart.render_notebook()
    

    ?

    ????

    ?

    其中我们看到主演“孙红雷”和“张艺兴”以及“刘奕君”所扮演的角色被观众提及的次数是最多的,另一名反派的饰演者“吴晓亮”也给观众留下了相当深刻的印象

    图片?

    下面小编便对提及“孙红雷”和“张艺兴”的评论做一个词云图的绘制,如下图所示

    stylecloud.gen_stylecloud(text=" ".join(review_list),
    max_words=500, collocations=False,font_path="KAITI.ttf",
    icon_name="fab fa-bandcamp",size=653,output_name="4.png")

    ??

    ????

    可能是由于“孙红雷”的演技真的真棒,观众朋友们对于他的演技评论相当多,以及在剧中和张艺兴还有刘奕君所扮演的角色互动相当多,因此在评论当中也有被提及。张艺兴在该部片中饰演警察,有不少的打戏等等,演技的进步也是得到了不少观众朋友们的喜爱

    ?

    ?观众朋友的画像分析

    而从粉丝的加入社区的年份来看,2021年也就是今年刚加入的群体所占最多,其次便是去年以及前年的粉丝,说明某瓣在新用户的增长上面也是下了不少的功夫的

    ?

    图片?

    ?

    关于该部剧

    《扫黑风暴》其中的情节取材于云南的孙小果案、湖北文烈宏案、海南黄鸿发案等等,当年,这些轰动一时的惊天大案也曾出现在了新闻报道当中,彼时大众只是获悉一个结果,并不了解办案过程当中的具体细节。例如上面提到的孙小果,他当年在触犯重大刑事案件轴,在母亲的包庇维护之下一再减刑,后来甚至逃脱了法律的制裁,在监狱外面过着更加嚣张的生活?

    ????

    ?在扫黑除恶的整个过程当中有多名人民警察身负重伤甚至是牺牲了自己的生命,才换来了我们现在太平的生活,所以现在想来,哪有什么真正的岁月静好,只是有人在默默地替咱们负重前行罢了,向这些英勇的人民警察致敬

    需要完整代码的可私信我!

    最后

    ? ? ?吐槽的时候到了,我要吐槽的就是每天更新太少,每天才一集,太少了,然后就是vip!好歹我也是v8用户,居然还是每天只能看一集,最后就是花钱,每天三块钱,还是只能看一集,我是缺那几十块钱的人吗,一次性给我更新出来不行吗,太难受了,你们有吐槽的点嘛!

    cs