当前位置 博文首页 > shopping_10_cats_炫云云:情感识别数据online

    shopping_10_cats_炫云云:情感识别数据online

    作者:[db:作者] 时间:2021-09-09 21:55

    online_shopping_10_cats 说明

    1. 下载地址: Github
    2. 数据概览: 10 个类别(书籍、平板、手机、水果、洗发水、热水器、蒙牛、衣服、计算机、酒店),共 6 万多条评论数据,正、负向评论各约 3 万条
    3. 推荐实验: 情感/观点/评论 倾向性分析
    4. 数据来源: 各电商平台,具体不详
    5. 原数据集: 中文情感分析语料、中文情感分析语料库,网上搜集,具体作者、来源不详
    6. 加工处理:
      1. 将 2 份语料整合成 1 份语料
      2. 将原来零散的 excel, txt 文档,整合成 1 个 统一的 csv 文档
      3. 去重
    import pandas as pd
    
    path = 'online_shopping_10_cats_文件夹_所在_路径'
    

    1. online_shopping_10_cats.csv

    加载数据

    pd_all = pd.read_csv(path + 'online_shopping_10_cats.csv')
    
    print('评论数目(总体):%d' % pd_all.shape[0])
    print('评论数目(正向):%d' % pd_all[pd_all.label==1].shape[0])
    print('评论数目(负向):%d' % pd_all[pd_all.label==0].shape[0])
    
    评论数目(总体):62774
    评论数目(正向):31728
    评论数目(负向):31046
    

    字段说明

    字段说明
    cat类别:包括 书籍、平板、手机、水果、洗发水、热水器、蒙牛、衣服、计算机、酒店
    label1 表示正向评论,0 表示负向评论
    review评论内容
    pd_all.sample(20)
    
    cs
    下一篇:没有了