Python3 + matplotlib.pyplot 实现数据可视化（折线图）

最新推荐文章于 2024-03-12 20:16:11 发布

赶尾张

最新推荐文章于 2024-03-12 20:16:11 发布

阅读量491

点赞数 1

分类专栏： python练手微博信息处理文章标签： python 可视化数据分析数据可视化 matplotlib

本文链接：https://blog.csdn.net/weixin_43954226/article/details/110584552

版权

python练手同时被 2 个专栏收录

7 篇文章 0 订阅

订阅专栏

微博信息处理

3 篇文章 0 订阅

订阅专栏

Python3 + matplotlib.pyplot 实现数据可视化（折线图）

需求
代码

需求

通过已有数据文件（链接: 数据文件来源.）拿到数据，筛选毒菌相关的我的评论，并使用matplotlib.pyplot画出筛选后的评论按日期分布折线图，实现数据可视化

代码

import datetime
import re

import matplotlib.pyplot as plt

first_date, last_date = '2020-01-01', '2020-11-01'

def comm_msg(path):
    day_num = (datetime.datetime.strptime(last_date, '%Y-%m-%d') -
               datetime.datetime.strptime(first_date, '%Y-%m-%d')).days + 1  # 总天数
    data_dict = dict([((datetime.datetime.strptime(first_date, '%Y-%m-%d') +
                        datetime.timedelta(days=i)).strftime('%m.%d'), 0) for i in range(day_num)])
    super_poisonous_mushrooms = ['青褶伞', '日本红菇', '盔孢伞', '卷边桩菇', '黄盖鹅膏', '肉褐鳞环柄菇', '亚稀褶红菇',
                                 '鹿花菌', '丝盖伞']
    poisonous_regular_strs = ['[^没无]毒|^毒', '头晕|头痛', '腹泻|肠胃炎', '[^牛]肝|^肝', '肾[^形]|肾$', '内脏损伤',
                              '致命|要命|生命危险', '|'.join(super_poisonous_mushrooms)]

    with open(path, 'r', encoding='utf-8') as f:
        for l in f:
            l = l.split('\t')
            comm_time, comm_text = l[3], l[2]
            if comm_time.startswith('2020'):
                matched_str = comm_text.split('</a>：')[-1]
                if '</a>:' in matched_str:
                    matched_str = comm_text.split('</a>:')[-1]  # 防止被回答者id带关键字
                for prs in poisonous_regular_strs:  # 是否符合任一条目标正则
                    if re.findall(prs, matched_str):
                        data_dict[comm_time.replace('-', '.')[5:10]] += 1  # 筛过处理
                        break
    return list(data_dict.keys()), list(data_dict.values())


plt.rcParams['font.sans-serif'] = ['simsun']  # 宋体
x_date_data, y_comm_data = comm_msg(r'D:\xxx\data.txt')
interval_x = 20  # 隔几单位显示一次日期
plt.xticks(range(len(x_date_data)), [x_date_data[i] if i % interval_x == 0 else ' ' for i in range(len(x_date_data))])  # x轴日期标注
plt.axis([-1, len(x_date_data), 0, ((max(y_comm_data) - 1) // 10 + 1) * 10])  # 横纵坐标边界
plt.grid()  # 网格
plt.plot(x_date_data, y_comm_data, c='red')
plt.legend(['涉及毒菌评论总数'], loc='upper left')
plt.show()

效果图：
效果折线图

赶尾张

关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
Python3 + matplotlib.pyplot 实现数据可视化（折线图）

文章目录前言一、pandas是什么？二、使用步骤1.引入库2.读入数据总结学习内容：学习时间：学习产出：前言提示：这里可以添加本文要记录的大概内容：例如：随着人工智能的不断发展，机器学习这门技术也越来越重要，很多人都开启了学习机器学习，本文就介绍了机器学习的基础内容。提示：以下是本篇文章正文内容，下面案例可供参考一、pandas是什么？示例：pandas 是基于NumPy 的一种工具，该工具是为了解决数据分析任务而创建的。二、使用步骤1.引入库代码如下（示例）：import nump
复制链接

扫一扫