【蟒蛇】16、数据可视化-学Python黑马程序员个人笔记

参考视频

黑马程序员python教程,8天python从入门到精通

地图基础

"""
演示地图可视化的基本使用
"""
from pyecharts.charts import Map
from pyecharts.options import VisualMapOpts

# 准备地图对象
china_map = Map()


# 准备数据
data = [
    ('北京市', 99),
    ('上海市', 199),
    ('湖南省', 299),
    ('台湾省', 399),
    ('广东省', 499),
]

# 添加数据
china_map.add('测试地图', data, 'china')  # china的c不能大写!!

# 设置全局选项
china_map.set_global_opts(
    visualmap_opts=VisualMapOpts(
        is_show=True,
        is_piecewise=True,  # 设置分段
        pieces=[            # 手动指定分段
            {'min': 1, 'max': 9, 'label': '1-9', 'color': '#CCFFFF'},
            {'min': 10, 'max': 99, 'label': '10-99', 'color': '#FF6666'},
            {'min': 100, 'max': 500, 'label': '100-500', 'color': '#990033'},
        ]
    )
)

# 绘图
china_map.render()

全球疫情地图

"""
演示全国疫情可视化地图开发
"""
import json
from pyecharts.charts import Map
from pyecharts.options import *

# 读取数据文件
f = open('D:/Pycharm-beginner/疫情.txt', 'r', encoding='UTF-8')
data = f.read()  # 全部数据

# 关闭文件
f.close()

# 取到各省数据
# 将字符串json转python的字典
data_dict = json.loads(data)  # 基础数据字典

# 从字典中取出省份的数据
province_data_list = data_dict['areaTree'][0]['children']

# 组装每个省份和确诊人数为元组,并各个省的数据都封装入列表内
data_list = []  # 绘图需要用的数据列表
for province_data in province_data_list:
    province_name = province_data['name']                 # 省份名称,pyecharts更新后要全称才行台湾-台湾省
    province_confirm = province_data['total']['confirm']  # 确诊人数
    data_list.append((province_name, province_confirm))
# print(data_list)
"""
[('台湾', 15880), ('江苏', 1576), …………]  # pyecharts2022年更新后要全称才行台湾-台湾省,导致地图不同出bug
"""

# 组装每个省份和确诊人数为元组,并各个省的数据都封装入列表内!!!
data_list = []
for province_data in province_data_list:
    province_name = province_data["name"]
    province_confirm = province_data["total"]["confirm"]

    # 处理省份不匹配问题
    if province_name == "新疆":
        province_name = "新疆维吾尔自治区"
    elif province_name == "广西":
        province_name = "广西壮族自治区"
    elif province_name == "宁夏":
        province_name = "宁夏回族自治区"
    elif province_name in ["内蒙古", "西藏"]:
        province_name = province_name + "自治区"
    elif province_name in ["北京", "天津", "重庆", "上海"]:
        province_name = province_name + "市"
    elif province_name in ["香港", "澳门"]:
        province_name = province_name + "特别行政区"
    else:
        province_name = province_name + "省"

    data_list.append((province_name, province_confirm))
# print(data_list)

# 创建地图对象
china_map = Map()

# 添加数据
china_map.add('各省份确诊人数是:', data_list, 'china')

# 设置全局配置,定制分段的视觉映射
# 设置全局选项
china_map.set_global_opts(
    title_opts=TitleOpts(title='全国疫情地图'),
    visualmap_opts=VisualMapOpts(
        is_show=True,
        is_piecewise=True,
        pieces=[
            {'min': 1, 'max': 99, 'label': '1-99人', 'color': '#CCFFFF'},
            {'min': 100, 'max': 999, 'label': '100-999人', 'color': '#FFFF99'},
            {'min': 1000, 'max': 4999, 'label': '1000-4999人', 'color': '#FF9966'},
            {'min': 5000, 'max': 9999, 'label': '5000-4999人', 'color': '#FF6666'},
            {'min': 10000, 'max': 99999, 'label': '10000-99999人', 'color': '#CC3333'},
            {'min': 100000, 'label': '100000+人', 'color': '#990033'},
        ]
    )
)

# 绘图
china_map.render('全国疫情地图.html')

河南省疫情地图绘制

"""
演示河南省疫情地图开发
"""
import json
from pyecharts.charts import Map
from pyecharts.options import *

# 读取数据文件
f = open('D:/Pycharm-beginner/疫情.txt', 'r', encoding='UTF-8')
data = f.read()  # 全部数据

# 关闭文件
f.close()

# 取到河南省数据
# 将字符串json数据转换成python的字典
data_dict = json.loads(data)  # 数据字典

# 从字典中取出河南省的数据
cities_data = data_dict['areaTree'][0]['children'][3]['children']

# 组装每个城市和确诊人数为元组,并各个城市的数据都封装入列表内
data_list = []  # 绘图需要用的数据列表
for city_data in cities_data:
    city_name = city_data['name'] + '市'     # 增加‘市’后缀准确名称
    city_confirm = city_data['total']['confirm']  # 确诊人数
    data_list.append((city_name, city_confirm))  # 构建的元组添加到列表中
# print(data_list)

# 手动添加济源市的数据
data_list.append(('济源市', 5))  # 为什么加两个括号?里面是一个元组?

"""
[('郑州市', 295), ('境外输入市', 79),…………]
"""

# 创建地图对象
henan_map = Map()

# 添加数据
henan_map.add('河南省疫情分布:', data_list, '河南')

# 设置全局配置,定制分段的视觉映射
# 设置全局选项
henan_map.set_global_opts(
    title_opts=TitleOpts(title='河南省疫情地图'),
    visualmap_opts=VisualMapOpts(
        is_show=True,
        is_piecewise=True,
        pieces=[
            {'min': 1, 'max': 99, 'label': '1-99人', 'color': '#CCFFFF'},
            {'min': 100, 'max': 999, 'label': '100-999人', 'color': '#FFFF99'},
            {'min': 1000, 'max': 4999, 'label': '1000-4999人', 'color': '#FF9966'},
            {'min': 5000, 'max': 9999, 'label': '5000-4999人', 'color': '#FF6666'},
            {'min': 10000, 'max': 99999, 'label': '10000-99999人', 'color': '#CC3333'},
            {'min': 100000, 'label': '100000+人', 'color': '#990033'},
        ]
    )
)

# 绘图
henan_map.render('河南省疫情地图.html')

基础柱状图构建

"""
演示基础柱状图的开发
"""
from pyecharts.charts import Bar
from pyecharts.options import LabelOpts

# 使用Bar构建基础柱状图
bar = Bar()
# 添加x轴的数据
bar.add_xaxis(['中国', '美国', '英国'])
# 添加y轴的数据,并设置数值标签在右侧
bar.add_yaxis('GDP', [30, 20, 10], label_opts=LabelOpts(position='right'))

# 反转x轴和y轴
bar.reversal_axis()

# 绘图
bar.render('基础柱状图.html')

基础时间线柱状图绘制

"""
演示带有时间线的柱状图的开发
"""
from pyecharts.charts import Bar, Timeline
from pyecharts.options import LabelOpts
from pyecharts.globals import ThemeType

bar1 = Bar()
bar1 .add_xaxis(['中国', '美国', '英国'])
bar1 .add_yaxis('GDP', [30, 20, 20], label_opts=LabelOpts(position='right'))
bar1 .reversal_axis()

bar2 = Bar()
bar2.add_xaxis(['中国', '美国', '英国'])
bar2.add_yaxis('GDP', [50, 50, 50], label_opts=LabelOpts(position='right'))
bar2.reversal_axis()

bar3 = Bar()
bar3.add_xaxis(['中国', '美国', '英国'])
bar3.add_yaxis('GDP', [70, 60, 60], label_opts=LabelOpts(position='right'))
bar3.reversal_axis()

# 构建时间线对象
timeline = Timeline({'theme': ThemeType.LIGHT})

# 在时间线内添加柱状图对象
timeline.add(bar1, '点1')
timeline.add(bar2, '点2')
timeline.add(bar3, '点3')

# 自动播放设置
timeline.add_schema(
    play_interval=1000,
    is_timeline_show=True,
    is_auto_play=True,
    is_loop_play=True,
)

# 绘图是用时间线对象绘图,而不是bar对象绘图
timeline.render('基础时间线柱状图.html')

GDP柱状动态图的绘制1

# 列表的sort方法
#
# 在前面我们学习过sorted函数,可以对数据容器进行排序。
# 在后面的数据处理中,我们需要对列表进行排序,并指定排序规则,sorted函数就无法完成了。
# 我们补充学习列表的sort方法。
#
# 使用方式:
# 列表.sort(key=选择排序依据的函数,reverse=True|False)
# ·参数key,是要求传入一个函数,表示将列表的每一个元素都传入函数中,返回排序的依据
# ·参数reverse,是否反转排序结果,True表示降序,False表示升序

# 准备列表,(嵌套列表,排序依据是数字无法用sorted排序)
my_list = [['a', 33], ['b', 55], ['c', 11]]

# 排序,基于带名函数


def choose_sort_key(element):  # 每个元素比如['a', 33]都排进去,再有函数决定元素有那一部分排序
    return element[1]   # 由['a', 33]数字下标1排序


my_list.sort(key=choose_sort_key, reverse=True)  # 将元素传入choose_sort_key函数中,用来确定按照谁来排序
print(my_list)
"""
[['b', 55], ['a', 33], ['c', 11]]
"""

# 排序,基于lambda匿名函数
my_list.sort(key=lambda element: element[1], reverse=True)
print(my_list)
"""
[['b', 55], ['a', 33], ['c', 11]]
"""

GDP柱状动态图的绘制2

"""
演示第三个图表:GDP动态柱状图开发
"""
from pyecharts.charts import Bar, Timeline
from pyecharts.options import *
from pyecharts.globals import ThemeType

f = open('D:/Pycharm-beginner/1960-2019全球GDP数据.csv', 'r', encoding='GB2312')
data_lines = f.readlines()

# 关闭文件
f.close()

# 删除第一条数据
data_lines.pop(0)

# 将数据转换为字典存储,格式为:
# {年份:[[国家, gdp], [国家, gdp],……], 年份:[[国家, gdp], [国家, gdp],……]……}
# 定义一个字典对象
data_dict = {}
for line in data_lines:
    year = int(line.split(',')[0])  # 通过’,‘切分数据,取对应下标数据
    country = line.split(',')[1]
    gdp = float(line.split(',')[2])
    # 如何判断字典里面有没有指定的key呢,年份空的时候会报异常,key有的时候不会
    try:
        data_dict[year].append([country, gdp])  # 如果无异常,表面字典有year数据,里面的list存在,需要追加
    except KeyError:
        data_dict[year] = []  # 如果异常,表明没有这个年份year,捕获赋值在空列表中
        data_dict[year].append([country, gdp])  # 上述赋值新year后的字典追加新的内嵌列表
# print(data_dict)
"""
{1960: [['美国', 543300000000.0],…………['图瓦卢', 47271463.0]]}
"""

# 创建时间线对象
timeline = Timeline({'theme': ThemeType.LIGHT})

# 排序年份
sorted_year_list = sorted(data_dict.keys())  # keys()把字典里取出全部的key,并用sorted排序
# print(sorted_year_list)
"""
[1960, 1961, 1962, 1963, 1964,…………2019]
"""
for year in sorted_year_list:
    # 字典内对列表中下标1的gdp进行降序排序
    data_dict[year].sort(key=lambda element: element[1], reverse=True)
    # 取出本年份前8名的国家
    year_data = data_dict[year][0:20]
    x_data = []
    y_data = []
    for country_gdp in year_data:
        x_data.append(country_gdp[0])  # x轴添加国家,取出列表中0号元素
        y_data.append((country_gdp[1]) / 100000000)  # y轴添加gdp数据,,取出列表中1号元素

        # 转换成固定小数位数
        # y_data.append(float("{:.2f}".format(country_gdp[1] / 100000000)))
        # y_data.append(f"{country_gdp[1] / 100000000:.2f}")
        # y_data.append("{:.2f}".format(country_gdp[1] / 100000000))
        # y_data.append(round((country_gdp[1]) / 100000000, 1))

    # 构建柱状图
    bar = Bar()

    # 轴的数据顺序调转,让gdp最大值在最上面
    x_data.reverse()
    y_data.reverse()

    # 添加x轴和y轴的数据
    bar.add_xaxis(x_data)
    bar.add_yaxis('GDP(亿)', y_data, label_opts=LabelOpts(position='right'))

    # 反转x轴和y轴,使柱状图平放
    bar.reversal_axis()

    # 设置每一年图表的标题
    bar.set_global_opts(
        title_opts=TitleOpts(title=f'{year}年全球前8GDP数据')
    )

    # 在时间线内添加柱状图对象
    timeline.add(bar, str(year))

# for循环每一年的数据,基于每一年的数据,创建每一年的bar对象

# 在for中,将每一年的bar对象添加到时间线中

# 设置时间线自动播放
timeline.add_schema(
    play_interval=1000,
    is_timeline_show=True,
    is_auto_play=True,
    is_loop_play=True,
)

# 绘图
# 绘图是用时间线对象绘图,而不是bar对象绘图
timeline.render('1960-2019年全球GDP前8国家.html')

转载请注明来源,欢迎对文章中的引用来源进行考证,欢迎指出任何有错误或不够清晰的表达。可以在下面评论区评论,也可以邮件至 3415226167@qq.com
资源 相册