中国最新上市公司市值500强,都分布在哪里?
公众号后台回复“图书“,了解更多号主新书内容 作者:小小明、黄伟呢
来源:数据分析与统计学之美
1. 背景介绍
最新中国上市公司市值500强
的那些公司。
表格识别api
。获取图片表格数据
的思路就是这样,咱们直接上代码吧!图片切分
import math
from PIL import Image
img = Image.open("500强.png")
w, h = img.size
height = 860
r = math.ceil(h/height)
img_splits = []
for i in range(r):
start = height * i
end = height * (i + 1)
if end > h:
end = h
if i != 0:
start -= 25
box = (0, start, w, end)
img_split = img.crop(box)
print(i)
display(img_split)
img_splits.append(img_split)
图片表格数据识别
import pandas as pd
request_url = f"https://aip.baidubce.com/rest/2.0/solution/v1/form_ocr/request?access_token={access_token}"
headers = {'content-type': 'application/x-www-form-urlencoded'}
base64_str = image_to_base64(img_splits[0])
params = {"image": base64_str, "is_sync": "true", "request_type": "excel"}
json_data = requests.post(request_url, data=params, headers=headers).json()
df = pd.read_excel(excel_url, header=None)
df
2. 数据分析

基本信息统计

万亿市值公司都在哪些?


千亿市值公司都在哪些?




中国上市公司500强分布地图


中国上市公司500强行业词云图



◆ ◆ ◆ ◆ ◆
麟哥新书已经在当当上架了,我写了本书:《拿下Offer-数据分析师求职面试指南》,目前当当正在举行活动,大家可以用相当于原价5折的预购价格购买,还是非常划算的:
数据森麟公众号的交流群已经建立,许多小伙伴已经加入其中,感谢大家的支持。大家可以在群里交流关于数据分析&数据挖掘的相关内容,还没有加入的小伙伴可以扫描下方管理员二维码,进群前一定要关注公众号奥,关注后让管理员帮忙拉进群,期待大家的加入。
管理员二维码:
猜你喜欢 ● 你相信逛B站也能学编程吗
评论