题目:作出GB国的喜欢(csv中第二列)与评论(第四列)的关系
关系:用散点图

image.png

image.png
缩小数值范围

image.png
但是,此处作图是以喜欢与点评为x,y,这样就要保证x,y的个数是一样,这样缩小范围的话会报错

image.png
所以我们可以在数据未做处理时,也就是刚从文件中读取出来的四列的时候就一起取出<500000的,这样就可以保持长度一致
from matplotlib import pyplot as plt
import numpy as np
#获得数据
fpath='./youtube_video_data/GB_video_data_numbers.csv'
data=np.loadtxt(fpath,delimiter=',',dtype=int)
#实际上只要随意取出第二列<500000或者第四列<500000的整个data就行
#因为这样就相当于取出整个数组,会保证个数都一样
data=data[data[:,1]<500000]
print(data)
#缩小范围
like_data=data[:,1]
comment_data=data[:,-1]
print(len(like_data),len(comment_data))
#绘制图片
plt.scatter(like_data,comment_data)
plt.show()

image.png
网友评论