[使用案例]python如何爬取微信好友信息?(下)

发布时间:2020-05-25 关注热度:°C

  用python爬取微信好友信息并且进行数据清洗,IP海之前已经将教程的上半部分进行了分解,下面我们继续来解决这个问题,将接下来的两个步骤完成。

微信好友信息如何python爬取

  4、利用签名绘制词云

  #4、绘制词云

  #4.1 替换签名中的emoji、span、class、类似<>/= 之类的符号等等

  siglist = []

  for i in friends:

  signature = i["Signature"].strip().replace("span","").replace("class","").replace("emoji","")

  rep = re.compile("1fd+w*|[<>/=]")

  signature = rep.sub("", signature)

  siglist.append(signature)

  text = "".join(siglist)

  #4.2 把结巴分词这个包搞进来分词

  import jieba

  wordlist = jieba.cut(text, cut_all=True)

  word_space_split = " ".join(wordlist)

  #4.3 进入画图阶段,根据自己想要的图片、形状、颜色画出相似的图形

  import matplotlib.pyplot as plt

  from wordcloud import WordCloud, ImageColorGenerator

  import numpy as np

  import PIL.Image as Image

  coloring = np.array(Image.open("101.jpg"))

  my_wordcloud = WordCloud(background_color="white", max_words=2000,

  mask=coloring, max_font_size=60, random_state=42, scale=2,

  font_path="STXINWEI.TTF").generate(word_space_split)

  image_colors = ImageColorGenerator(coloring)

  plt.imshow(my_wordcloud.recolor(color_func=image_colors))

  plt.imshow(my_wordcloud)

  plt.axis("off")

  plt.show()

  5、ggplot图形展示

  #5、ggplot图形展示

  import matplotlib.pyplot as plt

  #获取csv内容

  df = pd.read_csv('data.csv')

  #配置图

  fig = plt.figure()

  ax = fig.add_subplot(1,1,1)

  ax.hist(df['Sex'], bins=7)

  #标题

  plt.title('Sex distribution')

  #X轴标题

  plt.xlabel('Sex')

  #Y轴标题

  plt.ylabel('people')

  plt.show()

  以上当这些步骤执行完之后,我们就能够将微信好友的基本信息抓取完毕了。

 

版权声明:本文为IP海(iphai.cn)原创作品,未经许可,禁止转载!

Copyright © www.iphai.cn. All Rights Reserved. IP海 版权所有.
IP海仅提供中国内IP加速服务,无法跨境联网,用户应遵守《服务条款》内容,严禁用户使用IP海从事任何违法犯罪行为。
ICP备案鄂ICP备19030659号-3 公安备案鄂公网安备42100302000141号 计算机软件著作权证计算机软件著作权证 ICP/EDI许可证ICP/EDI许可证:鄂B2-20200106

微信扫一扫咨询