这篇文章给大家分享的是有关基于python实现微信好友数据分析的方法的内容。小编觉得挺实用的,因此分享给大家做个参考,一起跟随小编过来看看吧。
公司主营业务:成都网站建设、成都网站制作、移动网站开发等业务。帮助企业客户真正实现互联网宣传,提高企业的竞争能力。创新互联是一支青春激扬、勤奋敬业、活力青春激扬、勤奋敬业、活力澎湃、和谐高效的团队。公司秉承以“开放、自由、严谨、自律”为核心的企业文化,感谢他们对我们的高要求,感谢他们从不同领域给我们带来的挑战,让我们激情的团队有机会用头脑与智慧不断的给客户带来惊喜。创新互联推出晋城免费做网站回馈大家。本文主要介绍利用网页端微信获取数据,实现个人微信好友数据的获取,并进行一些简单的数据分析,功能包括:
1.爬取好友列表,显示好友昵称、性别和地域和签名, 文件保存为 xlsx 格式
2.统计好友的地域分布,并且做成词云和可视化展示在地图上
1、Pyecharts:一个用于生成echarts图表的类库,echarts是百度开源的一个数据可视化库,用echarts生成的图可视化效果非常棒,使用pyechart库可以在python中生成echarts数据图。
2、Itchat:一个开源的微信个人号接口,使用python调用微信从未如此简单。
3、Jieba:简单的分词操作库。
4、Numpy:NumPy 系统是 Python 的一种开源的数值计算扩展。这种工具可用来存储和处理大型矩 阵。
5、Pandas:pandas 是基于 NumPy 的一种工具,该工具是为了解决数据分析任务而创建的。
6、Pillow:图像处理。
7、wxpy:wxpy 在 itchat 的基础上,通过大量接口优化提升了模块的易用性,并进行丰富的功能 扩展。 (微信本身提供)
注:Pyecharts可能安装0.5.*的版本比较好
以上的三方库可以通过命令符(cmd)来实现安装,具体命令:pip install ***
from wxpy import * #导入模块 bot = Bot(cache_path=True) #初始化机器人,选择扫码登录 friend_all = bot.friends() #获取微信好友信息
首先出现的是一张二维码,然后扫描登录
成功登录好了就是这种显示
之后就可以进行操作了,好友数量,个人信息
print(len(friend_all)) #好友的数量 print(friend_all[0].raw) #输出个人信息
显示的结果
四、接下来把全部的好友信息转化为一个xlsx文件
获取全部好友信息
for a_friend in friend_all: NickName = a_friend.raw.get('NickName', None) #昵称 #Sex = a_friend.raw.get('Sex', None) Sex = {1: "男", 2: "女", 0: "其它"}.get(a_friend.raw.get('Sex', None), None) #性别(优化) City = a_friend.raw.get('City', None) #城市 Province = a_friend.raw.get('Province', None) #省份 Signature = a_friend.raw.get('Signature', None) #个性签名 HeadImgUrl = a_friend.raw.get('HeadImgUrl', None) #头像地址 HeadImgFlag = a_friend.raw.get('HeadImgFlag', None) #小Flag list_0=[NickName, Sex, City, Province, Signature, HeadImgUrl, HeadImgFlag] #存为一维数组 lis.append(list_0) #叠加数据
存为xlsx文件
def list_excel(filename,lis): ''' 将列表写入excel中,其中列表中的元素是列表. filename:保存的文件名(含路径) lis:元素为列表的列表,如下: lis = [["名称", "价格", "出版社", "语言"], ["暗时间", "32.4", "人民邮电出版社", "中文"], ["拆掉思维里的墙", "26.7", "机械工业出版社", "中文"]] ''' import openpyxl wb = openpyxl.Workbook() #激活worksheet sheet = wb.active sheet.title = 'sheet1' #创建一个表格 file_name = filename +'.xlsx' for i in range(0, len(lis)): for j in range(0, len(lis[i])): sheet.cell(row=i+1, column=j+1, value=str(lis[i][j])) #每行每列的存入数据 wb.save(file_name) print("写入数据成功!") list_excel('wechat',lis)
效果如下:
可以看到其好友基本分布再广东省,个性签名也是非常的杀马特
五、实现词云图(我们也可以从存储在本地的 excel 中读取数据进行分析,并查看数据形式。在执行以 下代码之前,我们需要先把 excel 文件加一个列标题行)
例如nickname sex city province signature headImgUrl headImgFlag
#导入模块 from wordcloud import WordCloud import matplotlib.pyplot as plt import pandas as pd from pandas import DataFrame word_list= df['city'].fillna('0').tolist() #将 dataframe 的列转化为 list,其中的 nan 用“0”替换 new_text = ' '.join(word_list) wordcloud = WordCloud(font_path='simhei.ttf', background_color="black").generate(new_text) #设计图背景颜色,字体 plt.imshow(wordcloud) plt.axis("off") plt.show()
还可以将词云图存为HTML形式
#利用 pyechart 做词云 import pandas as pd #count = df.city.value_counts() #对 dataframe 进行全频率统计,排除了 nan city_list = df['city'].fillna('NAN').tolist()#将 dataframe 的列转化为 list,其中的 nan 用“NAN” 替换 count_city = pd.value_counts(city_list)#对 list 进行全频率统计 from pyecharts.charts.wordcloud import WordCloud #设置对象 name = count_city.index.tolist() value = count_city.tolist() wordcloud = WordCloud(width=1300, height=620) wordcloud.add("", name, value, word_size_range=[20, 100]) wordcloud.show_config() wordcloud.render(r'D:\python\wechatcloud.html')
再看看效果:
六、转化为地图形式
注:安装地图数据包:pip install echarts-china-provinces-pypkg pip install echarts-countries-pypkg
province_list = df['province'].fillna('NAN').tolist() #将 dataframe 的列转化为 list,其中的 nan 用 “NAN”替换 count_province = pd.value_counts(province_list) #对 list 进行全频率统计 from pyecharts import Map value =count_province.tolist() attr =count_province.index.tolist() map=Map("各省微信好友分布", width=1300, height=700) map.add("", attr, value, maptype='china', is_visualmap=True,visual_text_color='#000',is_label_show = True) #显示地图上的省份 map.show_config() map.render(r'D:\python\wechatProMap.html')
效果:
感谢各位的阅读!关于“基于python实现微信好友数据分析的方法”这篇文章就分享到这里了,希望以上内容可以对大家有一定的帮助,让大家可以学到更多知识,如果觉得文章不错,可以把它分享出去让更多的人看到吧!
另外有需要云服务器可以了解下创新互联scvps.cn,海内外云服务器15元起步,三天无理由+7*72小时售后在线,公司持有idc许可证,提供“云服务器、裸金属服务器、高防服务器、香港服务器、美国服务器、虚拟主机、免备案服务器”等云主机租用服务以及企业上云的综合解决方案,具有“安全稳定、简单易用、服务可用性高、性价比高”等特点与优势,专为企业上云打造定制,能够满足用户丰富、多元化的应用场景需求。
售后响应及时
7×24小时客服热线数据备份
更安全、更高效、更稳定价格公道精准
项目经理精准报价不弄虚作假合作无风险
重合同讲信誉,无效全额退款