干货:手把手教你导出微信聊天记录并做出词云图

核心提示本教程约2500字,实际操作过程约30min(之前发在班级公众号一次,现在搬运到知乎里)前言 疫情在家,大家的社交方式主要都变成了线上多人运动,微信聊天成为了维系社交的主要手段。聊了这么多,到底聊了些什么,聊了多少确实很让人好奇。 一个

本教程约2500字,实际操作过程约30min(之前发在班级公众号一次,现在搬运到知乎里)
前言 疫情在家,大家的社交方式主要都变成了线上多人运动,微信聊天成为了维系社交的主要手段。聊了这么多,到底聊了些什么,聊了多少确实很让人好奇。

一个星期前突发奇想,如何把和某人的聊天记录导出成文本或者表格。

按照我对中国程序猿的理解,实现这种功能的软件,上百度搜寻应该比比皆是。然而点开了各个所谓的教程后,不过都是一些手机备份软件的广告软文,有的甚至需要收费(实名diss一款叫楼月微信聊天记录导出的软件)。

本来觉得有点头绪了,但简单查询后得知,这玩意的加密方式较为特殊,解析难度较大,也没有破译的先例,只好放弃。在查阅了多方资料后,得知安卓端存储聊天记录的数据库较为固定,加密方式也比较简单,于是打算从安卓端入手,整理得到这份干货,话不多说,直接开始。

零、工具准备 由于是纯干货,在工具准备方面自然是越少越好!1. 安卓模拟器:首先由于ios封闭生态的原因,直接从苹果手机导出的比较麻烦。

此时我们就需要用安卓模拟器,主流的安卓模拟器都自带root,如果你使用的安卓手机没有root,也可以下载一个模拟器。(在本文中,我用的是夜神安卓模拟器)2. 微信电脑版:微信电脑版的用途是作为一个中转站,通过备份功能将现有设备的聊天记录备份到电脑上,再通过恢复功能将其恢复到模拟器中的微信中。3. SQLCipher:聊天记录基本是以数据库.db文件存储的,该软件的目的便是解密数据库(在附录给出该文件)。

4. 其他:excel(废话)、python(用于统计词频)、谷歌浏览器(不必要)。获取EnMicroMsg.db 接下来打开安卓模拟器,登录微信。同时需要重新登录电脑端微信,选择恢复聊天记录至手机。这样的话就成功将iPhone中的聊天记录保存至电脑中了!接下来,只要找到安卓模拟器储存的聊天记录数据库EnMicroMsg.db就行!依次选择根目录/data/data/com.tencent.mm/MicroMsg

由于方法有很多,我在这里给出使用夜神模拟器的方法。 一般加密的数据库文件在两个长名字文件夹之一,自己寻找,优先选择修改日期最新的那个。打开EnMicroMsg.db微信的UIN码1. 谷歌浏览器抓包 谷歌浏览器”中打开“微信网页版”(微信网页版),手机微信扫码登陆。然后新建一个标签页,输入chrome://net-internals/#events,回车。

按“Ctrl+F”,输入"uin”进行搜索,即可找到的UIN号。然而,我的账号似乎使用不了网页版微信。

“为了你的帐号安全,此微信号已不允许登录网页微信。你可以使用Windows微信或Mac微信在电脑端登录。Windows微信下载地址:

https://

pc.weixin.qq.com

Mac微信下载地址:

https://

mac.weixin.qq.com

2. 从手机(模拟器)目录中进行获取 同上获取EnMicroMsg.db的方法 找到根目录/data/data/com.tencent.mm/sharedprefs/systemconfig_prefs.xml 在电脑上打开方式选择用记事本打开 找到这个value值(前面的name是default_uin) 这里需要注意UIN号可能是负值(比如说我的),有的时候可能需要做unsigned int到int的转换(通常不用),即如果你的UIN大于2147483647时,需要减去4294967296得到一个负数的UIN号。

数据库处理输入密码后,就成功进入数据库了!点击file->export->Table as CSV file->messsage->export 文件名需填写成“文件名.csv”点开导出的csv文件后可以发现有很多列,我简单解释一些有意义的。 在WORDS下点击import,将词频统计的结果复制进去就行。需要注意的是,该网站不自带中文字体,需要自己在FONTS中导入(一般后缀为.ttf),我在附件中会提供微软雅黑的字体文件。

由于该网站生成词云图的设置过于浅显易懂,在此不做过多赘述。一切设置好后,点击Visualize即可。 后话 当然,有了那个数据库,你也可以用SPSS进行聊天时间,聊天次数等等的描述性统计(机器学习、情绪识别等等也可),有兴趣的同学可以对create time进行分列处理然后丢进SPSS(直接Excel也行)。工具下载(SQLCipher、停词表、字体文件):链接:

https://

pan.baidu.com/s/1D_uo-P

_CVuFx76Fjd0WmxA

提取码:btjg参考文献:i.

https://www.

sy2k.com/2018/%E5%BE%AE

%E4%BF%A1%E6%95%B0%E6%8D%AE%E5%BA%93%E5%AF%BC%E5%87%BA%E5%B9%B6%E7%A0%B4%E8%A7%A3/

ii.

https://

wormtooth.com/20180417-

decrypt-wechat-database/

(最后声明,本教程仅供娱乐交流使用,网络并非法外之地,不要从事任何违法获取他人信息的行为。

 
友情链接
鄂ICP备19019357号-22