使用R语言挖掘QQ群聊天记录
发布时间:2020-12-30 20:59:19 所属栏目:大数据 来源:网络整理
导读:数据挖掘入门与实战 ?公众号: datadw 1、获取数据 从 QQ 消息管理器中导出消息记录,保存的文本类型选择 txt 文件。这里获取的是某群从 2016-04-18 到?2016-05-07 期间的聊天记录,记录样本如下所示。 2、数据预处理 打开 R 软件,先通过 File—Change dir
寻找聊天峰值日 观察每天的发言次数 online.day为每天的发言次数online.day <- sapply(flat.day[,-1],sum) -1 表示去除第一列,第一列是 IDtempdf <- data.frame(time=ymd(names(online.day)),online.day ) qplot(x=time,y=online.day,ymin=0,ymax=online.day,data=tempdf,0); line-height: 1.5 !important;">linerange 观察到有少数峰值日,看超过200次发言以上是哪几天
|