1.数据集展示

僵尸数据集如下所示

微博数据处理——处理僵尸用户数据集(二)1.数据集展示2.处理数据集3.展示结果

2.处理数据集

编写处理代码，将所需训练数据保存为csv格式

代码如下：

import json
import csv

csvfile = open("csv_test.csv","w",newline = "")
writer = csv.writer(csvfile)
writer.writerow(["uid","follow_num","fun_num,post_num","is_brief",
                 "like_picture_num","like_music_num","like_movie_num","like_post_num","mark"])
f = open("../users_data/dic_marked_5737286648.json","r")
str = f.read()
data = json.loads(str)
f1 = open("../users_data/dic_marked_6878691599.json","r")
str1 = f1.read()
data1 = json.loads(str1)
data.extend(data1)
for item in data:
    uid = item["uid"]
    follow_num = item["follow_num"]
    fun_num = item["fun_num"]
    post_num = item["post_num"]
    brief = item["brief"]
    if(brief==""):
        is_brief = 0
    else:
        is_brief = 1
    like_picture_num = item["like_picture_num"]
    like_music_num = item["like_music_num"]
    like_movie_num = item["like_movie_num"]
    like_post_num = item["like_post_num"]
    mark = item["mark"]
    writer.writerow([uid,follow_num,fun_num,post_num,is_brief,like_picture_num,like_music_num,like_movie_num,like_post_num,mark])
    print(item)

3.展示结果

处理后的结果如下所示

微博数据处理——处理僵尸用户数据集(二)1.数据集展示2.处理数据集3.展示结果

微博数据处理——处理僵尸用户数据集(二)1.数据集展示2.处理数据集3.展示结果

1.数据集展示

2.处理数据集

3.展示结果

继续阅读

SOC体系建设学习笔记0x00 背景0x01 目标愿景0x01 架构设计0x02 SOC运营指标0x03 SOC 使用场景0x04 参考场景

大数据安全相关概念（上）

天涯论坛——python网络爬虫下载论坛关键字帖文（一）前言内容代码

微博数据爬虫——获取特定ID的热门转发评论用户列表（五）plus1.获取用户接口2.分析获取方法3.数据结果如下

微博数据处理——获取广告用户数据集(三)1.筛选广告话题2.获取广告用户3.获取用户信息4.标注广告用户

微博数据爬虫——获取特定ID的粉丝和关注（二）1.通过o_id获取p_id2.获取用户的关注列表3.获取用户的粉丝列表

微博数据处理——获取僵尸用户数据集(一)1.手工查找僵尸用户2.迭代遍历僵尸用户关注粉丝列表3.标记僵尸用户集

微博模型训练——僵尸用户识别(一)1.数据导入2.模型训练3.可视化输出

微博模型训练——僵尸用户识别(二)

随着美军侦察机在南海的活动日益频繁，设立南海防空识别区也变得越来越迫切。根据南海战略态势感知平台（SCSPI）数据统计，

出身即落后，美国新一代M10轻型坦克在美国陆军248岁生日之际，于弗吉尼亚州贝尔沃堡的美国陆军国家博物馆上，美国陆军正式

美军机抵近中国侦察，外媒讽刺：西媒仍会说是中国“咄咄逼人”据外媒报道称，日前根据“南海战略态势感知”发布的消息称，美军一

企业安全态势感知系统的实现方法与技术（附大量案例）

这个注释有点伤人，美国仙童公司(Fairchild-Hiller)/共和航空竞标MD二等人F-X/F-15计划的方案。吸

网安加·百家讲坛 | 刘志诚：威胁情报和态势感知的生态观