能力中心 > 能力公社 > 微博用户信息 开发者中心

微博用户信息

采集微博用户的信息

7条评分 1218个项目使用过

基本信息

  • 能力名称(中文): 微博用户信息
  • 能力名称(英文): UserInfo
  • 版本: 1.0.0
  • 能力入口类名: com.hylanda.processors.crawl.weibo.n.UserInfoNode
  • 开发者dog3dog2dog1
  • 供应商平台自营
  • 编程语言: JAVA
  • 授权范围: 公开
  • 工程分类: 数据抓取
  • 能力分类: 普通能力
  • 能力级别: 普通
  • 能力状态: 正常
  • 标签

收费方式

  • 收费方式: 0.003000[按条数](按能力输出的有效数据量计费)

使用说明

能力说明

功能简介

根据新浪微博用户id,采集该用户的相关信息; 采集用户信息为非登录状态下可查看的用户信息内容 (比登录状态下可查看的信息内容少,详情见输出简介配图)

配置参数

参数名称 参数类型 是否必填 默认值 参数说明
请输入微博用户id 文本 直接部署用户id时需要填写,格式为一行一个(换行操作:shift+回车),建议部署上限在100以内;当能力接收上层数据流时可不填
流入此能力的json中提取的key 文本 uid 上游能力流过来的json流中提取key名称作为本能力的输入

输入简介

输入用户id,多个以换行分隔(换行操作:shift+回车),建议部署上限在100以内 可从该能力配置中进行填写,也可用通过上游能力输入。通过上游能力输入时,建议使用 采集格式转换 能力对输入的数据进行格式规整。

支持如下两种上游流入格式:

第一种字符串:["1222419165"]
第二种json传:{"uid","1222419165"}

输入数据样例

输入新浪微博用户id示例如下:

注:直接部署用户id,当链接中不能找到用户id时,建议从网页源码中分析提取用户id

1222419165
1222419163

输出简介

输出用户id对应的新浪微博用户信息,为json格式。每个人物的数据字段可能不尽相同,取决于该人物在人物主页中所展示的字段内容。 如下图所示,当前人物仅有左边红框内的可见字段。 输入图片说明

输出数据样例

部分输出字段简介:

1.uid:用户id

2.nick_name:昵称

3.location:所在地

4.verified_reason:认证名称

5.statuses_count:微博数

6.followers_count:粉丝数

7.birthday:生日

8.daren_score:达人积分

9.verified_type:认证信息

10.verified_reason:认证原因

11.education:学校信息

12.friends_count:关注数

13.gender:性别(1男2女)

输出详细字段信息举例如下:

{
    "uid":"2087425303",
    "daren_score":"0.0",
    "birthday":"1986年12月16日",
    "reidx_uid":"7fdc37e8-015e-1000-fe8d-8265fc728095",
    "location":"福建 宁德 ",
    "taskid":"1510",
    "verified_type":"3",
    "source_type":"4",
    "verified_reason":"母婴育儿博主",
    "education":"[{"school_name":"","school_type":""}]",
    "type":"u",
    "statuses_count":"1300",
    "vip_name":"Lv.21",
    "nick_name":"范光华-白血病不可怕",
    "sentiment_status":"已婚 ",
    "verified":"3",
    "active_days":"0",
    "gender":"1",
    "trust_score":"0.0",
    "task_serial":"192.168.253.54-7fdc37e8-015e-1000-fe8d-8265fc728095",
    "followers_count":"2080",
    "avatar_large_url":"http://tva4.sinaimg.cn/crop.0.0.640.640.180/7c6b9517jw8evzlz8a9dij20hs0hswfl.jpg",
    "profile_url":"http://www.weibo.com/u/2087425303?/info?",
    "sex_preference":"异性恋 ",
    "vip_score":"0",
    "media_url":"weibo.com",
    "career":"[{"org_name":"曾经是个美发师","time_rang":"","position":""}]",
    "download_date":"2017-11-17 14:45:40",
    "level_now":"Lv.21",
    "url":"http://weibo.com/u/2087425303",
    "from_flag":"sina_weibo1.3",
    "vip_speed":"0",
    "friends_count":"11",
    "rel_type":"u",
    "media_name":"新浪微博",
    "profile_image_url":"http://tva4.sinaimg.cn/crop.0.0.640.640.180/7c6b9517jw8evzlz8a9dij20hs0hswfl.jpg"
}

字段明细表

输入图片说明

相关能力

参考指标

  • 数据质量:准确率:99.2%

  • 处理性能:7200条/小时

CPU:4 内存:4G

附加说明

  • 采全率:90%以上 注:不包括已失效的人物链接
  • 准确率:95%以上
  • 采集速度:2人物链接/秒;7200人物链接/小时
  • 改版后响应速度:工作时间4小时内;非工作时间一天内。

隐藏参数说明

粗体

最新版本

  • 最新版本: 1.0.0
  • 更新日志: 系统同步

用户评论