科技行者

行者学院 转型私董会 科技行者专题报道 网红大战科技行者

知识库

知识库 安全导航

至顶网网络频道知微为提供新浪微博片面样本数据引误读道歉

知微为提供新浪微博片面样本数据引误读道歉

  • 扫一扫
    分享文章到微信

  • 扫一扫
    关注官方公众号
    至顶头条

7月10日消息,社会化网络与数据挖掘研究机构知微今天发布公开微博,为提供关于新浪微博片面样本数据被媒体非理性解读道歉,知微称媒体误读对大众产生了误导,同时也给该机构带来了困扰。

来源:千龙网 2013年7月11日

关键字: 新浪微博

  • 评论
  • 分享微博
  • 分享邮件

7月10日消息,社会化网络与数据挖掘研究机构知微今天发布公开微博,为提供关于新浪微博片面样本数据被媒体非理性解读道歉,知微称媒体误读对大众产生了误导,同时也给该机构带来了困扰。

昨日,虎嗅网发布一篇独家调查文章,称新浪微博活跃度已经降至2011年初水平,下滑超过30%,其中涉及的数据引用机构为知微。

知微在声明中称,文章引用数据仅为少量用户微博发布量变化趋势,未与互动量(转发、评论)数据等进行综合比较,且该数据仅产生于新浪微博少量用户,仅能代表该群体的发微博趋势,不足以说明整个微博平台的发展情况。

笔者在对上述文章和知微声明进行研究后,上述数据存在如下缺陷:

1、样本量不足。根据新浪在财报会议上公布的数据,微博注册用户超过5.3亿,日活跃用户接近5000万,但上述调研数据样本只对部分粉丝大于1万的用户行为进行了分析。两者相比,样本量严重不足,同时,知微存在将特定群体当做样本分析,使得数据过于片面。

2、属性缺失。知微在声明中承认,样本仅为少量用户微博发布量的变化趋势,未与转发、评论等互动数据进行综合比较,数据样本属性单一,实际上,微博用户还存在着大量的评论、赞、投票行为,而作为私密沟通的私信行为也为数不少,但这些行为是无法被系统性抓取的。

3、终端迁移。知微被引用的数据更偏重于PC端的行为权重,但新浪微博用户移动端登陆比例目前已接近80%,此份数据与用户真实行为存在较大差别。

样本量不足、终端迁移,以及数据属性缺失,导致媒体得出的相关结论存在误导。

知微在声明中表示,根据对微博热门事件数据的测量发现,微博热门的热度并未出现明显下滑,甚至还稳步上升。从2011年动车事件到2012年北京暴雨,再到2013年雅安地震,新浪微博均成为网民讨论公共事件的广场。

知微称未经新浪微博平台授权独自发布少量样本数据的行为存在不妥,对此致歉,并表示部分媒体对数据进行了非理性姐夫,对大众产生了误导。知微呼吁第三方机构应慎重发布数据,同时呼吁媒体谨慎解读。

我们在知微声明下面摘取部分业界人士对此事的看法。

@1968金鹏远: 知微无过,过在于用数据胡乱分析,虎嗅在选择文章时过于看爆炸力忽略了真实。

@肖明超: 数据的结论是否可靠,第一,需要看指标定义,比如什么叫活跃度?每个人理解不一样,容易引起理解差异;第二,数据的抽取样本是否可以完整代表总体?有误差的样本也容易引起偏差。

@艾瑞网:的确,抽取的样本能否代表微博的整体数据,以及用户整体构成,这点还是存异的。

@龚文祥: 本人的新浪微博活跃度一直处于上升趋势的,做个人自媒体还是新浪微博靠谱,而且新浪微博已经成为中国最大公关发声的平台。

@seeisee: 新浪微博在公共事件中的持续影响力有目共睹。

@张锐时趣科技: 果然是被媒体当枪使了么?#当黑新浪微博成为一种流行#

@张文浩100:对于宏观数据的抽样方法应该符合人口的分布,文中只用粉丝大于10000的人群的数据对宏观数据进行分析,类似于利用达官贵人的数据来分析中国国情了。所以分析结论就会比较片面了~作为第三方公司发布类似的数据还是要严谨一些。

@勤娘纸: 那篇文章拜读了,作者对数据狗屁不通,先确立软文观点然后曲解数据到有利于自己的一面。例如第三条:转评量总体还是稳步上升,这一部分一句话带过还故意不配曲线图,就是因为这部分数据恰恰说明新浪微博活跃深度在增加,与软文观点相反。

笔者呼吁,媒体在对重大产品做出价值和事实判断前,应该多方求证并谨慎发布相关结论,过度消费用户眼球的做法势必会影响到媒体自身品牌。

    • 评论
    • 分享微博
    • 分享邮件
    邮件订阅

    如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。

    重磅专题
    往期文章
    最新文章