Get这一招,你想要的数据速速来!数据分析师进阶必读

案例参考 09-04 311
当我们面对一个分析课题时,都希望自己拿到的数据是比较完整、准确及规范的。然而事实上,会因为各种各样的原因导致获取的数据缺失、不准确、不规范等情况出现。通常在项目初期,分析师需要首先梳理清楚研究思路、明确分析目的,建立数据分析思维,然后才是确定这个分析任务的数据需求及数据获取方式。分析思维决定分析能力,只有养成正确的分析思维,才能使用好数据,通过数据得出有价值的见解和洞察,让数据说话。 

384711692

 

simplyAnalytics互联网数据分析处理平台,帮助分析师轻松获取到来自互联网的文本数据(数据源覆盖微博、微信、新闻、论坛、问答、博客、视频),无需任何技术,后台自动完成数据采集、清洗、处理等环节。分析师需要做的是根据自己的分析目的和需求,准确完成分析对象的建立。所以分析对象建立得越清楚、完整,数据结果越准确,便于更清晰地进行后续数据分析工作。 

 

page1-1

simplyAnalytics 新增分析对象设置界图

 

针对分析目的去构建一套逻辑清晰、内容完整的关键词体系,便于系统或工具更加准确抓取及处理想要的数据。如何定义一个关键词Tree? 来看常见的两类研究目的及其数据挖掘&数据采集关键词TREE: 

第一种:针对企业/品牌/产品的互联网舆情表现&网民口碑分析

  • 分析关注点:企业推广效果、负面危机状态
  • 数据要求:全面
  • 数据采集模式:关键词命中
  • 数据采集平台:一般需覆盖全网,具体视项目需求而定
例1:以研究某汽车企业整体舆情表现为目的Tree
qq%e6%88%aa%e5%9b%be20170831165736
例2:以研究特定车型产品横向竞争力为目的Tree
qq%e6%88%aa%e5%9b%be20170831165858
第二种:特定活动/话题/营销表现类

  • 分析关注点:活动声量表现、KOL表现、产品关联率、与行业benchmark的对比、竞品同类活动case study
  • 数据需求:声量尽量全,尽量能挖掘出活动亮点、不足等部分的insight
  • 数据采集模式:关键词命中+品牌官方账号+KOL账号追踪
  • 数据采集平台:活动主要的推广平台,比如社交媒体、视频网站等。
例3:以研究特定活动、广告效果评测为目的Tree ;如分析某耳机品牌的新品,一新推出的跨界合作耳机
qq%e6%88%aa%e5%9b%be20170831170014 
Tips
分析对象任务建立Tips:

  1. 在设定的时候需考虑关键词命中的准确度(即关键词设置后获取的数据是否和需要分析的内容匹配,要考虑关键词本身是否应该和其他关键词做组合,关键词本身是不是有别名,俗称,英文名等)
  2. 设置排除词进一步筛选,排除掉与品牌、产品、行业等完全无关且容易混淆的词。比如针对六一儿童节进行节日话题分析,设置一级关键词有“六一儿童节、六一节、儿童节、六一”等,不包含关键词有“六一儿童医院”等。

 

simplyAnalytics平台操作步骤:首次登陆后会进入数据配置界面,引导建立【新建分析对象】:

第1步:选择获取数据的时间段(起末时间)

第2步:输入采集关键词

必须包含的关键词:支持单个或多个关键词,多个关键词可以使用逗号隔开。“&&”表示“和”、“,”表示“或”(例如,AA&&BB代表同时包含AA和BB;AA,BB包含AA或者BB,包含其一)不包含的关键词:数据采集结果中排除掉含有此关键词的信息

第3步:选择媒体类型

目前平台标准版本支持7种媒体源数据获取:微博、微信、新闻、论坛、问答、博客、视频;勾选设置。需要更多媒体源类型数据, 请联系客服咨询。

第4步:数据预览确认

新增分析对象建立后,点击预览按钮,会估算得出本次任务的预估数据量,并返回部分数据查阅;此操作帮助检视分析对象的设置是否准确,获取到的数据结果是否符合需求。

第5步:分析对象保存建立

确认预览数据为所需数据后,点击保存按钮,并为该新增分析对象命名;一旦设置完毕,任务保存后,后台就进行自动数据获取处理,无法对该分析对象再做任何设置修改。如有修改调整需求,可停用此分析对象,重新建立。

上午好,游客

你可能感兴趣

打开微信“扫一扫”



打开微信“扫一扫”