当我们面对一个分析课题时,都希望自己拿到的数据是比较完整、准确及规范的。然而事实上,会因为各种各样的原因导致获取的数据缺失、不准确、不规范等情况出现。通常在项目初期,分析师需要首先梳理清楚研究思路、明确分析目的,建立数据分析思维,然后才是确定这个分析任务的数据需求及数据获取方式。分析思维决定分析能力,只有养成正确的分析思维,才能使用好数据,通过数据得出有价值的见解和洞察,让数据说话。
simplyAnalytics互联网数据分析处理平台,帮助分析师轻松获取到来自互联网的文本数据(数据源覆盖微博、微信、新闻、论坛、问答、博客、视频),无需任何技术,后台自动完成数据采集、清洗、处理等环节。分析师需要做的是根据自己的分析目的和需求,准确完成分析对象的建立。所以分析对象建立得越清楚、完整,数据结果越准确,便于更清晰地进行后续数据分析工作。
simplyAnalytics 新增分析对象设置界图
针对分析目的去构建一套逻辑清晰、内容完整的关键词体系,便于系统或工具更加准确抓取及处理想要的数据。如何定义一个关键词Tree? 来看常见的两类研究目的及其数据挖掘&数据采集关键词TREE:
第一种:针对企业/品牌/产品的互联网舆情表现&网民口碑分析
分析关注点:企业推广效果、负面危机状态
数据要求:全面
数据采集模式:关键词命中
数据采集平台:一般需覆盖全网,具体视项目需求而定
例1:以研究某汽车企业整体舆情表现为目的Tree
例2:以研究特定车型产品横向竞争力为目的Tree
第二种:特定活动/话题/营销表现类
分析关注点:活动声量表现、KOL表现、产品关联率、与行业benchmark的对比、竞品同类活动case study
数据需求:声量尽量全,尽量能挖掘出活动亮点、不足等部分的insight
数据采集模式:关键词命中+品牌官方账号+KOL账号追踪
数据采集平台:活动主要的推广平台,比如社交媒体、视频网站等。
例3:以研究特定活动、广告效果评测为目的Tree ;如分析某耳机品牌的新品,一新推出的跨界合作耳机
分析对象任务建立Tips:
1、在设定的时候需考虑关键词命中的准确度(即关键词设置后获取的数据是否和需要分析的内容匹配,要考虑关键词本身是否应该和其他关键词做组合,关键词本身是不是有别名,俗称,英文名等)
2、设置排除词进一步筛选,排除掉与品牌、产品、行业等完全无关且容易混淆的词。比如针对六一儿童节进行节日话题分析,设置一级关键词有“六一儿童节、六一节、儿童节、六一”等,不包含关键词有“六一儿童医院”等。
simplyAnalytics平台操作步骤:
首次登陆后会进入数据配置界面,引导建立【新建分析对象】:
第1步:选择获取数据的时间段(起末时间)
第2步:输入采集关键词
必须包含的关键词:支持单个或多个关键词,多个关键词可以使用逗号隔开。“&&”表示“和”、“,”表示“或”(例如,AA&&BB代表同时包含AA和BB;AA,BB包含AA或者BB,包含其一)不包含的关键词:数据采集结果中排除掉含有此关键词的信息
第3步:选择媒体类型
目前平台标准版本支持7种媒体源数据获取:微博、微信、新闻、论坛、问答、博客、视频;勾选设置。需要更多媒体源类型数据, 请联系客服咨询。
第4步:数据预览确认
新增分析对象建立后,点击预览按钮,会估算得出本次任务的预估数据量,并返回部分数据查阅;此操作帮助检视分析对象的设置是否准确,获取到的数据结果是否符合需求。
第5步:分析对象保存建立
确认预览数据为所需数据后,点击保存按钮,并为该新增分析对象命名;一旦设置完毕,任务保存后,后台就进行自动数据获取处理,无法对该分析对象再做任何设置修改。如有修改调整需求,可停用此分析对象,重新建立。
simplyAnalytics是simplyBrand旗下自主研发的一款面向行业调研、市场研究需求的互联网数据分析处理平台。全面获取互联网UGC(User Generated Content,用户生产内容)数据,数据源覆盖微博、微信、新闻、论坛、问答、博客、视频等,助力分析师轻松挖掘互联网大数据。
欢迎扫码申请试用
15天数据包免费体验
完成用户注册后
请返回PC端登录使用
产品访问 a3.simplybrand.com
或登录官网 www.simplybrand.com
如果您是数据控、资深分析师、产品专家,欢迎联系simplyBrand官方微信,直接回复微信对话小编,获得更高体验权限。