2020年1月8日

数据分析:如何从互联网大数据中分析行业趋势

摘要:一、前言: 研究行业趋势是每家公司的硬需求,如手机业者希望了解同行有没有什么颜色是比较受消费者欢迎的,护肤品公司想要了解什么成分是被广泛而且美誉的讨论,借由加入这些概念元素,他们可以让他们的产品更具吸引力,这种跟风做法其实一直都有,但是传统人工去看会遇到两个问题: 1、发现过慢:通常人工可以发现时, 阅读全文

posted @ 2020-01-08 13:58 彦柏 阅读 (237) 评论 (0)

2019年11月26日

数据分析:如何透过互联网公开数据评估品牌营销活动成效

摘要:一、背景介绍 随着互联网发展,网民的不断增加,现在品牌方在投放广告预算分配时,逐渐降低了传统的电视、报纸比例,增加了微博、微信公众号、小红书、抖音这些平台上的广告投放。一般会透过广告公司或是直接和平台的KOL(key opinion leader,就是那些网红大V)合作,但是目前投放放都会遇到类似的 阅读全文

posted @ 2019-11-26 11:27 彦柏 阅读 (36) 评论 (0)

2019年4月19日

Python 处理Excel内的数据(案例介绍*2)

摘要:(一)案例一介绍 现在有一匹电商产品跟当日销量的数据,如下,总共有上万笔的数据,现在需要统计每个品牌当日的销售量,比如美宝莲今天总共卖出了多少的商品,另外需要统计每个品牌下面的每个子品类当日销售量(品类可分为口红、睫毛膏、粉底等),比如卡姿兰口红卖了多少、眉笔卖了多少 首先是要做出关键字码表,如下, 阅读全文

posted @ 2019-04-19 15:14 彦柏 阅读 (146) 评论 (0)

2019年3月9日

微博数据抓取练习

摘要:由于最近工作的关系接触到了微博数据分析这一块,觉得挺有意思的,想先练习将微博的数据抓取下来练习看看。 目标是将微博的内容和作者这两个数据储存在数据库内,由于数据量不是很大,先暂时用MySQL,如果以后要大量储存再考虑使用Hive或是HBASE。 然后代码使用Python3,因为写起来比较方便。下面就 阅读全文

posted @ 2019-03-09 23:09 彦柏 阅读 (43) 评论 (0)

2019年1月31日

微信小程序开发笔记(二)

摘要:一、前言 继承上一篇所说的,有了对微信小程序的基础概念后,这边将会示范动手做一个小程序,在动手的过程中我们可以更快的熟悉小程序里面的架构和开发流程。 二、小程序的设计 这次要做的是一个猜数字的程序,程序会自动产生一组4个不重复的数字,例如1835,玩家看不到数字,但每次玩家输入一个数字,系统会自动给 阅读全文

posted @ 2019-01-31 12:18 彦柏 阅读 (113) 评论 (0)

2019年1月29日

微信小程序开发笔记(一)

摘要:一、为什么要学习微信小程序开发 微信小程序是一个可以在微信上打开的轻应用,他是由多个页面组成的程序,跟传统APP比较如下: 优点 1、不需要在应用商店下载,不占用内存空间,即开即用 2、可以在微信内直接打开使用,方便透过微信传播分享,有许多API可以很方便的调用(例如微信支付) 3、开发成本低,微信 阅读全文

posted @ 2019-01-29 19:42 彦柏 阅读 (167) 评论 (0)

2019年1月27日

UCI 人口收入数据分析(python)

摘要:一、项目介绍 UCI上有许多免费的数据集可以拿来练习,可以在下面的网站找寻 http://archive.ics.uci.edu/ml/datasets.html 这次我使用的是人口收入调查,里面会有每个人的教育程度、每周工时、职业、性别等数据,并以50K为界线,分为收入大于50K和收入小于50K的 阅读全文

posted @ 2019-01-27 14:54 彦柏 阅读 (215) 评论 (1)

2019年1月22日

OpenStack介绍

摘要:一、背景 OpenStack是一个开源的云计算项目,里面包含了许多的组件,可以提供免费下载,对一些想要搭建公有云和私有云的公司或个人提供了非常好的帮助。 国内OpenStack最大的用户是华为云,由于华为本身发展云服务比较慢,软件方面又没有BAT有经验,OpenStack提供了一个非常好的捷径,让华 阅读全文

posted @ 2019-01-22 13:24 彦柏 阅读 (28) 评论 (0)

2019年1月5日

Hadoop以及组件介绍

摘要:一、背景介绍 在接触过大数据相关项目的时候常常都会听到Hadoop这个东西,简单来说,他是一个用分布式计算来处理大数据的开源软件,下面包含了许多的组件和子项目,这篇文章将会介绍Hadoop的原理以及一些组件的应用。 二、准备工作 1、确认储存规模 有很多的大数据项目其实数据量跟本没这么大,跟本不需要 阅读全文

posted @ 2019-01-05 18:04 彦柏 阅读 (1091) 评论 (0)

2018年12月18日

Python for Data Analysis 学习心得(四) - 数据清洗、接合

摘要:一、文字处理 之前在练习爬虫时,常常爬了一堆乱七八糟的字符下来,当时就有找网络上一些清洗数据的方式,这边pandas也有提供一些,可以参考使用看看。下面为两个比较常见的指令,往往会搭配使用。 split(“,”)可以将文字串分割,冒号里的为分割依据,左边的代码就是把两个冒号中间的文字串视为一个单元。 阅读全文

posted @ 2018-12-18 15:04 彦柏 阅读 (105) 评论 (0)