首页English
  • 时政
  • 国际
  • 时评
  • 理论
  • 文化
  • 科技
  • 教育
  • 经济
  • 生活
  • 法治
  • 军事
  • 卫生
  • 养生
  • 女人
  • 文娱
  • 电视
  • 图片
  • 游戏
  • 光明报系
  • 更多>>
  • 报 纸
    杂 志
    中华读书报 2010年12月08日 星期三

    以数窥豹

    薇 言 《 中华读书报 》( 2010年12月08日   18 版)

        这真是一本奇怪的书!

        尽管近些年,各种类型的书籍看了不少,比如之前介绍过的《说服力:让你的PPT会说话》就是一本用PPT写PPT的奇书。但手上的这本还是大大超出了我的预期。

        一般而言,一本书“实在”程度是衡量质量好坏的一个因素。“不实在”说白了就是字数少,那种字与字间距极大且在每一页留下一堆空白的书,常被指摘为骗钱。而《深入浅出数据分析》的每一页基本都符合这个特点,再瞅瞅它的定价,居然是如此吉利的“八八”!即便网站打折也要卖到六十元以上。真是搞没搞错呀,以为这是经典书籍的引进版么?还是以为内地人民的收入水平赶上了港台?作者和出版社穷疯了罢!作者在书中回应了各种“不实在”的“指控”:我们使用丰富的图片,这是因为,大脑追逐图像,而非文字。图形比单调的文字好记得多,可以提高学习效率(记忆学习和转移学习的学习效率最多能提高89%)。图形还能让知识更容易理解,在大脑的活动中,一张图片胜过千言万语。当同时使用图片和文字进行说明时,我们将文字填写在图片当中。当文字出现在它所描述的事物当中时,大脑的工作更有效率;相反,若将说明性文字放在注释或其他正文当中,则无此效果。 

        我承认,确实是有“A picture is worth a thousand words”(一图胜千言)的谚语,但仅仅凭借一句谚语,绝不能说服我这本定价如此之高的书值回“票价”。于是,我花了两个小时看完了序言和第一章。序言的内容同数据分析的主题并无直接关系,而是主要强调了如何更好地调动大脑学习,很快就看完了。而第一章“数据分析引言”只有三十多页,大部分又都是图片,文字极少,但我却脑袋飞转地看了很久。

        第一章中作者进行了角色分配,读者成为了一名刚刚上岗的数据分析师,客户是一家化妆品公司的首席执行官,他提供给你公司一款旗舰保湿霜的销售情况,希望你通过数据分析,找到提高销量达到目标的方法。作者并不顺着数据一步步分析,讲解规则,得出结论。而是把参与的主动权交给读者,在行动前,作者先提出一些必要建议,比如,告诉读者在直接分析数据之前,应该做的是了解问题和确定问题,而与客户的沟通可以帮助分析师确定问题。在这个实例里,首席执行官给了分析师几条信息,其中包括客户对提高销售额的预期,除此以外,首席执行官还告诉分析师,保湿霜的目标客户群是少女消费者,而竞争对手可能已经抢占了部分市场份额。在得到客户的回答之后,分析师,也就是读者我,将提高销量的大问题分解为一个个小问题,再结合数据的分解、比较,我很快得到评估、决策,结论是销售相对目标下降可能与广告费相对下降有关。而针对少女消费者做广告是让总销售额重新达到销售目标的手段。

        正当我发现自己的结论同书中的基本一致,自鸣得意地以为决策英明,是时候享受夸赞的时候,作者却话锋一转,提出一份由另外的媒体做的产品调查,指出该品牌的保湿霜在市场上占有了绝大多数的市场,该市场可能已经饱和。这个调查报告和数据分析结论是冲突的,如果市场已经饱和,那么增加广告投入一定无法解决问题,我仿佛又回到了起点,方才知道,客户的“估计”绝对不会永远正确,而根据客户的估计建立的心智模型必须随时根据其他证据推倒重建,所以,在向客户咨询知道什么的同时,还需要询问客户有什么不确定、不知道。这样的过程大多漫长而曲折,甚至在一个阶段是循环往复,或许最后我们拿到的是一堆未加处理的原始数据,再重新建立问题、假设、证据、决策。但这种探秘的过程也正是数据分析的乐趣所在,或者另一个名字更符合这个过程——数据挖掘。

        在当今这个数据爆炸的年代,人人都得面对堆积如山的数据,希望以数据说话,把握问题的要害,推进现实工作,而不仅仅凭借“常识”或是直觉。所以了解如何处理原始数据,如何分解和构建复杂的问题和数据集,不止是数据分析师的工作,而可能是我们每个人生活的一部分。

        这本书的另一个不同之处在于它并非是一本软件工具指导书。许多以“数据分析”为题的书籍其实类似软件手册,它们大多围绕Excel函数表或是其他流行的软件工具进行介绍,着重突出和数据分析有关的部分,再针对每个函数给几个实例。尽管在这本书中也会学到相当多的软件工具,但它们不过是手段而已,《深入浅出数据分析》的每一章每一小节都在不遗余力地带你进入从确定、分解到评估、决策的世界。而那些诸如:最优化方法、假设检验方法、贝叶斯统计方法等看似冰冷、生硬、困难的统计方法,在作者以图为主的写作风格和步步紧逼地提问、思索、回答中,竟然真的印在脑子里,想忘却都不容易了。

        《深入浅出数据分析》,[美]Michael Milton著,李芳译,电子工业出版社,2010 年9月,88.00元

    光明日报社概况 | 关于光明网 | 报网动态 | 联系我们 | 法律声明 | 光明网邮箱 | 网站地图

    光明日报版权所有